Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Работа для программиста > Фриланс
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 12.04.2021, 19:41   #1
bigmamakira
Новичок
Джуниор
 
Регистрация: 12.04.2021
Сообщений: 0
По умолчанию Нужна помощь с модулем nltk.

Здравствуйте, мне очень нужна помощь с модулем nltk на языке Python + регулярные выражения. Нужно решить несколько задач.
1. Опишите, какие строки соответствуют следующим регулярным выражениям:
а) [a-zA-Z]+
б) [A-Z][a-z]*
в) p[aeiou]{,2}t
г) \d+(\.\d+)?
д) ([^aeiou][aeiou][^aeiou])*
е) \w+|[^\w\s]+

Можете проверить свой ответ при помощи nltk.re_show().

2. Напишите регулярное выражение, которое ищет арифметические выражения, включающее натуральные числа, сложение и умножение, например, 2*75+43

3. Для оценки сложности восприятия (английского) текста используется Automated Readability Index (ARI), который рассчитывается по формуле 4.71 * lpw + 0.5 * wps - 21.43б где lpw (letters per word) - это среднее количество букв в слове, а wps (words per sentence) - среднее количество слов в предложении. Коэффициенты подобраны так, чтобы результат обозначал класс школы, для которого предназначен текст. Убеники для пятого класса должны давать сложность около 5, для шестого класса - около 6 и так далее.
Напишите функцию для подсчёта сложности текста по списку предложений. Посчитайте сложность текстов по всем категориям брауновского корпуса.
На вход функции подаётся список предложений (список списков токенов), на выходе должно быть значение ARI.

4. Пусть имеется файл, в котором хранится частотный словарь - на каждой строке указано слово и через пробел его частота. Напишите функцию, которая принимает на вход путь к файлу и возвращает питоновский словарь, в котором для каждого слова хранится его частота (при желании можно вместо словаря возвращать непосредственно FreqDist).

5. Посчитайте по брауновскому корпусу:
а) Какие существительные чаще встречаются во множественном числе, чем в единственном? Можно ограничиться стандартной формой множественного числа на -s.
б) Какое слово (или слова) имеет больше всего разных тэгов частей речи? Какие это тэги и что они означают?
в) Выведите 20 наиболее частотных тэгов в порядке убывания частоты. Что означают эти тэги?
bigmamakira вне форума Ответить с цитированием
Старый 13.04.2021, 19:20   #2
Larboss
Недо
Участник клуба
 
Регистрация: 11.08.2011
Сообщений: 1,394
По умолчанию

ТЗ, срок, бюджет: larbossfreelance@yandex.ru Метка: freelance. Указывайте ссылку на тему форума.
С помощью программирования можно разбогатеть и изменить мир к лучшему (с) Бьерн Страуструп
Larboss вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Python Nltk 300р Ivan912 Фриланс 4 28.11.2019 01:10
Работ с модулем для dle. Нужна помощь. artiom4356 WordPress и другие CMS 1 15.08.2015 14:04
Очень нужна помощь c матрицами, макросами в Excel. Заранее благодарен(поверьте, очень-очень нужна помощь) Farridjan Помощь студентам 1 03.07.2009 12:24
Очень нужна помощь с написанием программы... срочно(буду благодарен за помощь) 5Paladin5 Помощь студентам 3 02.07.2009 09:12