|
|
Регистрация Восстановить пароль |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
12.04.2021, 19:41 | #1 |
Новичок
Джуниор
Регистрация: 12.04.2021
Сообщений: 0
|
Нужна помощь с модулем nltk.
Здравствуйте, мне очень нужна помощь с модулем nltk на языке Python + регулярные выражения. Нужно решить несколько задач.
1. Опишите, какие строки соответствуют следующим регулярным выражениям: а) [a-zA-Z]+ б) [A-Z][a-z]* в) p[aeiou]{,2}t г) \d+(\.\d+)? д) ([^aeiou][aeiou][^aeiou])* е) \w+|[^\w\s]+ Можете проверить свой ответ при помощи nltk.re_show(). 2. Напишите регулярное выражение, которое ищет арифметические выражения, включающее натуральные числа, сложение и умножение, например, 2*75+43 3. Для оценки сложности восприятия (английского) текста используется Automated Readability Index (ARI), который рассчитывается по формуле 4.71 * lpw + 0.5 * wps - 21.43б где lpw (letters per word) - это среднее количество букв в слове, а wps (words per sentence) - среднее количество слов в предложении. Коэффициенты подобраны так, чтобы результат обозначал класс школы, для которого предназначен текст. Убеники для пятого класса должны давать сложность около 5, для шестого класса - около 6 и так далее. Напишите функцию для подсчёта сложности текста по списку предложений. Посчитайте сложность текстов по всем категориям брауновского корпуса. На вход функции подаётся список предложений (список списков токенов), на выходе должно быть значение ARI. 4. Пусть имеется файл, в котором хранится частотный словарь - на каждой строке указано слово и через пробел его частота. Напишите функцию, которая принимает на вход путь к файлу и возвращает питоновский словарь, в котором для каждого слова хранится его частота (при желании можно вместо словаря возвращать непосредственно FreqDist). 5. Посчитайте по брауновскому корпусу: а) Какие существительные чаще встречаются во множественном числе, чем в единственном? Можно ограничиться стандартной формой множественного числа на -s. б) Какое слово (или слова) имеет больше всего разных тэгов частей речи? Какие это тэги и что они означают? в) Выведите 20 наиболее частотных тэгов в порядке убывания частоты. Что означают эти тэги? |
13.04.2021, 19:20 | #2 |
Недо
Участник клуба
Регистрация: 11.08.2011
Сообщений: 1,394
|
ТЗ, срок, бюджет: larbossfreelance@yandex.ru Метка: freelance. Указывайте ссылку на тему форума.
С помощью программирования можно разбогатеть и изменить мир к лучшему (с) Бьерн Страуструп
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Python Nltk 300р | Ivan912 | Фриланс | 4 | 28.11.2019 01:10 |
Работ с модулем для dle. Нужна помощь. | artiom4356 | WordPress и другие CMS | 1 | 15.08.2015 14:04 |
Очень нужна помощь c матрицами, макросами в Excel. Заранее благодарен(поверьте, очень-очень нужна помощь) | Farridjan | Помощь студентам | 1 | 03.07.2009 12:24 |
Очень нужна помощь с написанием программы... срочно(буду благодарен за помощь) | 5Paladin5 | Помощь студентам | 3 | 02.07.2009 09:12 |