|
|
Регистрация Восстановить пароль |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
|
Опции темы | Поиск в этой теме |
01.04.2024, 14:03 | #1 |
Старожил
Регистрация: 24.01.2011
Сообщений: 3,127
|
Прогнозирование завершения слов=словосочетаний
здравствуйте прогнозирование- штука тёмная))
но то что под капотом у одного из простых примеров Код:
выдало ответ ['йенах,', 'йод,'] - тушите свет есть у кого пример кода получше, в датасете закондательство РФ, спасибо |
08.07.2024, 02:02 | #2 |
Форумчанин
Регистрация: 10.01.2020
Сообщений: 215
|
Ципихович Эндрю,
Прогнозирование следующего слова на основе предыдущего слова с использованием n-грамм — довольно сложная задача, особенно для юридических текстов, которые часто содержат сложную терминологию и структуру. Вот улучшенный пример кода, который может дать более релевантные предсказания для юридических текстов: Код:
Обратите внимание, что для получения хороших результатов важно иметь большой и представительный набор данных. Рекомендуется использовать как можно больше юридических текстов для обучения модели языка. |
08.07.2024, 15:41 | #3 |
Старожил
Регистрация: 24.01.2011
Сообщений: 3,127
|
спасибо за ответ, опробовать не смог, гуглёж возникающих ошибок подсказывает:
В последних версиях NLTK (Natural Language Toolkit) класс NgramLanguageModel был удален в пользу более гибкого и модульного подхода к языковому моделированию можете исправить? |
08.07.2024, 23:59 | #4 | |
Форумчанин
Регистрация: 10.01.2020
Сообщений: 215
|
Цитата:
Код:
Последний раз редактировалось MakarovDs; 09.07.2024 в 00:04. |
|
09.07.2024, 10:34 | #5 |
Старожил
Регистрация: 24.01.2011
Сообщений: 3,127
|
MakarovDs, а у вас разве не было ошибки при запуске кода
Traceback (most recent call last): File "C:\pythonProject\sudrf.ru1.py" , line 16, in <module> padding_pipeline = padded_everygram_pipeline(n) ^^^^^^^^^^^^^^^^^^^^^^^^^^^^ TypeError: padded_everygram_pipeline() missing 1 required positional argument: 'text' ?? джипити мне подсказало Сообщение об ошибке указывает на то, что в функции Padded_everygram_pipeline отсутствует необходимый текст позиционного аргумента. Эта функция ожидает два аргумента: n и текст. Вам нужно передать слова в функцию Padded_everygram_pipeline. и исправило код....... только толку нет я его запустил - жду уже минут 15, а ведь речь про подсказки при вводе текста и тогда это время неприемлемо для этой задачи, такие дела........ |
09.07.2024, 10:49 | #6 |
Старожил
Регистрация: 24.01.2011
Сообщений: 3,127
|
понял 1 раз нужно запускать код:
Код:
Код:
Последний раз редактировалось Ципихович Эндрю; 09.07.2024 в 10:56. |
09.07.2024, 16:07 | #7 |
Пользователь
Регистрация: 16.05.2024
Сообщений: 92
|
to ЭЦ: алгоритм, который в сообщении 1, мне кажется, тоже неплохой (на подсчёте частоты появления в текстах определённой пары слов), надо только его аккуратно запрограммировать и натаскать.
|
09.07.2024, 16:25 | #8 |
Старожил
Регистрация: 24.01.2011
Сообщений: 3,127
|
я пока застрял на
Код:
я ожидаю увидеть 3.11.1, выпущенную 24 мая 2024 года - как этого добиться? всё перепробовал: # pip install nltk --upgrade обновить nltk # pip uninstall nltk удалить nltk # pip install nltk установить nltk # pip list | grep nltk проверить установленную версию nltk |
09.07.2024, 17:11 | #9 |
Пользователь
Регистрация: 16.05.2024
Сообщений: 92
|
если посмотреть сайт проекта www.nltk.org , то там внизу слева написано что последняя версия 3.8.1 , так что всё верно.
При помощи NLTK удобно подготавливать лексикон (набор слов из предметной области) и тексты для анализа. Разбиение на лексемы, удаление незначащих слов, "нормализация" (stemming) https://habr.com/ru/companies/otus/articles/774498/ |
09.07.2024, 17:20 | #10 | |
Старожил
Регистрация: 24.01.2011
Сообщений: 3,127
|
Цитата:
|
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Помогите с макросом: поиск и подсчет словосочетаний в примечаниях | Alex_dolg | Microsoft Office Word | 3 | 05.11.2016 19:19 |
Прогнозирование осадков | TURIK | Паскаль, Turbo Pascal, PascalABC.NET | 1 | 20.12.2011 17:56 |
Заплачу за создание системы для выбора правильного перевода слов (а). Словосочетаний. | aquatell | Фриланс | 0 | 10.05.2011 10:44 |
прогнозирование excel | dron7sem | Фриланс | 0 | 07.05.2011 23:57 |
Анализ словосочетаний. | PUH | Помощь студентам | 19 | 11.06.2008 01:53 |