![]() |
|
|
Регистрация Восстановить пароль |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
![]() |
|
Опции темы | Поиск в этой теме |
![]() |
#1 |
Участник клуба
Регистрация: 23.07.2007
Сообщений: 1,054
|
![]()
уже сколько бьюсь но ни как не найду способа учитывать словоформы для слов.
есть база данных из слов (причем не обязательно в начальной форме) пользователь пишет как в поисковике что то и нужно найти в этой базе то что он ищет. (короче поисковый механизм) я придумал следующее: найти какой то словарик слов без приставок и окончаний. если слово из словаря полностью входит в слово из запроса то берется это слово из словаря и пробегается уже по базе данных ищя все вхождения. так будут учитываться словоформы. единственная проблема в том что все обыскал но ни где че то не могу найти такого словарика (без приставок и окончаний) ну или где приставки и окончания бы шли отдельно от слова. Ребят, помогите плиз. дайте хотяб идею. Диплом горит...
Писано по д'Эльфийски
|
![]() |
![]() |
![]() |
#2 |
Участник клуба
Регистрация: 23.07.2007
Сообщений: 1,054
|
![]()
прошло много времени но что то нормальной базы данных словоформ русского языка не могу найти ни как. или фэйк полный или платные версии (не известно что там) а мне просто надо элементарно базу данных в которой бы лежало слово и ссылка на его начальную форму
Писано по д'Эльфийски
|
![]() |
![]() |
![]() |
#3 |
Участник клуба
Регистрация: 23.07.2007
Сообщений: 1,054
|
![]()
Элементарно надо допустим на слова "лошади" выдавать "лошадь" на слова "школьникам" выдавать "школьник" я пробовал сделать это программно
есть у меня в базе слова но они написаны как попало, в разных формах. делал я так пользователь пишет слово, программа берет 70% от длинны этого слова и ищет в базе при помощи like слово в которое входит эта подстрака в 70% от начального слова. это конечно работает но очень криво.
Писано по д'Эльфийски
|
![]() |
![]() |
![]() |
#4 |
Пользователь
Регистрация: 02.02.2011
Сообщений: 92
|
![]()
Вам нужна так называемая "машинная морфология" Она бывает 2 видов - словарная (основанная на словарях склонений-спряжений типа Зализняка) и приближенная (вероятностные методы).
Недостаток 1-го метода - не распознаются слова, отсутствующие в словаре 2-го - возможность ошибок (напр. слово "кровать" может распознаться как глагол - я крую, ты круешь и т.д.) Как я понял, Вас интересует именно приближенная морфология. Поищите по ключевой фразе "вероятностный морфологический анализатор" |
![]() |
![]() |
![]() |
#5 |
Участник клуба
Регистрация: 23.07.2007
Сообщений: 1,054
|
![]()
Не совсем так... мне бы лучше по словарю, а уж второй метод в довесок (я вторым методом делал от безисходности просто)
Писано по д'Эльфийски
|
![]() |
![]() |
![]() |
#6 |
Форумчанин
Регистрация: 04.05.2010
Сообщений: 495
|
![]()
Найди обычный словарь русских слов, такие в Инете есть.
Прогони его через алгоритм Стеммер Портера и получишь словарь. http://gv0zdik.livejournal.com/10301.html
Нажми на весы, поставь +
Для благодарностей : WebMoney WMR R252732729948 |
![]() |
![]() |