Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > IT форум > Помощь студентам
Регистрация

Восстановить пароль

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 04.06.2010, 16:44   #1
Лубышев
Участник клуба
 
Аватар для Лубышев
 
Регистрация: 23.07.2007
Сообщений: 1,054
По умолчанию Словоформы

уже сколько бьюсь но ни как не найду способа учитывать словоформы для слов.

есть база данных из слов (причем не обязательно в начальной форме) пользователь пишет как в поисковике что то и нужно найти в этой базе то что он ищет. (короче поисковый механизм)
я придумал следующее:
найти какой то словарик слов без приставок и окончаний. если слово из словаря полностью входит в слово из запроса то берется это слово из словаря и пробегается уже по базе данных ищя все вхождения. так будут учитываться словоформы.

единственная проблема в том что все обыскал но ни где че то не могу найти такого словарика (без приставок и окончаний) ну или где приставки и окончания бы шли отдельно от слова.

Ребят, помогите плиз. дайте хотяб идею. Диплом горит...
Писано по д'Эльфийски
Лубышев вне форума Ответить с цитированием
Старый 17.02.2011, 14:50   #2
Лубышев
Участник клуба
 
Аватар для Лубышев
 
Регистрация: 23.07.2007
Сообщений: 1,054
По умолчанию

прошло много времени но что то нормальной базы данных словоформ русского языка не могу найти ни как. или фэйк полный или платные версии (не известно что там) а мне просто надо элементарно базу данных в которой бы лежало слово и ссылка на его начальную форму
Писано по д'Эльфийски
Лубышев вне форума Ответить с цитированием
Старый 17.02.2011, 15:02   #3
Лубышев
Участник клуба
 
Аватар для Лубышев
 
Регистрация: 23.07.2007
Сообщений: 1,054
По умолчанию

Элементарно надо допустим на слова "лошади" выдавать "лошадь" на слова "школьникам" выдавать "школьник" я пробовал сделать это программно
есть у меня в базе слова но они написаны как попало, в разных формах.
делал я так пользователь пишет слово, программа берет 70% от длинны этого слова и ищет в базе при помощи like слово в которое входит эта подстрака в 70% от начального слова. это конечно работает но очень криво.
Писано по д'Эльфийски
Лубышев вне форума Ответить с цитированием
Старый 17.02.2011, 15:36   #4
Д_М
Пользователь
 
Регистрация: 02.02.2011
Сообщений: 92
По умолчанию

Вам нужна так называемая "машинная морфология" Она бывает 2 видов - словарная (основанная на словарях склонений-спряжений типа Зализняка) и приближенная (вероятностные методы).

Недостаток 1-го метода - не распознаются слова, отсутствующие в словаре
2-го - возможность ошибок (напр. слово "кровать" может распознаться как глагол - я крую, ты круешь и т.д.)

Как я понял, Вас интересует именно приближенная морфология. Поищите по ключевой фразе "вероятностный морфологический анализатор"
Д_М вне форума Ответить с цитированием
Старый 18.02.2011, 00:52   #5
Лубышев
Участник клуба
 
Аватар для Лубышев
 
Регистрация: 23.07.2007
Сообщений: 1,054
По умолчанию

Не совсем так... мне бы лучше по словарю, а уж второй метод в довесок (я вторым методом делал от безисходности просто)
Писано по д'Эльфийски
Лубышев вне форума Ответить с цитированием
Старый 18.02.2011, 15:33   #6
Z1000000
Форумчанин
 
Регистрация: 04.05.2010
Сообщений: 495
По умолчанию

Найди обычный словарь русских слов, такие в Инете есть.
Прогони его через алгоритм Стеммер Портера и получишь словарь.
http://gv0zdik.livejournal.com/10301.html
Нажми на весы, поставь +
Для благодарностей : WebMoney WMR R252732729948
Z1000000 вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц