|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
|
Опции темы | Поиск в этой теме |
18.01.2013, 19:29 | #1 |
Участник клуба
Регистрация: 14.06.2011
Сообщений: 1,138
|
словарь словоформ русского языка
//Че б и не спросить... А вдруг? Задачка довольно известная, мож у кого есть...
В общем, мне нужен .txt список всех вариантов написания слов. Или внятная прожка для генерации оного. Но лучше уже сразу файлом. |
18.01.2013, 19:35 | #2 |
Старожил
Регистрация: 31.05.2010
Сообщений: 13,543
|
ёклмнопрстйцуукен-ихерсинм. Чем не словоформа?
Пиши пьяным, редактируй трезвым.
Справочник по алгоритмам С++ Builder |
18.01.2013, 20:04 | #3 |
Участник клуба
Регистрация: 14.06.2011
Сообщений: 1,138
|
Имелось в виду нормальные, правильные варианты написания. Без падонковщины и ошибок выбора шаблона склонения/спряжения.
|
18.01.2013, 20:13 | #4 |
Старожил
Регистрация: 31.05.2010
Сообщений: 13,543
|
Не хочешь "падонковщины", пиши так, чтобы тебя понимали. Приводи тексты (форматы). Если есть наработки - выкладывай, мы не звери, поможем.
Но если так, -"Я барин и вы мне обязаны", смею тебя заверить - ХРЕН ТЕБЕ ПОМОГУТ.
Пиши пьяным, редактируй трезвым.
Справочник по алгоритмам С++ Builder |
18.01.2013, 20:28 | #5 |
Старожил
Регистрация: 30.12.2009
Сообщений: 11,426
|
Словарь русского языка. Бери и переписывай в txt А ещё лучше загугли его и найти конвертор базы в нужный вид. Делов не шибко много.
|
18.01.2013, 20:39 | #6 |
Старожил
Регистрация: 31.05.2010
Сообщений: 13,543
|
Человек_Борща, мы то всё понимаем, только ТС, куда-то пропал
Пиши пьяным, редактируй трезвым.
Справочник по алгоритмам С++ Builder |
18.01.2013, 20:55 | #7 | |
Белик Виталий :)
Старожил
Регистрация: 23.07.2007
Сообщений: 57,097
|
Цитата:
I'm learning to live...
|
|
18.01.2013, 22:08 | #8 | |
Старожил
Регистрация: 16.05.2012
Сообщений: 3,211
|
Цитата:
Начал решать проблему с помощью регулярных выражений. Теперь решаю две проблемы...
|
|
18.01.2013, 22:10 | #9 |
Участник клуба
Регистрация: 14.06.2011
Сообщений: 1,138
|
Если брать только грамматически правильные варианты и исключить специфические термины, с частотностью вхождения 1 штука на миллион слов текста, то словарь будет где-то метров двадцать самый-самый максимум.
Вот тут скрипт, но как там что на Perl я не понимаю. Во вложениях продублирован скрипт, сам словарь сформированный скриптом и маленькая программка-генератор. Но она работает только с существительными и прилагательными. В общем, словарь достаточно полный и без ошибок генерации. Но в нем нету где-то каждого сотого обычного слова, типа: склонения "человек" (сам человек есть) может спасет живем Пытаюсь написать Т9 для компа и для меня проще искать уже в готовом массиве, чем генерировать на лету окончания. Последний раз редактировалось Smogg; 18.01.2013 в 22:28. |
18.01.2013, 22:24 | #10 |
Старожил
Регистрация: 31.05.2010
Сообщений: 13,543
|
Это весьма писсиместическая оценка. Предположим, что у всех слов, есть 6 вариантов написания (очень писсимистичное предположение, т.к. у некоторых слов вариантов нет). В словаре, 14-16 тысяч слов. 16000*6=96000. Учитывая, что в текстовом файле, каждая буква занимает 2 байта, а слово в среднем (опять-же максимально предположительно) состоит из 10-букв получим 96000*10*2-1920000 байт. Разделим это число на 1024 и получим 1875 Кбайт. Не очень много, а? Ну, прибавим ещё тех.инфу. Итого: 2 МБ.
Пиши пьяным, редактируй трезвым.
Справочник по алгоритмам С++ Builder Последний раз редактировалось Smitt&Wesson; 18.01.2013 в 22:29. |
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
некорректное отображение русского языка | zlo_999 | HTML и CSS | 11 | 10.02.2015 13:19 |
Windows 8 - кракозябры русского языка | tatianak99 | Windows | 0 | 24.11.2012 15:25 |
проблема русского языка в vcf | malloy84 | Свободное общение | 1 | 14.01.2011 10:43 |
Словарь служебных слов языка delphi | Kate68 | Помощь студентам | 1 | 09.11.2009 22:06 |