|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
23.12.2010, 05:44 | #1 |
Регистрация: 20.10.2008
Сообщений: 6
|
MSGR_RU.LEX - как достать список слов??!
Привет!
У меня очень неординарный и не менее важный вопрос, касающийся в основном программистов! Продукты Оффис, как известно, используют базу слов для проверки орфографии. В интернете не сложно найти, что файлами, хранящими эти базы являются MSGR_RU.LEX, MSHY3UA.DLL, MSHY3UA.LEX, MSHYRU32.DLL, MSHY_RU.LEX, MSPRU32.DLL, MSSP3UA.DLL, MSSP3UA.LEX, MSSP_RU.LEX, MSTHRU32.DLL, MSTH_RU.LEX, MSGRRU32.DLL, которые лежат в папке Program Files\Common Files\Microsoft Shared\PROOF. (тут ru и ua) На сколько я знаю, сам русский словарь хранится в файле MSGR_RU.LEX, возможно и в схожих с ним по расширению и аффиксом *RU*. Но вот беда!!! Как достать эти слова оттуда??!?!??! Открывание файлов через нотэпад, естесн, не помогает!!! Знающие!! Помогите пожалуйста! Мне очень нужна эта база! (Ну или киньте ссылочку на другую базу, уже в текстовом формате (желательно txt) и не менее полную, чем у оффиса (другими словами, настолько полную, что содержит почти все слова и их падежные/временные и тп формы русского языка)). Заранее Спасибо!!! ___________________________________ _______________ ПС Пробовал присоединить к проекту в Делфи библиотеку mspru32.dll, дабы поизучать ее функции и, возможно, извлечь все слова, но Делфи ругнулся на библиотеку и открывать ее не захотел. (((((( Последний раз редактировалось xxx-z-xxx; 23.12.2010 в 06:04. |
23.12.2010, 07:48 | #2 |
Форумчанин
Регистрация: 05.07.2010
Сообщений: 136
|
Имхо нереально
|
23.12.2010, 08:10 | #3 |
Регистрация: 20.10.2008
Сообщений: 6
|
Точно же как-то можно..... Вот ведь они, перед нами все слова! Просто в фиговой кодировке какой-то записаны, епть Как ее разгадать??
Офис же как-то ее открывает влет! Но это еще ладно, офис офисом, - есть программы, например, AutoCheck Complete Spell, которые тупо используют эту самую офисовскую базу!!!! У нее в инструкции написано так легко и непренужденно, мол, "...Правда, эта программа может проверять только английскую орфографию, но это не беда! Укажите в ее настройках путь на MSGR_RU.LEX и MSPRU32.DLL и все будет круто!" ??? |
23.12.2010, 08:30 | #4 |
Старожил
Регистрация: 09.01.2008
Сообщений: 26,229
|
никогда не сталкивался,
но мне кажется, что это реализовано через использование функций (интерфейсов) из DLL-ки.... т.е. и Word и другие программы используют эти функции... Кстати, думаю, что поиском можно найти, как в своей программе можно эти функции задействовать. Но я, например, абсолютно не уверен, что получится вытащить все слова... |
23.12.2010, 08:57 | #5 | ||
Регистрация: 20.10.2008
Сообщений: 6
|
Цитата:
Цитата:
Или вы думаете, что MS их как-то зашифровала??.... |
||
24.12.2010, 10:16 | #6 |
Форумчанин
Регистрация: 09.07.2009
Сообщений: 111
|
На всех форумах регулярно всплывает этот вопрос. И на него один ответ: да, зашифровано. Но не мелкомягкими. Проверку делает модуль ОРФО от Информатик. Да, он свирепо закрыт - коммерческий же продукт же. Российский же. (Точнее, там используется свой формат).
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Как достать переменную из функции? | Abuhamed | PHP | 5 | 15.12.2010 17:18 |
Как достать временные файлы из Оперы? | Terran | Свободное общение | 9 | 04.06.2010 23:45 |
Составить в алфавитном порядке список всех слов, встречающихся в тексте, и количество этих слов. | KAPAHDAW | Паскаль, Turbo Pascal, PascalABC.NET | 2 | 17.02.2009 01:19 |
Как достать админа? | =Bgik= | Свободное общение | 32 | 17.01.2009 20:30 |
В PASCAL .Составить список слов начинающихся на конкретную букву | Waia | Помощь студентам | 1 | 07.11.2008 18:20 |