|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
14.03.2010, 20:15 | #1 |
Регистрация: 14.03.2010
Сообщений: 5
|
Генератор текста, Анализатор текста, График, С++
Требуется создать генератор текста, использующий вероятности встречаемости символов русского алфавита с пробелом, и вероятность появления биграмм (ну можно и триграмм, если это не сложно). О встречаемости символов(с числовыми значениями вероятностей) подробно написано:
http://www.statsoft.ru/home/portal/e...xtanalysis.htm Необходимо генерировать в файлы на подобие Text_1.txt ... Text_N.txt, размер сгенерированных файлов ==20кб откуда потом и будем считывать, но это потом. Файлы проходят обработку, в результате чего я получаю, к примеру: Text_1_1.txt ... Text_N_N.txt. Пары файлов(можно по отдельности, например запуск программы с параметром) {Text_1.txt,Text_1_1.txt}...{Text_N .txt,Text_N_N.txt} подаются на вход анализатору, который подсчитывает частоту встречаемости символов в кодировке UTF,и показывает два графика(или сохранят эти графики как-то, я с этим вообще не знаю как работать):что было,что стало. Вот как-то так. Примеры реализации, части кода, алгоритмы, предположения, рекомендации, буду рад любой помощи. |
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Анализатор текста | Xeon332 | Помощь студентам | 1 | 14.03.2010 17:24 |
Простейший анализатор текста | Marsel737 | Общие вопросы Delphi | 13 | 19.02.2010 07:52 |
Выделение текста | Sensizu | Компоненты Delphi | 0 | 01.10.2009 19:09 |
[Turbo Prolog] Анализатор текста на языке Pascal | Arkuz | Помощь студентам | 1 | 04.05.2009 20:41 |