|
|
Регистрация Восстановить пароль |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
12.09.2011, 07:43 | #1 |
Пользователь
Регистрация: 08.07.2011
Сообщений: 42
|
Алгоритм определения наличия текста в файле.
Всем доброго времени суток.
Собственно вопрос в теме. Есть произвольный бинарный файл, содержит набор спецсимволов типа %:?*№ и т.д. и текст "Привет, это тест!" Подскажите где копать, по поводу алгоритма определения текста в файле. Т.е. моя задача написать функцию, которая вернет мне 1, если файл, помимо спецсимволов содержит текст. Можно тупо загнать все символы в исключение и сканировать, но это долго и тупо. Подскажите где можно поискать алгоритмы распознавания текста в файле (точнее наличия текста, для начала) в фйле?? Заранее спасибо.
Created by KorPaEv...
|
12.09.2011, 08:01 | #2 | |
Android Developer
Старожил Подтвердите свой е-майл
Регистрация: 19.02.2007
Сообщений: 3,708
|
Цитата:
Ну а так, я уже ответил, проверять попадания байта (двух байт и больше в соответствии с кодировкой) в допустимый диапазон. |
|
12.09.2011, 08:13 | #3 | |
Пользователь
Регистрация: 08.07.2011
Сообщений: 42
|
Цитата:
Created by KorPaEv...
|
|
12.09.2011, 08:47 | #4 |
Старожил
Регистрация: 25.08.2011
Сообщений: 2,841
|
Да. Придется. Для начала определите какой набор символов может являться текстом, а потом сканируйте текст и проверяйте.
Skype - wmaster_s E-Mail - WorldMasters@gmail.com
Работаем по 3 критериям - быстро, качественно, недорого. Заказчик выбирает любые два. |
12.09.2011, 09:10 | #5 |
Форумчанин
Регистрация: 05.09.2011
Сообщений: 869
|
А как работает юниксовая команда strings?
Предпочитаю на "ты".
|
12.09.2011, 10:33 | #6 |
Android Developer
Старожил Подтвердите свой е-майл
Регистрация: 19.02.2007
Сообщений: 3,708
|
Либо так либо как я сказал, диапазон, т.е.
Код:
На самом деле, я считаю надо определить, ваши правила того, чего хотите найти в файле в итоге, я просто думаю вы сильно углубились, стоит абстрагироваться, стараться хотя бы. Перебор букв, в общем, это сильно вы углубились, лучше искать сочетание букв или слов и символов, т.е. конкретизировать поиск. |
12.09.2011, 11:00 | #7 | |
C++ hater
СтарожилДжуниор
Регистрация: 19.07.2009
Сообщений: 3,333
|
Код:
Цитата:
I invented the term Object-Oriented, and I can tell you I did not have C++ in mind. (c)Alan Kay
My other car is cdr. Q: Whats the object-oriented way to become wealthy? A: Inheritance |
|
12.09.2011, 11:37 | #8 |
Android Developer
Старожил Подтвердите свой е-майл
Регистрация: 19.02.2007
Сообщений: 3,708
|
Я знал! Верно, так лучше, давно не писал тем более такого, на С++. В Java есть такая штука Character, просто не знал аналогичного в C++.
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Алгоритм определения стоящих рядом одинаковых чисел, что не так. | leshij | Паскаль, Turbo Pascal, PascalABC.NET | 2 | 12.02.2011 16:05 |
Необходимо переделать процедуру ooo.sum_m в функцию определения наличия отрицательных элементов | ul_m | Помощь студентам | 4 | 10.01.2009 20:32 |
Алгоритм поиска HEX строки в файле | Vlad_3310 | Общие вопросы Delphi | 8 | 17.06.2008 10:02 |