Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > IT форум > Общие вопросы по программированию, компьютерный форум
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 23.03.2012, 23:25   #1
сушка
Новичок
Джуниор
 
Регистрация: 21.05.2010
Сообщений: 1
Вопрос Поиск слов в файле

Здравствуйте, мне надо найти порядка 300 000 000 слов(по 5 байт) в случайном 1-5 гб бинарном файле. Подскажите, пожалуйста, какие алгоритмы поиска самые подходящие и быстрые?
На одном форуме мне предложили проиндексировать файл, подскажите как?
Просто перебором он лет 10 копать будет)
И, примерно, в лучшем случае, сколько по времени такой поиск займет?
сушка вне форума Ответить с цитированием
Старый 08.04.2012, 12:44   #2
s-andriano
Старожил
 
Аватар для s-andriano
 
Регистрация: 08.04.2012
Сообщений: 3,229
По умолчанию

Не совсем понятно, что нужно сделать.
- Что такое "слово"? Почему именно 5 байт? Как определяются границы слова?
- Что Вы подразумеваете под "бинарным" файлом? Я, например, при работе с большими текстовыми файлами ВСЕГДА загружаю их в память как бинарные. Так намного быстрее. Но от этого файлы не перестают быть текстовыми.
- Что Вы подразумеваете под словом "найти"? Т.е. пусть у нас на входе два файла: с 300 млн. имен и "бинарный", что хочется иметь на выходе?

Индексация - правильная идея, но в зависимости от задачи следует решить, что именно нужно индексировать.

Последний раз редактировалось s-andriano; 08.04.2012 в 14:16.
s-andriano вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
поиск слов в файле-словаре php nuevegramodelamor Помощь студентам 0 21.11.2010 18:46
Поиск данных в текстовом файле (в самом файле! а не в Memo и не загружая всю инфу из файла в одну строку glagoff Помощь студентам 1 05.05.2010 13:00
Поиск слов в текстовом файле svt Помощь студентам 8 07.11.2009 19:56
Поиск русских слов в файле getUp Общие вопросы C/C++ 3 23.10.2009 16:20