![]() |
|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
![]() |
|
Опции темы | Поиск в этой теме |
![]() |
#1 |
Новичок
Джуниор
Регистрация: 30.05.2009
Сообщений: 2
|
![]()
Здравствуйте.
Есть файл, весом в 64 гб. Там больше 1кк строк. Нужно сделать из него выборку. Т.е. сравниваем каждую строку с шаблоном(регулярка), и, если совпало, то записываем в другой файл. А проблема вся в скорости. Я написал скрипт на перле, но выборка из такого файла занимает более 3-х суток(само регулярное выражение большое), что очень много. Есть какие нибудь идеи? Вообще, не обязательно делфи, главное что бы это можно было как то ускорить. Заранее спасибо за ответы. |
![]() |
![]() |
![]() |
#2 |
Старожил
Регистрация: 28.01.2009
Сообщений: 20,999
|
![]()
да там в принципе дело в переборе.
может вам все-таки разбить файл на части и попробовать распараллелить? Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
Программа делает то что написал программист, а не то что он хотел. Функции/утилиты ждут в параметрах то что им надо, а не то что вы хотите. |
![]() |
![]() |
![]() |
#3 | |
Старожил
Регистрация: 30.12.2009
Сообщений: 11,442
|
![]() Цитата:
Режьте файл, переделайте его в БД, а из БД делайте выборку. БД по-шустрее будет в плане всего. |
|
![]() |
![]() |
![]() |
#4 |
Старожил
Регистрация: 17.11.2010
Сообщений: 19,042
|
![]()
Не обязательно базу создавать. Тот же FileStream совершенно не читает весь файл в ОП. Читать поблочно, отказаться от регулярок, использовать для парсинга Pos, PosEx. 3-ое суток как минимум не будет. И распараллелить не помешает как выше подсказывают
Если бы архитекторы строили здания так, как программисты пишут программы, то первый залетевший дятел разрушил бы цивилизацию
|
![]() |
![]() |
![]() |
#5 |
Новичок
Джуниор
Регистрация: 30.05.2009
Сообщений: 2
|
![]()
Всем спасибо за ответы, пойду пробовать.
|
![]() |
![]() |
![]() |
#6 |
Форумчанин
Регистрация: 05.07.2010
Сообщений: 136
|
![]()
Хочу уточнить у тех, кто сталкивался с такими конскими объемами данных, если файл данных читать в оперативку блоками скажем по 2Гб и уже там обрабатывать - будет существенно быстрее или не особо?
|
![]() |
![]() |
![]() |
#7 |
Старожил
Регистрация: 30.12.2009
Сообщений: 11,442
|
![]()
igh0st, нет, не будет. В систме есть встроеные средства для очень больших файлов. Называется "Файловый маппинг".
|
![]() |
![]() |
![]() |
Опции темы | Поиск в этой теме |
![]() |
||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
РазXORивание большого файла | Человек_Борща | Общие вопросы Delphi | 9 | 21.05.2013 16:47 |
импорт данных из большого txt файла | Неологист | Microsoft Office Excel | 14 | 28.09.2011 18:45 |
Выборка данных из одного файла в другой | Kerstone | Microsoft Office Excel | 1 | 01.04.2011 02:39 |
выборка данных из текстового файла | uraura | Общие вопросы Delphi | 3 | 27.11.2010 16:34 |
Выборка данных из Excel файла | CraZZy RabbIt | PHP | 5 | 23.07.2010 03:27 |