![]() |
|
|
Регистрация Восстановить пароль |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
![]() |
|
Опции темы | Поиск в этой теме |
![]() |
#1 |
Пользователь
Регистрация: 01.12.2011
Сообщений: 52
|
![]()
В общем, начал я парсить html страницу, все прошло нормально, нашел все, что хотел. Результат я записал в мемо. Помимо нужной мне информации в мемо еще куча пустых строк, в которых только символы в роде таких: #$A и #$D.
Помогите пожалуйста от них избавиться. |
![]() |
![]() |
![]() |
#2 |
Старожил
Регистрация: 26.04.2008
Сообщений: 2,645
|
![]()
#$A и #$D это возврат и перевод каретки. В цикле проверять и ненужное выкидывать
Код:
|
![]() |
![]() |
![]() |
#3 |
Пользователь
Регистрация: 01.12.2011
Сообщений: 52
|
![]()
Что делать, если такие символы присутствуют в строчке с нужной мне информацией, не удалять же всю строчку? Взять ее отдельно в цикл, где будут удаляться только эти символы?
И еще, в строчках присутствуют и перевод и возврат каретки, и пробелы тоже, количество пробелов неизвестно. Что делать в таком случае? ------ Код:
Последний раз редактировалось Skalp; 04.07.2012 в 18:33. |
![]() |
![]() |
![]() |
#4 |
Старожил
Регистрация: 26.04.2008
Сообщений: 2,645
|
![]() |
![]() |
![]() |
![]() |
#5 |
Пользователь
Регистрация: 01.12.2011
Сообщений: 52
|
![]() |
![]() |
![]() |
![]() |
#6 |
Старожил
Регистрация: 08.04.2012
Сообщений: 3,229
|
![]()
А зачем их вообще удалять? Их нужно просто игнорировать.
При парсинге следует использовать такое понятие как "разделитель". Символы конца строки и возврата каретки являются такими же разделителями, как и пробел. И обрабатывать все эти символы нужно единообразно. Можно, конечно, пользоваться pos, copy и del, но это очень нерационально с точки зрения скорости обработки. |
![]() |
![]() |
![]() |
#7 |
Пользователь
Регистрация: 01.12.2011
Сообщений: 52
|
![]()
Тогда скажите, какие из этих символов возврат и перевод каретки (#$A #$D), и как понимать их комбинации типа #$A#$D#$A. И я не пойму, как их игнорировать, если я выполняю парс страницы с помощью регулярных выражений?
|
![]() |
![]() |
![]() |
#8 |
Старожил
Регистрация: 08.04.2012
Сообщений: 3,229
|
![]()
Символ, имеющий десятичный номер 10 или 16-чный $A, называется символом конца строки (LF), а 13 и $D соответственно - символом возврата каретки (CR).
Комбинация #$A#$D#$A в нормальном случае может встретиться только в виде #$D#$A#$D#$A, где она обозначает пустую строку. В DOS и Windows принято конец строки обозначать парой символов #$D#$A, в Unix для этих же целей принято использовать единственный символ #$A. |
![]() |
![]() |
![]() |
![]() |
||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
парс для сайта | Jadson | Работа с сетью в Delphi | 2 | 24.04.2012 17:16 |
Парс ссылки | cargo29 | Общие вопросы Delphi | 3 | 07.07.2011 18:32 |
Вставка особой нумерации на нечетные страницы с разрывом страницы | akokin | Microsoft Office Word | 13 | 20.10.2009 15:23 |
Динамическое изменение URL страницы в JavaScript без перезагрузки страницы | ilusha | JavaScript, Ajax | 7 | 25.02.2009 09:59 |
Как сделать разрыв страницы печати по условию и узнать номер страницы | Leanna | Microsoft Office Excel | 2 | 21.01.2008 06:59 |