![]() |
|
|
Регистрация Восстановить пароль |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
![]() |
|
|
Опции темы | Поиск в этой теме |
![]() |
#1 |
Пользователь
Регистрация: 13.10.2013
Сообщений: 15
|
![]()
Здравствуйте, у меня такая проблема:
1) Нужно спарсить информацию в спойлере, но пока не откроешь спойлер, то не спарсишь. (причем нужно спарсить все спойлеры на странице) - Как я понимаю, чтобы спарсить, нужно открывать программно все спойлеры на странице, и парсить, но как открыть я беспонятия ![]() Пример вот тут, оттуда нужно спарсить содержимое всех спойлеров. вид содержимого спойлера что-то вроде: Код HTML:
<embed src="http://video.rutube.ru/321c98ea1b9d8604c9d2cc108414d0d7" type="application/x-shockwave-flash" wmode="window" allowfullscreen="true" height="450" width="600">
Код HTML:
[spoiler=Тут название спойлера][center]Тут содержимое спойлера[/center][/spoiler] |
![]() |
![]() |
![]() |
#2 |
Форумчанин
Регистрация: 16.03.2013
Сообщений: 599
|
![]()
Если информация грузится динамически по мере нажатия джава-скриптами - надо использовать TWebBrowser и оттуда брать текст уже после перехода на конкретную страницу и перещелкав все что надо.
Сам 2 недели назад бот один писал для сайта, иначе никак. TIdHttp не умеет работать с скриптами. А как парсить - уже дело твое. В интернете куча способов, я же писал алгоритм на основе pos'ов. Про сумму строк в дельфях и как к отпарсеной инфе пару слов добавить - промолчу.
alextrof94$gmail.com
|
![]() |
![]() |
![]() |
#3 | |
Пользователь
Регистрация: 13.10.2013
Сообщений: 15
|
![]() Цитата:
![]() |
|
![]() |
![]() |
![]() |
#4 |
Далеко не
Участник клуба
Регистрация: 11.08.2011
Сообщений: 1,512
|
![]()
alextrof94, отличный метод, для новичка самое то.
Берешь Thttpsend грузишь страницу, Tregexpr'ом парсишь все, что тебе угодно и откуда подгружается и куда, и зачем. |
![]() |
![]() |
![]() |
#5 |
Форумчанин
Регистрация: 16.03.2013
Сообщений: 599
|
![]()
Я где то тут про js обновляемые страницы спрашивал и про то как с этим работать. BDA ответил, что tidhttp с js не работает, а вот через wb это осуществить легко и просто.
alextrof94$gmail.com
|
![]() |
![]() |
![]() |
#6 | |
Старожил
Регистрация: 30.12.2009
Сообщений: 11,434
|
![]() Цитата:
|
|
![]() |
![]() |
![]() |
#7 | |
Форумчанин
Регистрация: 16.03.2013
Сообщений: 599
|
![]() Цитата:
"Если информация грузится динамически по мере нажатия джава-скриптами - надо использовать TWebBrowser и оттуда брать текст уже после перехода на конкретную страницу и перещелкав все что надо." Я имел ввиду программно выполнить щелчки по нужным "спойлерам". UPD: Ой, сори, Человек_Борща, я увидел мое имя в начале и подумал мне адресовано =)
alextrof94$gmail.com
|
|
![]() |
![]() |
![]() |
#8 |
Далеко не
Участник клуба
Регистрация: 11.08.2011
Сообщений: 1,512
|
![]()
Человек_Борща, почему же не прокатит? если url подгрузки можно спарсить, то можно.
|
![]() |
![]() |
![]() |
#9 | ||
Старожил
Регистрация: 30.12.2009
Сообщений: 11,434
|
![]() Цитата:
Цитата:
Последний раз редактировалось Человек_Борща; 14.10.2013 в 11:11. |
||
![]() |
![]() |
![]() |
#10 |
Форумчанин
Регистрация: 22.12.2010
Сообщений: 175
|
![]()
А можно просто разобрать все скрипты, подумать, и сообразить с idhttp
Здравствуйте
|
![]() |
![]() |
![]() |
|
![]() |
||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Скрипт конвертера валют или как корректно спарсить xml | miscwrk | JavaScript, Ajax | 1 | 22.04.2012 06:11 |
[Вопрос] Как спарсить ссылки которые выдаёт поисковик | O'NeiLL | Общие вопросы Delphi | 8 | 15.03.2012 19:45 |
Как получить информацию о БД? | Belarus | SQL, базы данных | 1 | 14.07.2010 19:09 |
Как считать информацию с CD\DVD? | Bullterrier | Общие вопросы Delphi | 3 | 12.01.2010 00:13 |
как загружать информацию с сайта | lg12 | Работа с сетью в Delphi | 2 | 05.08.2009 15:24 |