|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
31.10.2016, 10:39 | #1 |
Новичок
Джуниор
Регистрация: 31.10.2016
Сообщений: 1
|
Парсинг url
Готовлю ребенка к сдаче ГИА-9 (ОГЭ) по информатике. База вопросов выложена на сайте фипи. Сделано у них все весьма коряво: через сам сайт fipi зайти проблематично (там постоянно какие-то перебои). Получается зайти по ip: по такому адресу:
http://85.142.162.126/os/xmodules/qp...74F2D6E7955F06 Задания тут представлены большим списком, без тем, без какой-либо группировки, не удобно очень. Подумал написать небольшой скрипт для парсинга: Во-первых, перед тем, как эту страницу открывать, нужно посетить: http://85.142.162.126/os/xmodules/qprint/openlogin.php На которой получить идентификатор сессии и с которой будет перенаправление. Странички (как оказалось) в кодировке 1251, что для современного сайта, имхо, дичь. Ну да ладно, это я поборол, но вот тут не могу разобраться и тут залип: после того, как делаю запрос к странице он возвращает мне ее без заданий. Хотя точно такой же запрос в браузере – дает результат. Дебаг по JS не помог, в ресурсах тоже ничего не нашел (думал может задания подгружаются в процессе). Возможно дело в MathJax? Может еще в чем. Если кто-то сталкивался с чем-то подобным – помогите пожалуйста. Вот скрипт: Код:
|
31.10.2016, 11:34 | #2 |
Старожил
Регистрация: 12.01.2011
Сообщений: 19,500
|
Ну значит не точно такой же, берите снифер (Fiddler, Wireshark, F12—>Network, ...) и сравнивайте
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом. |
31.10.2016, 12:41 | #3 | |
Новичок
Джуниор
Регистрация: 11.02.2016
Сообщений: 1
|
Цитата:
Спасибо Alex11223 и спасибо Fiddler! |
|
31.10.2016, 13:14 | #4 |
Старожил
Регистрация: 12.01.2011
Сообщений: 19,500
|
В F12-Network есть галочка, чтобы не очищались запросы при переходе на другую страницу/редиректе.
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом. |
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Парсинг XML документа по URL | LukeSkywalker | Общие вопросы по Java, Java SE, Kotlin | 0 | 10.12.2012 21:31 |
Парсинг XML документа по URL (Java, Android) | LukeSkywalker | Мобильные ОС (Android, iOS, Windows Phone) | 1 | 10.12.2012 21:17 |
uniturlipv6.pas - парсинг url-а | lexesv | Работа с сетью в Delphi | 1 | 08.02.2012 13:03 |