|
|
Регистрация Восстановить пароль |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
|
Опции темы | Поиск в этой теме |
15.02.2016, 19:23 | #1 |
Пользователь
Регистрация: 24.12.2010
Сообщений: 13
|
Помогите с парсером
День добрый пытаюсь написать парсер для сайта, но застрял на том что на первой странице у меня ссылки на последующие я собираю из в массив и нотом в цикле пытаюсь до них достучаться, но увы таблицы которая мне надо там нет. Открываю ссылку в браузере все работает. вчем дело???
PHP код:
|
16.02.2016, 10:55 | #2 |
юзер как все
Участник клуба
Регистрация: 10.01.2012
Сообщений: 1,586
|
Я не могу понять что тебе нужно ?
Парсить сайт по ссылке допустим http://site.com/ А если парсер находит втутренние ссылки типа /pageA или /pageB то их тоже парсить ? Получается такой рекурсивный парсинг, это цель ? Попробуй замени вот эту строку PHP код:
PHP код:
Если и у тебя отработает как нужно то вот это подключение файла можно смело убирать если ты его там больше не будешь использовать! PHP код:
<Дзен - Вся вселенная в тебе > | Резюме: https://ch3ll0v3k.github.io/CV/
Последний раз редактировалось pompiduskus; 16.02.2016 в 11:03. |
16.02.2016, 12:34 | #3 |
Пользователь
Регистрация: 24.12.2010
Сообщений: 13
|
Я хочу получив ссылку на команду, загрузить отдельно её статистику.
Код HTML:
<a href="/soccer/argentina/detail/almagro-002DshSN/">Almagro</a> Но при загрузке PHP код:
Тут разницы нет просто читал чтобы мол не забанили IP лучше там браузером представляться. |
16.02.2016, 12:49 | #4 |
юзер как все
Участник клуба
Регистрация: 10.01.2012
Сообщений: 1,586
|
Я просто не разбираюсь в спорте, ты вот про эту таблицу ?
<Дзен - Вся вселенная в тебе > | Резюме: https://ch3ll0v3k.github.io/CV/
|
16.02.2016, 13:13 | #5 |
Пользователь
Регистрация: 24.12.2010
Сообщений: 13
|
|
16.02.2016, 13:22 | #6 |
юзер как все
Участник клуба
Регистрация: 10.01.2012
Сообщений: 1,586
|
Вот зайдите вот сюда. и посмотри выводит ли то что вам нужно.
http://pompiduskus2.0fees.us/imgs/test.php
<Дзен - Вся вселенная в тебе > | Резюме: https://ch3ll0v3k.github.io/CV/
|
16.02.2016, 13:25 | #7 |
юзер как все
Участник клуба
Регистрация: 10.01.2012
Сообщений: 1,586
|
Аааа, я наверное понял. Нету самих цифр в колонках [ 1, X, 2] ?
Я глянул, скорее всего эти данные подгружаются Ajax-ом.
<Дзен - Вся вселенная в тебе > | Резюме: https://ch3ll0v3k.github.io/CV/
Последний раз редактировалось pompiduskus; 16.02.2016 в 13:29. |
16.02.2016, 13:33 | #8 | |
Пользователь
Регистрация: 24.12.2010
Сообщений: 13
|
Цитата:
Можно как то загрузить Страницу с отработаными скриптами и тд??? Последний раз редактировалось igrok_by; 16.02.2016 в 13:38. Причина: Добавил |
|
16.02.2016, 14:05 | #9 |
юзер как все
Участник клуба
Регистрация: 10.01.2012
Сообщений: 1,586
|
Скорее всегоконечно можно, нужно отслеживать запросы ajaxa и смотреть какие параметры куда передаюся. Я так по быстрому глянул.
Сходу не выдает результаты, так как не хватило параметров каких-то. Другими словами, если правильно передать параметры в запросе то он выдаст все что нужно, возможно даже чистым JSONом. Попробуйте отследить что от куда идет. Вот как пример, посмотри что он выдал. Это вроже то что нужно http://www.sportstats.com/ajax-table...yZDE3IjowfQ==/ или вот этот http://www.sportstats.com/ajax-table...sIjJkMTciOjB9/
<Дзен - Вся вселенная в тебе > | Резюме: https://ch3ll0v3k.github.io/CV/
Последний раз редактировалось pompiduskus; 16.02.2016 в 14:09. |
16.02.2016, 14:24 | #10 | |
Пользователь
Регистрация: 24.12.2010
Сообщений: 13
|
Цитата:
|
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Перевод нужен срочно помогите ) в течение 2 часов от Паскаля на Турбо СИ нужно помогите | Жанибек | Помощь студентам | 14 | 01.04.2015 17:23 |
[C#] Пoмoщь с парсером | JonMagon | Помощь студентам | 2 | 08.02.2012 15:44 |
Проблема с парсером | ckopnio | PHP | 11 | 01.11.2010 17:05 |
Помогите создать програму для роботы с файлами, пожалуйста помогите нужно очень срочно | Сергей Человек | Фриланс | 3 | 06.07.2009 19:30 |