Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Скриптовые языки программирования > PHP
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 09.02.2015, 16:34   #1
Luca Brasi
Пользователь
 
Аватар для Luca Brasi
 
Регистрация: 19.09.2012
Сообщений: 66
По умолчанию создание простого парсера

доброго времени. Уже не первый день раздумываю насчет решения. Можно вытянуть средствами пхп инфу из DOM, удаленного сайта? Если да, то как...
Мой скромный блог: www.progreso.com.ua
Luca Brasi вне форума Ответить с цитированием
Старый 09.02.2015, 16:54   #2
lomastr_
Форумчанин
 
Регистрация: 16.01.2015
Сообщений: 672
По умолчанию

Цитата:
Можно вытянуть средствами пхп инфу из DOM, удаленного сайта?
если найдете браузер которым можно будет управлять из пхп

зачем вам дом? выкиньте вы его из головы, начните с изучения протокола http
lomastr_ вне форума Ответить с цитированием
Старый 09.02.2015, 17:12   #3
Alex11223
Старожил
 
Аватар для Alex11223
 
Регистрация: 12.01.2011
Сообщений: 19,500
По умолчанию

http://www.programmersforum.ru/showthread.php?t=272932
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом.
Alex11223 вне форума Ответить с цитированием
Старый 09.02.2015, 17:21   #4
Luca Brasi
Пользователь
 
Аватар для Luca Brasi
 
Регистрация: 19.09.2012
Сообщений: 66
По умолчанию

что изучать в протоколе? Мне нужно инфу подтягивать с некоторых сайтов. Возможно я что то всецело недопонимаю, но что то мне подсказывает что задачу можно решить проще. Только я не знаю как.
Вы кажется в недавней моей теме утверждали, что любую инфу можно вытянуть из кода. Вот к примеру тут есть курс валют. https://www.privat24.ua/. Он то генерируется jаvаscr и в коде его не видно. Следовательно я не могу обработать к примеру считав файл в массив.
Мой скромный блог: www.progreso.com.ua
Luca Brasi вне форума Ответить с цитированием
Старый 09.02.2015, 17:23   #5
Alex11223
Старожил
 
Аватар для Alex11223
 
Регистрация: 12.01.2011
Сообщений: 19,500
По умолчанию

Ну раз видно в коде, то выполните GET запрос, получите в ответе HTML, используйте например XPath запросы для парсинга. По ссылке выше это ж и написано.

А для курсов валют обычно API есть. https://api.privatbank.ua/
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом.

Последний раз редактировалось Alex11223; 09.02.2015 в 17:27.
Alex11223 вне форума Ответить с цитированием
Старый 09.02.2015, 17:29   #6
lomastr_
Форумчанин
 
Регистрация: 16.01.2015
Сообщений: 672
По умолчанию

Цитата:
что изучать в протоколе?
ну хотябы то что передается текст и никакого дома в нем нет и быть не может.

Цитата:
Следовательно я не могу обработать к примеру считав файл в массив.
то что вы не можете не говорит о том что там этого нет, я вам там и говорил - доставать надо уметь.
если сайт имеет курсы то они есть а не из воздуха генерируются, только надо понять что к чему.
lomastr_ вне форума Ответить с цитированием
Старый 09.02.2015, 17:33   #7
lomastr_
Форумчанин
 
Регистрация: 16.01.2015
Сообщений: 672
По умолчанию

https://api.privatbank.ua/p24api/pub...=1423492295007 вот курсы
lomastr_ вне форума Ответить с цитированием
Старый 09.02.2015, 17:36   #8
buriat
Форумчанин
 
Регистрация: 28.06.2010
Сообщений: 189
По умолчанию

http://simplehtmldom.sourceforge.net/
buriat вне форума Ответить с цитированием
Старый 10.02.2015, 09:52   #9
Luca Brasi
Пользователь
 
Аватар для Luca Brasi
 
Регистрация: 19.09.2012
Сообщений: 66
По умолчанию

всем спасибо за ссылки. В моем случае обошелся с ЭйПиАй. А вот с XPath еще не разобрался, но буду более усиленно вникать.
Мой скромный блог: www.progreso.com.ua
Luca Brasi вне форума Ответить с цитированием
Старый 10.02.2015, 22:59   #10
Luca Brasi
Пользователь
 
Аватар для Luca Brasi
 
Регистрация: 19.09.2012
Сообщений: 66
По умолчанию

Господа, я так и не дошел до истины...
Цитата:
Ну раз видно в коде, то выполните GET запрос, получите в ответе HTML, используйте например XPath запросы для парсинга. По ссылке выше это ж и написано
Выполнил GET запрос, через file_get_content(). Получил исключительно исходный код страницы, в котором ничего интересующего меня нету. Потом пытаюсь использовать Xpath запрос, но желаемый результат не выводиться. Делал по аналогии с этим
Цитата:
если сайт имеет курсы то они есть а не из воздуха генерируются, только надо понять что к чему
Что погуглить чтобы понять?
Мой скромный блог: www.progreso.com.ua
Luca Brasi вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Создание и внедрение на сайт (MODX) простого калькулятора Al_hagen Фриланс 6 17.11.2014 18:25
Создание простого дома Mr.Drayzy Операционные системы общие вопросы 7 21.06.2010 14:50
TICQClient создание простого клиента betirsolt Работа с сетью в Delphi 7 19.02.2010 17:43