|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
14.10.2014, 02:17 | #1 |
Регистрация: 13.10.2014
Сообщений: 3
|
парсинг
Кто нибудь может помочь с парсингом. Я только недавно начала заниматься этим вопросом. Начала с авито впринципе и в работе бы пригодилась програмка. Главная цель изучить. Пока получилось только спарсить все URL и ID с первой страницы. Помогите пожалуйста.
|
14.10.2014, 05:08 | #2 |
Участник клуба
Регистрация: 19.01.2009
Сообщений: 1,453
|
А чем конкретно помогать? Вы же парсите URL и ID, значит уже умейте работать с pos, posEx, delete, copy ? а если да, то могу посоветовать только использовать регулярные ворожения, для этого вам понадобится компонент regexpr.
|
14.10.2014, 07:28 | #3 |
Белик Виталий :)
Старожил
Регистрация: 23.07.2007
Сообщений: 57,097
|
Можно использовать ActiveX IE.
Вот примерно так: http://www.programmersforum.ru/showthread.php?t=262558
I'm learning to live...
|
14.10.2014, 19:51 | #4 |
Регистрация: 13.10.2014
Сообщений: 3
|
Я использовала regexpr. Не пойму в каком нарправлении дальше двигаться. Как зациклить на все страницы? И правильная идея вначале спарсить все URL со страницы затем в каждую заходить или одну спарсила потом зашла затем след спарсила? И еще думаю возникнуть проблемы т.к. они защищаются от парсинга плюс номера телефонов в картинке.
|
14.10.2014, 20:03 | #5 | |
Белик Виталий :)
Старожил
Регистрация: 23.07.2007
Сообщений: 57,097
|
Цитата:
I'm learning to live...
|
|
16.10.2014, 10:06 | #6 | |||
Форумчанин
Регистрация: 12.02.2009
Сообщений: 215
|
Цитата:
Цитата:
Цитата:
Помог с вопросом - тыркаем в весы, Вам не сложно, а мне приятно
|
|||
19.10.2014, 22:24 | #7 | |
Регистрация: 13.10.2014
Сообщений: 3
|
Цитата:
|
|
19.10.2014, 23:13 | #8 | ||
Старожил
Регистрация: 30.12.2009
Сообщений: 11,426
|
Цитата:
Изучаем, какой запрос уходить чтоб получить след. выборку данных, запоминаем запрос, смотрим куда там вставить 20 чтоб попасть на 20 страницу. И погнали... Собрали ссылки, добавили +1 к странице, получили след. страницу, собрали ссылки, снова +1 и так далее.. Ну и проверка, что страницы не закончились(брать макс. возможный отображаемый номер страницы в навигаторе). Цитата:
А ещё ещё AJAX загрузка данных на страницу, без её перезагрузки - вот где ад для разработчиков парсеров AJAX сейчас в моде. Кстати у IE есть клевая фишка, если конкретнее это программный доступ к DOM. Можно свои JS внедрять... я таким макаром XPath к html приспособил. Очень облегчает жизнь. Последний раз редактировалось Человек_Борща; 19.10.2014 в 23:19. |
||
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
парсинг | Nonesa | C# (си шарп) | 3 | 01.06.2014 18:21 |
Парсинг | WeezyWayne | Общие вопросы Delphi | 6 | 26.04.2014 18:29 |
парсинг | gunguru | PHP | 1 | 07.06.2012 11:49 |
Парсинг | Gudzik11 | Общие вопросы Delphi | 6 | 15.04.2012 21:51 |
Парсинг | tigrend | PHP | 8 | 02.10.2011 00:09 |