|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
23.07.2010, 17:17 | #1 |
Новичок
Джуниор
Регистрация: 23.07.2010
Сообщений: 1
|
Как собирать объявления с других сайтов в один общий?
Добрый день.
Подскажите, возможно ли создать программу, которая будет заходить на другие сайты-каталоги и собирать на них размещенные объявления, фильтровать дубли и автоматически размещать полученные объявления на одном общем сайте? Какие могут быть препятствия и возможно ли их преодолеть? |
23.07.2010, 20:28 | #2 |
Форумчанин
Регистрация: 31.05.2009
Сообщений: 786
|
Возможно. Это можно сделать при помощи так называемых "парсеров". Программ, которые под видом пользователя заходят на сайты, считывают содержимое страниц сайта и парсят его, забирая из html-текста только нужную информацию. Лучше всего делать такой парсер на основе механизма регулярных выражений (RegExp).
Из препятствий - на сайте может стоять анти-парсинг защита (обычно на основе JavaScript). Но ее можно обойти полной эмуляцией действий пользователя в браузере. Медленно, но надежно Иногда сайты меняют оформление, в таком случае приходится корректировать программы-парсеры. |
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Как в один лист можно собрать данные с других листов | Lis000iq | Microsoft Office Excel | 12 | 24.08.2015 12:51 |
как реализовать общий счётчик объектов класса? | ZigaZaga | Общие вопросы по Java, Java SE, Kotlin | 7 | 18.06.2010 10:51 |
Как отключить ''простой общий доступ к файлам''? | DomiNick | Операционные системы общие вопросы | 2 | 26.10.2009 23:34 |
Как найти общий делитель? | Xcopy | Общие вопросы Delphi | 2 | 13.09.2009 17:53 |