|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
06.11.2011, 15:48 | #1 |
Новичок
Джуниор
Регистрация: 06.11.2011
Сообщений: 1
|
Программа для парсинга HTML страницы
Моя задача состоит в том чтобы я написал программу в которой вводишь URL и она заходит на эту страницу и ищет там ссылки <a href и вытягивает http://google.com потом записывает ссылку эту в файл и в конца у нас в файле есть все ссылки с страницы потом она берет эти ссылки,заходит по ним и ищет в них уже новые ссылки и так в 5 слоев... Выходит некое дерево! Я уже реализовал коннект к сайту и запись всего содержимого в файл контента... моя задача теперь распарсить либо файл, либо сразу входной поток! препод говорил юзать регулярки! Но я не пойму ведь регулярные проверяют на валидность имя пользователя или мыло или адресс а не целый HTML документ, или можно делать поиск по регулярным ? хотя можно с таким успехом подстроку в строке где начало <a href
Кто подскажет как решить проблему ? |
08.11.2011, 11:47 | #2 |
Пользователь
Регистрация: 15.12.2009
Сообщений: 11
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Регулярка для парсинга ссылки | MyXa | PHP | 1 | 03.11.2011 15:11 |
Нужен скрипт для парсинга | 111Alex111 | Фриланс | 2 | 19.09.2011 22:57 |
Программа для подсчета количества посещения моей страницы кем-то из друзей. | Kasper1 | Свободное общение | 8 | 03.09.2011 22:29 |
Компоненты для парсинга страниц!!! | $T@LKER | Работа с сетью в Delphi | 14 | 20.02.2011 17:17 |
Программа для парсинга описаний | chilinik | Общие вопросы Delphi | 2 | 07.10.2009 10:17 |