|
|
Регистрация Восстановить пароль |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
18.06.2013, 16:24 | #1 |
Форумчанин
Регистрация: 07.04.2012
Сообщений: 216
|
Парсер веба и С++
Появилась нужда сделать парсер "Трекера" на хабре, но у него нет Апи своего, поэтому мне нужно как-то связать веб-язык с С++, на вебе сделать парсер, а на С++ вывод. Как такую связку можно реализовать?
|
18.06.2013, 16:39 | #2 |
Старожил
Регистрация: 12.01.2011
Сообщений: 19,500
|
Что за "связать веб-язык с С++"? Вы о чем? Зачем что-то связывать?
Просто загружаете страницу соответствующим HTTP запросом, получаете в ответ HTML код, достаете из него что надо. В С++ не знаю с помощью каких библиотек это удобнее делается.
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом. |
18.06.2013, 16:44 | #3 |
Форумчанин
Регистрация: 07.04.2012
Сообщений: 216
|
Да? Пока что не работал с вебом через С++, кто знает, расскажите как это реализовать на С++ тогда.
|
18.06.2013, 17:22 | #4 |
Старожил
Регистрация: 30.12.2009
Сообщений: 11,430
|
RussDragon
Что за проблема у вас? Посылаете GET запрос по HTTP протоколу на нужный адрес http://... к вам возвращается массив текста(исходный код страницы в html). Вы этот код разбираете на нужные части(выбирает оттуда необходимое)(Простые операции со строками: поиск, копирование, удаление. Или регулярные выражения) а с остальным делаете то, что вам нужно. Для C++ посмотрите cURL, LibcURL |
18.06.2013, 17:30 | #5 |
Форумчанин
Регистрация: 07.04.2012
Сообщений: 216
|
Вот так выглядит трекер P.S. Какую версию качать? SSL? Последний раз редактировалось RussDragon; 18.06.2013 в 17:37. |
18.06.2013, 17:38 | #6 |
Старожил
Регистрация: 30.12.2009
Сообщений: 11,430
|
Это простая HTML таблица.
Нашли <table> далее нашли </table> , скопировали текст между двумя этими позициями, получили только необходимое(таблица). Нашли тег <td> нашли </td> скопировали текст между ними во временную переменную, а в ней: 3 раза нашли <tr> далее </tr>. 1 раз - это ник 2 раз - название темы 3 раз - кол-во ответов |
18.06.2013, 18:00 | #7 |
Форумчанин
Регистрация: 07.04.2012
Сообщений: 216
|
Ага, спасибо. Но тем не менее, какую версию библиотеки качать?
|
18.06.2013, 18:03 | #8 |
Старожил
Регистрация: 30.12.2009
Сообщений: 11,430
|
RussDragon, не знаю. Любую, чтобы просто присмотреться и попробовать.
А когда научитесь пользоваться инструментом, можно и на более новый перейти. Я не использую cURL, просто вспомнил что с её помощью можно такое делать. SSL для HTTPS протокола. Если у вас просто HTTP то SSL вам не нужен. Последний раз редактировалось Человек_Борща; 18.06.2013 в 18:20. |
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Парсер | qiperman | Работа с сетью в Delphi | 4 | 29.04.2013 22:16 |
Проверка данных из Веба на соответствие заданному условию без вставки их на лист | Snekich | Microsoft Office Excel | 6 | 23.11.2011 20:18 |
парсер | shanluu | PHP | 3 | 31.05.2011 17:59 |
парсер на C# | newerwiner | C# (си шарп) | 1 | 08.05.2011 16:16 |
Парсер | Ronin333 | Общие вопросы C/C++ | 3 | 15.04.2010 14:00 |