Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > IT форум > Помощь студентам
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 12.10.2014, 15:06   #1
asoman
 
Регистрация: 12.10.2014
Сообщений: 5
По умолчанию Загрузка html кода

Здравствуйте! Столкнулся с проблемой: необходимо загрузить html код страницы. Немного знаком с javascript, да и в дальнейшем на js было бы проще работать, но насколько я понял из гугла, подобное на этом языке не осуществимо. Могу, умею C++, начинаю учить Java (было бы неплохо для тренировки решить именно на этом языке)

Суть вопроса: На каком ЯП загрузить html код из интернета будет проще и какими средствами это осуществить?

Заранее благодарю!
asoman вне форума Ответить с цитированием
Старый 12.10.2014, 15:18   #2
Stilet
Белик Виталий :)
Старожил
 
Аватар для Stilet
 
Регистрация: 23.07.2007
Сообщений: 57,097
По умолчанию

Загрузить для чего? Одноразовая задача? - открываешь браузер и сохраняешь страницу. Многоразовая? - на любом ЯВУ, смотря что ты там такое пишешь. Понятное дело, надеюсь, что если ты пишешь на Фокспро (к примеру) то и загружать нужно не на Питоне.
С++ ? Кажись хвалят CURL .http://pblog.ru/?p=607
Плюс если под винду - WinINET. http://www.programmersforum.ru/showt...d=1#post856077
I'm learning to live...
Stilet вне форума Ответить с цитированием
Старый 12.10.2014, 15:24   #3
min@y™
Цифровой кот
Старожил
 
Аватар для min@y™
 
Регистрация: 29.08.2014
Сообщений: 7,629
По умолчанию

Цитата:
На каком ЯП загрузить html код из интернета
загрузить куда?
Расскажу я вам, дружочки, как выращивать грибочки: нужно в поле утром рано сдвинуть два куска урана...
min@y™ вне форума Ответить с цитированием
Старый 12.10.2014, 15:25   #4
asoman
 
Регистрация: 12.10.2014
Сообщений: 5
По умолчанию

Конечно же многоразовая загрузка. Спасибо, попробую с CURL разобраться. Насколько плохой идеей будет через C++ сохранять 100+ страниц, а затем с помощью js их перебирать и обрабатывать?

Загрузить в какую либо переменную или нечто подобное (с js планировал в невидимый div загружать на странице) Ну или просто в папку в виде html документа.
asoman вне форума Ответить с цитированием
Старый 12.10.2014, 15:28   #5
Stilet
Белик Виталий :)
Старожил
 
Аватар для Stilet
 
Регистрация: 23.07.2007
Сообщений: 57,097
По умолчанию

Цитата:
Насколько плохой идеей будет через C++ сохранять 100+ страниц, а затем с помощью js их перебирать и обрабатывать?
Найгадоснейшей. Не знаю как с JS.Node может там и удастся, а обычным JS - забудь.
Лучше расскажи что именно тебе нужно будет обрабатывать.
Ибо возможно тебе попроще будет использовать IHTMLDocument для загрузки и парсинга страниц.
I'm learning to live...
Stilet вне форума Ответить с цитированием
Старый 12.10.2014, 15:32   #6
asoman
 
Регистрация: 12.10.2014
Сообщений: 5
По умолчанию

Нужно поисковую выборку с сайта распарсить и сохранить в отдельный файл ссылки на удовлетворяющие критериям запросы. Как то так. Предчувствую, я тот ещё велосипед пытаюсь написать.
asoman вне форума Ответить с цитированием
Старый 12.10.2014, 17:53   #7
Stilet
Белик Виталий :)
Старожил
 
Аватар для Stilet
 
Регистрация: 23.07.2007
Сообщений: 57,097
По умолчанию

Ну либо парсер свой писать под конкретный сайт, либо использовать IHTMLDocument. А вот второе предпочел. Там XPath помогает отобрать ссылки. Код дать не могу, ибо он не на си )
I'm learning to live...
Stilet вне форума Ответить с цитированием
Старый 13.10.2014, 07:37   #8
challengerr
Участник клуба
 
Аватар для challengerr
 
Регистрация: 30.07.2008
Сообщений: 1,601
По умолчанию

Код:
#include <stdio.h>
#include <windows>
#include <WinSock.h>

int main()
{
WSADATA data;
SOCKET sock;
SOCKADDR_IN sockaddr
PHOSTENT phe
char buf[1024]:

WSAStartup(0x101, &data);
sock = socket(AF_INET, SOCK_STREAM, 0);
sockaddr.sin_family = AF_INET;
sockaddr.sin_port = htons(80);
phe = gethostbyname("mail.ru");
memcpy(( char FAR*)&(sockaddr.sin_addr), phe->h_addr, phe->h_length);
connect(sock, (PSOCKADDR) &sockaddr.sizeof(sockaddr));
send(sock, "GET /\nHost: mail.ru\n\n", 21, NULL);
while(recv(sock, buf, 1024, NULL))
printf("%s\n", buf);
WSACleanup();
return 0;
}
Java выбросьте в мусорное ведро и убейте об стену. Учите C++.
"SPACE.THE FINAL FRONTIER.This's a voyage of starship Enterprise. It's 5-year mission to explore strange new worlds,to seek out new life and civilizations,to boldly go where no man has gone before"
challengerr вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
загрузка HTML-кода Alex54 C/C++ Сетевое программирование 4 03.06.2011 23:19
Загрузка html страницы DinamoBrynsk Работа с сетью в Delphi 6 13.12.2010 14:16
Загрузка кода с другого сервера Форсировка JavaScript, Ajax 2 18.11.2010 11:26
Загрузка html из EXE Shouldercannon Общие вопросы Delphi 9 21.01.2010 19:18
Выдернуть куски кода из html-кода trafbite Помощь студентам 7 18.08.2007 13:51