Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Скриптовые языки программирования > PHP
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 16.06.2022, 10:28   #1
Chaser_81
Пользователь
 
Регистрация: 09.04.2007
Сообщений: 37
Лампочка Скачать сайт через Selenium

Всем привет! Не получается скачать страницу сайта на селениуме и ОС Linux Red Hat.

Последовательность действий:
- скачал вот это https://github.com/php-webdriver/php-webdriver
- подключил в PHP-скрипт require_once $_SERVER['DOCUMENT_ROOT'].'/.../vendor/autoload.php';
- отсюда http://selenium-release.storage.goog...com/index.html скачал selenium-server-standalone-3.5.3.jar
- запустил команду "java -jar selenium-server-standalone-3.5.3.jar -role hub"
- получил такой скрин (вроде все что нужно запущено) - Selenium Grid hub is up and running...
- а вот тут в коде почему-то не срабатывает - доходит до пункта отладки 4.1 и дальше не идет
- в итоге не качает страницу
- а как это исправить не понятно

Подскажите, что я делаю не так?
Изображения
Тип файла: png question-java-console.png (49.9 Кб, 20 просмотров)
Тип файла: png question-code.png (77.8 Кб, 2 просмотров)
SiteAnalyzer - анализ и аудит сайта. Telegram: @majento

Последний раз редактировалось Chaser_81; 16.06.2022 в 10:30.
Chaser_81 вне форума Ответить с цитированием
Старый 13.12.2022, 10:49   #2
web developer
Пользователь
 
Регистрация: 04.06.2022
Сообщений: 62
По умолчанию

Вы можете использовать приведенный ниже код для загрузки страницы HTML:
Код:
from selenium import webdriver

driver = webdriver.Chrome()
driver.get("http://www.yahoo.com")
with open("/path/to/page_source.html", "w") as f:
    f.write(driver.page_source)
Просто замените "/path/to/page_source.html"желаемый путь к файлу и имя файла

Обновлять

Если вам нужно получить полный исходный код страницы (включая CSS, JS, ...), вы можете использовать следующее решение:
Код:
pip install pyahk # from command line
код python
Код:
Вы можете использовать приведенный ниже код для загрузки страницы HTML:

from selenium import webdriver

driver = webdriver.Chrome()
driver.get("http://www.yahoo.com")
with open("/path/to/page_source.html", "w") as f:
    f.write(driver.page_source)
Просто замените "/path/to/page_source.html"желаемый путь к файлу и имя файла

Обновлять

Если вам нужно получить полный исходный код страницы (включая CSS, JS, ...), вы можете использовать следующее решение:

pip install pyahk # from command line
Pythonкод:

from selenium.webdriver.firefox.firefox_binary import FirefoxBinary
import ahk

firefox = FirefoxBinary("C:\\Program Files (x86)\\Mozilla Firefox\\firefox.exe")
from selenium import webdriver

driver = web.Firefox(firefox_binary=firefox)
driver.get("http://www.yahoo.com")
ahk.start()
ahk.ready()
ahk.execute("Send,^s")
ahk.execute("WinWaitActive, Save As,,2")
ahk.execute("WinActivate, Save As")
ahk.execute("Send, C:\\path\\to\\file.htm")
ahk.execute("Send, {Enter}")
web developer вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Переключение страниц на сайте через Selenium fanat_96 C# (си шарп) 1 22.04.2018 10:51
Сайт.рф - Не могу скачать через Indy.Get grib_aga Работа с сетью в Delphi 4 18.04.2014 00:57
Невозможность скачать мелодию через сайт Yorik93 Свободное общение 2 15.07.2012 19:09
Скачать сайт целиком vlrnk PHP 17 11.08.2011 10:42
Скачать сайт W0LF Работа с сетью в Delphi 2 17.02.2010 18:57