|
|
Регистрация Восстановить пароль |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
|
Опции темы | Поиск в этой теме |
26.07.2022, 19:21 | #1 |
Пользователь
Регистрация: 26.07.2022
Сообщений: 14
|
Парсер сайтов
Добрый вечер! Есть скрипт на Питоне. Парсит forebet, predictz, windrawwin, soccervista, prosoccer, vitibet .
Хочу добавить туда еще сайт http://www.scorepredictor.net/index....ction=football Код:
|
26.07.2022, 19:23 | #2 |
Пользователь
Регистрация: 26.07.2022
Сообщений: 14
|
продолжение кода
Код:
Код:
|
27.07.2022, 02:17 | #3 |
МегаМодератор
СуперМодератор
Регистрация: 09.11.2010
Сообщений: 7,359
|
Код:
Пишите язык программирования - это форум программистов, а не экстрасенсов. (<= это подпись )
|
27.07.2022, 19:48 | #4 |
Пользователь
Регистрация: 26.07.2022
Сообщений: 14
|
Огромное спасибо, подкорректировал вроде работает, завтра больше матчей проверю
Код:
|
27.07.2022, 19:52 | #5 | |
Пользователь
Регистрация: 26.07.2022
Сообщений: 14
|
Цитата:
Код:
|
|
28.07.2022, 01:36 | #6 |
МегаМодератор
СуперМодератор
Регистрация: 09.11.2010
Сообщений: 7,359
|
Не до конца понял ваш вопрос. Можно открыть страницу в браузере и через кнопку "Посмотреть код" прикинуть, какие именно теги и классы искать. Хотя, например, Хром балуется и вставляет tbody тег внутрь table. Можно прямо в коде скрипта добавить print(resp.content) и посмотреть, что именно получает скрипт, чтобы подкорректировать условия поиска. Можно увидеть, что описания матчей хранятся в строках таблицы (tr), но первая строка содержит не матч, поэтому пропускается.
Пишите язык программирования - это форум программистов, а не экстрасенсов. (<= это подпись )
|
28.07.2022, 20:11 | #7 |
Пользователь
Регистрация: 26.07.2022
Сообщений: 14
|
Ну как вариант на примере сайта https://primatips.com
если сайт использует тег span, то можно найти скрипт-код аналогичного сайта использующего этот тег, и уже ровняться на этот макет, или в программировании так не получится ? вот пример Код:
Код:
Последний раз редактировалось OlegShtompel; 28.07.2022 в 20:26. |
29.07.2022, 00:31 | #8 |
МегаМодератор
СуперМодератор
Регистрация: 09.11.2010
Сообщений: 7,359
|
Для меня эти два примера кода аналогичны. Дело-то не в теге span, просто на forebet можно однозначно находить нужный текст (ищя элемент по тегу, классу, свойствам), а на scorepredictor приходится ориентироваться на порядковый номер в списке элементов. Пожалуй, первый подход лучше, но если сайт сильно переделают, то код при любом подходе придется переделывать. Используйте в качестве основы тот код, который вам понятнее и легче менять.
Пишите язык программирования - это форум программистов, а не экстрасенсов. (<= это подпись )
|
29.07.2022, 13:46 | #9 |
Пользователь
Регистрация: 26.07.2022
Сообщений: 14
|
Подскажите пожалуйста, на примере сайта https://primatips.com/
Я сделал скрины и шаги внизу написано под картинкой свои расчёты, где ошибка. В итоге у меня получился такой код Код:
|
29.07.2022, 21:35 | #10 |
МегаМодератор
СуперМодератор
Регистрация: 09.11.2010
Сообщений: 7,359
|
В коде есть опечатки, из-за которых он просто не исполняется. Только при поиске по классу нужно писать class_ (т.к. слово class зарезервировано в питоне), а при поиске по id, так и надо писать id, не забывая про знак равенства. Первый find_all("span") найдет span на всех уровнях вложенности, а не только на первом уровне вложенности. В цикле "for game in :" нужно указывать после in какие именно элементы перебирать. На сайте щедро разбросаны классы, так что не нужно мучиться с подсчетом позиций:
Код:
Пишите язык программирования - это форум программистов, а не экстрасенсов. (<= это подпись )
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Парсер новостей с новостных сайтов разумеется =) | maxvel0007 | Фриланс | 6 | 17.10.2017 22:59 |
Парсер поиска любых контактов и определения категорий сайтов | Dumas | Софт | 0 | 12.06.2015 14:40 |
Php парсер части сайтов) | Fahman | PHP | 6 | 15.12.2013 17:14 |
Требуется написать парсер-граббер сайтов | bashkov | Фриланс | 4 | 28.07.2009 01:12 |