Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Работа для программиста > Фриланс
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 22.08.2021, 03:45   #1
Another777
 
Регистрация: 29.11.2020
Сообщений: 5
По умолчанию Парсинг youtube - получить колличество лайков, дизлайков requests, beautifulsoup

Всем привет!

Столкнулся с проблемой при парсинге с ютуб.

Пытаюсь получить доступ к div:

Код:

import requests

from bs4 import BeautifulSoup

r = requests.get('https://www.youtube.com/watch?v=xxx')
soup = bs4.BeautifulSoup(r.text, "lxml")

container = soup.find_all('div')

for i in container:
	#print(i)
	print(i.get('id'))
	print(i.get('class'))
	print("-------------")


data = soup.find_all('div', {'id': 'content'})

#page-manager

for i in data:	
	
	if i.get('id') == "columns":
		print(i.get('id'))
	data2 = i.find_all('div')
	
	for j in data2:
		#pass
		if j.get('id') == "columns":
			print(j.get('id'))
		
		#print(j.get('class'))
		
		data3 = j.find_all('div')
		for n in data3:
			if n.get('id') == "columns":
				print(n.get('id'))
Код должен cпарсить div'ы с указанного url, но он выдаёт пустые списки.

Дело в том что BS видит код, таким как он был до выполнения всех скриптов,
и это может отличаться от html кода в средстве отладки браузера.

Надо сделать через requests/beautifulsoup, без google/youtube api.

Может кто нибудь сталкивался с чем-то подобным?
Another777 вне форума Ответить с цитированием
Старый 22.08.2021, 03:59   #2
Another777
 
Регистрация: 29.11.2020
Сообщений: 5
По умолчанию

Кто сможет помочь, написать готовое решение? Надо спарсить количество лайков и дизлайков с помощью requests/beautifulsoup. Не используюя регулярные выражения. Отблагодарю финансово, в рамках разумного.
Another777 вне форума Ответить с цитированием
Старый 22.08.2021, 12:55   #3
Avazart
Форумчанин
 
Аватар для Avazart
 
Регистрация: 13.08.2011
Сообщений: 184
По умолчанию

Запросам большинство сайтов в наше время не спарсить, скорее всего нужен селениум.
Но нужно смотреть.

Связаться со мной Вы можете по следующим контактам:
  • Icq: 673574224
  • E-mail: avazart.fl@gmail.com
  • Skype: присылайте свой ник на мой e-mail я Вас добавлю.
Огромная просьба сразу указывать:
  1. Ccылку на данную тему, что бы сразу было понятно о чем речь, без лишних слов.
  2. Предполагаемый предварительный бюджет или его рамки.
  3. Максимальные сроки в которые нужно выполнить ваш заказ.(конкретная дата или кол-во дней)
  4. Максимально полное и подробное техническое задание, если Вы его не указали или указали частично в вашей теме
    (желательно в виде MS Word документа с необходимыми иллюстрациями, схемами, скриншотами итп)

Работаю только с предоплатой! (от 30% до 100% от оговоренной суммы, в зависимости от типа задачи)
Предложения без указания "со старта" цены/сроков могут быть проигнорированы.
Для прикладных программ использую С++,C++Qt/Python(PyQt,Selenium)
Avazart вне форума Ответить с цитированием
Старый 02.09.2021, 16:39   #4
Larboss
Недо
Участник клуба
 
Регистрация: 11.08.2011
Сообщений: 1,394
По умолчанию

ТЗ, срок, бюджет: larbossfreelance@yandex.ru Метка: freelance. Указывайте ссылку на тему форума.
С помощью программирования можно разбогатеть и изменить мир к лучшему (с) Бьерн Страуструп
Larboss вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Не ставится from bs4 import BeautifulSoup satfan Python 7 14.01.2021 13:17
beautifulsoup zhukvs Python 3 09.09.2019 01:05
Как отсортировать комментарии на youtube по количеству лайков? isnalu Свободное общение 0 07.09.2018 22:00
Графическое отображение лайков и дизлайков как в youtube gufon PHP 2 06.06.2013 22:03
YOUTUBE delphi (парсинг) DjDram Работа с сетью в Delphi 24 07.12.2012 21:11