Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Скриптовые языки программирования > Python
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 15.04.2020, 16:54   #1
Димитрий22
 
Регистрация: 29.07.2019
Сообщений: 7
По умолчанию Проблема в кодировке при парсинге

Уважаемые программисты.
Изучаю python. Есть Html:
HTML5
1
2
3
4
5
6
7
8
9
10
11
<!DOCTYPE html>
<head><title>Заголовок веб-сайта</title></head>
<head>
<meta charset="UTF-8">
<title>2 заголовок веб-сайта</title>
</head>
<body>
<p>Загрузите мои книги по <strong>Python</strong> на моем сайте <a href="http://inventwithpithon.com"></a>.</p>
<p class="slogan">Простой подход к изучению Python</p>
<p>Автор <span id="author">Эл Свейгарт</span></p>
</body>
Проводжу парсинг:
Python
1
2
3
4
5
6
7
8
9
10
11
12
import bs4, sys

exampleFile = open(r"C:\Users\администратор\.PyCh arm2019.2\config\scratches\example. html")

example = bs4.BeautifulSoup(exampleFile.read( ), features="html.parser")

elems = example.select('#author')
elems.dec
print(exampleFile.encoding)
print(type(elems))
print(len(elems))
print(elems[0])
Выдается ответ:
C:\Users\администратор\PycharmProje cts\untitled\venv\Scripts\python.ex e C:/Users/администратор/.PyCharm2019.2/config/scratches/BeautifulSoap.py
cp1251
<class 'bs4.element.ResultSet'>
1
<span id="author">РР» Свейгарт</span>

Process finished with exit code 0

Как сделать нормальную кодировку в ответе. Использую pycharm. В нете не нашел.
Димитрий22 вне форума Ответить с цитированием
Старый 15.04.2020, 17:21   #2
knight
Дон Кихот
Форумчанин
 
Аватар для knight
 
Регистрация: 17.01.2008
Сообщений: 130
По умолчанию

Из документации open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

Пример: open("text.txt", "r", encoding="utf-8")
knight вне форума Ответить с цитированием
Старый 16.04.2020, 08:20   #3
Димитрий22
 
Регистрация: 29.07.2019
Сообщений: 7
По умолчанию

knight,
Цитата:
Сообщение от knight Посмотреть сообщение
Из документации open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

Пример: open("text.txt", "r", encoding="utf-8")
Вот спасибо, так спасибо!!!)
Димитрий22 вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Проблема в кодировке? Делфи Artsiom Помощь студентам 14 13.05.2014 01:22
Недопонимания при парсинге Fiesko Общие вопросы Delphi 2 23.03.2014 20:31
Проблема в кодировке сообщений ВКОНТАКТЕ temchik2004 Работа с сетью в Delphi 6 04.09.2013 14:33
Блокируют при парсинге. Schmiss PHP 5 01.02.2013 08:49
Проблема при парсинге grafgrial Общие вопросы Delphi 0 15.11.2011 23:12