|
|
Регистрация Восстановить пароль |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
|
Опции темы | Поиск в этой теме |
31.07.2016, 10:36 | #1 |
Пользователь
Регистрация: 06.06.2014
Сообщений: 79
|
Парсер на Python
Здравствуйте.
Мне предложили Парсер на Python для автозаполнения описаний страниц (<meta name="description" content="" />) Помогите разобраться как им пользоваться на статичном сайте. #!/usr/bin/python ################################### ################################ from BeautifulSoup import BeautifulSoup import os ################################### ################################ HTML_DOCS = os.listdir("/www/"); for HTML in HTML_DOCS: if ".html" in HTML or ".htm" in HTML: parsed_html = BeautifulSoup( HTML ); meta = parsed_html.head.find('meta', attrs={'name':'description'}) print( meta.text ); Последний раз редактировалось vihtor; 31.07.2016 в 17:13. |
31.07.2016, 11:27 | #2 |
Старожил
Регистрация: 12.01.2011
Сообщений: 19,500
|
Не важно на каком он языке. И сайт не нужен если вам только 1 раз заполнить.
Просто любая программа/скрипт, которая пройдется по всем файлам, достанет текст (убрав из него HTML теги) и вставит куда надо.
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом. |
31.07.2016, 13:06 | #3 |
юзер как все
Участник клуба
Регистрация: 10.01.2012
Сообщений: 1,586
|
Привет. Этож я писал там.
Давайте я вам помогу. =) Если у вас есть АСЯ, постучите. Я все объясню что к чему. Там дел кот наплакал.
<Дзен - Вся вселенная в тебе > | Резюме: https://ch3ll0v3k.github.io/CV/
|
31.07.2016, 15:55 | #4 | |
Пользователь
Регистрация: 06.06.2014
Сообщений: 79
|
Цитата:
Ну здесь объясните, что с этим кодом делать? Сохранить в отдельный файл? С каким расширением? Что делать на статичной странице? Почему здесь нельзя объяснить? Это что, коммерческий скрипт? Последний раз редактировалось vihtor; 31.07.2016 в 17:18. |
|
31.07.2016, 17:28 | #5 |
юзер как все
Участник клуба
Регистрация: 10.01.2012
Сообщений: 1,586
|
Просто тут не удобно.
Тут дак тут. Возможно сегодня, или скорее всего завтро, зайду сюда и напишу что к чему. Если все файлы html у вас на компе, то установите себе Python https://www.python.org/
<Дзен - Вся вселенная в тебе > | Резюме: https://ch3ll0v3k.github.io/CV/
|
31.07.2016, 20:11 | #6 | |
Пользователь
Регистрация: 06.06.2014
Сообщений: 79
|
Цитата:
|
|
31.07.2016, 20:16 | #7 |
Старожил
Регистрация: 15.02.2010
Сообщений: 15,760
|
Ну так пайтон.орг можно и древнее найти версии
|
01.08.2016, 03:32 | #8 |
юзер как все
Участник клуба
Регистрация: 10.01.2012
Сообщений: 1,586
|
Если запустите exe-шник который я напишу ? Он будет питоновский. Тогда, просто напишите свою структуру дирикторий и любых пару таких файлов нужно мне будет для эксперимента.
<Дзен - Вся вселенная в тебе > | Резюме: https://ch3ll0v3k.github.io/CV/
|
01.08.2016, 06:09 | #9 |
Пользователь
Регистрация: 06.06.2014
Сообщений: 79
|
Черт побери, да, я же изначально неправильно поставил свой вопрос.
Мне нужна готовая, бесплатная программа (утилита) на компьютер для пакетного редактирования html-файлов (html-кодов), здесь же на компьютере. Задача: скопировать первые 200 символов текста и вставить в <meta name="description" content="">. Уж проще задачи тяжело придумать. Всё, буду искать программу, скорее всего в Буржунете. Извините за беспокойство. |
01.08.2016, 06:15 | #10 |
юзер как все
Участник клуба
Регистрация: 10.01.2012
Сообщений: 1,586
|
Как будет угодно.
<Дзен - Вся вселенная в тебе > | Резюме: https://ch3ll0v3k.github.io/CV/
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Документации, учебники, уроки и полезные материалы по Python, PyQt, PySide | pompiduskus | Python | 4 | 22.07.2022 10:16 |
Парсер | Ольга 963 | Помощь студентам | 10 | 07.12.2013 11:13 |
Парсер | qiperman | Работа с сетью в Delphi | 4 | 29.04.2013 22:16 |
Парсер | cargo29 | JavaScript, Ajax | 2 | 15.09.2011 19:07 |
парсер на C# | newerwiner | C# (си шарп) | 1 | 08.05.2011 16:16 |