Форум программистов
 
Контакты: о проблемах с регистрацией, почтой и по другим вопросам пишите сюда - alarforum@yandex.ru, проверяйте папку спам! Обязательно пройдите активизацию e-mail.

Вернуться   Форум программистов > Скриптовые языки программирования > Python
Регистрация

Восстановить пароль
Повторная активизация e-mail

Ответ
 
Опции темы
Старый 03.08.2016, 09:43   #21
Alex11223
Модератор
Заслуженный модератор
 
Регистрация: 12.01.2011
Сообщений: 17,008
Репутация: 3316

icq: 512-765
skype: alexp.frl
По умолчанию

Думаю лучше что-то из ранних 2.*

Что у вас за HTML такие что архивище?
Если они например по 10 КБ (rabota.16mb.com 6.4 КБ), то 25 тысяч всего 250 МБ будет даже без сжатия.
Alex11223 на форуме   Ответить с цитированием
Старый 03.08.2016, 11:47   #22
vihtor
Форумчанин
 
Аватар для vihtor
 
Регистрация: 06.06.2014
Сообщений: 55
Репутация: -60
По умолчанию

Нет архивами я заниматься не буду. Хочу всё сделать сам.
Установил на компьютер Python 2.1. Жду ваших дальнейших распоряжений.
vihtor вне форума   Ответить с цитированием
Старый 04.08.2016, 10:57   #23
pompiduskus
юзер как все
Профессионал
 
Аватар для pompiduskus
 
Регистрация: 10.01.2012
Адрес: земля
Сообщений: 1,567
Репутация: 629

icq: 446.452.423
По умолчанию

Опишите структуру директорий. Как называются файлы HTML всегда-ли они (index.html) или нет ?

И еще мне нужно будет пару таких страниц, ато яж не могу так в слепую
__________________
<Дзен - Вся вселенная в тебе > | <Рай - это всего лишь мечта терпящего страдания ада> | github.com/ch3ll0v3k
pompiduskus вне форума   Ответить с цитированием
Старый 04.08.2016, 18:09   #24
vihtor
Форумчанин
 
Аватар для vihtor
 
Регистрация: 06.06.2014
Сообщений: 55
Репутация: -60
По умолчанию

Цитата:
Сообщение от pompiduskus Посмотреть сообщение
Опишите структуру директорий. Как называются файлы HTML всегда-ли они (index.html) или нет ?

И еще мне нужно будет пару таких страниц, ато яж не могу так в слепую
Никакой структуры директорий (папок) нет. Я буду делать по одной папке. Т.к. на сайте много страниц с уже ранее прописанными мета-Описаниями.

В папке 200 файлов: index.html , 1.html, 2.html ..... 200.html

А код страницы - чистый (или голый, как вам будет угодно) html:
<!DOCTYPE html>
<html lang="ru">
<head>
<title></title>
</head>
<body>

<h1></h1>

</body>
</html>

Или нужен код полностью, со всеми ссылками, текстом, мета-тегами, линками и т.д.? Что значит "мне нужно будет пару таких страниц" ?
Здесь коды выложить или выслать пару страниц Куда-то?
vihtor вне форума   Ответить с цитированием
Старый 04.08.2016, 20:58   #25
pompiduskus
юзер как все
Профессионал
 
Аватар для pompiduskus
 
Регистрация: 10.01.2012
Адрес: земля
Сообщений: 1,567
Репутация: 629

icq: 446.452.423
По умолчанию

Абсолютно все страници имеют вот такую структуру ?

Код:

<!DOCTYPE html>
<html lang="ru">
<head>
<title></title>
</head>
<body>

<h1></h1>

</body>
</html>

__________________
<Дзен - Вся вселенная в тебе > | <Рай - это всего лишь мечта терпящего страдания ада> | github.com/ch3ll0v3k
pompiduskus вне форума   Ответить с цитированием
Старый 05.08.2016, 10:28   #26
vihtor
Форумчанин
 
Аватар для vihtor
 
Регистрация: 06.06.2014
Сообщений: 55
Репутация: -60
По умолчанию

Цитата:
Сообщение от pompiduskus Посмотреть сообщение
Абсолютно все страници имеют вот такую структуру ?

Код:

<!DOCTYPE html>
<html lang="ru">
<head>
<title></title>
</head>
<body>

<h1></h1>

</body>
</html>

Да, все страницы имеют такую структуру.
Кодировка win-1251
Нужно вставить <meta name="description" content=""> сразу после тега </title>
В Описаниии необходимо сгенерировать первые 255 символов текста.
Но в Описании не должно быть "кавычек", которые могут быть в тексте. Не должно быть всяких кавычек: " и «»
vihtor вне форума   Ответить с цитированием
Старый 05.08.2016, 12:03   #27
pompiduskus
юзер как все
Профессионал
 
Аватар для pompiduskus
 
Регистрация: 10.01.2012
Адрес: земля
Сообщений: 1,567
Репутация: 629

icq: 446.452.423
По умолчанию

Понятно, а где брать эти первые 255 символов ?
__________________
<Дзен - Вся вселенная в тебе > | <Рай - это всего лишь мечта терпящего страдания ада> | github.com/ch3ll0v3k
pompiduskus вне форума   Ответить с цитированием
Ответ

Опции темы

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Документации и полезные материалы по Python, Python-Qt, PySide pompiduskus Python 3 11.01.2018 01:15
Парсер Ольга 963 Помощь студентам 10 07.12.2013 11:13
Парсер qiperman Работа с сетью в Delphi 4 29.04.2013 22:16
Парсер cargo29 JavaScript, Ajax 2 15.09.2011 19:07
парсер на C# newerwiner C# (си шарп) 1 08.05.2011 16:16


18:43.


Powered by vBulletin® Version 3.8.8 Beta 2
Copyright ©2000 - 2018, Jelsoft Enterprises Ltd.

RusProfile.ru


Справочник российских юридических лиц и организаций.
Проекты отопления, пеллетные котлы, бойлеры, радиаторы
интернет магазин respective.ru