Форум программистов
Реклама:
Гарантия безопасности сети с UTM-системой ИКС.
Защита ПД, межсетевой экран, контроль доступа, фильтрация трафика, система предотвращения вторжений.
Контакты: о проблемах с регистрацией, почтой и по другим вопросам пишите сюда - alarforum@yandex.ru, проверяйте папку спам! Обязательно пройдите активизацию e-mail.

Вернуться   Форум программистов > Скриптовые языки программирования > Python
Регистрация

Восстановить пароль
Повторная активизация e-mail

Ответ
 
Опции темы
Старый 19.12.2016, 18:50   #1
Anriuser
Пользователь
 
Регистрация: 13.07.2014
Сообщений: 46
Репутация: 10
По умолчанию Закон Ципфа - PYthon

Добрый вечер. Вообщем есть реализирован первый который строит гистограму по словам в тексте.
"Измерим количество вхождений каждого слова в текст и возьмем только одно значение из каждой группы, имеющей одинаковую частоту. Расположим частоты по мере их убывания и пронумеруем, порядковый номер частоты назовем рангом частоты Выделение ключевых слов в текстовых документах ранг слова Выделение ключевых слов в текстовых документах). Наиболее часто встречающиеся слова будут иметь ранг 1, следующие за ними – 2 и так далее"
Вот результат программы (На скрине программы справа, ето частота слова): cipf.png
Первое это проблема с кодировкой: На графике легенда отображается неправильно.
Если я удалю эти строки

[PYTHON]reload(sys)
sys.setdefaultencoding('Cp1252')[/PYTHON]
Выдается ошибка при построении на русском и украинском языке. Нужно сделать чтоб график на любом языке нормально рисовался.

Второе: Нужно построить второй график, отложив по оси абсцисс частоту вхождения слова, а по оси ординат – количество слов в данной частоте.
Вот проект.
ZipfTest.rar
Anriuser вне форума   Ответить с цитированием
Старый 04.01.2017, 04:59   #2
pompiduskus
юзер как все
Профессионал
 
Аватар для pompiduskus
 
Регистрация: 10.01.2012
Адрес: земля
Сообщений: 1,468
Репутация: 587

icq: 446.452.423
По умолчанию

Я архив не качал, и не знаю что внутри. Во всех файлах, в самом начеое файла должна быть вот такйя строка!

Код:


# -*- coding: utf-8 -*-

А там где вы пытаетесь записать кирилицу в переменную, попробуйте так

Код:


name = u"это слово";

возможно это поможет!
__________________
<Дзен - Вся вселенная в тебе > | <Рай - это всего лишь мечта терпящего страдания ада> | github.com/ch3ll0v3k
pompiduskus вне форума   Ответить с цитированием
Ответ



Опции темы

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
закон поглощения gelior C++ Builder 0 10.04.2013 20:37
Закон об авторском праве Miha85193 Свободное общение 2 24.02.2011 17:14
Фед. закон от 29-го. Alex Cones Свободное общение 8 09.01.2011 04:15
Закон и программы cowboy Свободное общение 21 18.06.2010 09:01
закон отражения DRAgon™ Свободное общение 4 28.05.2010 12:07




01:48.


Powered by vBulletin® Version 3.8.8 Beta 2
Copyright ©2000 - 2017, Jelsoft Enterprises Ltd.

купить трафик


как улучшить посещаемость, а также решения по монетизации сайтов, видео и приложений

RusProfile.ru


Справочник российских юридических лиц и организаций.
Проекты отопления, пеллетные котлы, бойлеры, радиаторы
интернет магазин respective.ru