Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Низкоуровневое программирование > Win Api
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Закрытая тема
Ваша тема закрыта, почему это могло произойти? Возможно,
Нет наработок или кода, если нужно готовое решение - создайте тему в разделе Фриланс и оплатите работу.
Название темы включает слова - "Помогите", "Нужна помощь", "Срочно", "Пожалуйста".
Название темы слишком короткое или не отражает сути вашего вопроса.
Тема исчерпала себя, помните, один вопрос - одна тема
Прочитайте правила и заново правильно создайте тему.
 
Опции темы Поиск в этой теме
Внимание! Есть замечания модератора по теме: так точнее
Старый 11.04.2016, 15:19   #201
RAFA91
Заблокирован
 
Регистрация: 06.02.2011
Сообщений: 1,999
По умолчанию

вы не путайте .

если в старших 3-х байтах одни нули так это не значит что на этом

можно что-то сэкономить.
RAFA91 вне форума
Старый 11.04.2016, 15:23   #202
Alex11223
Старожил
 
Аватар для Alex11223
 
Регистрация: 12.01.2011
Сообщений: 19,500
По умолчанию

Путаете тут только вы.

Что не значит? Вместо 3 байтов с нулями + 1 байт ASCII символ храним только 1 байт, все ок с экономией.
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом.
Alex11223 вне форума
Старый 12.04.2016, 11:38   #203
RAFA91
Заблокирован
 
Регистрация: 06.02.2011
Сообщений: 1,999
По умолчанию

зачем вы употребляете тут ASCII если речь идет о юникоде ?

пока я не увидел смысл применения U-8 с точки зрения здравого смысла.

особенно тут.

00010000-001FFFFF 4
00200000-03FFFFFF 5
04000000-7FFFFFFF 6



было 4 байта стало 6. вы вообще в своем уме ?
RAFA91 вне форума
Старый 12.04.2016, 11:41   #204
Пепел Феникса
Старожил
 
Аватар для Пепел Феникса
 
Регистрация: 28.01.2009
Сообщений: 21,000
По умолчанию

Цитата:
вы не путайте .
перечитайте сообщение по ссылке все-же.
Цитата:
сколько мусолим эту разработку, так никто и не доказал что она в чем-то
полезна.
вам уже дали достаточно информации.
мало кому интересно объяснять статистичность сжатия.
Цитата:
тут выигрыш в сжатии идет только по первым трем строкам.
все остальное анархия.
я вам уже задал вопрос, как часто у вас идет текст с редкими символами выше FFFF?
UTF специально составлена так что большая часть применяемых символов идет в начале.
UTF считали относительно текстов, а не одиночных символов.

хотите еще пример? абсолютно реальный.
https://habrahabr.ru/post/278745/
UTF-8: 303*648 байт.
UTF-16: 544*144 байта.
UTF-32: 1*088*288 байта.

надеюсь пример пояснений не требует.
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
Программа делает то что написал программист, а не то что он хотел.
Функции/утилиты ждут в параметрах то что им надо, а не то что вы хотите.
Пепел Феникса вне форума
Старый 12.04.2016, 11:49   #205
RAFA91
Заблокирован
 
Регистрация: 06.02.2011
Сообщений: 1,999
По умолчанию

UTF-8: 303*648 байт.

что это за фонарные числа ?

где доказательства ?

информации дали много - только ни одна ни показывает положительные стороны.


а символы у меня как раз в диапазоне 04000000-7FFFFFFF.
RAFA91 вне форума
Старый 12.04.2016, 11:53   #206
Alex11223
Старожил
 
Аватар для Alex11223
 
Регистрация: 12.01.2011
Сообщений: 19,500
По умолчанию

Откройте блокнот и сохраните какой-нибудь текст в UTF-8 и в UTF-16 (в блокноте называется просто Unicode), сравните размер.
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом.
Alex11223 вне форума
Старый 12.04.2016, 11:57   #207
Пепел Феникса
Старожил
 
Аватар для Пепел Феникса
 
Регистрация: 28.01.2009
Сообщений: 21,000
По умолчанию

Цитата:
что это за фонарные числа ?
для вас откровение что страницы в интернете что-то весят?
это страница по ссылке. ее размер при сохранении в файл.
Цитата:
где доказательства ?
перечитайте тот пост
этого достаточно если уметь читать.
Цитата:
символы у меня как раз в диапазоне 04000000-7FFFFFFF.
хотелось бы увидеть данные текст. реальный, а не синтетический пример.
учитывая что Unicode символы до туда насколько я помню еще не дошли.

UTF-8 не дает 100% гарантии меньшего размера.
есть случаи, где он выдаст больше.
так же есть случаи где и UTF-16 выдаст больше, чем UTF-32. но ничего, все живут же.

PS: кстати говоря, свои заявлением про фонарные числа вы показали что пост вы не читали.
там вед написано все
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
Программа делает то что написал программист, а не то что он хотел.
Функции/утилиты ждут в параметрах то что им надо, а не то что вы хотите.

Последний раз редактировалось Пепел Феникса; 12.04.2016 в 12:11.
Пепел Феникса вне форума
Старый 12.04.2016, 12:11   #208
RAFA91
Заблокирован
 
Регистрация: 06.02.2011
Сообщений: 1,999
По умолчанию

Цитата:
Сообщение от Alex11223 Посмотреть сообщение
сравните размер.
странно что тут никто не вспомнил про архиватор , раз пошла такая пьянка.
RAFA91 вне форума
Старый 12.04.2016, 17:01   #209
Pavia
Лис
Старожил
 
Аватар для Pavia
 
Регистрация: 18.09.2015
Сообщений: 2,409
По умолчанию

Её моё сколько можно про сжатие?
Нету тут сжатия!
Разно размерное кодирование даёт выигрыш только на определенных тестах. На других текстах оно может давать отрицательный результат.
Наиболее часто встречающиеся символы делаем короткими наиболее редко длинными.
Это ещё Шенон описал.
Теорию можно прочитать в Лидовский В.В., Теориинформации, 2003.pdf
Вопрос какие символы наиболее часто встречаются?
https://ru.wikipedia.org/wiki/Языки_мира
Ответ Китайские иероглифы. Так что правильно 8 битными кодировать китайские тексты, а не английские.
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
У дзен программиста программа делает то что он хотел, а не то что он написал .
Pavia вне форума
Старый 12.04.2016, 17:06   #210
RAFA91
Заблокирован
 
Регистрация: 06.02.2011
Сообщений: 1,999
По умолчанию

китайские символы лежат в основном в младших 16 битах.

как эти символы можно подогнать до байта если по описанию


00000080-000007FF 2
00000800-0000FFFF 3


в этом диапазоне они и лежат
RAFA91 вне форума
Закрытая тема


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Мои фантазии про С++11 RAFA91 Общие вопросы C/C++ 265 18.07.2016 15:15
Проблема кодировок Anarios JavaScript, Ajax 2 25.12.2011 11:06
Стандартные средства = бесконечный полет фантазии. Alex Cones Софт 2 27.07.2009 17:10
Проблема кодировок!!! chekanoff Общие вопросы Delphi 4 04.12.2007 00:03