|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
19.07.2011, 01:59 | #1 |
Регистрация: 20.01.2010
Сообщений: 9
|
UTF-8 to WINDOWS-1251
Здравствуйте! Надо вот чего...
Есть строка в UTF-8. После перекодировки функцией `UTF8ToString` выползает, естественно, ANSI. Только хреново как-то выползает. Знаки вопроса высовываются там, где зашкаливает за 255. В аглицкой транскрипции, к примеру. И приспичило эти знаки вопроса заменить на html-сущности (html-entities). То есть вместо них вставить штуки типа 〹 (`&` без `amp;`,- тут текст корежится,- амперсанд+решетка+циферки+точка_с_з апятой) Однако, никак не получается вынуть код символа в исходной строке нормально. Кракозубрины выходят, хоть в затылке не чеши. Как получить ord(x) для UTF-8? Заранее признателен. |
19.07.2011, 02:27 | #2 |
Форумчанин
Регистрация: 08.08.2010
Сообщений: 371
|
Код:
Хакинг - не преступление, а способ выживания.
|
19.07.2011, 02:48 | #3 |
Регистрация: 20.01.2010
Сообщений: 9
|
[ b ] [ б ] Одиночные звуки
[ d ] [ д ] [ Λ ] [ а ] — короткое [ f ] [ ф ] [ a:] [ а ] — глубокое [ 3 ] [ ж ] [ i ] [ и ] — короткое [ d3 ] [ дж ] [ i: ] [ и ] — долгое [ g ] [ г ] [ o ]1 [ о ] — короткое [ h ] [ х ] [ o: ] [ о ] — глубокое [ k ] [ к ] [ u ] [ у ] — короткое [ l ] [ л ] [ u: ] [ у ] — долгое [ m ] [ м ] [ e ] как в слове "плед" [ n ] [ н ] [ ε: ] как в слове "мёд" [ p ] [ п ] Дифтонги2 [ s ] [ с ] [ əu ]3 [ оу ] [ t ] [ т ] [ au ] [ ау ] [ v ] [ в ] [ ei ] [ эй ] [ z ] [ з ] [ oi ] [ ой ] [ t∫] [ ч ] [ ai ] [ ай ] [∫] [ ш ] [ r ] Мягкое [ р ] как в слове русский [ о Знак мягкости как в русской букве Ё (ёлка) Звуки без аналогий в русском языке [ θ ] [ æ ] [ ð ] [ ŋ ] Носовой, на французский манер, звук [ n ] [ ə ]4 [нейтральный звук] [ w ] ------------------------------------------------------- æ,ð,∫ и иже с такими же - надо заменить на коды. (&#12345 Utf8ToAnsi - всё из той же оперы, не работает... Последний раз редактировалось Zanooda; 19.07.2011 в 02:51. |
19.07.2011, 02:59 | #4 |
Старожил
Регистрация: 03.01.2011
Сообщений: 2,508
|
"Когда приходит положенное время, человек перестаёт играть в пинбол. Только и всего."
|
19.07.2011, 07:57 | #5 |
Регистрация: 20.01.2010
Сообщений: 9
|
Спасибо, чтение пошло на пользу, но тараканы не выводятся по-прежнему.
Вываливаю конкретнее - мож, доразмыслит кто-нибудь... Код:
|
19.07.2011, 09:06 | #6 |
Старожил
Регистрация: 13.08.2009
Сообщений: 2,581
|
Бррр....
Код:
В сообщении вам указали переводить UTF8 в Unicode-строку (WideString) и с ней уже работать. Когда все символы замените на их escape-варианты - строку можно будет конвертнуть в ANSI уже без потерь информации.
Опытный программист на C++ легко решает любые не существующие в Паскале проблемы.
|
19.07.2011, 09:07 | #7 |
Старожил
Регистрация: 13.08.2009
Сообщений: 2,581
|
Версия Delphi, кстати, какая?
Опытный программист на C++ легко решает любые не существующие в Паскале проблемы.
|
19.07.2011, 21:03 | #8 |
Регистрация: 20.01.2010
Сообщений: 9
|
Delphi - XE.
AnsiString потому, что после Delphi 7 всё корёжится и приходится изобретать подобное: Код:
А сдвиги и `маринования`... Это вот тут: http://php.net/manual/en/function.ord.php --- А именно: Код:
|
19.07.2011, 21:07 | #9 | |
Старожил
Регистрация: 13.08.2009
Сообщений: 2,581
|
Цитата:
Результат UTF8ToString сохраняй в String - вот и не будет у тебя никаких потерь символов. При условии, конечно, что у тебя действительно нормальный UTF8. В чём я сейчас очень сильно сомневаюсь: Код:
Опытный программист на C++ легко решает любые не существующие в Паскале проблемы.
|
|
20.07.2011, 08:13 | #10 |
Регистрация: 20.01.2010
Сообщений: 9
|
Методом тыка Америку открыли. А без неё какая скукатища по Земле расплескалась бы...
В общем, вот, кому интересно, ещё по теме: http://habrahabr.ru/blogs/javascript/118973/ ... А строка у меня, действительно, не совсем utf-8, наверное. Спасибо. |
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
utf-8 -> windows-1251 | Lihosvet | Visual C++ | 10 | 03.09.2022 16:37 |
php перекодировка из utf-8 в windows-1251 | world12_tk | PHP | 3 | 25.04.2010 22:55 |
UTF-8 в Windows-1251 - нужна функция | motorway | PHP | 3 | 04.07.2009 15:28 |
Wordpress. Поменять кодировку utf-8 на windows 1251 | GarantR | Фриланс | 4 | 08.02.2009 12:09 |