Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > C/C++ программирование > Общие вопросы C/C++
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 05.07.2013, 19:42   #11
Cnukep
 
Регистрация: 04.07.2013
Сообщений: 9
По умолчанию

Цитата:
Сообщение от waleri Посмотреть сообщение
Для того, чтоб парсить XML вовсе не надо конвертировать поток.
Допустим на определенном этапе
в потоке встречается BYTE 1 , за ним BYTE 2 и тд (значения 208 и 156 соответственно)

конкретно здесь вместе они образуют русскую букву 'М'

нужно проверить буква это или нет
как это сделать стандартными средствами без конвертации скажем в wchar_t ?



и как заставить студию нормально отображать русский UTF-8 в отладчике?

Последний раз редактировалось Cnukep; 05.07.2013 в 19:46.
Cnukep вне форума Ответить с цитированием
Старый 05.07.2013, 21:48   #12
waleri
Старожил
 
Регистрация: 13.07.2012
Сообщений: 6,493
По умолчанию

Вы выдаете информацию по чайной ложечке в час. Для чего нужно проверят буква или нет при парсинге XML? Нужно проверить буква это или нет или нужно проверить буква М ли это? Что мешает проверять два последовательных байта на предмет соотвествия 208 и 156?
waleri вне форума Ответить с цитированием
Старый 05.07.2013, 22:26   #13
Cnukep
 
Регистрация: 04.07.2013
Сообщений: 9
По умолчанию

Цитата:
Сообщение от waleri Посмотреть сообщение
Вы выдаете информацию по чайной ложечке в час. Для чего нужно проверят буква или нет при парсинге XML? Нужно проверить буква это или нет или нужно проверить буква М ли это? Что мешает проверять два последовательных байта на предмет соотвествия 208 и 156?

буква или нет вообще
потому что будь это мультибайт я бы вызвал isalpha просто напросто

Последний раз редактировалось Cnukep; 05.07.2013 в 22:28.
Cnukep вне форума Ответить с цитированием
Старый 05.07.2013, 23:00   #14
Пепел Феникса
Старожил
 
Аватар для Пепел Феникса
 
Регистрация: 28.01.2009
Сообщений: 21,000
По умолчанию

если вы проводите валидацию xml на предмет вашего формата, то есть средства лучше.
а для того чтоб максимально быстро работать с utf8 учитесь работать с ним, очевидно же.
на сайте спецификации указаны группы символов и их диапазоны.
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
Программа делает то что написал программист, а не то что он хотел.
Функции/утилиты ждут в параметрах то что им надо, а не то что вы хотите.
Пепел Феникса вне форума Ответить с цитированием
Старый 06.07.2013, 17:56   #15
waleri
Старожил
 
Регистрация: 13.07.2012
Сообщений: 6,493
По умолчанию

А зачем при обработке XML нужно знать буква или нет?
Либо мы говорим о чем-то другом, а не просто parse XML.
В контексте XML можно считать все что не является специальным XML символом - буква.
waleri вне форума Ответить с цитированием
Старый 06.07.2013, 18:18   #16
Cnukep
 
Регистрация: 04.07.2013
Сообщений: 9
По умолчанию

Цитата:
Сообщение от waleri Посмотреть сообщение
А зачем при обработке XML нужно знать буква или нет?
Либо мы говорим о чем-то другом, а не просто parse XML.
В контексте XML можно считать все что не является специальным XML символом - буква.
спасибо, примерно такой и сделал алгоритм в конечном итоге

Последний раз редактировалось Cnukep; 06.07.2013 в 18:21.
Cnukep вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Русские буквы в \u символы J-Max Общие вопросы Delphi 4 01.07.2012 19:35
Русские символы в консоле pimple2006 Общие вопросы Delphi 2 16.12.2011 10:50
Русские символы Akord Общие вопросы C/C++ 0 26.09.2010 11:17
Expression Studio и Visual Studio 2010 ждать ли русские версии? Casper-SC Свободное общение 31 25.05.2010 14:31
как конвертнуть русские символы.(Visual Studio.Net) reyn90 Помощь студентам 0 05.01.2010 13:32