Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Работа для программиста > Фриланс
Регистрация

Восстановить пароль

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 02.12.2010, 19:46   #1
alexplato
Пользователь
 
Аватар для alexplato
 
Регистрация: 14.11.2010
Сообщений: 47
По умолчанию Функция для преобразования HTML в валидный XML

Задача следующая. Я получаю тело html страницы используя HttpWebRequest и HttpWebResponse. Затем я хочу преобразовать полученный код в валидный XML для последующего обращения к нему с помощью XPATH (здесь http://forum.vingrad.ru/forum/topic-316073.html объяснял свои проблемы в данном вопросе).

Таким образом, мне нужна функция, которая на входе получает HTML код страницы, а возвращает валидный XML, к которому я смогу обращаться с помощью XPATH. Обращаться к ней буду с помощью следующего кода (как пример):

validatedHtmlText=TranslateToValidX ML(htmlText);

XmlDocument doc = new XmlDocument();
doc.LoadXml(validatedHtmlText);

XmlNodeList nodeList;
XmlElement root = doc.DocumentElement;
nodeList = root.SelectNodes(XPATHString);


Пример страницы, на которой можно потестировать:
http://siteexplorer.search.yahoo.com/search?p=forum.searchengines.ru/forumdisplay.php?f=19&bwm=i&bwmf=u& bwmo=d

Когда я сейчас напрямую подгружаю htmlText в LoadXml, при обработке получаю исключение, которое ругается, что:
"--" не является допустимым маркером ……...

Желательно создать решение на базе HTML Agility Pack. За эту небольшую функцию готов заплатить 5$ (оплата Webmoney). Уточню, что функция должна быть ХОРОШО ДОКУМЕНТИРОВАНА.
Автоматизация получения заказов для ВСЕХ ФРИлансеров!
alexplato вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Функция преобразования количества дней в количество лет atenon Microsoft Office Access 4 11.09.2010 18:42
Параллельный алгоритм быстрого преобразования Фурье (fft) для C# oleeg Помощь студентам 6 19.02.2010 13:19
Как обработать не валидный коннект?(delphi,winsock) zotox Работа с сетью в Delphi 1 02.08.2009 19:46
Нужен код на C# для преобразования в двоичную систему Sanyok Общие вопросы C/C++ 3 02.10.2008 03:33