|
|
Регистрация Восстановить пароль |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
11.05.2010, 11:51 | #1 |
Пользователь
Регистрация: 13.01.2010
Сообщений: 77
|
Удобочитаемость на C#
Доброе время суток. Понадобилось написать на C# программу "удобочитаемость", пример как это работает на javascript можно посмотреть на http://lab.arc90.com/experiments/readability/ просто перетащив кнопку "Readability" на панель закладок. Т.е. со страницы убирается все, кроме необходимого контента, т.е. меню, шапка, подвал, реклама. Скрипт этот написан на javascript, код открыт. Меня интересует, можно ли такое же реализовать на C#? Только мне не требуется чтобы это можно было кидать на панель закладок, просто программе будет скармливаться скорее всего текстовый файл - исходный html-код страницы - и затем программа должна реализовывать следующее, как и в этом js-скрипте:
* 1. Prep the document by removing script tags, css, etc. * 2. Build readability's DOM tree. * 3. Grab the article content from the current DOM tree. * 4. Replace the current DOM tree with the new one. * 5. Read peacefully. Возможна ли такая реализация на C#? И как-нибудь можно перевести js-код в код C#? |
13.05.2010, 05:56 | #2 |
Пользователь
Регистрация: 13.01.2010
Сообщений: 77
|
Неужто никто не знает возможно ли это на C#?
|
13.05.2010, 09:42 | #3 |
Android Developer
Старожил Подтвердите свой е-майл
Регистрация: 19.02.2007
Сообщений: 3,708
|
Могу предположить, что Да, возможно.
|
13.05.2010, 10:21 | #4 |
Старожил
Регистрация: 22.05.2007
Сообщений: 9,085
|
Берем HTML-парсер какой-нибудь и вперёд: анализируем, вырезаем лишнее,...
|
14.05.2010, 04:12 | #5 |
Пользователь
Регистрация: 13.01.2010
Сообщений: 77
|
Я взяла HtmlAgilityPack. Дерево построить получилось, теперь буду двигаться дальше. Всем спасибо хоть на том, что сказали, что возможно, потому как я новичок в C#, были сомнения. Но, если у кого нибудь есть идеи, пишите
|