|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
31.10.2012, 17:35 | #1 |
Регистрация: 31.10.2012
Сообщений: 3
|
регулярные выражения ( убрать теги)
Здравствуйте.
Проблема в построении регулярного выражения. Есть входной HTML: Код HTML:
<a href="http://lenta.ru/rss/" h="ID=SERP,5062.1"> <strong>Lenta</strong>.ru: Новости</a> <a href="http://lenta.ru/rss/articles/" h="ID=SERP,5078.1"><strong>Lenta</strong>.ru: Статьи</a> <a href="http://img.lenta.ru/r/EX/import.rss" h="ID=SERP,5093.1"><strong>Lenta</strong>.ru: Новости</a> <a href="http://img.lenta.ru/r/EX/yandexfull.rss" h="ID=SERP,5108.1"><strong>Lenta</strong>.ru: Новости</a> <a href="http://www.lenta.com/rss.php?path=news/rss/1" h="ID=SERP,5123.1">Лента новостей</a> <a href="http://strana.lenta.ru/sec_articles-cat_tajikistan.rss" h="ID=SERP,5138.1">ООО "Лента.Ру" (1999-2012). Лицензия ...</a> <a href="http://news.404.ru/rss/lenta.ru.rss" h="ID=SERP,5153.1"><strong>Lenta</strong>.ru: Новости</a> <a href="http://lenta.ge/?feed=comments-rss2" h="ID=SERP,5168.1">Comments for <strong>LENTA</strong> .GE</a> Lenta.ru: Новости Lenta.ru: Статьи Lenta.ru: Новости Лента новостей и т.д. Применяю к HTML "(?<=h=.*?>).*?(?=</a>)" получаю: <strong>Lenta</strong>.ru: Новости <strong>Lenta</strong>.ru: Статьи <strong>Lenta</strong>.ru: Новости ООО "Лента.Ру" (1999-2012). Лицензия ... Comments for <strong>LENTA</strong>.GE Как избавится от strong и "? Выражение "(?<=h=.*?>)[^<strong>].*?(?=</a>)" удаляет тэги только с начала строки, т.е.: Lenta</strong>.ru: Новости Comments for <strong>LENTA</strong>.GE |
31.10.2012, 17:37 | #2 |
Форумчанин
Регистрация: 18.01.2012
Сообщений: 975
|
Наводящая мысль: вам нужен только текст, который находится между ">" и "<", именно в этом порядке
Вроде что-то вроде этого, только переносы строк вам придется отслеживать как-то еще Код:
Благодарить в репутацию. Проклинать — туда же
Последний раз редактировалось Luuzuk; 31.10.2012 в 17:41. |
31.10.2012, 17:47 | #3 |
Регистрация: 31.10.2012
Сообщений: 3
|
Это заголовки результатов поисковика.
тег strong встречается не везде. Нужна строка типа [^<strong>] как написать чтобы он ее фильтровал на всю ширину вхождения, а не только сначала, как в моем варианте? Последний раз редактировалось j3st3r; 31.10.2012 в 18:01. |
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
регулярные выражения | Sparky | Помощь студентам | 4 | 18.04.2012 18:58 |
регулярные выражения | brulik67 | PHP | 4 | 24.06.2011 06:14 |
регулярные выражения | Aleksey1408D | PHP | 5 | 05.06.2011 07:41 |
Регулярные выражения | Marsik | Помощь студентам | 4 | 14.11.2009 14:13 |
Регулярные выражения | AnalogXP | Общие вопросы Delphi | 0 | 01.08.2009 23:12 |