|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
21.07.2011, 12:54 | #1 |
Пользователь
Регистрация: 27.07.2010
Сообщений: 91
|
Парсинг HTML
Здрасьте!
Очередная трабла с парсингом страницы. Точнее, с поиском русского (кирилического) слова в тексте страницы. Мой код: PHP код:
|
21.07.2011, 13:44 | #2 |
Старожил
Регистрация: 31.05.2010
Сообщений: 3,301
|
У меня ваш код нормально отрабатывает - без проблем находит любое слово или сочетание слов на кириллице.
НО - это когда сам документ с кодом сохранен как ANSI. После пересохранения его в UTF-8 - скрипт перестал находить совпадения. Вероятно, по причине разницы в кодировках, потому что вот это исправило ситуацию с поиском совпадений (но не с отображением результатов проверки ): PHP код:
|
21.07.2011, 14:27 | #3 | |
Пользователь
Регистрация: 27.07.2010
Сообщений: 91
|
Цитата:
PHP код:
|
|
21.07.2011, 14:49 | #4 |
Пользователь
Регистрация: 27.07.2010
Сообщений: 91
|
По "идее" осуществления парсинга теперь нужно вырезать фрагмент кода от найденного слова до определённого тега. В моём случае:
Код HTML:
доллар США</strong> </td> <td align="right" style="border-bottom:1px dashed #ccc"> <strong>1722.4</strong> </td> <td align="right" style="border-bottom:1px dashed #ccc;color:green"> Вопрос - какой ф-ции по-силам осуществить эту операцию? |
21.07.2011, 19:28 | #5 |
Участник клуба
Регистрация: 28.06.2009
Сообщений: 1,950
|
Ответ:
Код:
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Парсинг HTML | russian-stalker | Общие вопросы C/C++ | 0 | 18.12.2010 11:25 |
Парсинг html кода | LT. | Общие вопросы .NET | 2 | 01.07.2010 07:30 |
парсинг Html | eldar | Общие вопросы Delphi | 4 | 23.04.2009 20:42 |
Парсинг HTML страницы | OkeaH | Работа с сетью в Delphi | 1 | 19.01.2009 09:17 |
HTML Парсинг | BaikalLord | Помощь студентам | 5 | 15.12.2008 08:20 |