Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Скриптовые языки программирования > PHP
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 31.10.2009, 14:05   #1
supercelt
 
Регистрация: 27.10.2009
Сообщений: 3
По умолчанию парсер XML, не видит XML тэги

Помогите пожалуйста. Нужно просто просканить ленту RSS, выдернуть из неё всё что встречается между <item></item>
PHP код:
function get_search_bazos($lines$url)
{
global 
$done_2;
    foreach(
$lines as $line)
    {
    
$line urlencode($line);
    
$page = @file_get_contents($url.$line); 
    
    
preg_match_all('!<item>(.*?)</item>!'$page$output);
        for(
$i=0$i count($output[0]); $i++)
        {
        
$str $output[0][$i];
        
$done_2 .= $str.'<br />';
        }
        
    
$done_2 .= '<br /><br />';
    
$done_2 .= '<hr>';
    }
return 
$done_2;    
}
$lines file('words.txt');
$url_2 'http://www.bazos.cz/rss.php?hledat=';
$done_2 '';
echo 
'<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html>
<head>
<title>destroy obuv - Seznam</title>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
</head>
<body>'
;
echo 
get_search_bazos($lines$url_2);
echo 
'</body></html>'
При скане, отдаваемый код такой:

Код HTML:
<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
<channel>
<title>Bazos.cz - recept</title><link>http://www.bazos.cz/</link>
<description>Bazoš - internetový bazar, on-line inzerce zdarma.</description>
<language>cs</language>
  <item>
    <title>KRÁSNÁ KUCHAŘKA -    200</title>
    <link>http://knihy.bazos.cz/inzerat/4498850/KRASNA-KUCHARKA.php</link>
    <description><![CDATA[<img src="http://www.bazos.cz/knihy/obr/1t/4498850.jpg" class="obrazek" />Prodám krásnou kuchařku, kde vaří známé hlasatelky a radí své oblíbené recepty. Kuchařka je úplně nová, nepoužitá, byl to nevhodný dárek, tak posílám dál. Vhodný dárek třeba k vánocům. ...]]></description>
    <pubDate>Fri, 30 Oct 2009 19:04:24 +0100</pubDate>
  </item>
  <item>
    <title>Přirozená cesta ke kráse -    140</title>
    <link>http://knihy.bazos.cz/inzerat/4497760/Prirozena-cesta-ke-krase.php</link>
    <description><![CDATA[Autor: Maria - E. Langeová - Ernstová. Témata knihy: jak šetrně pečovat o pleť a vlasy, praktické návody a recepty na přírodní kosmetické přípravky. 1x čtená, 127 stran, formát trochu větší než A5. ...]]></description>
    <pubDate>Fri, 30 Oct 2009 16:26:55 +0100</pubDate>
  </item>
</channel>
</rss>
Фишка в том, что тоже самое проделывал с HTML документом, всё работало, я искал что между тэгами <table></table>. А вот XML тэги <item></item> регулярка не видит
supercelt вне форума Ответить с цитированием
Старый 02.11.2009, 12:40   #2
ssdm
Форумчанин
 
Регистрация: 20.05.2009
Сообщений: 506
По умолчанию

Попробуйте перед / вставить экранирующий символ.
ssdm вне форума Ответить с цитированием
Старый 02.11.2009, 14:48   #3
mv28jam
Старожил
 
Аватар для mv28jam
 
Регистрация: 09.09.2008
Сообщений: 2,714
По умолчанию

У вас неправильный подход, используйте http://ru.php.net/manual/en/book.simplexml.php
Стрелок-охотник
mv28jam вне форума Ответить с цитированием
Старый 02.11.2009, 19:18   #4
supercelt
 
Регистрация: 27.10.2009
Сообщений: 3
По умолчанию

спасиб, посмотрю что это за зверь
supercelt вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
XML в Delphi 7 Mutagena Общие вопросы Delphi 17 09.10.2009 16:29
XML Sergey2 Общие вопросы Delphi 7 20.04.2009 12:36
БД и XML MPa БД в Delphi 4 02.02.2008 21:42