|
|
Регистрация Восстановить пароль |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
|
Опции темы | Поиск в этой теме |
13.09.2019, 21:36 | #1 |
Пользователь
Регистрация: 01.02.2008
Сообщений: 24
|
Доброго времени суток!
Кто-нибудь сталкивался с переносом постов с Ucoz на Wordpress. Вопрос как перенести новости с Ucoz на Wordpress. Руками не вариант сейчас постов почти 12000 В сети нашел скрипт на php. Код:
Я с Wordpress не работал и не понимаю как этот скрипт запустить Значения в самом файле, который и нужно обработать, разделяются |. Смысл понятен. Нужно перебрать весь файл, и значение распихать в поля Wordpress. Вопрос: как запустить свой скрипт на Wordpress.
Если вы хотите защитить вашу систему от «дурака», то всегда найдется один такой, изобретательность которого вы и предвидеть не могли.
|
13.09.2019, 22:26 | #3 |
Старожил
Регистрация: 03.01.2014
Сообщений: 2,870
|
Для начала Вам нужно доработать скрипт, чтобы он результаты парсинга добавлял в качестве постов WordPress.
Можно добавлять в БД напрямую (что не очень желательно) или используя API WordPress через самописный плагин (да, он будет одноразовый, но за то с использованием API движка). Необходимые знания по WordPress Вы можете почерпнуть из документации для разработчиков или сайтов наподобие WP-Kama. Как это реализовать в деталях рассказывать долго, т.к. задача слишком объёмная для одного поста и возможно даже одной темы. Если при самостоятельной реализации возникнут конкретные вопросы, задавайте их на форуме. Если не я, то коллеги ответят. Если же самостоятельно разобраться не получится или просто нет на это времени, тогда проще обратиться к фрилансерам. Они хоть и не бесплатно, но сделают за Вас . |
14.09.2019, 00:24 | #4 | ||
Александр
Администратор
Регистрация: 28.10.2006
Сообщений: 17,597
|
Streletz, да он даже и не пытался переносить вручную, если бы это делал, то и понял как это автоматизировать.
Сначала бы просто добавлял посты через админку, потом обленился стал бы добавлять в PHPmyadnin, потом опять обленился, сделал бы SQL скрипт, потом обленился сделал бы парсер, после чего было бы не сложно сдружить парсер и SQL скрипт. но нет, качает какое-то барахло, типа это его наработки, где вообще не пришей никчему от чего Цитата:
хорошо сверху Цитата:
А всего то нужно перекинуть в базу URL, TITLE и CONTEN Это можно несколькими SQL запросами сделать. Из базы источника SELECT, потом в базу направление - INSERT причем не долго думая в нотепад++ автозаменой заменить SELECT на INSERT Скрипты они наворачивают с циклами и массивами )), типапрограммисты ) Для отдельного случая, который никогда в жизни больше не пригодиться. топикстартер, ты хоть раз бекап базы делал? в глаза видел как она выглядит в SQL файлике? ))) |
||
14.09.2019, 00:43 | #5 |
Старожил
Регистрация: 12.01.2011
Сообщений: 19,500
|
большая часть кода это парсинг файла с экспортированными постами, видимо в каком-то юкозовском велосипедном формате.
какая разница какой язык? а юкоз дает к ней доступ?
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом. |
14.09.2019, 01:46 | #6 | |
Александр
Администратор
Регистрация: 28.10.2006
Сообщений: 17,597
|
Ты хочешь мне объяснить что этот PHP скрипт делает этой регуляркой?
Цитата:
нельзя забрать базу вообще никак? тогда тупо через GET скраббить, и потом через Insert влить в вордпресс базу. там если что ещё есть вариант через XML, и ещё какие-то варианты по моему были. XML, наверное, вообще самое простое, можно даже никуда дальше админки вордпресса не ходить. Вероятно, карьера программиста на этом скрипте и закончилась )) |
|
14.09.2019, 11:26 | #7 | ||
Старожил
Регистрация: 12.01.2011
Сообщений: 19,500
|
так не обязательно же напрямую БД пользователям давать.
Экспортируют в свой формат (который тут парсится), импортируют из него же. Ну может конечно они уже дают и другие варианты, хотя бы XML/JSON, которых там либо не было в 2014, либо автор о них не знал. Он на строки делит текст, когда встречаются два таких символа вместе: 1. любой символ кроме \ (видимо он где-то используется для экранирования, типа как в терминале перенос длинных команд). Целых три \\\ там написано потому что надо экранировать \ в регулярках (как и в большинстве языков). 2. перевод строки (\n): Код:
Цитата:
Тогда хз зачем эта регулярка, может быть там виндовские переводы строк (\r\n), но тогда и регулярка не нужна (как впрочем и для |\n), хватило бы и функции explode. Смысл в регулярках для разделения файлов на строки может быть когда там возможны разные виды переводов строк (виндовские, линуксовские), тогда в регулярке было бы что-то типа \r?\n, но тут не такая регулярка. Может быть автор хотел написать регулярку, которая находит переводы строк перед которыми нет экранирующего \ (то есть один символ, а не два как тут), но ошибся и не заметил ошибки (может быть она не влияла на результат, например, если там в конце всегда какой-нибудь лишний пробел или не используемое поле). Нет. Цитата:
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом. Последний раз редактировалось Alex11223; 14.09.2019 в 12:13. |
||
14.09.2019, 13:47 | #8 |
Александр
Администратор
Регистрация: 28.10.2006
Сообщений: 17,597
|
Поржал, никогда мне не работать в крупных компаниях, потому что не пишу такие скрипты )))
Накопировал скриптов из разных мест, и подогнал под малые данные. В итоге всё как везде, куча не рабочего мусора в кодах или работающего но не так как надо, бсод не вылетает и ладно ) Смотри в чём главная проблема, на топикстартера походе уже забить, с ним всё понятно, раз тут не отписывается, чуть подрастёт и тоже пойдет во вконтакте работать - порнуху допубертатного возраста модерировать ) Так вот главная проблема в чём - нужно провести склейку старого и нового сайта. Страницы должны быть 1 к 1. т.е. не нужно переводить никаких строк и т.д. и даже кое-где появившийся лишний энтер разобьёт весь текст и поисковики вряд ли склеят. Потому, при таком переносе - переносится только дизайн, старые страницы проще сграбить в html 1 к 1 и на пол года минимум сделать склейку через .htaccess редиректом в котором вы полностью уверены )), опять же не известно как пойдёт ) Но, при желании, можно извратиться и в базу всё затолкать и даже склеить, но вряд ли это топикстартеру нужно, или он понимает зачем ему это нужно, не говоря о том, что он сможет это сделать сам ) Если же надо сграббить скажем так чужие сайты, или сделать несколько вариантов своего, доры например, а лет 10 назад и раньше только этим и занимались все. То зачем тебе скрипт граббинга через PHP, особенно с непонятными регулярками, ты просто настраиваешь граббинг по шаблону, делая возможность менять шаблон под разные сайты, на сколько я понимаю, но ещё ни разу не юзал, для этого есть куча готовых инструментов в питоне. Так вот в итоге инструмент вебмастера выглядит так. Гетт граббер и SQL или XML генератор, допустим под вордпресс. |
14.09.2019, 13:57 | #9 |
Старожил
Регистрация: 12.01.2011
Сообщений: 19,500
|
так тут не надо грабить, юкоз уже всё сграбил и отдал в чем-то типа CSV https://en.wikipedia.org/wiki/Comma-separated_values файла:
Код:
Если предположить, что это единственный вариант экспорта предоставляемый юкозом, то это оптимальный подход, намного проще и надежнее, чем самому грабить с сайта.
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом. |
14.09.2019, 13:59 | #10 |
Александр
Администратор
Регистрация: 28.10.2006
Сообщений: 17,597
|
Ну вот узнали как он хранит данные. С этого топикстартер должен был начинать тему.
Что бы я сделал. Сделал бы переделку в XML файл wordpress формата. в начале строки вставить открывающий тег, слеш теги, первый слеш - один набор тегов, второй слеш другой набор тегов. в конце строги закрывающийся слеш. в итоге был бы цикл по строкам - записям базы, и цикл по стринговому массиву в котором бы хранился набор тегов. Добавлено - а в SQL формат структуру, актуальной вордпресс базы, а она там менялась и не раз. из XML переведёт сам вордпресс. Если бы эти гении из юкоза сделали бы не одинакоый разделитель. а хотя бы так |1| |2| |3| или так |title| |Content| |Meta|, можно было бы в нотепаде вручную за 10 минут перелопатить в тру XML формат, без программирования и подсчётов разделителей. И только понимая всё это можно делать сайты, чтобы ругать криворукость юкозовцев, свою неопытность что вляпался туда, а не красногласить над левым скриптом )) мечтая работать во вконтакте )) Последний раз редактировалось Alar; 14.09.2019 в 14:07. Причина: Добавлено |
|
Опции темы | Поиск в этой теме |
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
[wordpress] Парсинг отзывов с booking.com и oteleus.ru в сайт на wordpress | Atomnsq | Фриланс | 3 | 26.08.2019 22:39 |
Перенос контента сайта с Webasyst на Wordpress | bigbox | Фриланс | 1 | 23.04.2013 15:15 |
ucoz wordPress joomla Вду | ruster05 | WordPress и другие CMS | 0 | 16.03.2011 13:21 |
Перенос с ucoz | velesf | Фриланс | 1 | 14.05.2009 01:28 |