Плагин-граббер для WP

24 Мар
2011

Собственно сабж :)

Получилось так, что мне потребовался грабер который бы сливал новости с ньюслэнда ко мне на сайт, т.к. все подобные граберы пишутся в три десятка строк, в одном файле и благополучно забываются через неделю использования, что привод к тому, что через какое то время снова нужно выдумывать тот же велосипед, решил сделать все более-менее цивильно и сварганить плагин к ВП. Что собственно и сделал. Писал его для себя, отсюда некоторое специфические моменты его работы.

Детально, его работа описывается следующим образом: Граббер получает RSS поток определенной категории! (т.е. не все подряд, а именно нужной категории), парсит его выдирая ссылки на новость. По этим ссылкам посещает странички, слизывает текст, теги, заголовок, источник новости и картинку. Картинку переписывает на фтп. Далее от определенного пользователя в нужную категорию вставляет пост с содержанием сграбленной новости. Запускается по расписанию.  Одинаковые новости не постит, т.е. перед вставкой проверяет наличие новости среди уже опубликованных. Источник новости, хоть и не используется в посте, но тем не менее по нему, определяется не является ли сайт, на котором запущен плагин, источником, в этом случае она не будет вставлена.  Собственно все.

Скриншот админки:

Настройки плагина:

URL адрес RSS ленты — указываете RSS поток нужной категории .
Пользователь
— имя пользователя, который будет постить новости.
ID категории — тут вставляете ID (не название!) категории в которую будет вставляться новость, можно указать несколько, через запятую.
Периодичность запуска — частотность запуска скрипта, всего три варианта это 1.hourly — раз в час, 2.twicedaily — раз в 12 часов, 3.daily — раз в день.
Папка для картинок — тут указываете папку куда будут переписываться фотографии которые используются в новостях. На момент запуска плагина, папка должна быть создана, и права должны быть установлены в 777.  Папка указывается от wp-content без первого и последнего слеша, например: вы создали папку “imagespatch” в директории wp-content, установили на нее права 777, и хотите использовать ее в качестве хранилища картинок, тогда в этом поле вам нужно указать “imagespatch”. Для папки “imagespatch/patch1/patch2/” нужно будет указать “imagespatch/patch1/patch2”, т.е. без последнего знака “/”.

Указываете все параметры, кликаете по сохранить, и потом щелкаете по кнопке “Начать работу”. Все плагин начнет работать в соответствии с установленным параметром “Периодичность запуска”. Его первый запуск состоится через интервал указанный в настройках.

Ну и теперь ложка дегтя. Плагин использует функцию “set_time_limit(0)”, а для ее использования (как правило) необходим свой сервер, vps или vds это не важно, на виртуальном хостинге, скорее всего, работать не будет. Однако, даже если эта функция не сработает, то плагин все же будет работать, но не на полную мощь.

Единственная просьба к тем кто будет юзать данный шедевр в своих корыстных целях: — “Найдете косяк, напишите мне о нем”. За сим откланиваюсь.

Скачать плагин для WP — Elche Graber 0.1

слов — 429, знаков: с пробелами — 3018, без пробелов — 2590
google.com bobrdobr.ru del.icio.us technorati.com linkstore.ru news2.ru rumarkz.ru memori.ru moemesto.ru
Читайте так же:

Комментировать

Вы должны войти чтобы комментировать.


Наверх