Парсер или граббер?

Дек 07 2011 Published by under Software

Что такое парсер и граббер?

Парсер — программа, благодаря которой можно парсить страницы. В основном применяется для поиска куска кода, или для того, чтобы выделить логические части документа.

Граббер — это специализированный скрипт, который позволяет «выкачивать» информацию с чужих сайтов на свой.

Часто эти понятия путают, но по факту парсер php и граббер это разные вещи. Допустим, вы хотите автоматически скопировать на свой сайт статью с другого ресурса. Оставим за кавычками этическую часть вопроса и рассмотрим техническую. Задача складывается по сути из двух пунктов:

1. Скопировать исходный код по требуемым параметрам себе

2. Обработать полученный код.

Первым занимается граббер, вторым парсер php. Все просто и понятно.

Зачем нужны парсеры и грабберы?

1. Для актуальности информации. К примеру, вашим пользователям  текущий курс валют или прогноз погоды. Изменять курс в ручную обычно не удобно, так как требует ежедневного внимания к веб-ресурсу. А что делать если информация меняется слишком быстро и не равномерно. Если для вас важно, чтоб на сайте всегда находилась самая актуальная информация и при этом чтобы вам не приходилось самому постоянно ее обновлять, то наилучшим решением будет использовать скрипт граббера или парсер php.

2. Для автоматического обновления страниц. Сайт, информация на котором редко обновляется обычно редко посещается. Но что делать если вам не хватает времени обновлять информацию на сайте? Использовать автоматическое добавление новостей, новых статей по тематике сайта и прочей информации с других ресурсов схожей тематики с помощью специализированных скриптов — парсера новостей или граббера контента сайтов.

3. Моментальное наполнение сайта полезной информацией. Все ресурсы сети когда то начинались «с нуля». Однако если ваш ресурс направлен на предоставление информации (каталог ссылок, архив рефератов, база текстов или аккордов песен), то заполнять сайт с нуля в ручную — процесс долгий и трудоемкий. Парсеры php и грабберы (например граббер ссылок) — отличное решения задач подобного рода.

В интернете довольно много различный скриптов, которые продаются любителям быстро наполнить свой сайт чужим контентом. Рассмотрим основные из них.

 WP Uniparser

Comments are off for this post