Ельчук, К. PHP: выцарапаем данные с сайта

Ельчук, К. PHP: выцарапаем данные с сайта [Текст] : [програмирование на PHP] : [извлечение данных с сайтов (scraping websites) при помощи PHP и регулярных выражений] : [практическое руководство] / Кент Ельчук [Kent Elchuk]  //  Linux Format. — 2014. — № 4 (182), апр.. — С. 76-79. — (Академия кодинга) (PHP). — Прил.: "Получаем удаленный контент и фильтруем вывод" : [способы получения содержимого страниц — потоки RSS, API, поиск и замена шаблона] : [краткая информация]. — С. 76 ; "Мониторинг ветра перемен" : [как следует изменить программу, чтобы она получала необходимые данные в случае изменения кода сайта] ; "Скорая помощь. Функции file_get_contents() и curl умеют загружать web-страницы и превращать их в строки!" : [краткая информация]. — С. 77 ; "Юридический аспект извлечения данных" : [публикация извлеченных данных в Сети повлечет за собой судебное преследование за нарушение авторского права и нанесение материального ущерба; Amazon принял жесткие меры в отношении сторонних провайдеров, использовавших средства извлечения данных с сайта компании без официального разрешения (Ecommercebytes, http://bit.ly/1bjmDCX); использование программ извлечения данных из сайтов как спорная тема] ; "Скорая помощь. Функция preg_match() может найти в строке одно совпадение, а preg_match_all() — все повторяющиеся совпадения!" : [краткая информация]. — С. 79. 
     Аннотация

     Извлечение данных с сайтов (scraping websites) на примере поиска стоимости товаров в www.amazon.com с помощью функций PHP и регулярных выражений (Regex). Рассмотрено извлечение информация об одном продукте на примере электронной книги Кента Ельчука "MYSQL. Fundamentals and Snippets", получение информации об одном и том же продукте у разных продавцов. Написание и код программы для поиска и извлечения данных из сайтов, которая находит интересующие продукты и проверяет их на заданные критерии. 



Оставить коментарий

Ваш email не будет опубликован.

Вы можете использовать HTML теги с атрибутами: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>