Почему не удается получить данные из iframe с JavaScript

Если вы уже некоторые время работаете с JavaScript, то вероятнее всего вы можете столкнуться с проблемой получения данных (текста и т.д.) из iframe. Это не так просто в JavaScript, потому что есть ограничения по «Same-origin policy». В этой записи я подробно опишу что это такое, почему эта проблема происходит и как её обойти.
Читать далее…

Как сделать скриншот сайта с помощью PhantomJS?

PhantomJS — это удобный инструмент для тестирования веб-приложений, который может также быть использоваться для скрапинга данных. В этой записи я покажу вам как сделать скриншот с его помощью. 
Читать далее…

Проблема с timeout’ом PhantomJS запущенным с PHP

PhantomJS — это отличный инструмент для тестирования ваших веб-приложений, и в целях парсинга данных с сайтов. В первом и во втором случае вам нужно правильно написать код, чтобы в конечном итоге завершить запущенный процесс PhantomJS. Если он не будет завершен, тогда он зависнет и будет нагружать сервер.
Читать далее…

Парсинг Яндекс новостей с помощью Phantomjs

Меня еще с самого начала моего пути как разработчика интересовал парсинг данных. Я всегда хотел делать половину моих задач автоматически. В свое время, я работал с разными вариантами парсинга. Пробовал это делать с помощью cURL (обычным получением HTML и парсингом по классам) и используя разные библиотеки. В один момент я наткнулся на PhantomJS.
Читать далее…