При подготовке статьи в блог, рекламного поста в социальной сети, либо наполнении каталога для интернет-магазина важно подобрать правильные изображения. Чаще всего, речь идет о поиске тематических картинок по ключевым словам через поисковые системы. Однако, подобное решение актуально далеко не всегда. Особенно, если товарный ассортимент вашего магазина представлен десятками тысяч отдельных позиций. Благо сегодня, этот процесс можно автоматизировать, используя парсер картинок с сайта производителя, поставщика или фотостоков.
Что такое парсинг фото?

Парсинг изображений – автоматический сбор картинок, фотографий, иллюстраций к статьям из открытых источников по параметрам, заданным пользователем. В процессе поиска, программа может учитывать:
- Ключевые слова или артикул;
- Размер изображения;
- Вес файла.
Кроме того, парсить можно как отдельный сайт или страницу, так и поисковую выдачу. В результате, вы получаете «пачку» картинок, релевантных заданным параметрам, затратив минимум времени или усилий.
Причем результаты парсинга могут выводится в виде:
- Папки с изображениями;
- Ссылок на картинки.
Первый вариант позволяет выгружать найденные фото на сайт или в группы соцсетей вручную, через или админ-панель. URL же используют при импорте графики посредством CMS: система управления контентом в интернет-магазине способна сама скачать их по внешним урлам, выгружая их в файловую систему автоматически.
Виды парсеров картинок
По сути, любой платный или бесплатный парсер сайтов может осуществлять скачивание картинок по параметрам, задаваемым во время настройки. Поэтому деление на категории происходит по аналогии с инструментами, скачивающими текстовый контент или файлы, лежащие в открытом доступе на сайте. Тем не менее, чтобы подобрать правильный инструмент, важно разобрать каждый из них по отдельности.
Десктопные парсеры
Приложения, требующие установки на компьютер. Различаются по интерфейсу, функционалу, гибкости настроек параметров поиска и прочим критериям. Задействует вычислительные мощности локальной машины, позволяет сохранять скачанные изображения в отдельную папку или архив.
К достоинствам десктопных парсеров можно отнести:
- Простоту настройки параметров поиска картинок;
- Разнообразие параметров парсинга изображений;
- Возможность одновременного сканирования нескольких сайтов;
- Уникализация фото онлайн для исключения проблем с авторским правом.
Но есть и минусы. Во-первых – нужно тратить время на установку и «чистить» память. Во-вторых, далеко не все программы бесплатны: демо-версии предлагают временное пользование, либо «урезанный» функционал. В-третьих, при настройке отдельных инструментов могут понадобиться базовые навыки программирования.
Сервисы онлайн парсинга
Популярность онлайн-сервисов, автоматизирующих загрузку фото по заданным параметрам, растет в геометрической прогрессии. Ведь во-первых, их не нужно устанавливать на компьютер, во-вторых – они не затрагивают вычислительные мощности вашей «машины», в-третьих, их разработчики стараются сделать максимально простой, понятный и удобный интерфейс, пользоваться которым сможет каждый. При этом стоит отметить, что результаты могут сохраняться сразу на ПК, съемный носитель или в облачное хранилище.
Плюсы:
- Простота использования;
- Возможность запуска с любого устройства;
- Высокая скорость сканирования сайтов;
- Возможность выгрузки найденных фото в общий доступ.
К минусам же можно отнести ограничения на одновременное сканирование нескольких ресурсов (5-10 в бесплатных версиях), сравнительно небольшое количество настраиваемых параметров поиска, ограничения на объем скачиваемых фото при парсинге из соцсетей в рамках одного поискового запроса.
Платные сервисы с подпиской
Для поддержки работоспособности онлайн-сервисов, большинство из них работают по модели платной подписки, предлагая пользователям несколько десятков различных тарифов. Оплата может производиться по количеству картинок, либо за использование парсера в течение дня, недели, месяца, квартала или полугодия.
Платные сервисы для парсинга картинок отличаются:
- Не урезанным функционалом;
- Отсутствием ограничений по массовой выгрузке изображений;
- Возможностью задействования более 10 источников при поиске нужных фото.
Единственным недостатком считается стоимость подписки: в отдельных случаях, за использование сервиса придется заплатить до $100 (с учетом актуального курса валют, сумма не маленькая, особенно – для частного использования).
Скрипты надстройки
В этом формате, парсером выступает Microsoft Excel с набором макросов, отвечающих за выполнение определенных функций. К достоинствам можно отнести:
- Отсутствие нагрузки на «железо» компьютера;
- Простота поиска нужной картинки в результатах парсинга;
- Формирование универсальной базы с таблицами, содержащими URL нужных изображений.
Из минусов – примитивный функционал, минимум настроек, сравнительно невысокая скорость работы, а также множество ошибок, вынуждающих «чистить» список полученных ссылок вручную.
Инструменты для парсинга изображений
Парсить картинки с сайта можно с помощью десятков различных инструментов. Причем большинство из них имеют схожий функционал, поскольку в основу программ, онлайн-сервисов и надстроек заложен аналогичный алгоритм работы. Различие – в интерфейсе, функционале и требованиях по оплате за их использование. К списку самых популярных парсеров графики, используемых разработчиками, контент-менеджерами и владельцами интернет-магазинов, можно отнести:
Image Parser
Представлен в формате расширения для браузера Google Chrome, доступен в магазине плагинов. После установки, соответствующий значок появляется в левом верхнем углу окна, около адресной строки.
Для запуска парсинга достаточно перейти на нужный сайт и кликнуть по иконке расширения: плагин откроет новое окно с найденными изображениями и предложит сохранить их в zip-архив. При этом стоит отметить, что:
- Дополнение абсолютно бесплатно;
- Поддерживаемые форматы – png, jpg, jpeg, gif;
- Image Parser скачивает даже “защищенные” картинки;
- Возможно получение списка ссылок на изображения.
Из минусов – необходимость в переходе на сайт, отсутствие многозадачности и настроек выборки.
PictureGoogleGraber
Простой и бесплатный сервис для парсинга картинок из выдачи Google с интуитивно понятным интерфейсом. По умолчанию скачивает самые большие файлы из доступных, после настройки можно задать свои параметры по высоте, ширине, разрешению или ориентации. Одновременно с графикой, копирует URL картинки. Может работать в 10 потоков.
Из достоинств:
- Отсутствие обязательной платы за использование сервиса;
- Молниеносная загрузка изображений по заданным параметрам;
- Выгрузка ссылок на картинки в отдельный файл.
К недостаткам же можно отнести минимум настроек, а также срабатывание антивирусного ПО во время установки программы.
ImageGrabber RX
Платная программа, способная анализировать десятки сайтов одновременно, либо «вытаскивать» все картинки с конкретного указанного источника. Может фильтровать картинки по размеру, а также сравнивать скачиваемый контент с имеющейся базой изображений. Возможна выгрузка только уникальных картинок, что исключает дублирование файлов даже при разных названиях.
Преимущества:
- Оперативность скачивания изображений;
- Интеллектуальный анализ картинок;
- Автоматическое сравнение скачиваемых и сохраненных изображений;
- Фильтрация файлов с мелким разрешением.
Из недостатков – платная лицензия, а также отсутствие инструментов для обхода блокировок при парсинге.
GoogleImageFinder
Парсер Google-изображений с простым интерфейсом, готовый к работе сразу после скачивания. Обладает множеством настроек: от количества, до параметров скачиваемой графики. Позволяет «раскладывать» картинки в папки соответственно запросу, может уникализировать сохраненные изображения в автоматическом режиме.
Интересен за счет:
- Демо-версии с полным функционалом;
- Разнообразия поисковых инструментов;
- Мультизадачности с сохранением скорости;
- Сохранения исходных названий файлов;
- Создания отдельного списка ссылок на картинки.
Минусы – по истечение демо-режима придется покупать лицензию на использование программы, а также ориентация исключительно на Google.
Работа с парсерами картинок
Независимо от используемого инструмента, процесс парсинга картинок происходит по схожему алгоритму:
- Запуск программы, сервиса или скрипта;
- Указание ссылки на сайт, страницу или паблик в соцсети;
- Выбрать параметры фильтрации изображений;
- Нажать кнопку «Запустить».
Десктопное приложение сохранит найденную графику в отдельную папку, онлайн-сервис предложит «выгрузить» фото в архив для скачивания, или сохранить результаты парсинга в облачном хранилище.
При парсинге картинок по ключевым словам, укажите:
- формат изображения;
- ориентацию;
- размер картинки;
- объем файла.
Это сузит область поиска, упростив выборку графики для дальнейшей публикации на вашем сайте.
Наиболее частые проблемы и их решения
Схема работы парсеров поисковой выдачи одинакова:
- Эмулирование запроса пользователя по ключевому слову;
- Формирование выдачи картинок по заданному параметру;
- Сохранение изображений из топа как нужных.
В большинстве случаев, выборка получается максимально точной. Но могут быть и проблемы:
- При поиске фото товаров по артикулу программа может сохранить наименование другого цвета;
- Сохраненные картинки могут сопровождаться водяными знаками, использующимися для защиты от парсеров;
- Низкочастотные и смешанные запросы могут вывести в топ выдачи совершенно непонятные, нерелевантные картинки;
- Блокировка IP, с которого осуществляется парсинг: в этом случае, весь архив будет состоять из картинок с уведомлением об ошибке 404.
Увы, но универсального решения не существует. Поэтому парсинг изображений требует постоянного контроля, подключения прокси-серверов и VPN с регулярно меняющимся IP и т.д.
При этом стоит отметить, что возможность скачивания картинок зависит от сложности ресурса. Если сайт создан на языках программирования высокого уровня, вероятность успешного парсинга нужных вам изображений близка к нулевой.
Единственное, что можно сделать – снизить вероятность блокировки, выставив правильные параметры сканирования в соответствии с нормами поведенческих факторов пользователей:
- Средняя скорость просмотра страниц;
- Использование разных IP для разных сайтов;
- Автоматическое одобрение отправки
Кроме того, “достать” нужные картинки со сложных сайтов можно, просто запустив парсинг по их мобильной версии!