В руках умелого специалиста, веб-скрепинг становится мощным инструментом, позволяющим извлекать большие массивы полезной информации для использования в различных целях – от проведения маркетинговых исследований, до быстрого наполнения сайта релевантным контентом. Но несмотря на полезность и эффективность, часть специалистов отказываются от использования скреперов и парсеров из-за сомнений в законности этого инструмента. Можно ли парсить сайты без разрешения? Что можно парсить?

Сам по себе, скрепинг не является чем-то противозаконным. Тем не менее, существуют определенные юридические, моральные и этические ограничения, удерживающие компании от использования скриптов и программ, извлекающих информацию со страниц конкурентов. Так, парсинг оказывается незаконным в случае:
- Если копирование запрещено условиями использования ресурса и прописано в пользовательском соглашении;
- Когда контент защищен авторским правом и полное копирование может привести к подаче иска о его нарушении;
- Извлечения базы данных без устного, письменного или задокументированного согласия её владельца;
- Воспроизведения товарных знаков компании, что влечет за собой судебные тяжбы о нарушении прав на их использование или выдачу;
- Сбора информации о физических лицах, рассматриваемой как «личные данные» (ФИО, город проживания, контакты и т.д.).
Кроме того, скрепинг для нанесения ущерба компьютеру (в т.ч. повреждения, частичного или полного удаления информации), а также получения удаленного доступа к данным пользователя является преступлением и тянет за собой криминальную ответственность.
При этом стоит отметить, что правомерность использования парсеров зависит от особенностей, нюансов и тонкостей законодательства той или иной страны. Важно помнить, что сбор общедоступной информации из открытых источников не противоречит ни одному закону о защите цифровой собственности. Ведь если бы это было незаконно, компания Google не смогла бы существовать и развиваться, т.к. боты поисковой системы собирают данные со всех существующих сайтов.
Безопасный парсинг:
- Может осуществляться из любого браузера;
- Не должен создавать нагрузки на сервер;
- Извлекает информацию, видимую обычным пользователям.
Иными словами, пока веб-скреперы не получают «несанкционированный» доступ к «закрытой» информации, они не нарушают требований действующего законодательства и не попадают под закон «О компьютерном мошенничестве и злоупотреблениях» (CFAA).
Но есть несколько моментов, т.к. тот же Facebook запрещает копирование любых данных без согласования с главным офисом. В таком случае, парсинг является незаконным и может стать причиной судебного иска со стороны социальной сети. В остальном же, извлечение общедоступной информации из открытых источников вполне легально.