Собирать информацию в сети можно сразу несколькими способами. Так, при большом желании и наличии свободного времени, вы можете сделать это вручную, изучая каждый источник по отдельности. Для ускорения, задачу можно распределить между несколькими специалистами. Однако самым быстрым и эффективным способом все-таки считается парсинг, при котором сбор данных, находящихся в открытом доступе, осуществляется посредством программного обеспечения, позволяющего не просто достать нужные сведения, а и систематизировать их, преобразуя в любой удобный для использования формат.
Полученные сведения можно использовать в различных целях: от написания научных трудов, до аналитики в электронной коммерции. Но законно ли парсить сайты, насколько законен ли парсинг? Есть ли ограничения, касающиеся извлечения информации с чужих страниц? Бывали ли прецеденты, когда парсинг стал причиной громких судебных разбирательств? Парсинг это законно?

Парсинг с точки зрения закона
На сегодняшний день, законодательства большинства стран не воспрещают пользоваться информацией, размещенной в открытых источниках, коими и являются сайты в сети интернет.
Определения понятия парсинга нет, равно как нет его и для смежных понятий краулинг (обход ограничений сайта) и скрайпинг (объединенный в одну программу краулинг и парсинг).
Так как парсинг — это один из способов сбора информации, то этот процесс подчиняется правилам, установленным для обращения с информацией, в частности, Закону Украины «Об информации».
Он делит информацию по двум критериям:
- по содержанию;
- по режиму доступа;
Причем режим доступа определяется, в том числе, по содержанию.
Любая информация является открытой, кроме той, которая отнесена к информации с ограниченным доступом. Соответственно, можно использовать любую информацию, которая не ограничена в доступе.
В свою очередь информация с ограниченным доступом делится на конфиденциальную, тайную и служебную. Определения каждого вида содержатся в Законе Украины «О доступе к публичной информации». Нас интересует в первую очередь определение конфиденциальной информации, потому что, вероятнее всего, спор о правомерности парсинга будет сводиться к тому, была ли «спарсенная информация» конфиденциальной. К тому же тайная или служебная информация точно не будет находиться в открытом доступе на сайте.
Какие есть ограничения в парсинге
Если информация находится в открытом доступе, не защищена законом об авторских и смежных правах, а её сбор осуществляется законными способами и не приводит к нарушению работы сайта или ограничению конкуренции, сбор информации даже посредством ПО считается вполне легальным. Во избежание проблем, парсинг не должен использоваться ради:
- Извлечения контента, защищенного авторским правом;
- Создания помех для стабильной работы сайта;
- Несанкционированного получения личных (персональных) данных.
При этом стоит отметить, что запрет на использование контента, размещенного на сайте, а также парсинг персональных данных может быть прописан в условиях использования ресурса.
Громкие судебные случаи из-за парсинга
Мировой судебной практике известно несколько ярких прецедентных случаев, связанных с парсингом данных:
- 2000-2009: eBay против Bidders Edge. Изначально, суды встали на сторону истца, пояснив свою позицию тем, что высокая активность ботов вредит скорости загрузки страниц и снижает конверсию маркетплейса. Чуть позже, в деле Intel против Hamidi, стороне обвинения удалось доказать, что Доктрина о нарушении границ движимого имущества не распространяется на компьютерную среду без физического ущерба личной собственности;
- 2009: Facebook против агрегатора Power.com. В пользовательском соглашении социальной сети указан запрет на полное копирование веб-сайта. Суд встал на сторону медиагиганта, ссылаясь на закон о защите авторского права;
- 2010: дело Ауэрнхаймера. Воспользовавшись брешью в системе безопасности сайта мобильного оператора AT&T, хакер извлек базу данных с адресами электронных почт пользователей, использовавших сервис с iPad. Суд встал на сторону обвинения, сославшись на закон о защите персональных данных.
И это лишь малая часть известных прецедентов, преданных всеобщей огласке, ведь многие сети продолжают использовать парсинг персональных данных, особенно тех, которые Скрыты от просмотра.