Выкачать данные о людях и товарах сегодня — вопрос пары скриптов. А вот вопрос, прилетит ли за это иск, — куда менее технический. Юристы habr.com разобрали, когда сбор информации из открытых источников превращается в посягательство на чужую базу данных — с разбором ключевых российских и западных кейсов.
Сайт — это тоже база данных
Каталог маркетплейса, лента соцсети, справочник — всё это юридически может быть базой данных, права на которую принадлежат тому, кто её собрал и поддерживает. Контент туда заливают пользователи? Не важно — изготовителем считается тот, кто вложил в продукт деньги, людей и инфраструктуру.
Показательная история — спор ООО «В Контакте» против ООО «Дабл Дата», начавшийся в 2017 году. «Дабл Дата» запустила поисковик по аккаунтам, визуализатор связей и инструмент для поиска дублей профилей — и, по версии соцсети, использовала всё это для скоринга без разрешения. Дело прошло несколько инстанций и закончилось мировым в Суде по интеллектуальным правам. Но позиция СИП успела закрепить важное: правообладателем БД остаётся тот, кто её организовал, даже если наполняли её сами пользователи.
Где грань между «можно» и «нельзя»
Свобода доступа к информации в Конституции есть, и отдельные факты — цены, характеристики, общедоступные сведения — авторским правом не охраняются. Но у изготовителя базы данных есть исключительное право, если в её создание вложены ресурсы. И главное правило: нельзя систематически извлекать существенную часть чужой БД.
- Пара профилей в учебных или личных целях — скорее всего, окей.
- Парсинг тысяч профилей с последующей перепродажей аналитики — почти гарантированный иск.
- Структура самой базы тоже под защитой — копировать её организацию нельзя.
Минимальная гигиена при парсинге
- Не трогать персональные данные, если разрешение прямо не прописано в законе.
- Не выкачивать эксклюзивный контент.
- Сверяться с robots.txt сайта — это формальный сигнал владельца.
- Не долбить систему частыми запросами: это уже похоже на атаку.
А что у них
Классика — LinkedIn против hiQ Labs. Первая инстанция и апелляция США встали на сторону парсеров: если пользователи сами открыли страницы, ограничивать доступ нельзя. Верховный суд отправил дело на пересмотр со ссылкой на кейс полицейского Ван Бюрена, который имел доступ к базе, но использовал его не по назначению. Итог: к публичным страницам концепцию «неавторизованного доступа» не натянуть, но платформы спокойно прописывают запреты в пользовательском соглашении — и за их нарушение уже идут в суд.
Что с этим делать
Если вы строите продукт на чужих данных — оцените три вещи: объём извлечения, коммерческую цель и пользовательское соглашение источника. Парсинг сам по себе не криминал, но «существенная часть чужой БД + деньги» — это формула иска, а не бизнес-модели.