s-timmi ← НА ГЛАВНУЮ

Парсинг чужих баз: где заканчивается «открытые данные» и начинается иск

Дело «ВКонтакте» против «Дабл Дата» и история LinkedIn vs hiQ Labs показывают, насколько тонкая грань между анализом и кражей.

Выкачать данные о людях и товарах сегодня — вопрос пары скриптов. А вот вопрос, прилетит ли за это иск, — куда менее технический. Юристы habr.com разобрали, когда сбор информации из открытых источников превращается в посягательство на чужую базу данных — с разбором ключевых российских и западных кейсов.

Сайт — это тоже база данных

Каталог маркетплейса, лента соцсети, справочник — всё это юридически может быть базой данных, права на которую принадлежат тому, кто её собрал и поддерживает. Контент туда заливают пользователи? Не важно — изготовителем считается тот, кто вложил в продукт деньги, людей и инфраструктуру.

Показательная история — спор ООО «В Контакте» против ООО «Дабл Дата», начавшийся в 2017 году. «Дабл Дата» запустила поисковик по аккаунтам, визуализатор связей и инструмент для поиска дублей профилей — и, по версии соцсети, использовала всё это для скоринга без разрешения. Дело прошло несколько инстанций и закончилось мировым в Суде по интеллектуальным правам. Но позиция СИП успела закрепить важное: правообладателем БД остаётся тот, кто её организовал, даже если наполняли её сами пользователи.

Где грань между «можно» и «нельзя»

Свобода доступа к информации в Конституции есть, и отдельные факты — цены, характеристики, общедоступные сведения — авторским правом не охраняются. Но у изготовителя базы данных есть исключительное право, если в её создание вложены ресурсы. И главное правило: нельзя систематически извлекать существенную часть чужой БД.

Минимальная гигиена при парсинге

А что у них

Классика — LinkedIn против hiQ Labs. Первая инстанция и апелляция США встали на сторону парсеров: если пользователи сами открыли страницы, ограничивать доступ нельзя. Верховный суд отправил дело на пересмотр со ссылкой на кейс полицейского Ван Бюрена, который имел доступ к базе, но использовал его не по назначению. Итог: к публичным страницам концепцию «неавторизованного доступа» не натянуть, но платформы спокойно прописывают запреты в пользовательском соглашении — и за их нарушение уже идут в суд.

Что с этим делать

Если вы строите продукт на чужих данных — оцените три вещи: объём извлечения, коммерческую цель и пользовательское соглашение источника. Парсинг сам по себе не криминал, но «существенная часть чужой БД + деньги» — это формула иска, а не бизнес-модели.

#судебная практика#прецеденты#авторские права