zpět

GDPR a Web Scraping

13.1.2025

Pokud někdo plánuje získávat data z internetu pomocí automatizovaných nástrojů, měl by hned na začátku zpozornět. Web scraping je sice efektivní způsob shromažďování informací, ale jeho realizace může přinést vážné právní problémy, zvláště pokud se pohybujete v EU nebo se vaše činnost týká evropských občanů. GDPR stanoví přísná pravidla pro zacházení s osobními údaji, která platí nejen pro firmy v EU, ale i pro ty mimo ni, pokud zpracovávají data evropských občanů. Co to znamená pro vás a váš projekt?

Pokud web scraping zahrnuje zpracování osobních údajů (například jména, e-maily, fotografie), stáváte se zpracovatelem dat a musíte splnit povinnosti podle GDPR. Největší překážkou je právní základ pro takové zpracování. Nelze jednoduše předpokládat, že data dostupná veřejně na internetu jsou volně k použití. GDPR chrání i tyto údaje.

Jednou z možných cest, jak zůstat v souladu s předpisy, je aplikace oprávněného zájmu podle článku 6 odst. 1 písm. f) GDPR. Tento přístup však vyžaduje splnění několika náročných podmínek. Musíte jasně specifikovat, proč data sbíráte, například pro analýzu trhu, sledování reputace nebo vývoj AI systémů. Je třeba prokázat, že váš zájem o zpracování dat nepřevyšuje práva a svobody dotčených osob, což znamená, že nesmíte zasahovat do soukromí jednotlivců nepřiměřeným způsobem. Musíte také informovat osoby, jejichž data sbíráte, což může být složité, pokud data pocházejí z velkého množství zdrojů.

Evropská praxe ukazuje, že výklad pojmu „oprávněný zájem“ není jednotný. Například nizozemský úřad pro ochranu osobních údajů se striktně staví proti tomu, aby byl oprávněný zájem používán pro komerční účely. Tento postoj byl vyjádřen v případu Nizozemské tenisové asociace, která sdílela osobní údaje svých členů s partnery za účelem marketingu. Asociace tvrdila, že jde o podporu tenisového sportu, ale úřad dospěl k závěru, že šlo o čistě komerční motiv, a udělil pokutu ve výši 525 000 EUR. Naopak Soudní dvůr EU v rozsudku z října 2024 připustil, že i komerční cíl může být oprávněným zájmem, pokud projde balančním testem. Správce musí ale zároveň prokázat, že neexistuje jiný, méně invazivní způsob, jak daného cíle dosáhnout.

Definujte účel: Ujasněte si, proč data sbíráte, a zajistěte, že účel odpovídá zásadám GDPR. Data sbírejte pouze v nezbytném rozsahu pro dosažení tohoto účelu. Připravte si balanční test a zdokumentujte své procesy, což vám pomůže v případě auditu nebo sporu. Filtrujte osobní údaje, pokud není jejich sběr nezbytný, a zvažte anonymizaci nebo jejich vynechání. Implementujte silná bezpečnostní opatření, abyste ochránili získaná data před zneužitím. Pokud je to možné, informujte jednotlivce o zpracování jejich dat. Pokud to není možné, dbejte na doložení důvodů, proč tak nelze učinit, a odkazujte se na výjimky dle čl. 14 odst. 5 GDPR.


Web scraping je mocný nástroj, ale jeho zneužití může vést k vysokým pokutám a reputačním škodám. Při projektech založených na této technice by měly být právní aspekty plánování stejně důležité jako realizace. Nařízení GDPR nepřestává být dynamickým rámcem, který se dále vyvíjí. Soudní precedensy budou hrát klíčovou roli při vyjasňování hranic použití oprávněného zájmu i jiných právních základů. Důsledná příprava a obezřetný přístup jsou tím nejlepším, co můžete udělat, aby vaše projekty byly úspěšné a v souladu s předpisy.