Rozpoznávání tváří se hlásí ke slovu. Jaká jsou rizika?

NÁZORY ČTENÁŘŮ

Rozpoznávání tváří se hlásí ke slovu. Jaká jsou rizika?
Názory čtenářů

Pavel Janský

Před několika dny schválil Evropský parlament zprávu o využití umělé inteligence pro vojenské a civilní účely. Dokument zmiňuje, mimo jiné, i využití technologií na rozpoznávání tváří. A právě pasáže této části zprávy byly příčinou, proč někteří naši europoslanci pro schválení tohoto dokumentu nehlasovali.

Hlavní výhrady, které poslanci vyjadřují, plynou z možnosti použití této technologie k plošnému sledování obyvatel. Tyto obavy jsou jistě namístě. Zároveň je dobré zdůraznit, že toto plošné sledování, pokud by k němu docházelo, či pokud k němu dochází, nemusí mít technicky vzato s umělou inteligencí (Artificial Intelligence, AI) přímou souvislost.

To, co učiní z technologie rozpoznávání obličejů nástroj k velmi efektivnímu sledování je až následné cílené spojování identifikované osoby a dílčích dat z různých informačních zdrojů a jejich následné využití. Pokud k tomuto dochází navíc v reálném čase, možnosti špehování jsou téměř nekonečné. Abychom mohli posoudit rizika použití těchto technologií pro veřejnost, je dobré porozumět obecnému principu jejich funkce.

Samotná technologie pro rozpoznávání obličejů je IT expertům z AI komunity dnes již dobře známá a dostupná. Existuje mnoho ověřených a veřejně přístupných modelů speciálních neuronových sítí, které byly pro tyto účely navrženy a úspěšně odskoušeny. Abychom však mohli tyto modely použít, musíme je rozpoznávání obličejů natrénovat. A zde se nachází jedno z úskalí této technologie. Přesnost a tedy úspěšnost těchto systémů závisí jednak na výpočetní síle, kterou máme k dispozici, a pak, a to je velmi důležité, na množství dat, které k natrénování dokážeme získat.

Trénování systémů pro rozpoznávání tváří spočívá v tom, že systému předkládáme obrázky tváří osob, které chceme rozpoznávat. Čím více takových obrázků pokud možno i pořízených z různých úhlů, tím lépe. Například pokud budeme chtít hledat jednoho určitého zločince, musíme mít dostatečné množství jeho fotografií, kde budeme jistojistě vědět, že tato osoba je na obrázcích zachycena a tuto informaci předáme, spolu s obrázky, systému, který trénujeme. Množství dat, které takto systému předáme je velmi důležité pro budoucí přesnost. Samozřejmě požadavek na celkové množství obrázků roste s tím kolik osob budeme chtít umožnit takto identifikovat. Pokud bychom chtěli použít systém k určení totožnosti například osoby, jenž se dopustila násilí v metru, kterýžto čin byl zaznamenán kamerami, tak pokud nemáme systém natrénovaný na obrázky osoby, která útok provedla, nebudeme úspěšní. I kdyby náš systém byl natrénován na obrázky všech osob, které kdy byly odsouzeny pro násilné činy (ponechme stranou otázku nakolik toto je legálně možné), útočníka ze záznamu kamer, pokud nebyl nikdy pro takový čin odsouzen, by taktéž nebylo možné systémem identifikovat.

A zde se dostáváme k problému plošné identifikace. Pokud by systém na rozpoznávání tváří byl natrénován například na celou populaci České republiky, a útočník by byl občanem této země, pak bychom byli v identifikaci úspěšní.
Pomineme-li argumentaci, zda, kdo a kdy by měl mít možnost tuto plošnou identifikaci osob používat, a pokud se budeme zabývat pouze technickou stránkou problému, pak to co je podstatné je opět množství dat potřebné pro tyto účely. Pro představu – Baidu, což je čínská obdoba Google, uváděl před několika lety, že pro training svého v té době pravděpodobně nejlepšího systému na rozpoznávání obličejů použil více než 200 milionů obrázků.
Potřeba velkého množství označených dat tak následně vyvolává otázku jejich dostupnosti. Státní správy zemí, pokud se rozhodnou jít touto cestou, mají jistě přístup k fotografiím pořízenými při vystavení osobních dokladů občanům. Zde je spolehlivě spojena identifikace osoby s její fotografií. Dalšími zdroji mohou být fotografie z policejních archivů, identifikačních systémů na letištích a podobně. Pro spolehlivé fungování systému na rozpoznávání obličejů, který by měl být být účinný pro celou populaci země však to zřejmě stačit nebude. Je sice možné užít postupy, kdy se nedostatek původních dat nahradí daty odvozenými, toto lze však použít jen omezeně. Existuje však jiný, obrovský zdroj označených fotografií osob. Tímto zdrojem je, jak jinak, internet.

V minulém roce vzbudila pozornost médií firma Clearview AI působící v New Yorku. CEO firmy předvedl redaktorům okamžitou identifikaci osoby na základě obrázku, který mu v redakci předložili, včetně úspěšné spontánní identifikace osoby, jejíž obraz CEO Clearview vyfotografoval mobilním telefonem z displeje laptopu přineseného v průběhu rozhovoru.
Tajemstvím vysoké přesnosti systému Clearview při možnostech plošné identifikace osob je obrovské množství dat, které bylo použito k jeho trénování. Clearview uvádí, že se jedná o 3 miliardy obrázků, které jsou veřejně přístupné na internetu. Jedná se o veřejné fotografie ze sítí jako je Facebook, Instagram, Linkedin a podobných, kde jsou vedle fotografií uvedena i jména vyobrazených. Dále jsou to veřejné weby společností s fotografiemi zaměstnanců atp. Clearview tedy provedl scan internetu a hledal fotografie spolu s informacemi, kdo je na fotografiích zobrazen. Tím získali materiál, kterým bylo možné natrénovat jejich AI systém na rozpoznávání tváří.

Tento přístup k získávání dat vychází z názoru, že pouhé určení jména osoby systémem poháněným AI, za použití veřejných informací z internetu je legální. Nakonec fotografie zřejmě tato osoba umístila na web s vědomím, že mohou být viděny potenciálně miliony návštěvníků. Z technického hlediska se tedy zdá být problém zdroje dat pro trénování systému vyřešen. Tím jsou také technické předpoklady pro vytváření systémů pro plošnou identifikaci osob splněny. Takový systém pak po předložení fotografie dokáže s jistou pravděpodobností určit, kdo je vyobrazen na základě dat z internetu. Zatím tedy jde jen o určení o koho jde, bez dalších informací. A zde se dostáváme k problému spojování identifikované osoby s jinými daty. V našich podmínkách stejně jako v jiných zemích existuje trend rozšiřování množství informací, které jsou o obyvatelstvu shromažďovány. Jedná se jak o data, která generujeme používáním svých mobilních telefonů a počítačů, ale také data, která vznikají při naší interakci se státem a jinými institucemi, jako je zdravotnictví a podobně. Z hlediska citlivosti údajů se dá říci, že data spadající do kategorie druhé jsou pro nás důležitější a také citlivější.

Pokud by například došlo k propojení systému na rozpoznávání tváří s registrem obyvatelstva, s katastrem nemovitostí, registrem automobilů a třeba lékařskými záznamy, bylo by možné instantně vytvořit velmi ucelený profil zobrazené osoby. Pak by stačilo například na ulici či v restauraci či kdekoliv jinde fotografovat mobilním telefonem osoby a okamžitě získávat důležité informace, včetně bydliště, rodinných a majetkových poměrů a zdravotního stavu.

Samozřejmě, vše související s identifikací osob a vyhodnocováním záznamů o nich lze používat také v případě souvislého záznamu z kamer. V tomto případě se analyzují jednotlivé obrázky záznamu. A co je také důležité, identifikaci tváří je možné provést ex-post, tedy přenést záznamy z kamer do analytického software například v noci a pak provést jejich hromadné vyhodnocení, spojení s externími daty a analýzu. Asi není třeba zdůrazňovat, že v daném scénáři vůbec nemusí jít jen o kamery rozmístěné státním aparátem!

A mohli bychom pokračovat popisováním propojení s daty z finančního úřadu, z policejních záznamů, z dopravních kamer, atp. (Samozřejmě, všechna tato data by měla být již dnes chráněna proti zneužití)

Je zřejmé, že je jen otázkou času, kdy vzniknou další systémy podobné Clearview. Takové, které fungují s menším rozsahem a přesností nežli uvedený příklad, již samozřejmě existují. Samotná firma Clearview poskytuje svůj systém pouze policejním složkám USA a Kanady pro účely vyšetřování zločinů (law enforcement) i když, jak uvádí, zájem je obrovský z celého světa.
To, co je na uvedeném případu Clearview důležité je skutečnost, že vše na sestrojení podobného systému je ve značné míře dostupné – softwarový model, výpočetní výkon (v podobě strojového času například od firem Google či Microsoft a nebo Amazon), i data na trénování systému. Z technického hlediska tedy nic nebrání, aby takové systémy vznikaly dále. A jak už bylo zmíněno, zájem je značný. A jistě jde o zájem “z obou stran” – tedy od subjektů s úmyslem použít tento nástroj ve prospěch i v neprospěch občanů. A samozřejmě, nesmíme zapomínat na státní aparát, který bude chtít v rámci péče o naši bezpečnost a komfort co nejširší přístup k těmto technologiím a našim datům.

Je proto nade vší pochybnost, že rozšíření technologie rozpoznávání tváří vytvoří jednak tlak na dostupnost těchto technologií, ale také na dostupnost osobních dat, kterých bude s postupem tzv. digitalizace přibývat. Důsledná – prakticky prováděná a nikoliv jen byrokratická – ochrana osobních údajů spolu s nějakou formou dohledu na vybrané aplikace AI technologií budou muset být nekompromisně vymáhány. Forma regulace AI se nyní intenzivně hledá. Již dnes se objevují velmi kontroverzní aplikace AI technologií a to zejména v oblastech, které potenciálně mohou ovlivnit formování budoucnosti jedinců. Jako odstrašující příklad je možné uvést aplikaci, jenž určuje, s jakou pravděpodobností se jedinec stane v budoucnu kriminálním živlem a to na základě výsledku vyhodnocení systémem pro rozpoznávání tváří.
Je dobré také mít na paměti, že zájem státního aparátu o přístup k těmto technologiím, který bude odůvodněn starostí zejména o bezpečnost, bude zvyšovat riziko jejich zneužití a úniků osobních dat.

Závěrem je asi zbytečné konstatovat, že budoucí opatření související s problematikou AI bude nutné přijmout ve velmi krátkém čase. Technologie AI totiž postupují rychlostí, kterou málokdo očekával.