Deepfake (skrót od deep learning i fake) opisuje zmodyfikowane w materiałach wideo i foniach treści audiowizualne przy użyciu technologii sztucznych sieci uczenia. Wynik charakteryzuje się syntetycznym podstawieniem, osadzeniem mimiki i głosu danej, popularnej jednostki ludzkiej do zachowań i tez odtwórczych, by oszukać odbiorcę przekazu.
Co to znaczy
Proceder wykorzystuje głębokie mechanizmy (w szczególności algorytmy z rodzaju GAN - Generative Adversarial Networks), trenując proces mapowania punktowego geometrii rysów twarzy przez ogromne cykle w celu uzyskania nienagannego, fotorealistycznego przenikania obrazu z docelową sylwetką w sekwencji filmowej. To technologia o szerokich zaletach dla specjalistów obróbki filmowej i artystycznej, ale rodząca z racji łatwej powszechnej asymilacji na otwartym oprogramowaniu rzesze zagrożeń i kampanii dyskredytacyjnych lub podszywania się merytorycznego do kradzieży.
Dlaczego to ważne
Znajomość natury technologii wspiera działy zarządzania wizerunkiem w definiowaniu polityk bezpieczeństwa (Brand Safety) do osłonowych i wczesnych analiz kampanii o złośliwym i zniesławiającym nacechowaniu kierowanym od podszywających oszustów i tworzących zmyślone pakiety materiałów dystrybuowanych wiralowo.
Zespół obsługi reputacji i analiz wykrywa gwałtowny przyrost popularności materiałów krótkich (Shorts), w których wygenerowana twarz kojarzona ze znaną marką wygłasza rzekomą decyzję o nowym partnerstwie z bardzo spornym, rynkowym kontrahentem kryptowalutowym. Eksperci inicjują proces szybkiej blokady oskarżających filmów do serwisu i analizują cyfrowe modyfikacje, np. rozmycia stykowe, niedopasowanie fonetyki i cieni, neutralizując problem komunikatem do stacji prasowych.
Czym to nie jest
- Narzędziem klasycznej obróbki cyfrowej w tradycyjnych programach nakładających oświetlenia maską — deepfake uczy się dynamiki i reaktywnych ekspresji animując je adaptacyjnie i mapuje w wymiarze wieloklatkowym w trójwymiarze ruchu postaci (tzw. zjawisko zsynchornizowanego z ruchem mówionym Lip-Syncing).
Jak rozpoznać
Powiązane sformułowania to tzw. w środowisku zapleczowym techniczne kategoryzowanie jako „technologie Voice Cloning”, „Video synthesis (Synteza Wideo)” oraz w legislacyjnym „Deepfake regulations / AI manipulations framework”.