Umbre inexistente, reflexii prea puternice, zone neclare, clipire nesincronizată, distorsiuni în interiorul gurii sau nesincronizarea vorbirii – sunt câteva elemente care îi pot ajuta pe utilizatorii de internet să detecteze deep-fake-uri. Directoratul Național de Securitate Cibernetică propune pe social media un test scurt în care utilizatorii își pot verifica abilitățile în a detecta falsuri.
Utilizatorii trebuie să analizeze o colecție de 10 imagini – unele clipuri video autentice și altele generate sau modificate prin intermediul tehnologiilor de Inteligență Artificială. Testul AICI
Deepfake este o manipulare digitală a unei înregistrări video, audio sau a unei imagini, realizată cu ajutorul inteligenței artificiale (IA) sau a altor programe specializate.
Semne de identificare a unui Deepfake, conform uni ghid DNSC:
• Mediul înconjurător (de exemplu, umbre inexistente, reflexii prea puternice, zone neclare)
• Imperfecțiuni ale feței (alunițe nerealiste, clipire nesincronizată, distorsiuni în interiorul gurii cum ar
fi lipsa dinților și a limbii, dinți mult prea perfecți etc.)
• Nesincronizarea vorbirii/sunetului și a mișcării buzelor, de exemplu: din cauza strănutului
Nesincronizarea vorbirii/sunetului și a mișcării buzelor poate fi observată la pronunțarea literelor b, m și
p. Uneori apar pixeli în nuanțe de gri la marginile componentelor modificate. Se poate distinge dacă este
vorba de o falsificare și atunci când persoana din înregistrare este privită dintr-un alt unghi. Dacă pentru
crearea conținutului Deepfake nu s-au folosit fotografii ale persoanei din unghiuri diferite, algoritmul nu
poate deduce aspectul persoanei din alt unghi, rezultând distorsiuni.
Massachusetts Institute of Technology (MIT) este una dintre entitățile care dezvoltă instrumente ML care pot identifica dacă un conținut este autentic sau un Deepfake, oferind totodată un chestionar educativ pentru a învăța publicul cum să facă această distincțieiv.
Un detector clasic de conținut vizual fals se bazează pe detectarea erorilor rezultate din prelucrare. Cel mai adesea, aceasta implică analiza pixelilor pe care ochiul uman nu îi poate vedea, deoarece prin manipularea imagini marginile componentei modificate au caracteristici speciale. Un astfel de
algoritm este hibridul dintre Long short term memory (LTSM – o rețea neuronală) și algoritmul Encoder-Decoder. Acesta funcționează analizând în paralel fiecare pixel individual și/sau întreaga imagine/videoclip comprimat(ă). În cele din urmă, rezultatele celor două funcții sunt comparate și dacă ambele indică aceeași regiune, materialul este considerat modificat.