Deepfake: tipologie e riflessioni, deep learning e GANs

Questo articolo vuole proporre alcuni esempi di Deepfake con tipologie e riflessioni su deep learning e GANs.

Prova a immaginare un discorso di un candidato politico estremamente volgare di incitamento all’odio che viene diffuso in rete e reso virale dalle community online sui social media.

Uno scenario fittizio ma realistico grazie alle tecnologie di AI e Synthetic Media conosciute anche come Deepfake.

Cosa sono le Deepfake?

Il termine Deepfake abbraccia un’ampia varietà di contenuti e si riferisce ad una tecnologia che deriva dall’Intelligenza Artificiale.

Può essere definito come l’insieme di immagini e video che sono stati alterati al fine di portare alla rassomiglianza di qualcun altro.

Questa definizione merita però di essere approfondita.

Possono essere definiti Deepfake tutti quei contenuti video o audio che vengono modificati sostituendo il volto, la voce o entrambi con quelli di altre persone. Più in generale, i Deepfake vengono descritti come contenuti mediali sintetici, da cui il termine “fake”, generati dalle tecniche di Deep Learning, da cui appunto il temine “deep”.

Per l’utente medio, la difficoltà nel creare Deepfakes può variare: alcuni filtri di Snapchat permettono di sostituire il proprio volto con quello di un altro per esempio.

Questo tipo di contenuto però è tanto facile da creare quanto poco convincente.

I Deepfake più realistici richiedono tecnologie ben più efficienti come il Machine Learning e le Reti Neurali: nel 2014 infatti alcuni ricercatori guidati da Ian Goodfellow per la prima volta riuscirono a generare volti iperrealistici grazie alle “generative adversarial networks” conosciute anche come GANs.

Potrebbe interessarti anche: Reti Neurali Artificiali per Comprendere il funzionamento della Mente

DEEPFAKE: TIPOLOGIE

FACE-SWAPPING

Come accennato poc’anzi, le tecniche di sostituzione del volto sono diffuse da tempo sui social media come Snapchat o Instagram.

L’output di questi strumenti sono però di bassa qualità e impiegati prevalentemente a scopo ludico.

PUPPETEERING

Conosciuta anche come “Full Body Deepfakes”, la tecnica del Puppeteering consiste nel renderizzare interamente in 3D le corporeità dei personaggi facendogli compiere azioni orchestrate dall’AI, proprio come accade alle marionette mosse dal burattinaio.

Per esempio, l’impresa giapponese di AI Data Grid ha creato un motore AI in grado di generare automaticamente modelli virtuali per l’industria dell’advertising e della moda.

LIP-SYNCH

La tecnica di sincronizzazione labiale consiste nel renderizzare i movimenti della bocca e le espressioni del viso per far dire al personaggio virtuale determinate frasi con il giusto tono.

Esemplare è il caso di Jordan Peele che ha impiegato questa tecnica per diffondere un video di Obama.

VOICE CLONING

In questo caso si fa riferimento ad un algoritmo di Deep Learning che, partendo da alcune registrazioni vocali di una persona, è in grado di creare un voce sintetica che corrisponde all’originale.

In questo modo possono essere generati discorsi interi con la voce artificiale appena generata.

Tra i servizi più conosciuti troviamo Microsoft Custom Voice oppure iSpeech.

IMAGE SYNTHESIS

I generatori di immagini sono ormai ampiamente diffusi online.

Essi impiegano tecniche di Computer Vision, Deep Learning e GANs (Generative Adversarial Networks) per sintetizzare nuove immagini di qualunque tipo: dai ritratti, come il tool ThisPersonDoesnotExist.com che è in grado di creare volti dal realismo fotografico di persone che non esistono, oppure NVIDIA Gaugan, in grado di generare paesaggi completamente nuovi con semplici input di pennello dell’utente con in mouse.

TEXT GENERATION

I generatori di testo sono motori di AI e Deep Learning in grado di generare automaticamente, testi, storie, poesie e poemi.

Un esempio rilevante è il GPT-3 di OpenAI in grado di generare, oltre a documenti testuali, anche tabs per chitarra o codice di programmazione.

QUALCOSA DI IMMORALE O CREATIVO E INNOVATIVO?

Nel definire se qualcosa è buono o cattivo, prima di tutto andrebbe considerate l’intenzione che si cela dietro la produzione di contenuti come i Deepfakes.

Sicuramente, da un lato questo tipo di tecnologia presenta un lato “positivo”, per esempio con la possibilità di divertirsi con i filtri che le piattaforme mettono a disposizione.

Diverso può essere il caso @deeptomcruise: il filtro condiviso su TikTok apparso in cui alcuni video virali dove il volto dell’attore viene collocato sul corpo dei creator con un livello di realismo elevatissimo.

TikTok si sta attivando per implementare policy contro la produzione di contenuti interamente sintetici o manipolati che possono alterare la percezione dell’utente dai fatti reali.

In questo caso però, l’account che ha condiviso quei video lo ha fatto con la semplice intenzione di dimostrare ciò che la tecnologia è in grado di fare con scopo di puro intrattenimento.

Purtroppo però esistono anche impieghi scorretti o immorali dei Deepfake.

Sono infatti diffusi i contenuti in cui i volti di celebrità appaiono in pellicole per adulti, oppure, nel caso in cui si voglia portare alla disinformazione generando false informazioni e opinioni, possono essere generati video nei quali appaiono candidati politici che propongono argomentazioni che in realtà sono state ampiamente modificate dalla tecnologia ma, allo stesso tempo, appaiono estremamente realistiche.

CONCLUSIONI

Abbiamo visto come i Deepfakes e le tecnologie di Deep Learning e GANs possono essere impiegati nei campi più diversi: la tecnologia è in grado di creare possibilità e opportunità per chiunque a prescindere dalla propria lingua.

Infatti, i benefici e le agevolazioni che questo tipo di tecnologia può portare comprendono l’istruzione, l’accessibilità, la produzione di film o l’espressione artistica individuale.

Come ogni nuova tecnologia però c’è sempre chi ne approfitta e cerca di trarne vantaggio a scapito degli altri. Infatti, i Deepfakes possono essere impiegati per creare disinformazione e usati come arma comunicativa danneggiando la reputazione delle persone, inficiando sulla sicurezza e la stabilità politica di un paese.

I contenuti Deepfake più raffinati sono in grado di scavalcare i sistemi di rilevamento e controllo basati su AI e questa capacità migliora progressivamente sempre di più a seguito dell’introduzione di nuovi metodi di rilevamento.

I metodi di rilevamento AI hanno infatti l’obiettivo di risolvere il problema nel breve termine aspettandosi che, con l’avanzamento delle tecniche di autenticazione e di controllo della provenienza possano porre una soluzione “long term” al problema dei Deepfake.

Risorse:

https://towardsdatascience.com/technical-countermeasures-to-deepfakes-564429a642d3

https://towardsdatascience.com/positive-use-cases-of-deepfakes-49f510056387

https://towardsdatascience.com/ai-generated-synthetic-media-aka-deepfakes-7c021dea40e1#_ftn4