Alternative Face: la macchina che mette le parole di Kellyanne Conway nella bocca di una cantante francese

di Mario Klingemann Viso alternativo v1.1 sembra, a prima vista, un vecchio video musicale della cantante francese Françoise Hardy. Ascolta le parole che escono dalla sua bocca, tuttavia, e sentirai la voce di Kellyanne Conway, consigliere di Donald Trump, che parla di "fatti alternativi".

È un inquietante lavoro di ventriloquio. Il volto di Hardy si trasforma davanti ai tuoi occhi, crescendo e calando mentre si avvolge attorno all'intervista a Conway. Dato l'argomento, l'esperimento di Klingemann è anche inquietante nel modo in cui manipola le immagini per far passare le parole di una persona per quelle di un'altra.

"Il punto con questa clip è che l'inizio dell'era dei 'fatti alternativi' è anche l'inizio di un'era in cui non puoi più fidarti di ciò che vedi", mi dice Klingemann. “Certo, questa clip è ancora molto grezza, ma è stata realizzata in pochi giorni sul piccolo computer di una persona. Immaginate cosa sono probabilmente già in grado di fare le forze che mirano a orientare l'opinione pubblica e che dispongono delle necessarie risorse finanziarie e tecniche».

Vedi correlati 

Il futuro della realtà aumentata è nelle avanguardie degli anni '30
Strani corpi in luoghi virtuali: un'intervista con l'artista Elliot Dodd
Bot, Facebook e poesia ritagliata: un'intervista con l'artista e creatore di bot Matthew Plummer-Fernandez

Per realizzarlo, Klingemann ha addestrato quella che è nota come rete contraddittoria generativa condizionale, alimentandola con sette clip musicali di Hardy, estraendo un totale di 68 marcatori facciali.

"Questo mi dà circa 20.000 esempi di formazione", spiega. “Questi esempi li inserisco in un modello chiamato pix2pix, che è il codice open-source del documento di ricerca del 2016 "Traduzione da immagine a immagine utilizzando reti avversarie condizionali" di Phillip Isola, Jun-Yan Zhu, Tinghui Zhou e Alexei A Efros.

La formazione è durata circa tre giorni. Klingemann osserva che non è necessario un supercomputer per farlo, solo un "PC da giocatore decente". Dopo che il sistema è stato addestrato, ha estratto i marcatori facciali dall'intervista a Conway e li ha inseriti nel modello. Il risultato è il video.

Facce interessanti

Klingemann è un artista in residenza presso Google Arts & Culture, anche se questo particolare progetto fa parte del suo lavoro personale. Mi dice che il suo obiettivo originale era quello di costruire un "generatore di volti fortuito", che potesse creare volti da utilizzare come base per le opere d'arte. Si è presto reso conto che dare alla rete troppe facce si traduceva in una faccia noiosa e dall'aspetto mediocre, con la modella che "rimuoveva tutte le piccole stranezze che rendono interessante un volto umano".

Invece, ha deciso di concentrarsi sul volto di una sola persona. “Ho scelto Françoise Hardy perché è senza dubbio molto bella”, spiega. “Credo di essere una persona molto nostalgica. Faccio fatica a trovare persone con facce interessanti come la sua al giorno d'oggi. C'erano anche alcuni motivi tecnici: prima di tutto, i clip musicali sono un'ottima fonte poiché mostrano molti primi piani, movimenti della bocca ed espressioni facciali. I vecchi clip musicali sono ancora migliori perché non avevano ancora inventato i tagli veloci. Anche il bianco e nero è stato un fattore, poiché risulta che il modello potrebbe apprenderlo più velocemente poiché contiene solo un terzo delle informazioni.

"Devo scusarmi con Françoise Hardy per aver abusato della sua faccia in questo modo"

“Il motivo per cui ho utilizzato il generatore per mappare Kellyanne Conway su Françoise Hardy è che non riesco a immaginare un contrasto più grossolano, sia in ciò che ascoltiamo che in ciò che vediamo. Devo scusarmi con Françoise Hardy per aver abusato della sua faccia in questo modo. Se all'epoca avessi avuto a disposizione un modello di viso diverso, ne avrei scelto un altro".

Verità personali

Klingemann mi dice che "non c'è dubbio" che queste tecniche diventeranno comuni nei prossimi anni. Per quanto riguarda ciò che potrebbe significare per la società, dice che spera che le persone imparino a riconoscere le immagini false, proprio come Ray Harryhausen i film sembrano irreali al pubblico di oggi, ma questo potrebbe essere minato da una società sempre più isolata tra verità incongruenti.

"Credo che il tribalismo già in atto accelererà - il raggruppamento di persone basato sui loro sistemi di credenze", afferma Klingemann. “Poiché le persone devono decidere da sole cosa credere o no, ognuno porterà con sé la propria verità personale. I fatti sono ciò in cui tu e il tuo gruppo di pari credete. Il che, di conseguenza, porterà a un aumento del conflitto tra quei gruppi. Tempi terribili.