La divisione di Microsoft in Asia ha presentato un nuovo strumento di intelligenza artificiale, Vasa-1, capace di realizzare video di persone partendo solo da una loro fotografia. La piattaforma, concorrente di Sora, il software sviluppato dal creatore di ChatGpt, OpenAI, è in grado anche di replicare la voce di un individuo, con solo pochi secondi di esempi campionati, aprendo a nuove domande sulle capacità di distinguere un contenuto generato dall’IA da uno reale.
Al momento, Vasa-1 è solo un esperimento dei laboratori di Microsoft Research e non un programma pensato per un utilizzo ampio. Sono stati già pubblicati diversi esempi in cui si vedono volti, a un primo sguardo verosimili, pronunciare varie frasi, e nonostante i movimenti delle labbra e della testa possano sembrare artefatti, il potenziale rischio di uso della tecnologia per diffondere deepfake è molto alto. I ricercatori consapevoli di questo pericolo hanno deciso di non rilasciare il programma finché non saranno sicuri dell’utilizzo che verrà fatto della loro tecnologia.
Vasa-1 è stato addestrato sul set di dati VoxCeleb2, che contiene “oltre 1 milione di espressioni di 6.112 individui celebri” estratte dai video di YouTube. Anche se lo strumento è stato addestrato su volti reali, Microsoft dimostra che Vasa-1 può funzionare anche su disegni e opere.