Microsoft sfida Sora con Vasa-1

Il nuovo strumento di intelligenza artificiale di Microsoft può realizzare video di persone partendo solo da una loro fotografia

La divisione di Microsoft in Asia ha presentato un nuovo strumento di intelligenza artificiale, Vasa-1, capace di realizzare video di persone partendo solo da una loro fotografia. La piattaforma, concorrente di Sora, il software sviluppato dal creatore di ChatGpt, OpenAI, è in grado anche di replicare la voce di un individuo, con solo pochi secondi di esempi campionati, aprendo a nuove domande sulle capacità di distinguere un contenuto generato dall’IA da uno reale.

Al momento, Vasa-1 è solo un esperimento dei laboratori di Microsoft Research e non un programma pensato per un utilizzo ampio. Sono stati già pubblicati diversi esempi in cui si vedono volti, a un primo sguardo verosimili, pronunciare varie frasi, e nonostante i movimenti delle labbra e della testa possano sembrare artefatti, il potenziale rischio di uso della tecnologia per diffondere deepfake è molto alto. I ricercatori consapevoli di questo pericolo hanno deciso di non rilasciare il programma finché non saranno sicuri dell’utilizzo che verrà fatto della loro tecnologia.

Vasa-1 è stato addestrato sul set di dati VoxCeleb2, che contiene “oltre 1 milione di espressioni di 6.112 individui celebri” estratte dai video di YouTube. Anche se lo strumento è stato addestrato su volti reali, Microsoft dimostra che Vasa-1 può funzionare anche su disegni e opere.

Lascia un commento

Altre notizie

OpenAI sfida Google con SearchGpt, il suo primo motore di ricerca con AI

Dynamo: la startup che racconta l’economia attraverso i video

Gli influencer della Gen Z hanno abbandonato Biden

E i media tradizionali rimasero a guardare