Un team di ricercatori di intelligenza artificiale di Microsoft Research Asia ha sviluppato un'applicazione AI che converte un'immagine statica di una persona e una traccia audio in un'animazione che ritrae accuratamente l'individuo che parla o canta la traccia audio con espressioni facciali appropriate.
Hanno chiaramente raggiunto l'obiettivo con lo sviluppo di VASA 1, un sistema di intelligenza artificiale che trasforma immagini statiche, scattate da una fotocamera, disegnate o dipinte, in quelle che descrivono come animazioni "eccellentemente sincronizzate".