Microsofts AI-verktøy VASA er i stand til å gjøre et menneskelig bilde til en overraskende høykvalitets video

har laget et kunstig intelligensverktøy, VASA, som er i stand til å gjøre om et bilde eller et bilde av enhver person til en video som snakker eller synger.

Ved å bruke et forhåndsinnspilt lydspor er VASA i stand til å lage en video av en person med både lepper i bevegelse og ansiktsuttrykk som endrer seg basert på det som blir sagt. Ja, hvis du tar en lengre titt på videoen, kan du se at leppebevegelsene er noe robotiske og talen er ikke helt synkronisert med disse bevegelsene. Potensialet til teknologien er imidlertid ganske imponerende.

Reklame

Derfor, av frykt for sikkerhet og upassende bruk av verktøyet, kommer Microsoft ennå ikke til å gjøre det tilgjengelig over Internett, gjennom en API-kanal eller på annen måte eksternt tilgjengelig. Denne løsningen kan brukes perfekt til å lage dype forfalskninger så vel som svært kompromitterende materiale som ikke samsvarer med virkeligheten. Forskerne mener selvsagt at en slik løsning kan være til stor nytte innen utdanningsfeltet, samt hjelpe mennesker med talevansker med å skape sitt digitale bilde.

VASA ble trent på VoxCeleb2-datasettet, som inneholder mer enn 1 million ytringer fra 6112 kjendiser hentet fra YouTube-videoer. Mens verktøyet ble trent på ekte menneskelige ansikter, fungerer det også på kunstverk som Mona Lisa.

Rating
( No ratings yet )
admin/ author of the article
Loading...