Udforsk vores forskning
Ved at kombinere en variational autoencoder med et generativt kontradiktorisk netværk kan vi bruge indlærte funktionsrepræsentationer i GAN-diskriminatoren som grundlag for VAE-rekonstruktionsmålet.
Vi erstatter elementvise fejl med funktionsvise fejl for bedre at kunne indfange datafordelingen, samtidig med at vi tilbyder invarians over for f.eks. oversættelse. Vi anvender vores metode på billeder af ansigter og viser, at den overgår VAE'er med elementvise lighedsmål med hensyn til visuel troværdighed.
Desuden viser vi, at metoden lærer en indlejring, hvor abstrakte visuelle træk på højt niveau (f.eks. at bære briller) kan ændres ved hjælp af simpel aritmetik.