Automatisk kodning ud over pixels ved hjælp af en indlært lighedsmetrik
Automatisk kodning ud over pixels ved hjælp af en indlært lighedsmetrik
Automatisk kodning ud over pixels ved hjælp af en indlært lighedsmetrik

Automatisk kodning ud over pixels ved hjælp af en indlært lighedsmetrik

Vi præsenterer en autoencoder, der udnytter indlærte repræsentationer til bedre at måle ligheder i datarummet.
Artikel
Læsetid:
Af
Anders Boesen Lindbo Larsen, Søren Kaae Sønderby, Hugo Larochelle, Ole Winther
INDHOLDSFORTEGNELSE

Opdag Raffle Søg

En AI-søgemaskine, der forenkler datahåndtering, analyse og insights for smartere forretningsbeslutninger og markedsstrategier.

Udforsk vores forskning

Ved at kombinere en variational autoencoder med et generativt kontradiktorisk netværk kan vi bruge indlærte funktionsrepræsentationer i GAN-diskriminatoren som grundlag for VAE-rekonstruktionsmålet.

Vi erstatter elementvise fejl med funktionsvise fejl for bedre at kunne indfange datafordelingen, samtidig med at vi tilbyder invarians over for f.eks. oversættelse. Vi anvender vores metode på billeder af ansigter og viser, at den overgår VAE'er med elementvise lighedsmål med hensyn til visuel troværdighed.

Desuden viser vi, at metoden lærer en indlejring, hvor abstrakte visuelle træk på højt niveau (f.eks. at bære briller) kan ændres ved hjælp af simpel aritmetik.

Download

Automatisk kodning ud over pixels ved hjælp af en indlært lighedsmetrik
Automatisk kodning ud over pixels ved hjælp af en indlært lighedsmetrik

Automatisk kodning ud over pixels ved hjælp af en indlært lighedsmetrik

Vi præsenterer en autoencoder, der udnytter indlærte repræsentationer til bedre at måle ligheder i datarummet.

Udforsk vores forskning

Ved at kombinere en variational autoencoder med et generativt kontradiktorisk netværk kan vi bruge indlærte funktionsrepræsentationer i GAN-diskriminatoren som grundlag for VAE-rekonstruktionsmålet.

Vi erstatter elementvise fejl med funktionsvise fejl for bedre at kunne indfange datafordelingen, samtidig med at vi tilbyder invarians over for f.eks. oversættelse. Vi anvender vores metode på billeder af ansigter og viser, at den overgår VAE'er med elementvise lighedsmål med hensyn til visuel troværdighed.

Desuden viser vi, at metoden lærer en indlejring, hvor abstrakte visuelle træk på højt niveau (f.eks. at bære briller) kan ændres ved hjælp af simpel aritmetik.

Download

Gå ikke glip af nogen opdatering!
SOC2-badge