Automatisk kodning ud over pixels ved hjælp af en indlært lighedsmetrik

Vi præsenterer en autoencoder, der udnytter indlærte repræsentationer til bedre at måle ligheder i datarummet.

Artikel

Læsetid:

Af

Anders Boesen Lindbo Larsen, Søren Kaae Sønderby, Hugo Larochelle, Ole Winther

INDHOLDSFORTEGNELSE

Opdag Raffle Søg

En AI-søgemaskine, der forenkler datahåndtering, analyse og insights for smartere forretningsbeslutninger og markedsstrategier.

Oplev nu

Udforsk vores forskning

Ved at kombinere en variational autoencoder med et generativt kontradiktorisk netværk kan vi bruge indlærte funktionsrepræsentationer i GAN-diskriminatoren som grundlag for VAE-rekonstruktionsmålet.

Vi erstatter elementvise fejl med funktionsvise fejl for bedre at kunne indfange datafordelingen, samtidig med at vi tilbyder invarians over for f.eks. oversættelse. Vi anvender vores metode på billeder af ansigter og viser, at den overgår VAE'er med elementvise lighedsmål med hensyn til visuel troværdighed.

Desuden viser vi, at metoden lærer en indlejring, hvor abstrakte visuelle træk på højt niveau (f.eks. at bære briller) kan ændres ved hjælp af simpel aritmetik.

Download

Mere fra nyhedsrummet

Artikel

4. september 2023

11 måder, hvorpå generativ AI kan fremskynde onboarding-processen i kundeservice

Blog

18. marts 2024

Top 5 AI-værktøjer til virksomheder i 2024

Artikel

8. november 2022

Er kunderne virkelig interesserede i selvbetjening?

Artikel

19. december 2023

En kort tidslinje over digital selvbetjening

Automatisk kodning ud over pixels ved hjælp af en indlært lighedsmetrik

Vi præsenterer en autoencoder, der udnytter indlærte repræsentationer til bedre at måle ligheder i datarummet.

Udforsk vores forskning

Ved at kombinere en variational autoencoder med et generativt kontradiktorisk netværk kan vi bruge indlærte funktionsrepræsentationer i GAN-diskriminatoren som grundlag for VAE-rekonstruktionsmålet.

Vi erstatter elementvise fejl med funktionsvise fejl for bedre at kunne indfange datafordelingen, samtidig med at vi tilbyder invarians over for f.eks. oversættelse. Vi anvender vores metode på billeder af ansigter og viser, at den overgår VAE'er med elementvise lighedsmål med hensyn til visuel troværdighed.

Desuden viser vi, at metoden lærer en indlejring, hvor abstrakte visuelle træk på højt niveau (f.eks. at bære briller) kan ændres ved hjælp af simpel aritmetik.

Download

Læs kundens historie