Konference: Fremskridt inden for neurale informationsbehandlingssystemer
En hash-indlejring kan ses som en interpolation mellem en standard ordindlejring og en ordindlejring, der er skabt ved hjælp af en tilfældig hash-funktion (hashtricket).
I hash-indlejringer er hvert token repræsenteret af endimensionale indlejringsvektorer og en endimensional vægtvektor. Den endelige dimensionelle repræsentation af tokenet er produktet af de to. I stedet for at tilpasse indlejringsvektorerne til hvert token, vælges de af hashtricket fra en fælles pulje af indlejringsvektorer.
Vores eksperimenter viser, at hash-indlejringer nemt kan håndtere store ordforråd bestående af millioner af tokens. Når man bruger en hash-indlejring, er det ikke nødvendigt at oprette en ordbog før træning eller udføre nogen form for beskæring af ordforrådet efter træning. Vi viser, at modeller, der er trænet ved hjælp af hash-indlejringer, udviser mindst samme præstationsniveau som modeller, der er trænet ved hjælp af almindelige indlejringer på tværs af en lang række opgaver.
Desuden er antallet af parametre, der er nødvendige for en sådan indlejring, kun en brøkdel af, hvad en almindelig indlejring kræver. Da standardindlejringer og indlejringer konstrueret ved hjælp af hashtricket blot er specialtilfælde af en hashindlejring, kan hashindlejringer betragtes som en udvidelse og forbedring i forhold til de eksisterende almindelige indlejringstyper.