End-to-end informationsudtræk fra dokumenter

Attend, Copy, Parse-arkitekturen er en dyb neural netværksmodel, der er trænet på end-to-end-data, og som omgår behovet for labels på ordniveau.

Artikel

Læsetid:

Af

Rasmus Berg Palm, Florian Laws, Ole Winther

INDHOLDSFORTEGNELSE

Opdag Raffle Søg

En AI-søgemaskine, der forenkler datahåndtering, analyse og insights for smartere forretningsbeslutninger og markedsstrategier.

Oplev nu

Dokumentinformationsudtræk, der udføres af mennesker, skaber data, der består af et PDF- eller dokumentbillede-input og udtræk af strenge-output.

Disse end-to-end-data forbruges og produceres naturligt, når opgaven udføres, fordi de er værdifulde i sig selv. De er naturligvis tilgængelige uden ekstra omkostninger.

Desværre kan de nyeste ordklassifikationsmetoder til informationsudvinding ikke bruge disse data, men kræver i stedet etiketter på ordniveau, som er dyre at skabe og derfor ikke er tilgængelige for mange opgaver i det virkelige liv.

I denne artikel foreslår vi Attend, Copy, Parse-arkitekturen, en dyb neural netværksmodel, der kan trænes direkte på end-to-end-data, uden at der er behov for etiketter på ordniveau. Vi evaluerer den foreslåede arkitektur på et stort, forskelligartet sæt fakturaer og overgår et avanceret produktionssystem baseret på ordklassificering.

Vi mener, at vores foreslåede arkitektur kan bruges til mange virkelige informationsudtrækningsopgaver, hvor ordklassificering ikke kan bruges på grund af mangel på de nødvendige etiketter på ordniveau.

Download

Mere fra nyhedsrummet

Artikel

22. juni 2023

Trends inden for kundeservice i 2023: Forbedring af oplevelser og opbygning af brands

Artikel

24. august 2023

Hvad er Site Search, og hvorfor har du brug for det på din hjemmeside?

Historie

22. marts 2023

Blue Water Shipping på Raffle

Blog

3. juli 2024

Vigtigheden af integration i en verden af AI-søgning og chat

End-to-end informationsudtræk fra dokumenter

Attend, Copy, Parse-arkitekturen er en dyb neural netværksmodel, der er trænet på end-to-end-data, og som omgår behovet for labels på ordniveau.

Dokumentinformationsudtræk, der udføres af mennesker, skaber data, der består af et PDF- eller dokumentbillede-input og udtræk af strenge-output.

Disse end-to-end-data forbruges og produceres naturligt, når opgaven udføres, fordi de er værdifulde i sig selv. De er naturligvis tilgængelige uden ekstra omkostninger.

Desværre kan de nyeste ordklassifikationsmetoder til informationsudvinding ikke bruge disse data, men kræver i stedet etiketter på ordniveau, som er dyre at skabe og derfor ikke er tilgængelige for mange opgaver i det virkelige liv.

I denne artikel foreslår vi Attend, Copy, Parse-arkitekturen, en dyb neural netværksmodel, der kan trænes direkte på end-to-end-data, uden at der er behov for etiketter på ordniveau. Vi evaluerer den foreslåede arkitektur på et stort, forskelligartet sæt fakturaer og overgår et avanceret produktionssystem baseret på ordklassificering.

Vi mener, at vores foreslåede arkitektur kan bruges til mange virkelige informationsudtrækningsopgaver, hvor ordklassificering ikke kan bruges på grund af mangel på de nødvendige etiketter på ordniveau.

Download

Læs kundens historie