Optisk tegngjenkjenning (OCR) er oversettelsen av optisk skannede punktgrafikk av trykte eller håndskrevne teksttegn til tegnkoder, for eksempel ASCII. Dette er en effektiv måte å slå trykte materialer til datafiler som kan redigeres og redigert på en datamaskin ellers. Dette er teknologien lenge brukt av biblioteker og offentlige etater til å lage lange dokumenter raskt tilgjengelig elektronisk. Fremskritt i OCR-teknologi har ansporet sin økende bruk av foretak. For mange dokument-inngangs oppgaver, er OCR den mest kostnadseffektive og raske metoden tilgjengelig. Og hvert år, teknologien frigjør hektar med lagringsplass gang gitt over til arkivskap og esker fulle av papirdokumenter. Før OCR kan brukes, må kildematerialet skannes med en optisk skanner (og noen ganger en spesialisert kretskort i PC) å lese på siden som punktgrafikk (et mønster av prikker). Programvare for å gjenkjenne bildene er også nødvendig.
Vår programvarepakken foreslår å løse klassifisering av isolerte håndskrevne tegn og sifre i Uji Pen tegn datasett ved hjelp av Neural Networks. Dataene består av prøver av 26 tegn og 10 siffer som er skrevet av 11 forfattere på en tavle-PC. Tegnene (i standard UNIPEN format) er skrevet både i store og små bokstaver, og det er en hel to sett med tegn per forfatter. Slik at produksjonen skal være i en av de 35 klasser. Det ultimate målet er å bygge en forfatter uavhengig modell for hvert tegn.
Utvalget av nyttige funksjoner er avgjørende i tegngjenkjenning, derfor en ny og meningsfull sett av funksjoner, Uniform Differential Normalisert Koordinater (UDNC), introdusert av C. Agell, er vedtatt. Disse funksjonene er vist å bedre anerkjennelse hastighet ved hjelp av enkle klassifiseringsalgoritmer slik at de er vant til å trene en Neural Network og teste ytelsen på Uji Pen tegn datasett.
Indeksvilkår:. Matlab, kilde, kode, ocr, optisk tegngjenkjenning, skannet tekst skrevet tekst, ascii, isolert karakter
Krav :
Matlab
Kommentarer ikke funnet