Slik bruker du Tesseract OCR i Java

Innhold

retninger

Tesseract optisk tegngjenkjenningsbibliotek gir utviklere en måte å skanne dokumenter og tekst på i et bilde. De brukes til å lagre bilder av dokumenter som du ikke lenger trenger på papir. Du kan bruke dem i Java ved å opprette kontrollløkker for hvert tegn og skrive hver til en fil. For å bruke Tesseract-bibliotekene må du inkludere Java "namespace" for OCR-funksjonene.

retninger

Tesseract-biblioteker tillater brukere å skanne dokumentene sine (John Foxx / Stockbyte / Getty Images)

Høyreklikk på Java-filen du vil bruke til å opprette OCR-dokumentet. Klikk på "Åpne med" og velg Java-editoren du ønsker.
Legg til navnet på OCR-biblioteket øverst i filen. Kopier og lim inn følgende kode til kildefilen din:

com.tplan.robot.imagecomparison.tesseractocr
Opprett koden som er ansvarlig for skanningstegn for en fil. For eksempel oppretter følgende kode sløyfer gjennom hvert tegn i en fil og skriver dem til en bildefil:

(I = 1; {i} <{lines} +1; i = {i}) er et sett med verdier som er definert som: +1) {Typeline "{_TOCR_LINE {i}}"}
Klikk på "Lagre" -knappen på redigeringsprogrammet og klikk "Kjør" for å kjøre koden i en Java-kompilator.