Slik bruker du Tesseract OCR i Java

Forfatter: Judy Howell
Opprettelsesdato: 3 Juli 2021
Oppdater Dato: 16 November 2024
Anonim
Slik bruker du Tesseract OCR i Java - Artikler
Slik bruker du Tesseract OCR i Java - Artikler

Innhold

Tesseract optisk tegngjenkjenningsbibliotek gir utviklere en måte å skanne dokumenter og tekst på i et bilde. De brukes til å lagre bilder av dokumenter som du ikke lenger trenger på papir. Du kan bruke dem i Java ved å opprette kontrollløkker for hvert tegn og skrive hver til en fil. For å bruke Tesseract-bibliotekene må du inkludere Java "namespace" for OCR-funksjonene.


retninger

Tesseract-biblioteker tillater brukere å skanne dokumentene sine (John Foxx / Stockbyte / Getty Images)
  1. Høyreklikk på Java-filen du vil bruke til å opprette OCR-dokumentet. Klikk på "Åpne med" og velg Java-editoren du ønsker.

  2. Legg til navnet på OCR-biblioteket øverst i filen. Kopier og lim inn følgende kode til kildefilen din:

    com.tplan.robot.imagecomparison.tesseractocr

  3. Opprett koden som er ansvarlig for skanningstegn for en fil. For eksempel oppretter følgende kode sløyfer gjennom hvert tegn i en fil og skriver dem til en bildefil:

    (I = 1; {i} <{lines} +1; i = {i}) er et sett med verdier som er definert som: +1) {Typeline "{_TOCR_LINE {i}}"}

  4. Klikk på "Lagre" -knappen på redigeringsprogrammet og klikk "Kjør" for å kjøre koden i en Java-kompilator.