OCR Androidon

Mi az OCR?

Az optikai karakterfelismerés (OCR) egy meghatározott ábécéhez tartozó karakterek vagy szimbólumok automatikus azonosítását jelenti egy képen. Ebben a bejegyzésben arra összpontosítunk, hogy elmagyarázzuk, hogyan használhatjuk az OCR-t Androidon.

A kép szövegének felismerése után:

    • Mentés a tárolóba.
    • Feldolgozás vagy szerkesztés.
  • Megfordítani más nyelvre.

Az okostelefonok népszerűsége az egyre jobb kamerákkal kombinálva az ilyen típusú felismerési technikák használatának növekedéséhez és az ezeket kihasználó mobilalkalmazások új kategóriájához vezetett.

A készüléken vagy a felhőben?

Az OCR-könyvtár használata előtt el kell dönteni, hogy az OCR-folyamat hol történjen, az okostelefonon vagy a felhőben.

Az alkalmazás igényeitől függően mindegyik megközelítésnek megvannak az előnyei és hátrányai.

Ha az alkalmazás például internetes kapcsolat nélkül kívánja elvégezni a karakterfelismerést, akkor az OCR-motor maga a készüléken indul. Így elkerülhető lenne a képek szerverre küldése, mivel a jelenlegi eszközökre szerelt kamerák nagyméretű képeket tudnak készíteni.

Másrészt az OCR könyvtárak általában sok helyet foglalnak, mivel minden egyes felismerendő nyelv letöltésére szükség van, amint azt alább kifejtjük.

Milyen könyvtárakat lehet használni?

A Wikipédia alábbi linkjén található egy összehasonlító táblázat az összes OCR könyvtárral, a támogatott platformokkal, a fejlesztés során használt programozási nyelvekkel és egyéb fontos információkkal.

Link: http://en.wikipedia.org/wiki/ List_of_optical_character_recognition_software

Ebben a bejegyzésben a Tesseract könyvtárat fogjuk használni, amely kiemelkedik a többi közül. Nyílt forráskódú, SDK-val rendelkezik, a HP hozta létre, és jelenleg a Google fejleszti.

OCR Androidon a Tesseract könyvtár használatával

A Tesseract ugyan futtatható Linux szerveren felhőszolgáltatásként, ebben a bejegyzésben a Tesseract könyvtárat egy Android alkalmazásban fogjuk implementálni, elindítva az OCR motort magán az eszközön.

Az eredeti Tesseract projekt Androidra a Tesseract Android Tools nevet viseli, és eszközöket tartalmaz a Tesseract és a Leptonica könyvtárak Android platformon való használatra történő lefordításához, valamint egy Java API-t, amellyel elérhetjük ezeket a natívan lefordított könyvtárakat.

Link: https://github.com/rebbix/tesseract-android-tools/tree/master/tesseract-android-tools

Példánkhoz a Tesseract Android Tools egy elágazását fogjuk használni, amely több funkcionalitást ad hozzá.

Link: https://github.com/rmtheis/tess-two

OCR példa Androidon

Az OCR Androidon történő végrehajtásához néhány egyszerű lépésre van szükségünk:

Figyelmeztetések

  • A felismerés minősége a kép fényviszonyaitól, a kamera felbontásától, a szöveg betűtípusától, a szöveg méretétől és egyéb …
  • A lehető legjobb minőség eléréséhez nagyon fontos, hogy a szöveg a képen középre kerüljön, és a kép megfelelően fókuszált legyen.

Az OCR használata egy fordító alkalmazásban

A következő videón a diplomamunkámhoz (TFG) fejlesztett alkalmazás egy része látható, ahol a leírt OCR technikákat használom.

Szólj hozzá!