Hogyan működik az OCR? Magyarázat egyszerű és érthető módon
Ebben a cikkben bemutatjuk, hogyan működik az OCR. Az OCR az "Optical Character Recognition" (optikai karakterfelismerés) kifejezést jelenti, és németül egyszerűen szövegfelismerésnek nevezik. Ez azt jelenti, hogy a számítógép az OCR használatával felismeri a beolvasott kép szövegét, majd konvertálhatja azt egyszerű szöveges dokumentummá.
Így működik az OCR
Képzelje el, hogy egy papír bemutatót kapott egy kollégájától. Most ezeket a számítógépen szeretné szerkeszteni, mert nem szereti az egyes részeket. Tehát szkennelje be, és lépjen az OCR programjába. Most a következő történik:
- A szoftver először egy ún. Elrendezési elemzést végez. Ennek érdekében átnézi az oldal elrendezését, és elválasztja a képeket a szövegtől. Felhívja a figyelmet az oldal helyzetére is. Ezután a bekezdések számát megszámolják, és az egyes elemeket, például az oldalszámokat menti.
- Most jön a nehéz rész. A szoftver átnézi az egyes szövegrészeket, és mondatokra bontja azokat. A mondatokat ezután külön szavakra, a szavakat betűkre osztják.
- Az OCR szoftver betű- és karaktermintákat tartalmaz. A program most összehasonlítja a beolvasott leveleket ezekkel a mintákkal. Ha ezek 99% -ban hasonlóak, az algoritmus úgy dönt, hogy valószínűleg ennek a betűnek kell lennie. Nagyon pontos, mert sok mintát képes összehasonlítani rövid idő alatt. Ily módon sikeresen megkülönbözteti a „8” és a „B”.
- Tehát a betűk és a karakterek fokozatosan felismerésre kerülnek. Ezután ismét szavakkal kombinálják és visszahelyezik a helyükre a mondatban. Amint a szoftver elkészült, az egészet egy normál dokumentumba menti, amelyet szerkeszthet. Kész!
Teszteli a szoftver ismereteit? Vegyen részt nagy szoftver-kvízünkön!