Rozpoznawanie tekstu na zdjęciach za pomocą tesseract

31 December 2012 Comments

tesseract to jeden z najlepszych silników OCR - do rozpoznawania tekstu na grafikach. Po instalacji dostajemy konsolową aplikację, która przyjmuje ścieżkę do pliku graficznego i zapisuje wynik w pliku tekstowym. Silnik obsługuje też różne języki przy rozpoznawaniu tekstu, w tym język polski.

W przypadku dystrybucji Linuksa tesseract powinien być dostępny w pakietach. Oprócz bazowego pakietu instalujemy też pakiet językowy (np. "tesseract-ocr-pol"). Użycie silnika wyglądałoby tak:

tesseract ŚCIEŻKA/DO/pliku.jpg NAZWA_PLIKU_NA_WYNIK -l pol

tesseract stworzy plik tekstowy o podanej nazwie (nie podajemy rozszerzenia). W pliku tym znajdziemy tekst jaki silnik rozpoznał na zdjęciu (jeżeli w ogóle).

W przypadku Pythona mamy dostępną nakładkę, którą możemy stosować jak aplikację lub importować funkcję w kodzie naszej aplikacji.

import Image
from tesseract import image_to_string

print image_to_string(Image.open('plik.jpg'), lang='pol')

Nakładka wykorzystuje PIL. Przed przekazaniem pliku możemy go zmodyfikować. z PIL.ImageOps możemy użyć "grayscale" by otrzymać grafikę w odcieniach szarości - to zwiększa efektywność silnika dla niektórych zdjęć/grafik. Dla tekstu na zdjęciach połączenie "grayscale" i "equalize" może okazać się nieco lepsze.

RkBlog

Podstawy Pythona, 31 December 2012

Comment article

e-learning linkuje - odświeżanie podstaw Pythona

Wzrost eLearningu w ostatnich tygodniach dał się zaobserwować jako referery kierujące na wybrane artykuły na mojej stronie. Poza Mikrobiologia żywności sporym zainteresowaniem cieszył się artykuł co to jest Python?... jak i drugi, wprowadzający w jego podstawy. Niestety te artykuły były napisane w 2008 roku i od tego czasu sporo się zmieniło.

› Read more

Kursy Pythona w kioskach od Komputer Świata i BDM

Od paru tygodni w kioskach i stoiskach z prasą dostępne są dwie książki/poradniki dotyczące programowania w Pythonie - Biblioteczka Komputer Świat - Python, kurs programowania na prostych przykładach oraz w wybranych sklepach - BDM's Manual - The Essential Coding Manual. Czy są warte zakupu? Sprawdźmy to.

› Read more

PyCon PL 2017 już w sierpniu

Mamy już pierwsze informacje dotyczące corocznej konferencji PyCon PL. W 2017 roku konferencja odbędzie się wcześniej niż zazwyczaj - 17-20 sierpnia. Niebawem ruszy call for proposals i poznamy więcej szczegółów.

› Read more

Konferencja 4developers 3 kwietnia ze ścieżką Pythonową

Już niebawem, bo 3 kwietnia odbędzie się konferencja 4Developers (Festiwal Technologiczny) poświęcona różnym zagadnieniom IT. Agenda podzielona jest na bloki tematyczne i jednym z nich jest Python. Całość uzupełniają inne języki, architektura aplikacji jak i tematyka umiejętności miękkich.

› Read more

PyCon PL 2016 startuje już w czwartek

Już w czwartek startuje PyCon PL 2016. Ja będę na konferencji od piątku. Dostępna jest też rozpisana na poszczególne dni agenda.

Klipy wideo z wystąpień powinny być dostępne na YouTube po konferencji, podobnie jak w poprzednich latach.

› Read more

PyCon PL 2016 - kończy się call for proposals

Do 10 czerwca można zgłaszać swoje propozycje prelekcji, warsztatów i innych wystąpień. Niebawem pewnie też ruszą zapisy na samą konferencję PyCon PL 2016 w ośrodku Ossa koło Rawy Mazowieckiej.

Konferencja odbędzie się od 13 do 16 października 2016 roku.

› Read more