OCR за Линукс
felipeДнес ми потрябва OCR
и реших да потърся какво има за Линукс. Пробвах gocr, но не ми хареса
как работи и преминах на tesseract.
Трябваше ми доста време да разбера колко просто се работи с него
всъщност. Програмата е конзолна. Работи само с текст в една колона.
Поддържа няколко езика, български естествено не е сред тях, но това се
и очаква. Програмата може да бъде обучавана, тъй че ако на някой му се
занимава…
Командата за разпознаване е:
tesseract име_на_графичен_файл име_на_текстов_файл -l
език
Графичният файл трябва да бъде tiff, без компресия, без слой за
прозрачност. При мен работи само с двубитови изображения.






