ashomokdev Apr 27 2016 at 12:15

Использование Open Source OCR библиотеки Tesseract в Android на примере простого приложения

2 min

43K

Development for Android*

Tutorial

From sandbox

+10

Comments 8

darkAlert Apr 27 2016 at 15:02

эмм… ну как бы все эти инструкции и примеры приведены на гитхабе (и там даже больше). Т.е. вы сделали просто перевод? В чем ценность вашей статьи?

ashomokdev Apr 27 2016 at 15:07

Ценность в том, что я написала короткое введение — для тех, кто вообще ничего не знает об OCR на Android. Читателю будет понятно, с чего начать изучать вопрос и на какой результат можно рассчитывать. Мой гитхаб проект тоже нацелен облегчить задачу понимания работы Tesseract.

Klukonin Apr 27 2016 at 15:07

Хотелось бы больше про реальное применение аффинных преобразований и как можно это реализовать в интерфейсе приложения =)

На сколько помню, в лептонике предобработка неплохая получается, правда некоторые заморачиваются и пытаются делать преобразования на стороне. На сколько это оправданно?

ashomokdev Apr 27 2016 at 15:11

Не отвечу, не приходилось использовать. Если Вы знаете, как можно быстро повысить качество картинки перед распознаванием — напишите сюда в двух-трех словах.

darkAlert Apr 27 2016 at 15:22

Tesseract чувствителен к перепадам яркости, поэтому нелишним будет использовать в качестве препроцессинга либо классический алгоритм автоуровней, либо CLAHE (есть реализация в opencv)

Klukonin Apr 27 2016 at 17:55

На сколько я смотрел вывод лептоники — там как раз и делается суперконтрастность перед распознаванием. То есть, как можно более резкие перепады яркости. Автоуровень или динамическая контрастность — это совсем не то что нужно для правильного распознавания текста. С разпознаванием лиц и объектов немного другая тема и там совершенно другие приемы.

darkAlert Apr 27 2016 at 18:08

Автоуровни не регулируют контрастность, они выравнивают яркость пикселей так, чтобы максимумы яркости в разных частях изображение были примерно одинаковыми. А вот CLAHE в добавок еще и усиляет контрастность.

«Автоуровень или динамическая контрастность — это совсем не то что нужно для правильного распознавания текста.»
Я бы был осторожен с такими смелыми выводами, если бы у меня не было фактов, подтверждающих это. А у вас они есть? Где можно почитать?

Klukonin Apr 28 2016 at 08:33

Ах, если бы каждый технарь где-то документировал свой ежедневный опыт в доступной для чтения форме — вот зажили бы.
С чего такая уверенность наличия печатны источников, отражающих конкретное мнение автора, высказывающего ту или иную идею?
Можно предположить, что автор работал с распознаванием текста, возможно, даже не только текста, возможно, даже и не один.
В любом случае, нить здравого диалога вы уже оборвали.
Выводы могут быть сколь угодно смелыми, пока это не рецензия, не платная консультация или нечто подобное.
А отчитываться перед первым встречным никто не будет ;-)

Show the best of all time