Tesseract: Поддержка Tesseract 3.05

Созданный на 13 апр. 2017  ·  25Комментарии  ·  Источник: charlesw/tesseract

Tesseract 3.05 доступен уже пару месяцев. Вы выпустите для него совместимую версию? Спасибо.

enhancement

Все 25 Комментарий

Я тоже, я был бы очень признателен, если бы это произошло !!

Хе-хе, я даже не догадывалась, что это вышло!

В 3.05 в интерфейсе c-api появился новый метод: TessBaseAPIDetectOrientationScript .

Я написал небольшую программу для определения ориентации страницы. В его текущей форме он только пытается выяснить, перевернута ли страница, но вы можете легко изменить код, чтобы определить другие ориентации. Что он делает, так это OCR части текста, затем поворачивает страницу на 180 градусов и затем в то же самое. От наилучшего результата зависит ориентация страницы.

https://github.com/Sicos1977/PageOrientationEngine

Вышел Tesseract 3.05.01. В интерфейс c-api внесены незначительные изменения.

https://github.com/tesseract-ocr/tesseract/releases

Спасибо, что дал мне знать. Согласно https://github.com/tesseract-ocr/tesseract/wiki/Compiling#windows, похоже, что tesseract улучшил процесс сборки, хотя мне все равно нужно переустановить VS2015 и т. Д., Чтобы избежать изменения целевой среды выполнения. Я посмотрю, смогу ли я обновить проект в эти выходные.

Заработал с другими делами, придется подождать до следующих выходных.

Слился в # 355, спасибо @nguyenq

Я также выпустил новую версию Nuget 3.2.0-alpha3 и собираюсь выпустить полную версию на выходных, если не будет обнаружено никаких проблем.

Привет. Посмотрев на сайт nuget, я вижу, что 3.0.2 по-прежнему является последней стабильной версией. Будет ли доступна версия Tesseract 3.0.5 или сразу будет переход на 3.2.0?

Привет, ребята, в настоящее время я использую метод DetectBestOrientation, чтобы убедиться, что каждая страница повернута в правильную ориентацию перед OCR, и он работает очень хорошо. В версии 3.2.0-alpha3 это было закомментировано из-за изменения TessBaseAPIDetectOrientationScript.

Есть ли какой-нибудь план по внедрению «нового» DetectBestOrientation, использующего TessBaseAPIDetectOrientationScript?

Метод DetectBestOrientation был закомментирован, поскольку используемый им метод Tesseract API, TessBaseAPIDetectOS считался небезопасным и, следовательно, был удален разработчиками Tesseract. Вместо него был создан новый метод TessBaseAPIDetectOrientationScript . Он включен в версию .NET, но еще не представлен в классе Page . На это только что был отправлен PR.

Спасибо @nguyenq. Я объединил PR, попробую завтра протестировать.

Если бы кто-нибудь мог взглянуть на методы DetectBestOrientationAndScript и co и сообщить мне, соответствуют ли они вашим требованиям, это было бы здорово. Если да, я создам новый Nuget, когда найду немного времени.

Спасибо.

Спасибо, парни. Я только что посмотрел и определенно соответствует всем требованиям 🙂 С нетерпением жду возможности протестировать его, когда вернусь в офис!

Если вы сможете собрать Nuget в ближайшее время, у меня будет возможность провести небольшое тестирование ... извините, не пытаюсь быть настойчивым, просто хочу помочь.

Хорошо, я посмотрю, что я могу сделать.

В сб, 19 августа 2017 в 12:59 MattMofDoom [email protected] написал:

Если вы сможете собрать Nuget в ближайшее время, у меня будет
возможность провести тестирование .. извините, не пытаюсь быть настойчивым, просто хочу
чтобы помочь.

-
Вы получаете это, потому что вас назначили.

Ответьте на это письмо напрямую, просмотрите его на GitHub
https://github.com/charlesw/tesseract/issues/340#issuecomment-323495733 ,
или отключить поток
https://github.com/notifications/unsubscribe-auth/AAPzyCouqoxpyK_LCFwnhJ6VL4iU85G4ks5sZk-bgaJpZM4M8v00
.

Извините за задержку, пакет nuget 3.2.0-alpha4 должен быть установлен сейчас.

Вообще нет проблем - большое спасибо. Я дам вам знать, как я иду.

Я смог провести некоторое тестирование с 3.2.0-alpha4, и он выглядит хорошо ... никаких проблем не возникает.

Я пытаюсь вызвать новый метод PixArray.Add(Pix pix, int copyflag) , но он продолжает генерировать исключения NonComVisibleBaseClass со следующим кодом. Может кто-нибудь посмотреть?

var pix = Pix.LoadFromFile(filename);
PixArray pixA = PixArray.Create(0);
pixA.Add(pix, 0); // L_NOCOPY

NonComVisibleBaseClass произошло
Сообщение: Помощник по управляемой отладке NonComVisibleBaseClass обнаружил проблему в C: \ PROGRAM FILES (X86) \ MICROSOFT VISUAL STUDIO 14.0 \ COMMON7 \ IDE \ COMMONEXTENSIONS \ MICROSOFT \ TESTWINDOW \ vstest.executionengine.x86.exe.
Дополнительная информация: был выполнен вызов QueryInterface с запросом интерфейса класса видимого управляемого класса COM «Tesseract.Pix». Однако, поскольку этот класс является производным от невидимого для COM класса Tesseract.DisposableBase, вызов QueryInterface завершится ошибкой. Это сделано для предотвращения ограничения видимого базового класса COM правилами управления версиями COM.

@nguyenq У меня такая же ошибка - есть ли причина использовать PixArray против ArrayList, состоящего из Pix? У меня есть последнее для работы, и в настоящее время меня это устраивает.

Я посмотрю, смогу ли я взглянуть на выходные, если позволит время.

Из памяти PixArray на самом деле просто используется для поддержки загрузки многостраничных
tiff, если вы можете использовать другую структуру данных, например списоктогда я бы
Предлагаю вам это сделать. Однако вы должны убедиться, что они утилизированы, когда вы
Выполнено.

В чт, 7 сентября 2017, 08:08 Райан Леонард [email protected] написал:

@nguyenq https://github.com/nguyenq У меня такая же ошибка - это
есть ли причина использовать PixArray против ArrayList, состоящего из Pix? у меня есть
последний, чтобы работать, и в настоящее время это нормально для меня.

-
Вы получаете это, потому что вас назначили.

Ответьте на это письмо напрямую, просмотрите его на GitHub
https://github.com/charlesw/tesseract/issues/340#issuecomment-327620665 ,
или отключить поток
https://github.com/notifications/unsubscribe-auth/AAPzyMqDkMZIW4jI40T4UVPAQE1ujBVKks5sfxH2gaJpZM4M8v00
.

PixArray - это нативный тип Leptonica. Я надеялся , что я мог бы использовать его для хранения без TIFF изображений, с использованием аналогичной кода , изложенной в ProcessMultipageTiff теста в ResultRendererTests класса (для целей и преимуществ повторного использования кода); в противном случае я могу использовать код, похожий на ProcessFile . На самом деле нет проблем.

Я посмотрел и обнаружил некоторые проблемы с PixArray.Add, которые я исправил, но, к сожалению, обнаружил некоторые другие проблемы, связанные с управлением памятью. Короче говоря, PixArray должен быть достаточно безопасным для использования для многостраничных Tiff, однако использование только массива пикселей в данный момент не работает, поэтому используйте vector \ arraylist. Я посмотрю, смогу ли я решить другие проблемы, и внесу исправление, когда у меня будет время.

Закрытие как Tesseract 3.05 теперь должно поддерживаться. Если вы обнаружите какие-либо ошибки в оболочке, сообщите о новых проблемах или, еще лучше, отправьте запрос на перенос с исправлением :)

Была ли эта страница полезной?
0 / 5 - 0 рейтинги