В прошедшем году в моей жизни прибавилось работы с бумажными документами и это способствовало тому, что я открыл для себя использование камеры iPhone в качестве сканера. Очень удобно смотреть нужный документ прямо на планшете вместо того, чтобы искать его в папках с бумажками. А многие бумажки можно просто выбросить после оцифровки.

Сканированию поддаётся что угодно: визитки, документы, объявления и т.д. А хранить их удобно в облачных сервисах, таких как iCloud Drive, Evernote, Dropbox и даже в 1Password. Все эти сканы документов неоднократно выручали меня, когда под рукой не было оригинала.

Я пробовал различные сканеры для iPhone и iPad, наиболее интересные из них на мой взгляд — Scanbot, Scanner Pro и Prizmo (Mac, iOS). Влад недавно писал, что пользуется Scanner Pro, но лично я оцифровываю большинство документов Сканботом, о чем рассказывал в своём обзоре. Но сейчас речь пойдёт о третьем игроке — сканере Prizmo. А рассматривать его будем в контексте поддержки новых возможностей Yosemite и iOS 8.

Prizmo – это сканер со встроенной технологией оптического распознавания символов для Mac и iOS. На самом деле, Prizmo – это не только сканер и OCR, он также позволяет делать различную специфичную для документов пост-обработку. Например, можно исправить перспективу изображения, снятого с наклоном в какую-либо сторону или сделать текст более читаемым. Именно эта функция показалась мне наиболее ценной, её можно использовать в отрыве от остальных возможностей и для этого есть специальные расширения (о которых я расскажу дальше).

Качество OCR

Сразу начну с минуса OCR-движка Prizmo: он не способен распознавать одновременно два языка. Тот же Scanbot умеет распознавать многоязычные документы.

Всего для распознавания поддерживаются 40 языков, из которых 10 встроены в приложение, а остальные 30 можно загрузить в настройках программы. Что интересно, «встроенные» языки распознаются быстрее, что наводит на мысль об использовании различных движков распознавания. Замечу, к слову, что Scanbot использует для распознавания свободную систему OCR под названием tesseract, которая очень даже ничего.

В спецификациях Prizmo написано, что для 10 встроенных языков они используют систему распознавания OpenRTK. Что используется для загружаемых языков — не сообщается, но могу предположить, что это тоже tesseract, т.к. OpenRTK эти языки не поддерживает.

OpenRTK и tesseract умеют распознавать форматирование и Prizmo использует эту возможность при сохранении в PDF. Но почему-то при сохранении в RTF я получил только чистый текст на том же документе, на котором было форматирование в PDF.

Также сразу хочу заметить, что рукописный текст, даже очень аккуратно написанный, Prizmo не распознает совершенно никак. Но печатный текст в достаточном разрешении распознает без ошибок.

Есть принципиальное отличие Prizmo от мобильных сканеров типа Scanbot. Тот же Scanbot предназначен для фотографирования и наложения на скан текстового слоя. Текстовый слой очень удобен для поиска – документы с ним индексируются в Spotlight, а также в самом Scanbot, в Documents от Readdle и т.д. В свою очередь, Prizmo, как FineReader ещё и позволяет создать новый документ с распознанным текстом, т.е. без фотографии оригинального документа в качестве фона. Для этого у него есть инструменты выделения блоков текста на скане, изменения их порядка в экспортируемом документе и т.д. Эту возможность удобно использовать для экспорта отдельного блока текста или чтобы быстро убрать лишнее, а также упорядочить хаотичное расположение блоков текста на документе.

Кстати, Prizmo умеет работать не только с камерой телефона, но и с настоящими сканерами.

Для небольшого сравнения распознавания в Prizmo и Scanbot я взял находящийся под рукой документ на русском языке. Оба сканера распознали его одинаково хорошо, без ошибок. Но в Scanbot всё делается в пару кликов, а в Prizmo целая приборная панель кнопок, чаще всего ненужных в мобильном сканере.

К слову, самый классный OCR из опробованных мною был у Evernote. Он даже творит чудеса – без ошибок распознает рукописный ввод, даже с очень кривым почерком. Но Evernote не даёт на выходе текст или документ с текстовым слоем. Распознанный в Evernote текст используется только для поиска и завязывает всё на своё облако, поэтому в качестве сканера его использовать не получается. Зато вот с хранением визиток у Evernote полный порядок.

Насколько я понял, OCR в Prizmo сильно уступает технологии ABBYY, но я пока не тестировал FineReader, который, кстати, в Pro-версии умеет работать с Automator и AppleScript.

Pro Pack

За дополнительную плату в 1490 ₽ можно разблокировать Pro Pack, который включает в себя следующие возможности:

  • Пакетная обработка: несколько документов могут быть обработаны и распознаны в один заход.
  • Автоматизация с Automator: например, можно автоматически обрабатывать документы, добавленные в определенную папку.
  • Скрипты: управление Prizmo из скриптов AppleScript или Unix Shell Script.

К сожалению, я тестировал только стандартную версию Prizmo, хотя от возможностей автоматизации я бы не отказался, уж я то найду им применение.

Визитки

В Prizmo заявлено сканирование и распознавание визиток, я решил протестировать и эту возможность. К сожалению, сканер визиток из Prizmo слабый. Во-первых, ввод визитки в Prizmo получается ощутимо дольше, чем с ABBYY BCR или тем же Evernote. Во-вторых, в отличие от двух последних, он сам не находит типовые поля на визитке, вынуждая вручную выбирать где ФИО, где телефон и т.д. В-третьих, он ничего не знает о поле «отчество».

ABBYY Business Card Reader и Evernote сами находят всю информацию на визитке и сразу сохраняют её в свою базу данных, в которой потом легко найти контакт. Я использую Evernote для сканирования визиток именно для того, чтобы сделать это быстро. Я знаю, что найду эту информацию, когда она понадобится. С Prizmo же мне проще положить визитку в карман, чем заниматься распознаванием в ручном режиме.

Фишки Yosemite и iOS 8

Вот здесь аплодисменты разработчикам: Prizmo по максимуму поддерживает новые возможности ОС. Во-первых, документы Prizmo синхронизируются с iCloud Drive. Во-вторых, поддерживается функция Handoff, которая позволяет буквально в один клик открыть на другом устройстве текущий документ.

Кроме того, Prizmo предлагает полный комплект расширений. Для Mac – это расширение OCR и расширение для обрезки и очистки изображений. Как это можно использовать:

  1. допустим, вы пытаетесь отправить кому-то фотографию объявления с кривой перспективой и лишним пространством вокруг содержимого:

  1. после добавления изображения во вложение к письму в Mail.app над ним появляется всплывающее меню с расширениями, там необходимо выбрать «Обрезка и очистка (Prizmo)»:

  1. Результат:

Как видно, изображение стало более контрастным и… прямым! Ещё можно распознать текст на изображении при помощи второго расширения и вставить его в письмо для удобства адресата (поиск, возможность копипаста). Хотя, на мой взгляд, было бы интереснее увидеть расширение, которое на лету будет превращать изображение в pdf с текстовым слоем, как это делает Scanbot.

Дополнительно, в menubar находится приложение, которое позволяет в один клик распознать любой текст на экране – достаточно активировать его и обвести область с текстом, как это делается при создании скриншотов. Это можно использовать для того, чтобы быстро сграбить текст откуда угодно – с открытого изображения, из каких-либо приложений, где невозможно выделить и скопировать текст и т.д.

Для iOS расширений ещё больше – они добавляются для изображений в галерее и для pdf-документов и даже для текста добавляется расширение «прочитать голосом» (да, это одна из функций программы, но работает она через системный синтезатор).

На iOS при помощи расширений Prizmo можно проделывать с изображениями тоже самое, что и на Маке. Полезные возможности для тех, кто использует paperless мобильный офис.

Вердикт

В качестве мобильного сканера программа не очень удобная, стоит довольно много ($50 для Mac и $10 для iOS на момент написания), качество OCR для русского языка не удивляет, но остаётся на приемлемом уровне. Но, в отличие от многих других мобильных сканеров, эта программа закрывает ряд моих потребностей.

Например, можно подготовить наспех сделанную фотографию перед добавлением в Evernote (который, кстати говоря, поддерживается в экспорте Prizmo): исправить кривую перспективу объявления на фотографии, «изогнутость» книжной страницы, повысить читаемость текста, автоматически обрезать лишние поля.

Особенно удобно то, что реализованы эти функции в виде расширений, что позволяет без копирования данных из одной программы в другую и обратно выполнять обработку.

Работа с отдельными блоками текста также нашла оригинальное применение: никак невозможно скопировать описание приложения в App Store, но можно сделать скриншот и скопировать отдельные блоки текста и даже иконку в Prizmo.

В итоге, я оставлю Prizmo на устройстве для определённых случаев. Чаще всего мне нужно быстро отсканировать документ или объявление и для этого мне удобнее всего использовать Scanbot – он сразу «отрежет» лишнее, улучшит контраст, сделает распознавание и сохранит документ в iCloud Drive. Но иногда я получаю от жены фотографии, сделанные наспех и без использования специальных приложений. Такие фотографии удобнее исправлять в Prizmo. Также не исключаю, что понадобится скопировать текст из какого-либо приложения, не предусматривающего такую возможность.

Подборка примеров результата работы Prizmo есть в галерее на сайте разработчиков. Ну а если же вам нужно качественное распознавание текста (OCR) на iPhone или iPad, то рекомендую посмотреть на недавно вышедший ABBYY Scanner Pro, где для распознавания мощности самой ABBYY, а распознавание русского языка — эталонное. Самое интересное, что сейчас программу можно купить всего за 1.99 $.

Prizmo - Pro Scanner
Prizmo - Pro Scanner
Developer:
Price: 749 р.+
Prizmo 3 - Сканирование
Prizmo 3 - Сканирование
Developer:
Price: 3 790 р.+
Share.