Лекция: Сканирование и распознавание текста.
Процесс ввода документов в компьютер состоит из четырех этапов: сканирование, распознавание, проверка и сохранение результатов распознавания.
В результате сканирования появится окно Изображение, содержащее «фотографию» страницы. Затем программа попросит Вас установить параметры распознавания и приступит к распознаванию изображения, одновременно анализируя его. Обработанные участки изображения закрашиваются синим цветом.
Результат распознавания Вы увидите в окне Текст. В этом же окне Вы можете проверить и отредактировать распознанный текст. Следуя далее указаниям Мастера Scan&Read, Вы можете либо передать распознанный текст в выбранное Вами приложение или сохранить его на диск, либо продолжить обработку следующих изображений.Мастер Scan&Read вызывает специальный режим, при котором можно отсканировать и распознать страницу или открыть и распознать графическое изображение. При этом каждый шаг сопровождается подсказками системы.
Сканирование:FineReader работает со сканерами через TWAIN-интерфейс. При этом возможно два варианта взаимодействия программы со сканерами через TWAIN-драйвер:
— через интерфейс FineReader: в этом случае для настройки опций сканирования используется диалог программы FineReader Настройки сканера;
— через интерфейс TWAIN-драйвера сканера: для настройки опций сканирования используется диалог TWAIN-драйвера сканера.
Преимущества одного режима перед другим:
— в режиме Использовать интерфейс TWAIN-драйвера сканера, как правило, доступна функция предварительного просмотра изображения (preview), позволяющая точно задать размеры сканируемой области, подобрать яркость, тут же контролируя результаты этих изменений. К сожалению, диалог TWAIN-драйвера сканера у каждого сканера выглядит по-своему, в большинстве случаев все надписи на английском языке. Вид этого окна и смысл опций описан в документации, прилагаемой к сканеру.
— в режиме Использовать интерфейс FineReader доступны такие опции, как возможность сканирования в цикле на сканерах без автоподатчика, сохранение опций сканирования в отдельный файл Шаблон пакета (*.fbt) и возможность использования этих опций в других пакетах.
Вы можете легко переключаться между этими режимами: на закладке Сканирование/Открытие диалога Опции (меню Сервис>Опции) установите переключатель в одно из положений: Использовать интерфейс TWAIN-драйвера сканера илиИспользовать интерфейс FineReader.
Примечание.
1. Для некоторых моделей сканеров опция Использовать интерфейс FineReader может быть по умолчанию отключена (недоступна).
2. Чтобы в режиме Использовать интерфейс FineReader показывался диалог Настройки сканера, на закладке Сканирование/Открытие (Сервис>Опции) отметьте пункт Запрашивать опции перед началом сканирования.
Задание:
- Изучите краткие теоретические сведения и составьте конспект в журнале-отчете.
- Проведите сканирование текста:
Чтобы запустить сканирование: в меню Файл выберите пункт Сканировать. Спустя некоторое время в Главном окне программы FineReader появится окно Изображение с «фотографией» вставленного листа.
(Если Вы хотите отсканировать несколько страниц, то нажмите стрелку справа от кнопки Сканировать и в локальном меню выберите пункт Сканировать несколько страниц).
В случае если сканирование не началось сразу:
— откроется встроенный TWAIN-интерфейс сканера;
— откроется диалог Настройки сканера.
- Проведите распознавание текста с помощью ABBY FineReader:
Если Вы хотите сразу запустить распознавание отсканированных страниц, воспользуйтесь опцией Сканировать и распознать или Сканировать и распознать несколько страниц: нажмите стрелку справа от кнопки Scan&Read и в локальном меню выберите один из пунктов: Сканировать и распознать или Сканировать и распознать несколько страниц.
FineReader отсканирует и распознает изображения. В Главном окне программы появятся окно Изображение с «фотографией» вставленного листа и окно Текст с результатом распознавания. Распознанный текст Вы можете сохранить во внешние редакторы и форматы.
- Проведите проверку орфографии и редактирование текста:
Проверка и редактирование текста:После завершения распознавания результат появляется в окне Текст. Окно Текст — это встроенный редактор программы FineReader; в нем Вы можете проверить результаты распознавания и отредактировать распознанный текст.
Одна из возможностей текстового редактора FineReader — это встроенная проверка орфографии (список языков, для которых поддерживается проверка орфографии, приведен в Поддерживаемых языках распознавания). Система встроенной проверки орфографии позволяет:
— находить неуверенно распознанные слова (слова, в которых есть неуверенно распознанные символы).
— находить орфографические ошибки (неправильно написанные слова).
— добавлять неизвестные системе FineReader слова в словарь для того, чтобы они распознавались уверенно.
- Проведите сохранение документа:
Сохранение во внешние редакторы и форматы:Результаты распознавания можно сохранить в файл, передать во внешнее приложение, не сохраняя на диск, скопировать в буфер обмена или отправить по электронной почте. Сохранить можно все страницы или только выбранные.
Вы можете:
— сохранить распознанный текст, используя Мастер сохранения результатов.
— сохранить открытую или выделенные в окне Пакет страницы в файл или во внешнее приложение.
— сохранить все страницы пакета в файл или во внешнее приложение.
— сохранить изображение страницы.
Кнопка Сохранить позволяет передать результаты распознавания в выбранное приложение или сохранить их в файл. Внешний вид иконки меняется в зависимости от выбранного режима сохранения; подпись Сохранить меняется на название выбранного приложения. Чтобы сохранить распознанный текст, нажмите стрелку справа от кнопки Сохранить и в локальном меню выберите необходимый пункт.
- Запишите в отчете алгоритм ваших действий при сканировании и распознавании.
Контрольные вопросы:
- Что определяет область сканирования?
- Какие параметры разрешения целесообразно выбирать при сканировании различных изображений?
- От какого элемента сканера зависит оптическое разрешение сканера?
2.13 Практическая работа № 13