Лекция: Сканирование и распознавание текста.

Процесс ввода документов в компьютер состоит из четырех этапов: сканирование, распознавание, проверка и сохранение результатов распознавания.

В результате сканирования появится окно Изображение, содержащее «фотографию» страницы. Затем программа попросит Вас установить параметры распознавания и приступит к распознаванию изображения, одновременно анализируя его. Обработанные участки изображения закрашиваются синим цветом.

Результат распознавания Вы увидите в окне Текст. В этом же окне Вы можете проверить и отредактировать распознанный текст. Следуя далее указаниям Мастера Scan&Read, Вы можете либо передать распознанный текст в выбранное Вами приложение или сохранить его на диск, либо продолжить обработку следующих изображений.Мастер Scan&Read вызывает специальный режим, при котором можно отсканировать и распознать страницу или открыть и распознать графическое изображение. При этом каждый шаг сопровождается подсказками системы.

Сканирование:FineReader работает со сканерами через TWAIN-интерфейс. При этом возможно два варианта взаимодействия программы со сканерами через TWAIN-драйвер:

— через интерфейс FineReader: в этом случае для настройки опций сканирования используется диалог программы FineReader Настройки сканера;

— через интерфейс TWAIN-драйвера сканера: для настройки опций сканирования используется диалог TWAIN-драйвера сканера.

Преимущества одного режима перед другим:

— в режиме Использовать интерфейс TWAIN-драйвера сканера, как правило, доступна функция предварительного просмотра изображения (preview), позволяющая точно задать размеры сканируемой области, подобрать яркость, тут же контролируя результаты этих изменений. К сожалению, диалог TWAIN-драйвера сканера у каждого сканера выглядит по-своему, в большинстве случаев все надписи на английском языке. Вид этого окна и смысл опций описан в документации, прилагаемой к сканеру.

— в режиме Использовать интерфейс FineReader доступны такие опции, как возможность сканирования в цикле на сканерах без автоподатчика, сохранение опций сканирования в отдельный файл Шаблон пакета (*.fbt) и возможность использования этих опций в других пакетах.

Вы можете легко переключаться между этими режимами: на закладке Сканирование/Открытие диалога Опции (меню Сервис>Опции) установите переключатель в одно из положений: Использовать интерфейс TWAIN-драйвера сканера илиИспользовать интерфейс FineReader.

Примечание.

1. Для некоторых моделей сканеров опция Использовать интерфейс FineReader может быть по умолчанию отключена (недоступна).

2. Чтобы в режиме Использовать интерфейс FineReader показывался диалог Настройки сканера, на закладке Сканирование/Открытие (Сервис>Опции) отметьте пункт Запрашивать опции перед началом сканирования.

Задание:

  1. Изучите краткие теоретические сведения и составьте конспект в журнале-отчете.
  2. Проведите сканирование текста:

Чтобы запустить сканирование: в меню Файл выберите пункт Сканировать. Спустя некоторое время в Главном окне программы FineReader появится окно Изображение с «фотографией» вставленного листа.

(Если Вы хотите отсканировать несколько страниц, то нажмите стрелку справа от кнопки Сканировать и в локальном меню выберите пункт Сканировать несколько страниц).

В случае если сканирование не началось сразу:

— откроется встроенный TWAIN-интерфейс сканера;

— откроется диалог Настройки сканера.

  1. Проведите распознавание текста с помощью ABBY FineReader:

Если Вы хотите сразу запустить распознавание отсканированных страниц, воспользуйтесь опцией Сканировать и распознать или Сканировать и распознать несколько страниц: нажмите стрелку справа от кнопки Scan&Read и в локальном меню выберите один из пунктов: Сканировать и распознать или Сканировать и распознать несколько страниц.

FineReader отсканирует и распознает изображения. В Главном окне программы появятся окно Изображение с «фотографией» вставленного листа и окно Текст с результатом распознавания. Распознанный текст Вы можете сохранить во внешние редакторы и форматы.

  1. Проведите проверку орфографии и редактирование текста:

Проверка и редактирование текста:После завершения распознавания результат появляется в окне Текст. Окно Текст — это встроенный редактор программы FineReader; в нем Вы можете проверить результаты распознавания и отредактировать распознанный текст.

Одна из возможностей текстового редактора FineReader — это встроенная проверка орфографии (список языков, для которых поддерживается проверка орфографии, приведен в Поддерживаемых языках распознавания). Система встроенной проверки орфографии позволяет:

— находить неуверенно распознанные слова (слова, в которых есть неуверенно распознанные символы).

— находить орфографические ошибки (неправильно написанные слова).

— добавлять неизвестные системе FineReader слова в словарь для того, чтобы они распознавались уверенно.

  1. Проведите сохранение документа:

Сохранение во внешние редакторы и форматы:Результаты распознавания можно сохранить в файл, передать во внешнее приложение, не сохраняя на диск, скопировать в буфер обмена или отправить по электронной почте. Сохранить можно все страницы или только выбранные.

Вы можете:

— сохранить распознанный текст, используя Мастер сохранения результатов.

— сохранить открытую или выделенные в окне Пакет страницы в файл или во внешнее приложение.

— сохранить все страницы пакета в файл или во внешнее приложение.

— сохранить изображение страницы.

Кнопка Сохранить позволяет передать результаты распознавания в выбранное приложение или сохранить их в файл. Внешний вид иконки меняется в зависимости от выбранного режима сохранения; подпись Сохранить меняется на название выбранного приложения. Чтобы сохранить распознанный текст, нажмите стрелку справа от кнопки Сохранить и в локальном меню выберите необходимый пункт.

  1. Запишите в отчете алгоритм ваших действий при сканировании и распознавании.

Контрольные вопросы:

  1. Что определяет область сканирования?
  2. Какие параметры разрешения целесообразно выбирать при сканировании различных изображений?
  3. От какого элемента сканера зависит оптическое разрешение сканера?

 

2.13 Практическая работа № 13

еще рефераты
Еще работы по информатике