|
|
Статьи
И невозможное возможно! Как из бумаги сделать файл
Вы никогда не задумывались, каким образом в Интернете появляются книги для скачивания? Каким образом книги, порой в тысячу страниц, преобразовываются в файлы самых разных разрешений для чтения на электронных носителях? Вряд ли эти тексты перепечатываются вручную…
С проблемой перевести бумажный документ в электронный все мы сталкивались не раз. Первые опыты в этом, без сомнения, важном деле происходили в школьные годы, когда самые смышленые троечники лихо фотографировали шпаргалки, любовно оформленные добросовестными хорошистами, и продавали мини-фото отпетым двоечникам по сходной цене. С тех прошло очень много лет, а необходимость в преобразовании документов сохранила свою актуальность. Едва ли не каждый год на рынок выводятся оригинальные или не очень, но продукты, которые предлагают без особых хлопот и забот превратить «бумагу в цифру». У этих продуктов даже название есть — OCR (Optical Character Recognition), что в переводе с английского означает «оптическое распознавание текста».
Для использования OCR-программ достаточно стандартного офисного набора оргтехники: сканера, цифрового фотоаппарата или того же МФУ. Если вы еще не укомплектовали свой офис этим оборудованием, наш краткий обзор наверняка поможет вам в этом деле.
Сканеры. Для работы в офисе оптимальный вариант — недорогой и качественный цветной планшетный сканер. Это плоский агрегат со стеклом, на которое кладется объект, подлежащий сканированию. Обычно сканеры «заточены» под решение двух главных задач: сканирование текстовых документов с последующим распознаванием и оцифровку фотографий и других изображений, то есть превращение слайда или бумажной фотографии/картинки в электронный вид. Сейчас практически все модели сканеров продаются в комплектации с OCR-программой, позволяющей распознавать текст и сохранять полученные данные в текстовый файл того или иного формата.
Хороший планшетный сканер формата A4 стоит от 100 до 150 долларов, а модели по цене от 150 до 250 долларов, как правило, способны удовлетворить самых привередливых пользователей. Модели дешевле 100 долларов можно рассматривать лишь как бюджетное решение, ибо с графикой они работают посредственно.
МФУ — это устройство, способное выполнять функции самой важной в офисной работе техники: копира, факса, сканера и принтера. Все многофункциональные устройства условно можно разделить на четыре класса аппаратов, отличающихся по типу базового механизма, на основе которого они построены: МФУ-факсы, МФУ-копиры и МФУ-принтеры (струйные и лазерные). Поэтому, выбирая подходящую для себя модель, вы должны ориентироваться на то, какие функции вам потребуются в работе: печать, копирование, сканирование или прием и передача факсимильных сообщений, и отдавать предпочтение тому классу МФУ, где эта функция взята за основу построения «комбайна».
Обычно при выборе товара сначала определяются с количеством имеющихся денег, а потом уже выбирают из моделей одной ценовой категории. В случае с МФУ такой подход не совсем оправдан. Экономия при покупке может обернуться существенными расходами при эксплуатации. И просто сравнить ресурсы картриджей и их цену недостаточно. У серьезных офисных машин в категорию расходников попадают и запасные части, требующие периодической замены. Причем для каждого МФУ этот список будет своим (к счастью, производители обычно указывают перечень расходников и их ресурс в описании модели).
Цифровые фотоаппараты. Выбирая среди рыночного разнообразия модель для работы в офисе, исходите прежде всего из того, какие задачи вам придется решать с помощью этого фотоаппарата. Предположим, вам необходимы фотосъемки в офисе, изображения для сайта компании, фотографии выпускаемой продукции, получение профессиональных снимков без необходимости привлечения фотографов-профессионалов. При такой постановке задач оптимальной будет камера со следующими характеристиками: разрешение — 7 мегапикселей и выше, тип объектива — Zoom, карты памяти — CompactFlash, Memory Stick, xD-Picture или SD/HC, формат фотоснимка JPEG или TIFF, интерфейс — USB, соединения NTSC/PAL, автоматическое управление экспозицией, приоритет диафрагмы и выдержки, ручной режим, выбор режимов замера, брекетинг. Стоят подобные фотоаппараты от 400 до 700 у.е.
Всевозможные производные классического сканера, например, ручки-сканеры, способные в считанные секунды перевести подпись шефа или другие небольшие по объему, но весьма важные по значению данные с бумаги на экран компьютера. Путем нехитрых манипуляций ваши записи приобретут начертание выбранного вами шрифта и кегля и преобразуются в обычный файл. Выбирать КПК и ручки-сканеры не так сложно, как МФУ или цифровой фотоаппарат: они представлены на рынке не столь широко, а их функции у всех моделей примерно одинаковые.
Определившись с оргтехникой, можно переходить к изучению непосредственно OCR-продуктов (если, конечно, вы не купите сканер с уже установленной программой для считывания и преобразования текстов).
На данный момент существует огромное количество продуктов, поддерживающих распознавание текста. Рассмотрим наиболее популярные из них.
Readiris Pro7 — профессиональная программа распознавания текста. Данная OCR отличается от аналогов высочайшей точностью преобразования обычных (каждодневных) печатных документов, таких как письма, факсы, журнальные статьи, газетные вырезки. Основными достоинствами программы являются: возможность более или менее точного распознавания картинок, сжатых по максимуму (с максимальной потерей качества) методом JPEG, поддержка цифровых камер и автоопределение ориентации страницы.
OCR Cuneiform. Выгодно отличается уровнем распознавания, особенно текстов низкого качества; эта программа может распознавать таблицы различной структуры, в том числе и без линий и границ, редактировать и сохранять результаты в распространенных табличных форматах.
И, наконец, самая популярная в России OCR-программа — Fine Reader, производимая компанией ABBYY Software, одной из первых в мире озаботившейся распознаванием текстов, набранных не латиницей, а кириллицей. Последняя разработка — ABBYY Fine Reader 9.0 — предлагает не просто преобразовывать бумажные документы, цифровые фотографии и PDF-файлы в стандартные электронные форматы Word или Exel, но и сохранять результаты распознавания в PDF-файлах с возможностью поиска по тексту, а также поставить пароль на особо важные и секретные PDF-файлы. Технология адаптивного распознавания документов позволяет анализировать и обрабатывать исходный материал не постранично, а целиком. «Наша программа понимает и восстанавливает такие элементы логической структуры документа, как верхние и нижние колонтитулы, сноски, подписи к картинкам и диаграммам, стили, шрифты, нумерацию страниц, — рассказывает руководитель по маркетинговым коммуникациям компании «ABBYY Россия» Людмила Булавкина. — Подсчитано, что использование Fine Reader 9.0 экономит 14 минут на каждой странице по сравнению с ручным вводом текста».
Собственно, процесс преобразования текстов можно рассмотреть на примере программы ABBYY FineReader 9.0. «Преобразование бумажного документа в электронный вид состоит из 4 простых этапов, — рассказывает Людмила Булавкина. — Первый этап — получение изображения печатного документа с помощью сканера либо цифрового фотоаппарата. Второй — распознавание изображения. Программа с помощью встроенных алгоритмов переводит графические изображения букв в редактируемые символы. Третий этап — проверка. В программе ABBYY FineReader 9.0 пользователь тут же может увидеть результат распознавания в окне «Текст», здесь же, при необходимости, внести правки. И, наконец, четвертый этап — сохранение электронного документа. На этом этапе нужно выбрать формат сохранения, например, документ Word, и документ в электронном виде готов!»
— Какие OCR-продукты Вы используете в своей работе?
Ольга Иванова, ведущий специалист департамента информационной политики ООО «Интертехэлектро — Новая генерация»:
— В своей работе мы активно используем ABBYY Fine Reader. В процессе проведения мониторингов и создания информационной базы компании не всегда можно воспользоваться готовыми электронными материалами. Большое количество информации поступает из изданий по подписке. Данная программа помогает быстрее, по сравнению с перепечатыванием материалов, перевести их в электронный формат, что делает организацию информационных потоков более удобной как в процессе создания, так и дальнейшего использования.
По материалам журнала Office Magazine
20.11.2008
Источник:
www.officemagazine.ru
Описание журнала "Office Magazine "
Читайте также:
Все статьи раздела "Оргтехника, расходные материалы"
|
|
|