Контакти

Як працювати в програмі Еббі файн рідер. Як користуватися програмою ABBYY FineReader. Сканування в pdf

Історія Abbyy FineReader налічує вже понад 20 років. Ювілейний 2013 році компанія відзначила випуском повноцінного (в порівнянні з Express Edition від 2009 року) Abbyy FineReader Pro для Mac, а через пару місяців, в лютому 2014 р свій «подарунок» отримали і користувачі Windows - Abbyy FineReader 12 Professional і Corporate. Нагадаю, що попередня версія з'явилася ще в 2011 році, а два з половиною роки термін чималий - давайте розбиратися, наскільки істотні зміни.

Загальна інформація

Системні вимоги для нової версії абсолютно не змінилися. Платформою може служити Windows або Windows Server починаючи від XP і 2003 відповідно. Апаратні запити на теперішній час і поготів скромні: процесор будь розрядності з частотою від 1 ГГц, оперативної пам'яті не менше 1 ГБ плюс по 512 МБ на кожне обчислювальне ядро \u200b\u200bі т. П. Дещо збільшилася тільки потреба в дисковому просторі - тепер для установки потрібно не 700, а 850 МБ (плюс, як і раніше, ще 700 МБ для робочих файлів).

природно, мова йде про мінімальні вимоги; повністю можливості Abbyy FineReader 12 Professional розкриються тільки на порівняно сучасних системах. Зокрема, нагадаю, що програма вміє ефективно распараллеливать обробку окремих сторінок, задіє при цьому всі процесорні ядра і завантажує будь-який процесор майже на 100%. А ось до оперативної пам'яті вона справді не жадібна, і навіть залишається 32-розрядної.

Чи не зазнала змін і процедура установки: мінімум питань і опцій. У комплекті з Abbyy FineReader 12 Professional як і раніше йде Abbyy Screenshot Reader, який стає працездатним тільки після реєстрації користувача.

Після цього також відкриється доступ до техподдержке.

Навіть на основі цієї скромної інформації можна припустити, що перед нами результат еволюції. Відповідно, в подальшому я зосереджуся на описі змін в порівнянні з попередньою версією, Які умовно можна розділити на дві основні групи: робота з програмою (інтерфейс, допоміжні інструменти, зручність використання) і OCR (якість і продуктивність власне розпізнавання).

Робота з програмою

Abbyy FineReader 12 Professional демонструє деякі доопрацювання в частині призначеного для користувача інтерфейсу. Це відразу ж помітно на вікні Завдання, яке за замовчуванням під час відкривання програми. Воно, очевидно, імітує концепцію плиток Windows 8.x і адаптовано для управління пальцями, тим більше, що в програмі також підтримуються і основні жести на кшталт прокрутки і масштабування. На ділі ж, зміни торкнулися тільки «фасаду», та й то частково - поруч з плитками сусідять звичайні елементи управління і в процесі настройки будь-якого сценарію доведеться мати справу зі стандартними діалоговими вікнами. Працювати з ними пальцями досить проблематично, особливо на екранах 8-10 ", які стають популярними у Windows-планшетів.

Уявити ж, що користувач такого планшета, оснащеного камерою, може захотіти швидко «на ходу» ввести якийсь друкований документ, дійсно нескладно. Тим часом вся історія Windows, починаючи з першої редакції Tablet PC, підтверджує безглуздість адаптації до сенсорного управління стандартного настільного інтерфейсу. Мабуть, для цих цілей набагато правильніше створювати спеціальну оболонку, що відповідає всім канонам Metro, але використовує той же «движок». Прикладом подібного рішення служить Internet Explorer з Windows 8.x. До того ж, у Abbyy навіть є якийсь заділ у вигляді Abbyy FineReader Touch для Windows 8, який використовує хмарний сервіс компанії.

Якщо ж абстрагуватися від сенсорного введення, то знайдуться ще зміни даного класу - від цілком очікуваного оновлення вікон відкриття / збереження документів, які, серед іншого, забезпечують простий доступ до хмарним сховищ (При наявності в системі відповідного агента і його папки), до декількох більш важливих і корисних.

Обробка сторінок в Abbyy FineReader 12 Professional тепер виконується в фоновому режимі. Це має на увазі відсутність колишнього модального вікна зі статусом операцій (тепер дану роль грає рядок статусу внизу екрану) і, відповідно, наявність доступу до інтерфейсу. Таким чином користувач має можливість працювати з програмою паралельно процесу розпізнавання (якщо він, звичайно досить тривалий), наприклад, копіювати фрагменти отриманого тексту або навіть коригувати розмітку сторінок - останні при цьому будуть поставлені в чергу і оброблені заново.

На відміну від попередньої версії, також не відбувається перегортання сторінок в міру розпізнавання або при початковому завантаженні документа, якщо автоматичне розпізнавання відключено. У Abbyy FineReader 12 Professional документ завантажується і розбивається на сторінки практично миттєво, а їх ескізи будуються тільки в міру ручного перегортання в лівій панелі. Крім усього іншого, тим самим заощаджуються обчислювальні ресурси, Причому, досить відчутно на великих багатосторінкових документах.

Решта змін даного класу не настільки цікаві, хоча і можуть стати в нагоді в якихось сценаріях, тому про них коротко.

Якщо потрібно не обробити документ цілком, а лише процитувати окремі місця, то можна відключити всі автоматичні операції і вибирати необхідні фрагменти будь-яких типів, відразу ж копіюючи їх в буфер обміну - при цьому аналіз і розпізнавання будуть виконуватися на льоту.

Для отримання результату з більш простою структурою, ніж у оригіналу, можна відключати відтворення колонтитулів, виносок та інших елементів макета. Це може стати в нагоді, наприклад, при підготовці електронних книг.

продовжуючи про електронних книгах - в Abbyy FineReader 12 Professional підтримуються формати EPUB 2.0.1 та 3.0.

Розширено параметри перетворення в XLSX, наприклад, з'явилася можливість очищати форматування або зберігати картинки.

При збереженні підсумкових документів в PDF з текстовим шаром тепер можна скористатися новою технологією Abbyy Precise Scan, яка полягає в згладжуванні символів на оригінальних зображеннях сторінок. Доступна вона, до речі, тільки в кольоровому режимі.

Ефект від її роботи досить помітний, хоча і не завжди, скажімо так, «академічний». Втім, читабельність згладжених символів в будь-якому випадку повинна бути вище, а в даному прикладі оригінал дійсно дуже низької якості.


OCR

Тепер давайте розберемося, які поліпшення відбулися в механізмах власне розпізнавання.

Розробники повідомляють про черговий етап вдосконалення технології ADRT, яка, нагадаю, аналізує і відтворює логічну структуру документа. Декларується, що вона стала працювати набагато точніше, особливо з таблицями, списками, діаграмами. Продемонструвати це адекватними прикладами не так просто, але не неможливо. Ось, наприклад, результати розпізнавання (з настройками за замовчуванням) однієї і тієї ж сторінки в Abbyy FineReader 11 Professional (вгорі) і Abbyy FineReader 12 Professional (внизу).


Стара версія виділила і опрацювала тільки основний текстовий блок, можливо, через низьку якість оригіналу визнавши інші елементи «сміттям». Нова, навпаки, коректно впізнала список і спробувала його відтворити. Результат, правда, не ідеальний: то що розпізнані не всі маркери можна, знову ж таки, віднести на якість зображення, але програма, мабуть, все-таки не зрозуміла, що перед нею зміст, інакше не інтерпретувала б цифри як літери. Проте, прогрес є і на більш якісних оригіналах подібних претензій, можливо, не було б.

А ось як обробляється «неявна» таблиця без розділових ліній - Abbyy FineReader 11 Professional (вгорі) і Abbyy FineReader 12 Professional (внизу).


Добре видно, що стара версія, на відміну від нової, взагалі не побачила тут табличнійструктури і обмежилася набором незв'язаних між собою текстових блоків. Не полінуйтеся клацнути на зображеннях і порівняти результати розпізнавання - у Abbyy FineReader 12 Professional він близький до ідеалу.

На жаль, так відбувається не завжди і вже на сусідніх сторінках Abbyy FineReader 12 Professional показав результати, аналогічні Abbyy FineReader 11 Professional. Хоча саме ADRT повинна була б відстежити однакові «шапки» і зрозуміти, що перед нею своєрідна перетікає таблиця.

Але все одно добре помітно, що оновлені алгоритми звертають увагу на більшу кількість деталей ніж раніше. В процесі тестування Abbyy FineReader 12 Professional спостерігалася, наприклад, навіть спроба інтерпретувати як таблицю картинку з упорядкованим розміщенням на ньому текстової інформації. Набагато частіше також нова версія намагається відтворювати різні діаграми та схеми на основі фонового малюнка, а не з окремих графічних і текстових блоків.

Є ще кілька новинок, покликаних підвищити в Abbyy FineReader 12 Professional якість розпізнавання. Як відомо, однією з передумов для цього є якість оригіналу, особливо якщо він отриманий з допомогою не сканера, а фотокамери. Саме тому свого часу в FineReader з'явилися кошти попередньої обробки оригіналів. У новій версії їх список розширений, додалися обрізка по краях сторінок, освітлення і вирівнювання яскравості фону, видалення кольорових елементів. Останнє може стати в нагоді, наприклад, для обробки документів з печатками та штампами. Крім того, тепер користувач може підключати різні методи індивідуально.

Поліпшено також мовна підтримка. По-перше, з'явився російський алфавіт з наголосами, по-друге, декларується підвищення якості розпізнавання китайського, японського та корейського (до 20%), арабського (до 60%), івриту (до 10%) - досягнуто це, мабуть, за рахунок вдосконалення та додаткового тренування класифікаторів.

Ну і нарешті, один з найбільш животрепетних питань для багатьох читачів: чи зросла швидкість роботи програми? Аргументовано відповісти на це питання, тим більше з цифрами, не так-то просто - надто багато мов, кожен з яких має свої нюанси; занадто велике розмаїття оригіналів; занадто багато невідомих нам факторів впливу на роботу алгоритмів. Тому навіть самі розробники досить стримано говорять про зростання продуктивності Abbyy FineReader 12 Professional на 10-15%.

Подібні цифри зазвичай виходять за результатами обробки досить великих масивів документів і, відповідно, являють собою щось на кшталт «середньої температури по лікарні». Тому корисно докладніше вивчити якісь показові окремі випадки, наприклад, подібні двом наступним:

  • відскановані в кольорі з дозволом 300 dpi 10 сторінок повнокольорового буклету формату A4. Якість хороша, мови російська та англійська, макет складний;
  • PDF з графічними зображеннями 138 сторінок книги, що містить невелика кількість кольорових і чорно-білих ілюстрацій, кілька таблиць. Якість низька (починаючи, мабуть, з «сліпий» друку в паперовій книзі), мови українська і російська, макет простий.

Обидва документи розпізнавалися в кольоровому режимі, а другий також і в чорно-білому, що мало на меті імітувати процес підготовки електронної книги. Всі настройки за замовчуванням залишалися без змін, за винятком набору мов і, відповідно, режимів роботи. В якості тестового полігону використовувався ПК з процесором i5-3450 і 8 ГБ пам'яті. Результати представлені в наступній таблиці:

Як видно, для PDF прискорення навіть перевищує обіцяні 15% - можливо, це якраз один з особливих випадків, добре підходять для останніх оптимізацій в алгоритмах розпізнавання. При цьому треба мати на увазі, що програми, взагалі кажучи, виконали різний обсяг роботи. Погляньте хоча б на ілюстрації вище до обробки таблиць - важко сказати, який з версій довелося складніше.

Що стосується кількості помилок, то воно у обох версій практично збігалося, хоча було помітно, що іноді сумніви викликають різні фрагменти і символи - це, мабуть, є свідченням тренування алгоритмів. У будь-якому випадку, більшість невпевнено розпізнаних символів абсолютно коректно ідентифікувалися за допомогою словників, а «грубі» помилки (неправильна інтерпретація спеціальних і декоративних символів, тексту на графіку та ін.) Збігалися. Так що різницю і зовсім можна вважати зникаючої.

Інше питання, наскільки подібне підвищення продуктивності взагалі має значення? Мабуть, виграш в півхвилини на 138 сторінках, які все одно потрібно перевіряти і, можливо, коригувати, небагато чого варто. Якщо роботи, подібні тестових завдань, передбачається виконувати час від часу, то про продуктивність можна точно не переживати. Інша справа, якщо мова йде про автономну обробці великих обсягів документів, яка доступна в Abbyy FineReader 12 Corporate. У такому випадку економія 15% часу вже цілком відчутна.

резюме

Незважаючи на те, що новий Abbyy FineReader 12 Professional не обіцяв нічого революційного, принаймні кілька змін в ньому заслуговують всілякої похвали. Перш за все, це удосконалення технології ADRT в частині розпізнавання таблиць, діаграм і взагалі логічної структури сторінок, що в деяких випадках дозволяє отримувати кардинально кращі результати, а також фоновий режим обробки, який відкриває нові можливості для інтерактивної роботи з великими документами.

Інших змін також чимало, хоча вони і менш значущі. Рух у бік підтримки сенсорного управління сьогодні безумовно виправдано, проте шлях обрано хибний - забезпечити в одному інтерфейсі однаково зручну роботу мишею і пальцями навряд чи можливо. Втім, поки Windows-планшети тільки намагаються пробитися на ринок, і у розробників з Abbyy ще є час.

Ціни на Abbyy FineReader 12 Professional:

  • версія коробочки: 4990 руб .;
  • версія для скачування: 4490 руб .;
  • оновлення: 2690 руб.

Як завжди, відповідь на питання «чи варто міняти стару версію на нову? » залежить від ситуації. У будь-якому випадку варто враховувати, що життєвий цикл у FineReader досить тривалий, і якщо якесь із описаних поліпшень грає для вас скільки-небудь істотну роль, то за 2-3 роки витрати на оновлення напевно окупляться - якщо не матеріально, то морально. Вирішити ж для себе це питання остаточно допоможе.

Робота з розпізнавання зображень складається з наступних етапів:

  1. Отримати відскановані зображення (скани).
  2. Відкрити їх в OCR-програми (FineReader).
  3. Зробити розмітку сторінок на блоки. Тобто, розбити сторінку на області, в кожній з яких буде перебувати або текст, або малюнки, або таблиці, або інше однорідне вміст.
  4. Власне розпізнавання.
  5. Вичитування розпізнаного, звірка отриманого тексту і вихідних сканів.
  6. Збереження отриманих результатів в одному з документальних форматів (DOC, RTF, PDF, HTML і т. Д.).

При розпізнаванні текстів можливі два варіанти: або ви бажаєте сканувати матеріал самі, або працюєте з уже відсканованим текстом.

У першому випадку етапи «Отримати зображення» і «Відкрити зображення» об'єднуються в одне - FineReader отримані скани відразу ж відкриває в своєму пакеті. У другому випадку етап «Отримати зображення» вже пройдено, треба тільки відкрити їх в програмі.

Розглянемо обидва варіанти по черзі.

Відсканувати текст в FineReader

Сканування запускається через «Файл → Сканувати сторінки» або кнопкою меню «Сканувати», або Ctrl-K.

Мал. 1 Інтерфейс сканування

Однак, перш ніж починати сканувати, непогано б розібратися, як отримати скани, найбільш оптимальні для розпізнавання. А для цього зрозуміти, чим «хороший» (з точки зору FineReader) скан відрізняється від «не дуже гарної».

Для якісного розпізнавання програмі потрібно три речі. По-перше, можливість надійно відрізнити текст і ілюстрації від фону сторінки. По-друге, щоб букви, цифри та інше вміст були чіткими і розбірливими, щоб не виникало ситуацій «тут і людське око не завжди зрозуміє, що саме надруковано». По-третє, рядки тексту на скане повинні йти так само рівно, як вони надруковані на сторінці книги, без перекосів і викривлень. Є ще й інші вимоги до якісної Сканія, але ці можна вважати ключовими.

1. Для надійного розрізнення «тут текст, а тут фон сторінки» потрібно, щоб перехід між тим і іншим був різким, що не розмитим. Ось зразки сторінок з поганою і з хорошою чіткістю. У першому випадку, природно, буде розпізнаватися гірше, з великою кількістю помилок.


Мал. 2. Розмиті межі літер



Мал. 3. Чіткі кордону літер

Звичайна причина розмитих кордонів «текст-фон» - сканування з порушеною фокусуванням, то, що зазвичай називають «не в фокусі». Тому перед початком роботи бажано перевірити ваш сканер на цей момент.

Інша причина, яка може перешкодити розрізнення тексту і фону - занадто «щільний» фон сторінки. У нормі він повинен бути або чисто білим, або білим з невеликою домішкою якогось кольору. Якщо скануються книги старих видань, де папір часто буває пожовклим, то фон теж може бути жовтуватий (але помірно).

Якщо ж фон виглядає помітно перетемненним, то такі сторінки знову ж будуть розпізнаватися гірше.

Те, який вигляд буде у фону, залежить від виставленої яскравості сканування. Її можна регулювати через движок «Яскравість». Для початку має сенс поставити 50%, перевірити, що при цьому буде, при необхідності поправити.

2. Чіткість літер тексту в основному залежить від яскравості і від дозволу сканування.

Якщо яскравість занадто велика, лінії букв будуть будуть рваними, вони стануть як би розсипатися на окремі шматочки. Якщо яскравість мала, то деталі букв починають зливатися між собою, виникають безформні плями. І те, і інше для програм розпізнавання не дуже-то їстівна «їжа».

Яскравість тут налаштовується так само, як і в попередньому випадку - ставимо для початку в інтерфейсі сканування 50%, а далі по ситуації.


Мал. 4. Сторінка з дуже великою яскравістю



Мал. 5. Сторінка з дуже маленькою яскравістю (перетемненний фон сторінки)



Мал. 6. А ось ця ж сторінка, але в нормальному вигляді

Дозвіл сканування визначає скільки пікселів в скане припадатиме на кожну букву. Якщо цих пікселів досить для відтворення контуру букви, то проблем при розпізнаванні не буде. Якщо ж недостатньо, то букви можуть стати погано помітними навіть для людського ока, не кажучи вже про програми розпізнавання.


Мал. 8. Те ж саме, але на 200 точок



Мал. 9. Те ж саме, але на 400 точок

При виборі дозволу зазвичай керуються такими правилами:

  • 300 точок вибирається для книг масових видань (сторінки заповнені текстом звичайного розміру, майже без малюнків);
  • 400 точок вибирається для книг і журналів з помітним обсягом тексту невеликими кеглями (примітки, підписи під малюнками, таблиці, врізки дрібним текстом);
  • 600 точок вибирається для книг, надрукованих зовсім дрібними кеглями (багато довідники та енциклопедії, книги-мініатюри). Або ж з мелкодеталірованнимі малюнками, наприклад, гравюрами. Сюди ж треба віднести багато книги видання 1990-х років - тоді видавці економили на папері і часто друкували зовсім крохотульнимі буквами.

Інтерфейс сканування в FineReader дозволяє вибирати тільки 300 точок або 600 (рядок «Дозвіл»). Тому якщо у вас багато матеріалу, який бажано робити на 400 точок, то краще сканувати не з-під FineReader, а з програми, що йде разом зі сканером.

Або ж в настройках FineReader переключитися з власного інтерфейсу програми на TWAIN-інтерфейс вашого сканера ( «Сервіс → Налаштування → закладка« Сканування / »→ клацнути внизу по« Використовувати інтерфейс сканера »). Тоді ви зможете сканувати з FineReader, але працювати будете в інтерфейсі сканера (зазвичай там більший обсяг налаштувань і функцій).

3. Рівні, акуратно виглядають рядки тексту в основному забезпечуються попередньої обробки зображень ( «перед-» в даному випадку означає «що виконується після сканування, але перед розпізнаванням»). Після правильно зробленої предобработки вміст сторінок буде розпізнаватися з більш високою якістю.

FineReader для цього має достатньо багатий набір функцій, який можна побачити в налаштуваннях програми, на закладці «Сканування /». Також це віконце можна викликати через кнопку «Налаштування» в віконці інтерфейсу сканування.


Мал. 10. Налаштування предобработки

«Ділити розворот книги» треба вибирати, коли книга сканувалася не посторінковий, а розворотами. Тоді для розпізнавання вони будуть нарізані посторінково.

«Визначати орієнтацію сторінок» використовується в тому випадку, якщо книга сканувалася поверненою набік. Тоді вона буде розгорнута в своє нормальне положення. Але якщо в книзі є сторінки, які надруковані поверненими на 90 градусів щодо основної маси, то галочку тут краще зняти. Інакше при виведенні розпізнаного в PDF ви можете отримати частину сторінок в «книжковій» орієнтації, а частина - в «альбомної». Повернути потрібні сторінки в цьому випадку краще вручну, у вбудованому редакторі зображень

«Виправити перекоси» усуває перекоси сторінок. Налаштування однозначно необхідна, але треба мати на увазі, що PDF «Текст під зображенням сторінки», отриманий з таких сканів, матиме не зовсім акуратний вигляд - сіруваті клини по краях сторінки (там де робився поворот).

«Виправити спотворення рядків» вирівнює вигини рядків, які при скануванні часто утворюються близько палітурки (їх ще називають «вуса»).


Мал. 11. Приклад сторінки з вигинами рядків

«Усунути трапецієподібні спотворення» виправляє деформації сторінок, що з'являються якщо книжка не дуже щільно притиснута до скла сканера.

«Інвертувати зображення» необхідна, якщо в сканованому матеріалі багато тексту «світлі букви на темному тлі» і ви хочете перетворити їх в звичайне «темні літери на світлому тлі».

«Видалити кольорові елементи» корисно, якщо на сторінці виду «чорні букви на білому тлі» треба прибрати різні непотрібності, начебто позначок ручкою на полях, підписів і печаток (офісна документація), а то й просто плям. Але якщо на цій же сторінці є якісь зроблені в кольорі «потрібності» - графіки, діаграми або фотографії, то галочку ставити не можна. Інакше будуть видалені і вони.

«Виправити дозвіл зображень» - пункт, що вимагає більш розгорнутого пояснення, ніж попередні. Справа в тому, що процес розпізнавання в FineReader дуже чутливий до того, який дозвіл виставлено у властивостях даного зображення. Від цього суттєво залежить те, наскільки точно будуть визначені кеглі букв тексту, інтервали між буквами і між рядками відстані та інше подібне. Тому галочка тут необхідна. Крім того, не варто дивуватися, якщо по ходу розпізнавання ви будете постійно отримувати повідомлення FineReader «на сторінці такий-то неправильно виставлено дозвіл і добре б його виправити».

Крім налаштувань предобработки на закладці «Сканування /» є блок налаштувань «Загальна». Тут задається набір основних дій, які будуть виконані над їх відкриває сторінками. Варіанти таких дій можуть бути наступні:

  1. просто відкрити відскановані зображення, нічого з ними при цьому не роблячи. Для цього треба зняти галочку «Автоматично обробляти додані сторінки».
    Подібне має сенс тільки в тому випадку, якщо у вас скани настільки високої якості, що їх вже нічим не вельми поліпшиш. Можна відразу відправляти на розпізнавання. Буває звичайно і таке, але набагато рідше, ніж хотілося б :-), тому галочку краще залишити.
  2. відкрити зображення, виконати предобработку, але до вашої команди поки більше нічого не робити. Для цього треба вибрати пункт «Передобробка зображень».
    Так зазвичай роблять якщо треба не запускати відразу розпізнавання, а спочатку подивитися, що вийшло в результаті попередньої обробки, наскільки вона добре відпрацювала по даного набору зображень.
  3. відкрити зображення, виконати предобработку, виконати розмітку на блоки, розпізнавання поки не запускати. Для цього треба вибрати пункт «Аналіз зображень (включаючи предобработку)».
    Найбільш часто обираний варіант. Скани у вас цілком пристойної якості, то, що з ними зробить предобработка ви добре уявляєте, перевіряти після неї немає необхідності. Значить з'єднуємо в одне три описаних вище етапу роботи з зображеннями і починаємо дивитися наскільки добре зроблена розмітка.
  4. всі етапи розпізнавання проходять автоматично, без будь-якого проміжного контролю. Ви відразу одержуєте готовий результат і починаєте його вичитувати. Для цього треба вибрати пункт «Розпізнавання зображень (включаючи предобработку)». Так має сенс робити тільки якщо у вас скани хорошої якості і з дуже простим зовнішнім виглядом - наприклад суцільний текст на одній мові і нічого більше. У всіх інших випадках краще вибирати варіант 2 або 3. Особливо якщо у вас сторінки зі складним форматуванням, таблицями, діаграмами, малюнками і т. Д.


Мал. 12. Приклад сторінки зі складною версткою



Мал. 13. Приклад сторінки зі складною версткою

Відкрити зображення в FineReader

Це другий варіант роботи з зображеннями: чи не сканувати їх самому, а отримати в уже готовому вигляді і відкрити в FineReader. Робиться через кнопку «Відкрити» в меню основного вікна або через «Файл → Відкрити PDF або зображення», або через Ctrl-O.


Мал. 14. Вікно «Відкрити зображення»

У віконці Провідника вибираєте зображення, задаєте необхідні настройки (кнопка «Налаштування») і натискаєте «Відкрити». Налаштування тут використовуються ті ж самі, що описані для сканування, працювати з ними треба так само.

Коли сторінки відкриті в FineReader, то пакет за замовчуванням створюється безіменним ( «Документ без імені») і зберігається в TMP-папці, тільки в межах поточного сеансу роботи. Щоб випадково не втратити результати роботи, рекомендується відразу ж після створення зберегти пакет в якому-небудь постійним ім'ям ( «Файл → Зберегти документ FineReader»).

Розмітка сторінок на блоки

Після того, як ви відкрили скани, треба виконати розмітку сторінок на блоки. Це робиться через «Документ → Аналіз документа» або через Ctrl-Shift-E.

Основних робочих цілей у розмітки дві.

По-перше, відокремити те, що на сторінці є текст, від того, що текстом не є. «Текстом» в даному випадку вважається все, що FineReader в змозі розпізнати. «Не-текстом» відповідно вважається все, що він розпізнати не в змозі. В основному це ілюстративна частина сторінки - малюнки, креслення, графіки, діаграми та інше подібне. Формули, рукописні записи і ноти з цієї точки зору теж вважаються-текстом - розпізнавати їх FineReader поки не вміє. А значить при розмітці їх треба помітити, як «картинка».

По-друге, ще треба те, що є текст, розмітити за категоріями - просто текст, таблиці, примітки (виноски), колонтитули, змісту тощо. Щоб потім, коли ви будете читати розпізнане в текстовому редакторі, Всі ці елементи виглядали б саме так, як ви і звикли (були б відформатовані відповідним чином).

Розмічена сторінка може мати приблизно такий вигляд:


Мал. 15. Вікно «Зображення» з розміченій сторінкою

Тепер треба переглянути розмітку, зроблену програмою на кожній сторінці і при необхідності поправити її.

Похибки розмітки зазвичай бувають наступних видів.

1. Якась частина вмісту сторінки (текст, малюнок і т. Д.) Виділена правильно в сенсі кордонів області, але їй присвоєно не те вміст. Наприклад, фрагмент тексту розмічений, як малюнок або навпаки.

В цьому випадку треба клацнути мишею по такій області, відкрити контекстне меню, вибрати в ньому «Змінити тип зони», в відкрилася подменюшке вибрати необхідний тип ( «Текст», «Таблиця», «Картинка», «Фонова картинка», «штрих код »).


Мал. 16. Контекстне меню «Змінити тип зони»

Швидко подивитися де яка область можна за кольором рамок. «Текст» виділяється рамками темно-зеленого кольору, «Таблиця» - синього, «Картинка» - світло-червоного, «Фонова картинка» - темно-червоного, «Штрих-код» - світло-зеленого.

2. У сенсі вмісту область виділена правильно, але в сенсі розмірів (кордонів) виділено не все, що в даному випадку було потрібно. Або ж навпаки - потрапив шматок від сусідньої області з іншим вмістом.


Мал. 17. Сторінка з некоректно зробленої розміткою

До верхньої області «картинка» схоплені навколишні її підпису (повинні бути розмічені, як «текст»).

У нижню область «картинка» при розмітці не потрапила частина зображення.

Щоб це виправити, треба спочатку клацнути у віконці «Зображення» по кнопці «Стрілка».

А потім клацати по кожній неправильно розміченій області і переміщати її межі. Приблизно таким же чином, як зазвичай переміщують кордону віконець відкритих програм.

3. Якась частина вмісту сторінки розміткою взагалі пропущена, не потрапила ні в одну із створених областей.


Мал. 18. З розмітки випала формула (не потрапила ні в один з блоків)

Тут треба буде створити на сторінці нову область (виділити пропущену частину сторінки рамкою), а потім привласнити створеної області потрібний тип.

Для цього треба спочатку клацнути у віконці «Зображення» по значку «Виділити зону розпізнавання»

Після цього обвести потрібну ділянку рамкою (як зазвичай в графічному редакторі виділяють частину малюнка) і нарешті поставити тип області. Остання операція вже описана в пункті 1.

Якщо текстова частина сторінки вам потрібна просто, як суцільний текст (що найчастіше і буває), то цього цілком достатньо. Якщо ж ви хочете, щоб в Word різні елементи оформлення розпізнаних сторінок (примітки, колонтитули) виглядали б саме, як примітки і колонтитули, то треба перевірити і цей момент.

Регулюється він через контекстне меню. Натискаючи на потрібній області «Текст» на перевіреній сторінці, в контекстному меню вибираєте пункт «Призначення тексту», всередині його подменюшкі дивіться проти якого пункту стоїть галочка (зазвичай це «Автоопределение»). Якщо стоїть не там, де треба, перемикаєтеся на потрібний елемент.


Мал. 19. Контекстне меню «Призначення тексту»

розпізнавання

Після того, як виправлені помилки в розмітці, можна запускати розпізнавання. Це робиться через «Документ → Розпізнати документ» або через Ctrl-Shift-R. Перед цим не забудьте виставити мову розпізнавання і задати необхідні настройки.

Мова виставляється через віконце «Мова документа» в панелі кнопок основного вікна програми.


Мал. 20. Вибір мови через основне меню

Або в настройках ( «Сервіс → Налаштування → закладка« Документ »).


Мал. 21. Вибір мови через настройки FineReader

Якщо в списку немає потрібного вам мови, то натисніть «Вибір мов» в нижній частині списку і в віконці поставте галочку проти необхідного вам мови (набору мов). Після цього він буде доданий в список.

В налаштуваннях розпізнавання ( «Сервіс → Налаштування → закладка« Розпізнати ») режим розпізнавання краще залишити в умолчательную значенні (« Ретельне розпізнавання »). «Швидке розпізнавання» має сенс ставити тільки якщо у вас щось нескладне за образом і з дуже гарною якістю сканування. Наприклад, відсканована в чорно-білому роздруківка текстового документа без ілюстрацій.


Мал. 22. Налаштування, закладка «Розпізнати»

З інших налаштувань основне значення має група «Визначення структурних елементів». Тут перераховані деталі оформлення сторінок: виноски (примітки), колонтитули, списки, змісту. Коли проти елемента поставлена \u200b\u200bгалочка, він буде розпізнано і збережений в DOC / RTF / DOCX не просто як частина тексту на сторінці, а саме, як виноска, колонтитул, список або зміст.

Тільки не забудьте при цьому важливий момент. Якщо вам доводиться розпізнавати області з подібним вмістом, то однією галочки в налаштуваннях закладки «Розпізнати» може виявитися мало. Крім цього ще потрібно на етапі розмітки правильно позначити ці області маркером «Призначення тексту» з контекстного меню.

вичитування

Вичитку розпізнаного тексту в FineReader можна робити двома способами. Або за допомогою функції «Перевірка», або звичайним чином, переглядаючи сторінки у вбудованому редакторі FineReader. Через вікно «Крупний план» звіряємо з сканом, де є помилки - виправляємо.

Функція «Перевірка» запускається кнопкою в правому верхньому куті меню або через Ctrl-F7. Її робота побудована на тому, що під час розпізнавання FineReader позначає символи і слова, які були розпізнані з недостатньо високим рівнем достовірності. Тобто, у програми по їх приводу є деякий сумнів «може це дійсно той символ, який вам пред'явлений, але може бути і щось інше». Під час перевірки такі сумнівні місця по черзі показуються користувачеві, щоб він при необхідності їх поправив.

Вікно перевірки влаштовано досить просто. У верхній його частині показується фрагмент сторінки, в якому знаходиться перевіряється символ. У нижній частині виводиться рядок розпізнаного тексту з цим символом, а також розташовані кілька кнопок для нескладного редагування.


Мал. 23. Вікно «Перевірка»

Якщо все гаразд, символ визначений правильно, то натискаємо на «Пропустити». Якщо він визначений невірно, то вводимо правильне значення або за допомогою клавіатури, або якщо на клавіатурі такого немає, то за допомогою кнопки «Вставити символ» (грецька буква «омега»). Після чого натискаємо на «Підтвердити».

Аналогічним чином діємо якщо символ розпізнано правильно, а ось його форматування - невірно. Наприклад в тексті книги в якомусь місці йде курсив, а розпізнається він, як звичайний шрифт. Для переформатування використовуємо кнопки в нижній частині вікна.

Але можливості вікна перевірки все-таки досить обмежені. І від того, якого розміру шматочок сторінки може бути показаний у верхній частині вікна, і за можливостями редагування, які тут є. Тому все переміщення по тексту, від однієї точки перевірки до іншої, відслідковуються ще й у вікнах «Текст» і «Великий план». Весь час, поки йде робота, курсори в «Тексті» і «крупним планом» переміщаються синхронно їх положенню в «Перевірці».

Якщо в перевіряється фрагменті сторінки (в його скане) раптом знадобилося побачити більше, ніж кілька слів, показаних в «Перевірці», то можна це зробити в «крупним планом». Якщо для редагування поточної помилки потрібні можливості редактора з «Тексту», то можна на час переключитися в нього (просто клацнувши по його віконця), зробити необхідну роботу і повернутися назад в «Перевірку» (клацнувши по її віконця). Після повернення в «Перевірку», там будуть відображені всі зміни, які ви зробили в «Тексті».


Мал. 24. Приклад роботи в одночасно відкритих вікнах «Перевірка», «Текст» і «Великий план»

Якщо вам віконце «Перевірка» з його обмеженими можливостями не дуже-то зручно (звикли працювати з усіма зручностями текстових редакторів і звички міняти не збираєтеся), то можна з самого початку робити цю роботу у вікні «Текст».

Місця, що вимагають перевірки, там відображаються в повному обсязі - це символи і слова, виділені світло-блакитним. Можливість переміщатися від помилки до помилки, що не переглядаючи всю сторінку цілком, теж є - кнопки «Наступна помилка» і «Попередня помилка» на панелі кнопок з лівого боку вікна.

Теоретично, за задумом творців FineReader, вікна «Перевірка» має бути цілком достатньо для повноцінної вичитки розпізнаного тексту. Усі сумнівні місця відзначені, рухаємося вздовж них, правимо помилки, на виході отримуємо повністю вичищений текст.

Але, як це часто буває, теорія тут розходиться з повсякденною практикою роботи. У розпізнаних текстах систематично зустрічаються помилкові місця, які, як помилки, які не позначені. Тобто FineReader розпізнає якийсь символ / слово невірно, але при цьому з повною упевненістю, що розпізнав правильно.

Тому для повноцінної вичитки одного тільки вікна «Перевірка» зазвичай буває недостатньо - особливо якщо в тексті багато наукових або технічних термінів, професійного жаргону і тому подібної «знайдене». Треба ще пройтися по розпізнаного вручну - уважно переглянути його у вікні «Текст» і перевірити всі більш-менш сумнівні місця.

Вичитування тексту у вікні «Текст» мало чим відрізняється від звичайної коректорській роботи. Налаштовуєте вікна «Текст» і «Великий план» так, щоб вони займали більшу частину робочого вікна програми, переходите до чергової перевіряється сторінці, переглядаєте її текст. Якщо виявляєте сумнівне або явно помилкове місце, то клацаєте по ньому - при цьому курсор в «крупним планом» встановлюється точно в тому ж самому місці оригіналу (скан). Порівнюєте оригінал і розпізнане, при необхідності керуєте, рухаєтеся далі.


Мал. 25. Вичитування за допомогою вікон «Текст» і «Великий план»

Функціональність редактора вікна «Текст» нічим особливо не відрізняється від функціональності будь-якого текстового редактора середнього ступеня складності. Вигляд у кнопок в меню досить типовий, будь-яких проблем при роботі з ними виникати не повинно. Якщо треба поправити якийсь символ, який на клавіатурі немає, то, як і в віконці «Перевірка», треба натиснути на кнопку з грецької «омегою» і в таблиці, вибрати необхідне.

збереження результатів

Коли відсканований матеріал розпізнаний і вичитаний, його треба зберегти в одному з документальних форматів - DOC, DOCX, RTF, PDF, HTML і т. Д. Це робиться через «Файл → Зберегти документ як → вибрати потрібний формат» або через кнопку «Зберегти» в основному меню FineReader.

У віконці Провідника вибираєте формат, через кнопку «Налаштування» задаєте параметри збереження, натискаєте «ОК». Якщо хочете відразу ж подивитися чи немає помітних помилок у зовнішньому вигляді збереженого тексту, то крім цього поставте галочку в «Відкрити документ після збереження». Тоді він відразу ж буде відкритий в редакторі (браузері, програмою перегляду).


Мал. 26. Вікно збереження розпізнаного тексту

Звичайна практика розпізнавання - на вхід надходить відсканований текст книги або журналу, на виході все його сторінки зберігаються в файл з назвою цієї книги. Саме така настройка «Створювати один файл для всіх сторінок» стоїть за умовчанням в рядку «Опції файлу». Якщо ж у вас розпізнається не якийсь цілісний текст, а просто розсип сторінок (наприклад офісна документація), то тут треба буде виставити «Зберігати окремий файл для кожної сторінки ».

Налаштування пам'яті в форматах DOC, DOCX, RTF


Мал. 27. Налаштування пам'яті в DOC / DOCX / RTF

Ключове і основне, що тут треба вибрати - це з яким ступенем точності в збереженому документі буде відображено зовнішній вигляд оригіналу (один з режимів збереження в віконці «Оформлення документа»). Всі інші настройки - не більше, ніж уточнення і деталізація цього пункту.

Варіантів вибору тут чотири: «Точна копія», «Копія, що редагується», «Форматований текст» і «Простий текст».

1. «Точна копія».

За задумом розробників тут мало бути практично дзеркальне подібність розпізнається. Саме тому так і названо. З точним відтворенням шрифтів, розмірів літер (кеглів), відстаней між буквами в словах, відстаней між словами, рядками і абзацами і інших деталей верстки. Ідея, в общем-то, непогана, але можливості реалізувати її в задуманому обсязі у FineReader зазвичай не вистачає.

Шрифти і їх накреслення (Normal, Italic, Bold) часто відтворюються за принципом «як вийде, так і вийде». Можуть бути передані точно. Може трапитися так, що шрифт, використаний на розпізнається сторінці, буде заміщений іншим шрифтом (тобто бути ідентичним з вигляду, але іншим). Може трапитися так, що накреслення Normal буде розпізнано як Bold або ж навпаки. І так далі і тому подібне.

З відтворення кеглів, відстаней та іншого форматування ситуація не набагато краща - більш-менш точно відтворити зовнішній вигляд (верстку) розпізнається зазвичай вдається лише у випадках чого-небудь не дуже складного.

В результаті виходить не дуже зрозуміло що - Word-документ, який можна тільки читати (ну і копіювати звідти текст). Редагувати його за межами «пару букв прибрати, пару букв вставити» малореально. А редагувати таки потрібно - він адже далі піде в якусь роботу, а значить треба буде переробляти форматування під потреби майбутнього використання.

З одного боку весь текст тут розкиданий по численним фреймам, що неабияк ускладнює роботу з ним. З іншого боку під час розпізнавання програма генерує купу Word'овскіх стилів - все форматування в тексті робиться виключно через стилі. Цілком зазвичай, коли на текст книги середнього розміру (300-400 сторінок) генерується кілька сотень різних стилів. Що ще більше ускладнює редагування.

Резюме - вибирати цей режим збереження особливого сенсу не має, працювати зі збереженим текстом тут досить незручно.

Якщо ж вам потрібно повне відтворення зовнішнього вигляду оригіналу, то це і простіше, і практичніше зробити у вигляді PDF «Текст під зображенням сторінки» або ж PDF «Тільки текст і картинки» (про ці способи виведення трохи нижче).

2. «Копія, що редагується».

За змістом це полегшена версія «Точної копії». Зовнішній вигляд оригіналу відтворюється з таким ступенем скрупульозності, як в попередньому випадку, фреймів з текстом помітно менше (хоча періодично трапляються). Однак, хоч цей варіант і називається «редагується», працювати з ним теж, не сказати щоб зручно.

Якщо Word-документ потрібен, як є, тільки для переглянути його його вміст і скопіювати потрібний фрагмент тексту, то цілком можна використовувати і цей варіант. Якщо ж потрібно багато переробляти, переформатіровивать і так далі, то краще вибирати щось інше.

Причина та ж сама - занадто багато метушні з перетворення тексту з того виду, який видасть «Копія, що редагується», в той вид, який може знадобитися вам. Все ще залишилося якусь кількість тексту у фреймах, у форматуванні все ще зберігається тенденція точно відтворювати зовнішній вигляд (верстку) оригіналу. Та й звичка генерувати купу стилів нікуди не поділася.

Резюме - працювати з текстом тут не так клопітно, як в «Точної копії», але як і раніше залишає бажати кращого.

3. «Форматований текст».

Ступінь відповідності оригіналу тут зведена до мінімуму - відтворення шрифтів і кеглів, зразкового розташування матеріалу на сторінках оригіналу, загального вигляду тексту і таблиць.

Працювати з цим варіантом помітно простіше, ніж на попередніх, однак все ще важко через великої кількості стилів. Втім це досить просто лікується - можна швидко пройтися по тексту і накласти на нього ваш власний комплект стилів.

4. «Простий текст».

Хоча він називається «Простий текст», але тут можна зберігати як сам текст, так і текст з картинками. Форматування в цьому варіанті зведено до мінімуму - звичайні Word'овскіе абзаци від одного краю сторінки до іншого, плюс увіткнені між ними картинки. Звична за попередніми варіантами купа стилів теж не генерується.

Але при бажанні навіть тут можна залишити вихідну розбивку на рядки і на сторінки. Плюс зберігати зображення шрифту - звичайний, курсив, напівжирний.

Зазвичай для збереження вибирається або «Форматований текст», або «Простий текст» - залежно від того, що ви збираєтеся робити далі і як використовувати розпізнане.

Тепер про інші налаштуваннях цього вікна.

  1. «Розмір паперу за замовчуванням».
    Тут задається Word'овская настройка «Параметри сторінки → Розмір паперу», тобто на папері якого формату ви будете робити роздруківку. Зазвичай виставляється А4. Але треба мати на увазі, що в режимах «Точна копія» і «Копія, що редагується» один до одного зберігається не тільки вміст розпізнаної сторінки, але і її вихідний розмір. В результаті якщо поставити тут формат паперу, більший, ніж розмір сторінки, то при друку навколо тексту будуть порожні поля. Якщо ж поставити менший формат, то частина матеріалу сторінки може бути втрачена (опиниться за межами аркуша паперу).
  2. «Зберігати переноси і поділ на рядки».
    Якщо галочка поставлена, то буде збережена та розбивка на рядки, яка є в оригіналі. Перенесення рядків в цьому випадку робляться м'якими. Якщо галочки не ставити, то текст піде звичайними Word-овскими абзацами, з рядками від одного краю сторінки до іншого.
  3. «Зберігати поділ на сторінки».
    Якщо галочка поставлена, то буде збережена та розбивка на сторінки, яка є в оригіналі. Якщо галочки не ставити, то текст на сторінки буде розбивати сам Word.
  4. «Зберігати колонтитули і номера сторінок».
    Якщо галочка поставлена, то текст, розмічений і розпізнаний, як колонтитули і номера сторінок, буде збережений і розміщений у відповідних Word-івських полях. Якщо галочку не ставити, то ця частина тексту взагалі не виводиться.
  5. «Зберігати номери рядків».
    Якщо галочка поставлена, то в списках з пронумерованими рядками буде збережена нумерація цих рядків.
  6. «Зберігати колір фону і літер».
    Якщо галочка поставлена, то текст, надрукований в кольорі (або на кольоровому тлі), буде виведений, як в оригіналі. Якщо галочки не ставити, то весь текст буде виводитися звичайним чином - чорним на білому тлі (або на білим на чорному тлі).
  7. «Зберігати напівжирний шрифт, курсив і підкреслення в простому тексті».
    Висновок в «Простий текст» можна робити за принципом «все одним і тим же шрифтом, Normal», а можна зі збереженням накреслення, яке було в оригіналі. Тут як раз цей момент і регулюється.
  8. «Виділяти невпевнено розпізнані символи».
    Цю галочку треба ставити якщо ви віддаєте перевагу вичитувати розпізнаний текст не в FineReader, а в якомусь текстовому редакторі. Тоді всі позначки символів і слів, які у вас були в вікні «Текст», будуть відтворені в збереженому документі.
  9. «Зберігати малюнки».
    Визначається чи будуть крім тексту зберігатися ще й зображення.
  10. «Якість картинок».
    Тут визначається ступінь стиснення зображень з оригіналу. Воно може регулюватися за трьома напрямками - через різні алгоритми стиснення, через дозвіл зберігається зображення і через глибину кольору в ньому. Подробиці можна подивитися, якщо в рядку «Якість картинок» вибрати варіант «користувача». Найбільш практично користуватися саме їм, а не пресетами «Невеликий розмір (150 dpi)» і « Висока якість (Дозвіл вихідного зображення) ».


Мал. 28. Вікно налаштування якості зображення

Оскільки при зменшенні вихідного дозволу і подальшому стисненні можливі погано передбачувані спотворення, то галочку «Зменшувати вихідне дозвіл зображення» краще прибрати.

Глибину кольору ставите по ситуації. Якщо зображення потрібні, як є, то вибираєте «Не змінювати кольоровість зображення». Якщо досить просто загального вигляду, точне відтворення кольорів не обов'язково, то вибираєте «Конвертувати кольорові зображення в сірі». Перетворення кольорових і сірих зображень в чорно-білі краще не вибирати, тому що бінаризація може давати багато спотворень (причому погано передбачуваних). Пункт «Автоматично» теж краще не вибирати - не дуже зрозуміло яка логіка роботи там закладена і що ви при цьому будете отримувати на виході.

Налаштування пам'яті в форматах PDF і PDF / A


Мал. 29. Налаштування пам'яті в PDF

Режимів збереження тут теж чотири: «Тільки текст і картинки», «Текст на зображенні», «Текст під зображенням сторінки», «Тільки зображення».

  1. «Тільки текст і картинки».
    Тут ви фактично отримаєте PDF-варіант того, що видається в «Точної копії» - розпізнаний текст та ілюстрації з вікна «Текст» у вигляді, максимально наближеному до оригіналу. Якість відтворення оригіналу тут вище, ніж в DOC / DOCX / RTF, оскільки PDF-формат має для цього помітно більше можливостей.
  2. «Текст на зображенні».
    Це PDF, що складається з двох шарів - вихідне зображення (нижній шар), на яке накладено розпізнаний текст (верхній шар). Такий варіант досить зручний, якщо PDF потім буде редагуватися
  3. «Текст під зображенням сторінки».
    Це PDF складений з тих же двох шарів - вихідне зображення і розпізнаний текст. Тільки вони йдуть в зворотному порядку - зображення верхнім шаром, текст нижнім (невидимим) шаром. Такий спосіб виведення ще називається «PDF з текстовою підкладкою» і використовується, коли треба отримати з одного боку точну копію зовнішнього вигляду оригіналу, а з іншого боку можливість копіювати текст цього оригіналу.
  4. «Тільки зображення».
    Це PDF, зібраний з вихідних зображень. Крім самих зображень там більше нічого немає.

Тепер про інші налаштуваннях цього віконця.

1. «Розмір паперу за замовчуванням».

У PDF-виведення сенс цієї настройки такий же, як і в попередньому випадку - формат аркуша, на якому буде друкуватися сторінка.

У попередньому випадку йшлося про правило «якщо сторінка менше, ніж заданий формат, то навколо тексту будуть порожні поля, якщо більше - частина тексту буде обрізана». У PDF воно дотримується ще більш жорстко, оскільки тут вихідна сторінка в будь-якому варіанті відтворюється один до одного. Тому найбільш розумно ставити тут «Використовувати розмір оригіналу».

2. «Зберігати колір фону і літер».

3. «Зберігати колонтитули».

Сенс цих двох параметрів такої ж, як і в попередньому випадку.

4. «Створити зміст».

Якщо в налаштуваннях розпізнавання була поставлена \u200b\u200bгалочка «Визначення структурних елементів → Зміст», то розпізнане таким чином зміст книги може бути використано для автоматичного створення змісту в PDF-файлі.

5. «Дозволити теги PDF».

У PDF теги - це функціональний аналог Word-вских стилів, спосіб структурної розмітки вмісту PDF-файлу. З їх допомогою зберігається інформація про розбивці тексту на глави, про заголовках, змісті, ілюстраціях, таблицях, примітках, гіперпосиланнях, математичних формулах та інше подібне.

Якщо вам треба буде часто копіювати з PDF шматки тексту, то галочку тут варто поставити. Тоді скопійований текст буде набагато більше відповідати тому, як він виглядає на сторінці PDF.

Також теги корисні якщо PDF доводиться переглядати на екранах різних розмірів - від десктопів до смартфонів. У таких випадках PDF-читалкам доводиться переформатіровивать вміст сторінок під поточний розмір екрану і з тегів розміткою це проходить значно більш акуратно, без помітних спотворень первинного вигляду.

6. «Використовувати змішаний растровий вміст (MRC)».

MRC (Mixed Raster Content) - це назва технології стиснення, здатної давати помітно великі кратності стиснення, ніж відомі всім JPEG і JPEG 2000. Багато знайомі з нею за форматом DjVu - він побудований саме на базі MRC. Вибір «треба ставити галочку чи ні» тут неоднозначний і визначається виходячи з вашого розкладу справ.

Основний плюс - розмір одержуваного PDF. Може бути в кілька разів менше PDF, отриманого з тими ж налаштуваннями стиснення, але без MRC.

Які можуть бути мінуси:

MRC-стиснення так влаштовано, що при роботі завжди дає погано передбачувана кількість спотворень. У зв'язку з тим, що спотворення тут тільки частиною залежать від налаштувань стиснення, а в неабиякою мірою від вмісту сторінки. Текст, малюнки, графіки, фотографії - при MRC-стисканні всі вони ведуть себе помітно по різному і дають різну кількість спотворень.

Помітно велика ресурсомісткість при стисненні і перегляді таких PDF. Навіть на сьогоднішніх комп'ютерах MRC-PDF може відкриватися і перегортати не звично-плавно, а стрибками, коли чергова сторінка виводиться на екран не вся відразу, а частинами.

7. «Зберігати малюнки».

8. «Якість зображення».

Сенс цих налаштувань такий же, як і в попередньому випадку - треба чи не треба при створенні PDF зберігати зображення і з яким рівнем стиснення їх зберігати. Рекомендації теж аналогічні - прибрати галочку з «Зменшити вихідне дозвіл», кольоровість краще не міняти, движок «Якість» виставляти по аналогії зі стисненням в JPEG 2000.

9. «Шрифти».

Якщо поставити «Використовувати шрифти Windows», То для розпізнавання і подальшого виведення буде використовуватися той набір шрифтів, який встановлений у вас на комп'ютері. Якщо поставити «Використовувати зумовлені шрифти», то тільки той комплект шрифтів, який встановлюється при інсталяції FineReader.

Переважно виставляти перший варіант, оскільки при цьому буде використовуватися набагато більшу різноманітність шрифтів і програмою буде легше підбирати відповідність шрифтів було розпізнати книг.

10. «Вбудовувати шрифти».

Якщо вам потрібно, щоб при перегляді PDF-файлу на іншому комп'ютері він був видний саме так, як ви його отримали (саме в цих шрифтах), то треба поставити тут галочку.

11. «Параметри захисту PDF».

Тут можна виставити парольний захист на перегляд PDF, Друк, копіювання з нього тексту і малюнків, редагування.

Якщо у вас виникнуть питання по роботі FineReader, на які ви не знайшли відповіді в тексті статті, то їх можна задати розробників програми.

Розмова піде про програму ABBYY FineReader 12, тобто, про її останньої версії. Чи не заглядаючи задалеко, ми вибрали найвідоміший продукт компанії ABBYY, який, до його достоїнств, відмінно русифікований. Уже на перший погляд Fine Reader (FR) справляє враження програми з хорошою російськомовної підтримкою: в цьому плані, дійсно, все зроблено на дуже гідному рівні, включаючи довідкову інформацію.

Спочатку - відступ. Завжди актуальне питання, як перевести весь або деяку частину архіву в цифровий формат (і що, власне, розуміти під словом «цифровий»). Чи покупка сканера вирішує всі проблеми. Звичайно, дуже часто в комплекті з документацією до сканера поставляється диск або кілька з фірмовим програмним забезпеченням. Однак уже на стадії санування з'ясовується, що якість скануючої програми залишає бажати кращого або формат, в якому відбувається збереження, на жаль, не придатний для зберігання. Чому? Більшість графічних форматів не відокремлюють текст від нетекстового простору документа, і тому скопіювати будь-якої уривок з подібного файлу не надається можливим.

Саме в таких випадках на допомогу приходять функціональні програми- «распознавальщікі» тексту, в можливості яких, зокрема, входить витяг тексту з зображення.

Знайомство з ABBYY FineReader

пакет ABBYY Finereader 12 - система оптичного розпізнавання текстів (Optical Character Recognition - OCR). Призначена як для автоматичного введення друкованих документів в комп'ютер, так і для конвертації PDF-документів і фотографій в редаговані формати (З керівництва до програми)

Абревіатура «OCR» застосовна для всіх додатків для розпізнавання даних (а не тільки тексту). Джерелом для отримання даних може служити друкований або електронний документ. Коли щось не дуже давно про OCR, в тій чи іншій формі, мало хто знав, та й процес перекладу тексту в електронний вигляд перетворювався на справжню рутину, аж до ручної передруку тексту оригіналу. Сьогодні, володіючи планшетним сканером (Ручним в домашніх умовах користуються одиниці) і finereader 12- будьте впевнені - ніяких складнощів в скануванні і розпізнанні не виникне.

Починаючи з шостої версії, FineReader підтримує імпорт і експорт в формат PDF, запатентований компанією Adobe. Багато читачів, ймовірно, стикалися з труднощами перекладу з цього формату в будь-який інший (doc і т. П.), Оскільки дійсно корисних програм в цій галузі не так вже й багато (на увагу заслуговує хіба що дочірній продукт компанії ABBYY - PDF Transformer). Справа в тому, що подібні програми проводять розпізнавання тексту тільки один раз, внаслідок чого «ідентичність» результату зовсім невелика (в залежності від складності документа), плюс до того неабияк втрачається форматування документа.

У випадку з FineReader все йде по-іншому. У дев'яту версію програми впроваджено технологію під назвою Document OCR. В її основі лежить принцип цілісного розпізнавання документа: він аналізується і розпізнається як єдине ціле, а не посторінково. При цьому всілякі колонки, колонтитули, шрифти, стилі, виноски і зображення залишаються недоторканими або замінюються близькими до оригіналу.

установка пакета

Demo-версію Finereader 12 можна завантажити на сайті Abbyy.ru, в розділі Download, повна ліцензійна версія поширюється на CD-диску. Про способи покупки можна дізнатися на цьому ж сайті в розділі «Купити».

На сайті розробників ABBYY можна скачати демонстраційну версію пакету ABBYY FineReader версії 12 (або інший, актуальною на сьогодні)

ABBYY FineReader поширюється в декількох версіях: Professional Edition, Corporate Edition, Site License Edition і ін. Відмінність версії Professional від інших полягає в тому, що призначена для роботи в корпоративної мережі з можливістю спільної роботи над розпізнаванням документів. В іншому різниця незначна і залежить від вибору умов ліцензійної угоди.

Складно уявити, що 12 років тому існував FineReader 2.0, який займав близько 10 Мб дискового простору. Згодом пакет «виріс» десятикратно і зараз в установленому вигляді займає до 300 Мб. Багато це чи мало - судіть самі. Новий FR підтримує 179 мов розпізнавання, серед яких є маловідомі штучні мови (ідо, інтерлінгва, окциденталь і есперанто), мови програмування, формул і т. П. Не будемо забувати і про підтримку різних форматів, сценаріїв. Так що, якщо з якоїсь причини ви захочете обмежити займане пакетом місце, при установці відзначте тільки ті компоненти, які будуть затребувані при роботі.

Вибір компонентів впливає на тривалість установки, яка, втім, не повинна зайняти багато часу. В процесі інсталяції вас ознайомлять з основними можливостями FR. Після активації (по Інтернету, через E-mail, за допомогою отриманого коду та ін.) Програма готова до повнофункціональної роботи. У demo-режимі ви неодмінно зіткнетеся з різними обмеженнями, які, на жаль, не дозволяють повноцінно використовувати пакет.

Інтерфейс FineReader. Функціональні можливості

Доступ до можливостей програми доступний як за допомогою сценаріїв, які з'являться в головному меню відразу після процесу інсталяції, так і, власне, через основний інтерфейс.


Заставка при запуску FineReader

Зовнішній вигляд програми з версії до версії не зазнає особливих змін: розробники не бачать сенсу його кардинально міняти. Значна увага приділяється ергономіці, що помітно по всіх продуктах компанії ABBYY (Lingvo, PDF Transformer, FlexiCapture ...). Іншими словами, інтерфейс Fine Reader 12 добре продуманий і схильний до всіх користувачів, у тому числі новачків. Принцип «Отримати результат за одне натискання» припаде до смаку тим, хто не звик щось налаштовувати і змінювати. З іншого боку, більш досвідчені користувачі можуть ретельно налаштувати FineReader через діалог налаштувань (Сервіс -\u003e Опції ...). Єдиний нюанс: для комфортної роботи в додатку бажано встановити дозвіл екрана в 1280? 800, щоб всі інструменти завжди були, що називається, під рукою.

Після запуску програми Файн Рідер з'явиться вікно з кнопками швидкого доступу до функцій програми. дане меню також доступно через меню Сервіс -\u003e ABBYY FineReader, кнопку «Основні сценарії» в крайньому правому куті програми або через поєднання клавіш Ctrl + N (по аналогії з Word, де даної комбінацією викликається відкриття нового документа).

Сканувати в Microsoft Word: в дев'ятій версії FineReader з'явилася підтримка поки ще не встиг стати популярним Microsoft Word 2007. У свою чергу, на панелі інструментів в додатках Microsoft Office, в розділі надбудов після установки FR з'являється «фірмовий» червоний значок.


Меню для експорту розпізнаного документа FineReader
Вибір мов для сканування і розпізнання документів

Крім Microsoft Office, FR підтримує інтеграцію з Microsoft Outlook, забезпечує експорт результатів розпізнавання в ті ж Microsoft Word, Excel, Lotus Word Pro, Corel WordPerect і Adobe Acrobat. Ці можливості в деякій мірі полегшують і прискорюють роботу з програмою, в особливості, якщо вам доводиться регулярно в ній працювати.

PDF або зображення в Microsoft Word: розпізнати дані з PDF - або графічного файлу іншого типу, підтримуваного Finereader 12 версії. Слід зазначити, що технологія вилучення тексту з PDF-файлу в FR - це не просто «відшаровування» текстового наповнення (текстовий шар в PDF може й не бути) від графічного. Насправді, технологія розпізнавання досить непроста: проаналізувавши зміст документа, програма вирішує, що і як потрібно робити з текстом: просто витягти або розпізнати, - і так стосовно кожного текстового фрагменту.

сканувати в Microsoft Excel: сканування в XLS (формат програми Microsoft Excel) може бути виправдане в тому випадку, якщо скановане зображення містить таблиці.

Сканувати в PDF: приводів для сканування в PDF може бути безліч. Один з них - безпека: це єдиний формат, знайомий FR, в настройках якого можна встановити блокування паролем. Пароль встановлюється не тільки на відкриття документа, але і на його друк і інші операції. Є можливість вибрати один з трьох рівнів шифрування: 40-бітний, 128-бітний на основі стандарту RC4, 128-бітний рівень, заснований на стандарті AES (Advanced Encryption Standard).

Конвертувати фотографію в Microsoft Word: переклад файлу з графічного формату (причому це може бути PDF або багатосторінковий зображення) в DOC / DOCX.

Відкрити в Файн Рідер: відкрити графічний файл (PDF, BMP, PCX, DCX, JPEG, JPEG 2000, TIFF, PNG) для розпізнавання FineReader.

Робота в FineReader

Зараз - коротко про особливості роботи програми. Весь процес ділиться на сканування, розпізнавання і збереження результатів. Після того як ви вибрали тип дії програми, вказали файл або пристрій для сканування, FineReader поетапно виконує своє завдання, до речі, досить ресурсномістких для центрального процесора.

Якщо ви - щасливий володар двоядерного процесора, то, працюючи в пакеті Fine Reader 12, можете оцінити міць швидкодії комп'ютера. Справа в тому, що FR, виявивши двоядерний процесор, розпізнає не одну, а відразу дві сторінки документа паралельно. Дрібниця а приємно.

Спочатку йде сканування, потім - розпізнавання і експорт тимчасового документа в обраний формат.


Процес розпізнавання PDF-документа

Сканування. ніяких вибраних станцій в додатку FineReader (крім вибору пристрою, що зчитує) перед скануванням робити не потрібно. Саме тому і були придумані сценарії: вони покликані спростити виконання однотипних дій.

Розпізнавання. Спрощення торкнулося і інших дрібниць. Так, якщо згадати минулі версії програми, раніше нам доводилося вручну змінювати мову (мови, якщо їх було кілька) документа. Зараз це відбувається автоматично, правда, теж не завжди. В останньому випадку FR ненав'язливо пропонує перевірити мову документа.

Повертаючись до технології розпізнавання FR: чому програма спочатку сканує весь документ цілком, а не посторінково? Як вже було сказано, текст розпізнається, виходячи з усього змісту: підбираються аналогічні за розміром / гарнітурі шрифти, таблиці і межі, відступи і т. П.

Не дивуйтеся, якщо програма FineReader 12 видасть повідомлення, мовляв, сторінка не може бути розпізнана, оскільки не знайдено жодної області тексту. Експерименту заради, ми сфотографували на мобільний телефон з екрану LCD -дисплеєм область текстового документа (втім, знаючи, результат вже заздалегідь). Fine Reader 12не розпізнав текст зображення, оскільки воно було явно такої якості, якої для цього явно недостатньо. При другому заході ми сфотографували цифровим фотоапаратом сторінку з текстом при нормальному освітленні.

FineReader без проблем розпізнав уривок, зберігши форматування і зазначивши маркерами деякі сумнівні моменти або символи, у яких можуть бути варіативної написання.

Як видно на зображенні, переважно це точки, дефіси, коми - в загальному, дрібні символи. Крім цього, добре видно, що програма врахувала нерівності, зігнутості сфотографований сторінки і вирівняла рядки тексту. Висновок - FR відмінно впорався зі своєю нехай і не дуже складним завданням.

Зрідка можуть залишатися непоміченими програмою Файн Рідер деякі незначні моменти, проте їх легко відкоригувати вручну. Благо, в пакеті є свій WYSIWYG-редактор, можливостей якого цілком достатньо для здійснення остаточної правки документа. Перевірка орфографії теж є.

Як підвищити точність розпізнавання, щоб потім в меншій мірі займатися правкою тексту? По-перше, ви можете підключити словника Microsoft Word. Правда, складно судити про підвищення точності, хіба що про підвищення словникового запасу спеллчекер (модуля, який перевіряє орфографію і граматику). Крім усього іншого, для поліпшення розпізнавання є сенс ознайомитися з настройками програми (Сервіс -\u003e Параметри) і вибрати один з двох режимів:

ретельне розпізнавання - його можна вибрати при розпізнаванні документів будь-якої «складності»: з таблицями без ліній сітки, тексту, графіків, таблиць на кольоровому тлі і ін. Також може допомогти при неякісному джерелі для розпізнавання

швидке розпізнавання - даний режим рекомендується для обробки великих обсягів документів з простим оформленням або ж в тому випадку, якщо час не дозволяє проводити ретельне розпізнавання. У більшості випадків, коли ви маєте з чорним друкованим текстом на білому тлі, можна зупинитися на швидкому розпізнаванні.

Взагалі, поліпшення якості роботи FineReader - це окрема тема для розмови, про деталі якої ви можете дізнатися з офіційної довідки, а саме в розділі «Як поліпшити отримані результати».

Збереження документа. Останній етап роботи в програмі Fine Reader 12 - збереження підсумкового результату в певний графічний / текстовий формат. Попередньо настройки збереження можна вказати в опціях FR: Сервіс -\u003e Опції, вкладка «Зберегти». Для кожного формату передбачені свої настройки. При збереженні в DOCX -Формат слід подбати про сумісність форматів (Файли DOCX-формату розпізнаються в Word 2003<). В txt-файлах не забудьте проверить правильность кодировки (особенно в случае с текстом в кириллице).

ABBYY Screenshot Reader

До багатьох об'ємні пакети дуже часто розробники люблять додавати дрібні сервісні утиліти. Скажімо, до складу відомого додатка для запису дисків Nero входить набір з 3 - 5 утиліт, що дозволяють те, чого не може навіть сам Nero. Огляд (тут же можна скачати в складі Файн Рідер 12).

Що стосується FineReader, то в його складі виявляється одне невелике додаток Screenshot Reader. З його допомогою ви можете зробити знімок екрана та швидко перевести його в бажаний формат за допомогою FR. Програма доступна через меню «Пуск» (Пуск -\u003e Всі програми -\u003e ABBYY FineReader 12.0 -\u003e ABBYY Screenshot Reader.).

Можливості Screenshot Reader дещо ширше, ніж може здатися на перший погляд. (А інакше можна було б обійтися простим натисканням клавіші «PrintScreen» на клавіатурі). На додаток до того, що Screenshot Reader робить знімок екрана (або, точніше, обраної області екрана), програма тісно інтегрована з FR.

При натисканні на кнопку «Знімок» на панелі Screenshot Reader курсор змінює форму і включається інструмент виділення області екрану. Виділена область зображення полягає в рамку для подальшого розпізнавання тексту (воно запускається автоматично).

У випадаючому списку ви можете вибрати бажану дію: по суті, Screenshot Reader дублює швидкі сценарії FR c тією різницею, що замість знімка зі сканера «на вхід» надходить знімок екрана.

Слід зазначити, програма, нарівні з усім пакетом, вимагає активації. При реєстрації продукту ABBYY FineReader 12 Professional Edition Screenshot Reader надається безкоштовно, в якості «бонусу».

висновок

FineReader - незамінна програма для сканування і розпізнавання графічних даних. Російськомовний інтерфейс і доступність налаштувань не відлякають недосвідченого користувача. Підтримка новітніх форматів, інноваційні технології та, як наслідок, якісне розпізнавання роблять програму оптимальним вибором, тим більше що конкурентів у цій галузі у ABBYY FineReader все ще не передбачається.

Швидкий доступ FineReader 12

  • Створити новий документ ABBYY FineReader - CTRL + N
  • Відкрити документ ABBYY FineReader 12 - CTRL + SHIFT + N
  • зберегти сторінки - CTRL + S
  • Зберегти зображення в файл - CTRL + ALT + S
  • Розпізнати всі сторінки документа - CTRL + SHIFT + R
  • Закрити поточну сторінку - CTRL + F4
  • Розпізнати виділені сторінки документа ABBYY FineReader - CTRL + R
  • Відкрити Менеджер сценаріїв - CTRL + T
  • Відкрити діалогове вікно Параметри "Файн Рідер"- CTRL + SHIFT + O
  • відкрити довідку - F1
  • Перейти у вікно Документ - ALT +1
  • Перейти у вікно Зображення - ALT +2
  • Перейти у вікно Текст - ALT +3
  • Перейти у вікно Крупний план - ALT +4

Переклад тексту в цифровий формат - досить поширена завдання для тих, хто працює з документами. Програма Abbyy Finereader допоможе зберегти чимало часу, автоматично переводячи написи з растрових картинок або «читалок» в редагований текст.

У цій статті розглянемо, як використовувати Abbyy Finereader для розпізнавання текстів.

Як розпізнати текст з картинки за допомогою Abbyy Finereader

Для того, щоб розпізнати текст на растровому зображенні, Досить просто завантажити його в програму, і Abbyy Finereader автоматично розпізнає текст. Вам залишається тільки редагувати його, виділивши потрібне і зберегти в необхідному форматі або скопіювати в текстовий редактор.

Розпізнати текст можна прямо з підключеного сканера.

Більш детально читайте на нашому сайті.

Як створити документ PDF і FB2 за допомогою Abbyy Finereader

Програма Abbyy Finereader дозволяє конвертувати зображення в універсальний формат PDF і формат FB2 для читання на електронних книгах і планшетах.

Процес створення таких документів схожий.

1. У головному меню програми виберіть розділ E-Book і натисніть FB2. Виберіть тип вихідного документа - сканування, документ або фотографія.

2. Знайдіть і відкрийте документ. Він завантажиться в програму посторінково (це може зайняти деякий час).

3. Коли процес розпізнавання завершиться, програма запропонує вибрати формат для збереження. Вибираємо FB2. При необхідності, заходимо в «Опції» і вводимо додаткову інформацію (автор, назва, ключові слова, Опис).

Після збереження можна залишитися в режимі редагування тексту і перевести його в формат Word або PDF.

Особливості редагування тексту в Abbyy Finereader

Для тексту, який розпізнав Abbyy Finereader передбачено кілька опцій.

В результатом документі збережіть картинки і колонтитули, щоб вони перенеслися в новий документ.

Проведіть аналіз документа, щоб знати які помилки і проблеми можуть виникнути в процесі перетворення.

Редагуйте зображення сторінки. Доступні опції кадрування, фотокорекції, зміни дозволу.

Ось ми і розповіли як користуватися Abbyy Finereader. Він володіє досить широкими можливостями редагування і конвертації текстів. Нехай ця програма допоможе в створенні будь-яких потрібних вам документів.

Добрий день. Сьогодні я розповім про те, як за допомогою програми Abbyy FineReader розпізнати текст c зображення, яке ви могли отримати в результаті сканування. Ваш сканований текст буде повністю в документі Microsoft Word і цей розпізнаний текст можна буде редагувати! Розпізнати текст за допомогою Abbyy Finereader може стати в нагоді тим, хто вчиться, працює з текстами і перекладами. Програма, на жаль, є платною. Якось доводилося спробувати одну з безкоштовних варіантів аналогічних програм, Але вельми добре відсканований текст розпізнається просто жахливо ... А розпізнати текст в Abbyy FineReader виходить вельми якісно! Зараз я покажу як користуватися програмою Abbyy FineReader для швидкого розпізнавання тексту з зображення.

ABBYY FineReader має пробну версію на 30 днів з можливістю розпізнавання до 100 сторінок і збереженням не більше 3-х сторінок з документа. Тобто протягом цього часу ви можете побачити можливості програми і прийняти зважене рішення - чи потрібна вона вам, чи варто її купувати чи ні.

Як встановити Abbyy FineReader!

Перед тим як користуватися Abbyy Finereader її необхідно встановити. Розглянемо процес установки цієї програми ...

Для початку вибираємо мову програми. Натискаємо «ОК».

Приймаємо умови ліцензійної угоди (при бажанні можна прочитати ліцензійний договір, якщо вам цікаво про що там мова). Натискаємо «Далі».

Далі ви повинні вибрати режим установки. При звичайному режимі програма не запитає вас і встановить те, що в програмі задано за замовчуванням, а саме - всі компоненти: саму програму Abbyy Finereader для розпізнавання тексту, компонент для програм Microsoft Office і компонент для провідника Windows (дозволяє швидко розпізнавати зображення, не відкриваючи окремо програму). Раджу відзначити вибіркову установку щоб налаштувати так, як вам потрібно. Тим більше це не займе і 15 хвилин :) Внизу вказана папка куди встановиться програма. Бажано залишити вибір за замовчуванням, щоб потім не було ніяких проблем при використанні програми. Натискаємо «Далі».

Компоненти програми. Це вікно якраз з'явиться в разі, якщо ви оберете тип установки «Вибіркова». Компоненти - це щось на зразок допоміжних додатків до програми. Перший компонент «Інтеграція з програмами Microsoft Office і провідником Windows». Цей компонент буде відображений в меню Microsoft Office і якщо ви клацніть по зображенню у себе на комп'ютері правою кнопкою миші, то там буде пункт з цією програмою. Ось так буде виглядати ваше меню в Microsoft Office після додавання цього компонента.

А ось що буде якщо ви клацніть правою кнопкою миші по зображенню:

Тобто з'явиться меню, в якому ви можете зробити швидке розпізнавання тексту з відправкою результатів у Word, Excel або PDF.

Другий компонент дозволить вам розпізнати текст з екрану комп'ютера. Це означає, що ви зможете зробити скріншот і також розпізнати текст. Якщо ви не хочете встановлювати один з цих компонентів, або зовсім не хочете встановлювати обидва, то потрібно натиснути на стрілочку вниз і вибрати «Даний компонент буде недоступний». Тоді компонент встановлено не буде. Я залишила обидва.

Далі 4 пункту. 1-ий означає те, що відомості про те, як ви користуєтеся програмою Abbyy Finereader будуть передані розробнику. Даний пункт раджу не відзначати, щоб програма зайвий раз не виходила в інтернет заради відправки відомостей про роботу з нею. Тим більше, хіба мало які ще відомості будуть відправлятися :) 2-ий пункт створює ярлик програми на робочому столі. 3-ий означає, що програма буде запускатися при включенні комп'ютера, а 4-ий буде перевіряти оновлення програми. Я залишаю тільки другий і навпаки нього залишаю галочку. Закриваємо всі додатки Microsoft Office, тому що так вимагає установник і натискаємо «Встановити».

Потрібно почекати пару хвилин щоб програма завантажилася і натиснути «Далі».

Все, установка завершена! Натискаємо "Готово".

Як за допомогою Abbyy Finereader розпізнати текст c відсканованого або будь-якого іншого зображення?

Розглянемо, як користуватися програмою. Наприклад, у вас є відсканований текст. Тепер, щоб розпізнати текст в Abbyy FineReader, відкриваємо програму. Натискаємо «Відкрити».

Вибираємо потрібне нам зображення і натискаємо відкрити.

Коли ви відкриєте потрібний документ, Abbyy Finereader почне розпізнавати текст. Чим більше документ, тим довше буде тривати розпізнавання. Розпізнавання однієї сторінки може зайняти кілька секунд.

Після того як текст розпізнається вам залишиться тільки зберегти результат в документ Microsoft Word, щоб потім ви могли відредагувати в ньому що завгодно. Для цього натисніть кнопку «Зберегти» на верхній панелі інструментів, після чого виберіть у яку папку буде збережено документ Word і під якою назвою.

Якщо у вас підключений до комп'ютера сканер, то ви можете запустити сканування прямо з програми, і після чого відсканований документ відразу буде розпізнаватися. Для цього на верхній панелі інструментів натисніть кнопку «Сканувати». Далі дії будуть залежати від програми-драйвера для вашого принтера. Вам потрібно лише слідувати вказівкам майстра сканування.

Як бачите, все дуже просто і швидко. Тепер ви знаєте, як користуватися Abbyy FineReader для розпізнавання тексту з зображень! Сподіваюся, що ця інформація дуже допоможе багатьом :) Удачі!



Сподобалася стаття? поділіться їй