Чищення сканованих документів від сміття, усунення перекосу та спотворення рядків. Як редагувати сканований документ? Чи можна відсканований тект перетворити на виправлення

Після сканування документа ви можете відкрити документ Word, щоб змінити його. Спосіб залежить від того, яку версію Office інстальовано на вашому комп'ютері.

Сканування документа у вигляді PDF-файлу та його редагування у Word

Порада:Перетворення найкраще підходить для документів, які переважно є текстом.

Відскануйте документ відповідно до вказівок сканера та збережіть його на комп'ютері у вигляді PDF-файлу.

У Word відкрийте меню файл > Відкрити.

Перейдіть до папки PDF-файлу на комп'ютері та натисніть кнопку Відкрити.

З'явиться повідомлення про те, що Word перетворює PDF-файл у редагований документ Word. Натисніть кнопку ОК.

Повного посторінкового збігу перетвореного документа з вихідним може бути. Наприклад, розриви рядків та сторінок можуть знаходитись в інших місцях. Додаткову інформацію можна знайти у розділі Відкриття PDF-файлів у Word .

додаткові відомості

Параметр "від сканера або камери" для сканування документів та зображень недоступний у Word 2010. Натомість ви можете відсканувати документ за допомогою сканера та зберегти файл на своєму комп'ютері.

Програма Microsoft Office Document Imaging була видалена з Office 2010, однак ви можете інсталювати її на своєму комп'ютері, використовуючи один з варіантів, описаних у статті Установка програми MODI для використання спільно з Microsoft Office 2010 .

Перш ніж продовжити

Відкрийте Microsoft Office Document Imaging, виконавши пошук у меню "Пуск" Windows.

У меню Файлвиберіть команду Відкрити.

Знайдіть відсканований документ та натисніть кнопку Відкрити.

Після запуску Microsoft Office Document Imaging натисніть клавіші CTRL+A, щоб виділити весь документ, а потім натисніть клавіші CTRL+C.

Запустіть Microsoft Word.

На вкладці Файлнатисніть кнопку Створити.

Двічі клацніть елемент новий документ.

Натисніть клавіші CTRL+V, щоб вставити вміст відсканованого документа у новий файл.

Параметр "від сканера або камери" для сканування документів та зображень недоступний у Microsoft Office Word 2007. Натомість ви можете сканувати документ за допомогою сканера та зберегти файл на своєму комп'ютері.

Крок 1: Встановлення Microsoft Office Document Imaging

Завершіть роботу всіх програм.

Порада:Перед завершенням роботи всіх програм рекомендуємо роздрукувати цей розділ.

Відкрийте панель керування: клацніть правою кнопкою миші кнопку Пуск у Windows та виберіть пункт Панель управлінняабо введіть у полі пошуку Windows елемент Панель керування .

На панелі керуваннянатисніть Програми, а потім - Програми та компоненти.

Клацніть правою кнопкою миші ім'я встановленої версії Microsoft Office або клацніть правою кнопкою миші Microsoft Office Word 2007(залежно від того, чи встановлено програму Word як частину Office або як окрему програму), а потім натисніть кнопку змінити.

Виберіть Додати або видалити компоненти, а потім натисніть кнопку Продовжити.

В розділі Параметри встановленняклацніть знак "плюс" (+) поруч із компонентом Кошти Office.

Натисніть стрілку поруч із компонентом Microsoft Office Document Imaging, виберіть параметр Запускати все з мого комп'ютера, а потім натисніть кнопку Продовжити.

Крок 2: створення документа, який можна змінити.

Відскануйте документ, дотримуючись інструкцій сканера.

Перш ніж продовжитиПеретворіть файл, створений сканером, у формат TIFF. Ви можете конвертувати файл за допомогою Paint або іншої програми.

Тепер у вас є документ, який можна редагувати. Не забудьте зберегти новий файл, щоб не втратити зміни.

Чи можлива зміна сканованого тексту? Чи можна редагувати сканований текст, щоб потім використовувати його з іншими цілями? Так, дорогі друзі! Сьогодні це не тільки можливе, але й цілком легко робиться.

За необхідності, бажання, а також деяких технічних можливостей вам легко дасться:

сканування рукописного тексту (наприклад, конспекту),
сканування тексту з фотографії або зображення,
редагування,
розпізнавання тексту після сканування,
перетворення тексту як картинки на звичайний текст, у якому можна змінити сканований текст (наприклад, у документі pdf) документа та інших.

Загалом, зробити з текстом на картинці сьогодні можна все те саме, що і зі звичайним текстом у вордівському документі. А робити це життєво важливо та корисно тим, хто постійно має справи з численною документацією та витрачає багато часу – тобто й для студентів у тому числі. Давайте розумітися, як це робиться.

Чим відрізняється сканування від розпізнавання?

Як виявилося, сканування та розпізнавання тексту – це різні речі. Сканування аркушів документа – це його переклад тексту на електронний вигляд. Це робиться через сканер або за допомогою звичайного фотографування на смартфон або цифрову камеру.

Розпізнавання – це перетворення сканованого документа (тексту) на електронний вигляд.

До речі! Для наших читачів зараз діє знижка 10% на будь-який вид роботи

Що нам знадобиться для сканування та розпізнавання тексту по фото?

Для сканування та розпізнавання тексту нам не обійтися без деяких речей:

Сканер. Власне, роль сканера може виконувати не лише цей вид техніки, а й фотоапарат (у смартфоні, наприклад). Якщо ви використовуєте сканер, переконайтеся, що на комп'ютері інстальовано системні драйвери та програми, необхідні для його повноцінної роботи. Якщо сканера немає, але ви збираєтеся його купити, зверніть увагу на швидкість обробки одного листа. Деякі прилади обробляють лист за 10 секунд, іншим для цього знадобиться 30 і більше. І якщо працювати вам доведеться з об'ємними матеріалами по 300-400 аркушів, цей фактор має значення.
Програми для розпізнавання тексту чи онлайн-сервіси. Ми вже писали статтю щодо сервісів, які допомагають розпізнати текст після сканування документа через сканер. Але зараз хотіли б порадити програму ABBYY FineReader. Незважаючи на те, що вона платна, її функціонал справді вражає. І якщо ви працюватимете з величезними обсягами документів, вона стане вашим незамінним помічником. Втім, є і безкоштовний її аналог Cunei Form, яка чудово справляється зі скануванням та розпізнаванням тексту онлайн. Щоправда, її функціонал дуже обмежений у порівнянні з попереднім побратимом.
Документи для сканування. Студентам часто доводиться стикатися зі скануванням документа у вигляді журналів, статей, книг, конспектів, роздруківок, звідки потім часто потрібно скопіювати текст. І просто так, як порада – перед початком сканування постарайтеся пошукати ці документи в мережі. Якщо до вас цими матеріалами вже користувалися, існує велика ймовірність, що добра людина вже проробила всю роботу за вас. Тому вам залишиться тільки скопіювати текст готового сканованого документа і зайнятися редагуванням тексту після сканування.

Параметри сканування тексту

Тож сканер купили, документи підготували, програми встановили. Що далі? Далі нам потрібно буде зробити потрібні налаштування, які теж іноді допомагають суттєво полегшити завдання, наприклад, розпізнати сканований текст у певному форматі, редагувати текст після сканування у певному режимі тощо.

Загалом, від налаштувань залежатиме якість та швидкість вашої роботи. Отже, знаємося разом.

DPI-якість

Це роздільна здатність зображення, яка буде важлива при редагуванні тексту в сканованому документі. Ставте в налаштуваннях якість не менше 300 DPI, а якщо можливо – то більше. Що ця величина, то чіткішим вийде зображення після сканування.

А від чіткості залежатиме швидкість обробки. Тобто виправити або змінити сканований текст, текст сканованого аркуша буде швидше, а ще програма зробить менше помилок (так, програми теж помиляються, але про все по порядку).

Кольоровість

За допомогою цього параметра можна впливати на швидкість сканування тексту. Як правило, в сканерах є 3 режими: чорно-білий (підходить для аркушів зі звичайним друкованим текстом), сірий (підходить для роботи з документами з таблицями та простими картинками), кольоровий (для журналів, книг та інших документів, де колір грає значення ). Що менше кольору, то вища швидкість обробки документа.

Фото

Як ми вже говорили, для сканування можна використовувати не лише сканер, а й фотографування. Але тут будьте обережні – будь-яке змащування, нечіткість та інші спотворення зображення можуть вплинути на подальше розпізнавання та редагування тексту у сканованому документі.

Розпізнавання

Отже, відсканували та отримали сторінки в електронному вигляді. Потім відкриваємо програму для розпізнавання (наприклад FineReader) і починаємо розпізнавати текст. Деякі програми (у тому числі й наша) роблять цей процес помилково. Тоді область з помилкою потрібно виділяти вручну.

Робота з текстом

В області Текст можна буде виділити текст. Будь-які таблиці та зображення можна буде видалити. А ось для роботи з незвичайними та рідкісними символами доведеться попрацювати ручками. Ось як це виглядає у програмі:

Картинки

Ця область у програмі використовується для роботи із зображеннями та з тими областями тексту, які погано піддалися розпізнаванню.

Таблиці

Кнопка виділення таблиць допомагає працювати з таблицями. Однак ця функція не дуже добре розвинена. Іноді простіше використовувати редактор Картинка для роботи з таблицями. Це заощадить купу часу та нервів, а допрацювати все потім можна у звичайному ворді.

Зайві елементи

Якщо на сторінці залишилися елементи, які вам абсолютно не потрібні або марні, виділіть непотрібну область і видаліть її за допомогою гумки. Достатньо перейти в режим редагування та провести роботу. Причому що більше непотрібних елементів ви приберете, то швидше відбуватиметься процес розпізнавання тексту.

Перевірка помилок та збереження результатів роботи

Як ми вже говорили, помилки можуть виникати тоді, коли ви використовуєте неякісні, змащені, нечіткі зображення або документи з рідкісними символами. Тому завжди перевіряйте документ після процесу розпізнавання.

Знайшли? Чудово просто введіть потрібний символ. До речі, програма має режим перевірки, який допоможе швидко і без вашої участі перевірити документ на наявність помилок програми. І відразу після закінчення перевірки можете прямо з програми імпортувати документ (зберегти його у форматі) у ворд або будь-яку іншу програму.

Тип копії

При збереженні документа (в режимі редагування) вам запропонують зберегти його у трьох видах копії. Точна копія– це повна копія сканованого документа з усім форматуванням. Якщо ви потім плануєте редагувати текст після сканування у ворді, найкраще вибрати саме цей варіант.

Редагована копіядопомагає зберегти вже відредагований текст. Добре підходить, якщо ви маєте рясне подальше редагування. Простий текст - ідеально підходить для тих, хто хоче отримати в результаті звичайний текст без решти елементів сторінки.

Ось, власне, і все. Складно, довго і нудно, але набагато швидше сканувати та розпізнати текст (навіть рукописний) програмою, ніж переписувати 100 500 документів вручну. Ну а якщо вам і цим ніколи займатися - звертайтеся за допомогою до студентського сервісу. Тут вам швидко, дешево та якісно виконають усе, що потрібно.

Іноді немає часу для того, щоб створити новий документ і необхідно терміново:

відредагувати скановане креслення або схему, внести до документа доповнення, коментарі;
вставити у сканований малюнок форми документа поля заповнення;
просто отримати чистий, без помарок та зайвого брудного фону документ.

Для цього сканований документ попередньо необхідно перетворити на чорно-білий, при необхідності усунути перекіс і очистити від "сміття".
Передбачаю питання – чому б не включити при скануванні чорно-білий режим? Можна, але якість отриманого зображення у разі буде значно нижчий, ніж у розглянутому прикладі.

Існують спеціалізовані програми для цих цілей, такі як Spotlight Pro, але вони складні у використанні, і для їхнього освоєння потрібен значний час.

Я хочу запропонувати більш простий, але ефективний варіант обробки сканованих документів за допомогою програми оптичного розпізнавання тексту ABBYY FineReader 9.0.

Сканувати документ можна безпосередньо з інтерфейсу програми або вставити для обробки вже сканований малюнок.

Для наочності та ускладнення завдання, ми візьмемо вже сканований розворот книги, з перекосом сторінок та пожовклими від часу сторінками. Використовуючи програму ABBYY FineReader 9.0, перетворимо малюнок на чорно-білий, виправимо перекіс і очистимо від сміття.

Запускаємо програму ABBYY FineReader та в меню Сервіс, вибираємо команду Опції.
У вікні, у вкладці Сканувати/Відкрити, відзначаємо пункт Не обробляти отримані зображення, тому що розпізнавати текст ми не будемо - нам потрібне лише зображення. Вибираємо параметри Обробка зображення:
Тепер очистимо зображення від сміття – дрібних точок. Для цього просто натисніть 1-3 рази кнопку Очистити зображенняпри цьому спостерігаємо за процесом видалення сміття. при першому натисканні видаляються дрібніші точки, а при наступних, більші.
Ділянка малюнка на початок процесу очищення від сміття.

Ділянка малюнка після одноразового натискання на кнопку Очистити зображення

Ділянка малюнку після другого натискання на кнопку Очистити зображення
Тепер, залишилося очистити зображення від великих "клякс" та затемнених ділянок. Зробити це можна за допомогою інструменту Ластик .
Принцип роботи цього інструменту відрізняється від роботи аналогічних інструментів інших поширених графічних редакторів, і звичайно на краще. В даному випадку, відпадає необхідність "смикнути" піктограмою листка по зображенню, періодично вибираючи команду скасування, після ненароком стертої корисної інформації. Стерти ділянку зображення у програмі ABBYY FineReader, можна шляхом виділення цієї ділянки.
Утримуючи ліву кнопку миші, виділяємо ділянку зображення будь-яких розмірів, і, переконавшись, що виділену ділянку входять лише елементи, призначені для видалення, відпускаємо кнопку. Виділена ділянка очищена.
Оглядаємо очищений малюнок, що вийшов, і на одній зі сторінок виявляємо невеликий нюанс. Рядки тексту трохи спотворені. Але виявляється і цього дефекту сканування можна легко позбутися. Натискаємо кнопку Виправити викривлення рядків, та дефект виправлений.
Ділянка зображення до виправлення спотворення рядків

Ділянка зображення після виправлення викривлення рядків
Ось і все, вийшло чисте, без перекосів та спотворення рядків зображення.

Його можна роздрукувати, не витрачаючи зайву фарбу на ляпки і бруд, відправити електронною поштою другу, без докору сумління за не якісний скан, а також зберегти для подальшого використання в будь-якому з підтримуваних форматів.

Щоб зберегти зображення в меню Файл, вибираємо команду Зберегти зображення як.... Вибираємо будь-який із підтримуваних форматів:
Bitmap, чорно-білий (*.bmp; *.dib; *.rle)
Bitmap, сірий (*.bmp; *.dib; *.rle)
Bitmap, кольоровий (*.bmp; *.dib; *.rle)
DCX, чорно-білий (*.dcx)
DCX, сірий (*.dcx)
DCX, кольоровий (*.dcx)
JBIG2 (*.jb2; *.jbig2)
JPEG 2000, сірий (*.jp2; *.j2k)
JPEG 2000, кольоровий (*.jp2; *.j2k)
JPEG, сірий (*.jpg; *.jpeg)
JPEG, кольоровий (*.jpg; *.jpeg)
PCX, чорно-білий (*.pcx)
PCX, сірий (*.pcx)
PCX, кольоровий (*.pcx)
PNG, чорно-білий (*.png)
PNG, сірий (*.png)
PNG, кольоровий (*.png)
TIFF, чорно-білий, стиснутий (*.tif; *.tiff)
TIFF, чорно-білий, packbits (*.tif; *.tiff)
TIFF, чорно-білий, стиснення: ZIP (*.tif; *.tiff)
TIFF, чорно-білий, стиснення: LZW (*.tif; *.tiff)
TIFF, чорно-білий, Group4 (*.tif; *.tiff)
TIFF, сірий, несжатий (*.tif; *.tiff)
TIFF, сірий, Packbits (*.tif; *.tiff)
TIFF, сірий, стиснення: JPEG (*.tif; *.tiff)
TIFF, сірий, стиснення: ZIP (*.tif; *.tiff)
TIFF, сірий, стиснення: LZW (*.tif; *.tiff)
TIFF, кольоровий, несжатий (*.tif; *.tiff)
TIFF, кольоровий, Packbits (*.tif; *.tiff)
TIFF, кольоровий, стиснення: JPEG (*.tif; *.tiff)
TIFF, кольоровий, стиснення: ZIP (*.tif; *.tiff)
TIFF, кольоровий, стиснення: LZW (*.tif; *.tiff)
PDF (*.pdf)

Очищені скани сторінок від "сміття" та з виправленим спотворенням рядків.

Хочеться відзначити, багато хто зараз переводять свої документи (креслення, схеми, книги...) в електронний вигляд. При великому обсязі робіт зручніше використовувати для цих цілей фотоапарат. З деякими моделями сканерів та фотоапаратів, що підтримують функцію перезняття документів, програма ABBYY FineReader йде в комплекті. При виборі інструменту для перекладу документів в електронний вигляд, слід врахувати це, оскільки FineReader, з урахуванням її основного призначення - оптичного розпізнавання тексту, для тих, хто працює з документами не менш корисною програмою, ніж текстовий редактор.

Сканер - пристрій, який розпізнає об'єкти, зображення або документи і записує їх візуальний образ у графічний файл, який можна по-різному редагувати. З якою метою зазвичай проводиться ця операція? Як редагувати сканований документ?

Під словом «редагування» слід розуміти:

Редагування як модифікація зображення

Як ми зазначили вище, сканер, обробляючи документ чи інший об'єкт, згодом створює на основі його образу статичну картинку у вигляді окремого графічного файлу – наприклад, у форматі Jpeg. Потреби в її редагуванні найчастіше такі:

поверхневе коригування (зміна розміру, відображення, поворот на задану кількість градусів, настроювання колірного балансу);
редагування елементів зображення (зміна їхнього зовнішнього вигляду, видалення, додавання нових).

Поверхневе коригування зображення, отриманого зі сканера, може здійснюватися за допомогою найдоступніших видів програмного забезпечення, які встановлені в Windows за промовчанням. Якою програмою редагувати відсканований документ найпростіше? Ймовірно це буде Paint. Важливі опції редагування файлу знаходяться в меню програми, а також панелі інструментів її інтерфейсу.

Запустити Paint дуже легко: слід натиснути (у Windows до версії 7 включно) "Пуск", далі - "Всі програми" - "Стандартні" - Paint. Потім за допомогою інтерфейсу цього програмного забезпечення відкриваємо потрібний файл і вносимо в нього необхідні коригування.

Більш складна процедура - редагування елементів зображення - може передбачати найширший спектр можливих операцій: від нанесення невеликої ретуші або букв на картинку до її злиття з іншим графічним файлом у вигляді колажу. Залежно від складності відповідної процедури необхідно буде задіяти той чи інший вид ПЗ.

Якщо операції із зображенням прості (наприклад, справа обмежується нанесенням літер на нього), можна використовувати той же Paint. У панелі інструментів даної програми, яка міститься в її інтерфейсі ліворуч, потрібно вибрати "Текст". За допомогою нього на зображення наносяться друковані літери.

Редагування текстів та інших об'єктів форматування на зображенні

Як редагувати відскановані документи за допомогою вказаних програм? Дані рішення функціонують так: вони обробляють зображення, розпізнають текст та інші об'єкти форматування, присутні на ньому, а потім заносять їх в окремий файл, який можна, у свою чергу, відкривати за допомогою текстових редакторів – Word, OpenOffice та їх аналогів – і вільно редагувати.

Згодом можна розмістити змінений текст (таблиці, списки) на тому ж сканованому зображенні, з якого він був розпізнаний у вихідному вигляді. Для того, щоб здійснити цю процедуру, необхідно відкрити відповідний графічний файл у програмі для редагування – наприклад, Paint, в одному вікні, в іншому – розпізнаний та відредагований текст (таблиці, списки). Зробивши друге вікно активним, потрібно виконати скріншот тексту (знімок поточного зображення на екрані монітора) за допомогою клавіші Print Screen Sysrq, після вставити його в Paint (за допомогою поєднання Ctrl і V), а потім - розмістити на сканованому зображенні так, як потрібно .

Подібна потреба може виникнути, наприклад, дизайнер обкладинки журналу, якому потрібно відредагувати розміщений на ній текст, і якщо у нього з якихось причин немає вихідного файлу. Він може розпізнати потрібні абзаци з паперової сторінки видання, внести до них правки, а потім знову розмістити їх, вже в зміненому вигляді, на відсканованому зображенні сторінки.