Kontakty

Čistenie naskenovaných dokumentov od nečistôt, odstránenie zošikmenia a skreslenia čiar. Ako upravím naskenovaný dokument? Dá sa naskenovaný text previesť na opravy?

Po naskenovaní dokumentu môžete dokument otvoriť v programe Word a upraviť ho. Spôsob závisí od verzie balíka Office nainštalovanej v počítači.

Naskenujte dokument ako súbor PDF a upravte ho v programe Word

Poradenstvo: Konverzia funguje najlepšie pre dokumenty, ktoré sú väčšinou textové.

    Naskenujte dokument podľa pokynov pre skener a uložte ho do počítača ako súbor PDF.

    V programe Word otvorte ponuku súbor > Otvorené.

    Prejdite do priečinka súboru PDF v počítači a kliknite Otvorené.

    Zobrazí sa hlásenie, že program Word konvertuje súbor PDF na upraviteľný dokument programu Word. Kliknite na tlačidlo OK.

Nemusí existovať úplná zhoda medzi stránkou konvertovaného dokumentu s originálom. Napríklad zlomy riadkov a strán sa môžu objaviť inde. Ďalšie informácie nájdete v téme Otváranie súborov PDF vo Worde.

Ďalšie informácie

Možnosť Skener alebo Fotoaparát na skenovanie dokumentov a obrázkov nie je v programe Word 2010 k dispozícii. Namiesto toho môžete dokument naskenovať pomocou skenera a uložiť súbor do počítača.

Microsoft Office Document Imaging bol odstránený z balíka Office 2010, ale môžete si ho nainštalovať do počítača pomocou jednej z možností opísaných v časti Inštalácia MODI na použitie s balíkom Microsoft Office 2010.

Pred pokračovaním

    Otvorte Microsoft Office Document Imaging vyhľadaním v ponuke Štart systému Windows.

    Na jedálnom lístku Súbor vybrať tím Otvorené.

    Nájdite naskenovaný dokument a kliknite na tlačidlo Otvorené.

    Po spustení aplikácie Microsoft Office Document Imaging stlačte CTRL + A, aby ste vybrali celý dokument, a potom stlačte CTRL + C.

    Spustite program Microsoft Word.

    V záložke Súbor stlač tlačidlo Vytvorte.

    Dvakrát kliknite na položku nový dokument.

    Stlačením CTRL + V prilepíte obsah naskenovaného dokumentu do nového súboru.

Možnosť Skener alebo Fotoaparát na skenovanie dokumentov a obrázkov nie je dostupná v programe Microsoft Office Word 2007. Namiesto toho môžete dokument naskenovať pomocou skenera a uložiť súbor do počítača.

Krok 1: Nainštalujte Microsoft Office Document Imaging

    Ukončite všetky programy.

    Poradenstvo: Odporúčame vám vytlačiť si túto časť pred ukončením všetkých programov.

    Otvorte Ovládací panel: kliknite pravým tlačidlom myši na tlačidlo Štart systému Windows a vyberte Ovládací panel alebo zadajte do okien vyhľadávacieho poľa prvok ovládacieho panela .

    Na ovládacie panely kliknite programy, a potom - Programy a príslušenstvo.

    Kliknite pravým tlačidlom myši na názov nainštalovanej verzie balíka Microsoft Office alebo kliknite pravým tlačidlom myši Microsoft Office Word 2007(v závislosti od toho, či je Word nainštalovaný ako súčasť balíka Office alebo ako samostatný program) a potom kliknite zmeniť.

    Prosím vyber Pridajte alebo odstráňte komponenty a potom kliknite ďalej.

    V kapitole Možnosti inštalácie kliknite na znamienko plus (+) vedľa komponentu Kancelárske nástroje.

    Kliknite na šípku vedľa komponentu Microsoft Office Document Imaging, vyberte možnosť Spustiť všetko z môjho počítača a potom kliknite ďalej.

Krok 2: vytvorte dokument, ktorý je možné upraviť.

Naskenujte dokument podľa pokynov pre váš skener.

Pred pokračovaním Skonvertujte súbor vygenerovaný skenerom do formátu TIFF. Súbor môžete previesť pomocou programu Paint alebo iného programu.

Teraz máte dokument, ktorý môžete upravovať. Nezabudnite uložiť nový súbor, aby ste nestratili svoje zmeny.

Je možné zmeniť naskenovaný text? Môžem upraviť naskenovaný text, aby som ho mohol neskôr použiť na iné účely? Áno, milí priatelia! Dnes je to nielen možné, ale aj celkom jednoduché.

Ak existuje potreba, túžba, ako aj určité technické možnosti, bude to pre vás ľahké:

  • skenovanie rukou písaného textu (napríklad súhrnu),
  • skenovanie textu z fotografie alebo obrázka,
  • úprava,
  • OCR po skenovaní,
  • prevod textu vo forme obrázka na obyčajný text, v ktorom môžete zmeniť naskenovaný text (napríklad v pdf dokumente) dokumentu atď.

Vo všeobecnosti sa dnes dá s textom na obrázku urobiť to isté ako s obyčajným textom vo wordovom dokumente. A to je životne dôležité a užitočné pre tých, ktorí sa neustále zaoberajú početnou dokumentáciou a trávia veľa času – teda aj pre študentov. Poďme zistiť, ako sa to robí.

Aký je rozdiel medzi skenovaním a rozpoznávaním?

Ako sa ukázalo, skenovanie a rozpoznávanie textu sú dve rôzne veci. Skenovanie listov dokumentu je jeho preklad textu do elektronickej podoby. To sa vykonáva pomocou skenera alebo pomocou konvenčnej fotografie na smartfóne alebo digitálnom fotoaparáte.

Uznávanie je prevod naskenovaného dokumentu (textu) do elektronickej podoby.

Mimochodom! Pre našich čitateľov je teraz zľava 10 %. akýkoľvek druh práce

Čo potrebujeme na skenovanie a rozpoznanie textu z fotografie?

Pri skenovaní a rozpoznávaní textu sa nezaobídeme bez niekoľkých vecí:

  1. Skener... V skutočnosti môže úlohu skenera vykonávať nielen tento typ zariadenia, ale aj fotoaparát (napríklad v smartfóne). Ak používate skener, uistite sa, že váš počítač má systémové ovládače a softvér potrebný na správne fungovanie. Ak nie je skener, ale chystáte sa ho kúpiť, dávajte pozor na rýchlosť spracovania jedného listu. Niektoré zariadenia spracujú list za 10 sekúnd, iné na to budú potrebovať 30 alebo viac. A ak musíte pracovať s objemnými materiálmi 300-400 listov, potom na tomto faktore záleží.
  2. OCR softvér alebo online služby... O službách, ktoré pomáhajú rozpoznať text po naskenovaní dokumentu cez skener, sme už napísali článok. Teraz by sme vám však chceli odporučiť ABBYY FineReader. Napriek tomu, že je platený, jeho funkčnosť je skutočne pôsobivá. A ak pracujete s obrovskými objemami dokumentov, stane sa vašou nenahraditeľnou asistentkou. Existuje však aj jeho bezplatný analógový formulár Cunei, ktorý robí skvelú prácu pri skenovaní a rozpoznávaní textu online. Je pravda, že jeho funkčnosť je v porovnaní s predchádzajúcim bratom veľmi obmedzená.
  3. Dokumenty na skenovanie... Študenti sa často musia potýkať so skenovaním dokumentu v podobe časopisov, článkov, kníh, synopsí, výtlačkov, odkiaľ často potrebujú skopírovať text. A len tak vo forme rady - pred začatím skenovania si skúste tieto dokumenty vyhľadať na nete. Ak ste už tieto materiály použili, je veľká šanca, že láskavý človek už urobil všetku prácu za vás. Atk, že stačí skopírovať text hotového naskenovaného dokumentu a po naskenovaní začať text upravovať.

Možnosti skenovania textu

Kúpil sa teda skener, pripravili sa dokumenty, nainštalovali sa programy. Čo bude ďalej? Ďalej budeme musieť vykonať potrebné nastavenia, ktoré tiež niekedy pomáhajú výrazne uľahčiť úlohu, napríklad rozpoznať naskenovaný text v určitom formáte, upraviť text po skenovaní v určitom režime atď.

Vo všeobecnosti bude kvalita a rýchlosť vašej práce závisieť od nastavení. Poďme to teda spolu vyriešiť.

Kvalita DPI

Toto je rozlíšenie obrázka, ktoré bude dôležité pri úprave textu v naskenovanom dokumente. V nastaveniach nastavte kvalitu aspoň na 300 DPI, ak je to možné, aj viac. Čím vyššia je táto hodnota, tým jasnejší bude obrázok po naskenovaní.

A rýchlosť spracovania bude závisieť od jasnosti. To znamená, že na opravu alebo zmenu naskenovaného textu bude text naskenovaného hárku rýchlejší a program bude robiť aj menej chýb (áno, aj programy sa mýlia, ale najskôr).

Chromatickosť

Vďaka tomuto parametru môžete ovplyvniť rýchlosť skenovania textu. Skenery majú spravidla 3 režimy: čiernobiely (vhodný pre listy s bežným tlačeným textom), sivý (vhodný na prácu s dokumentmi s tabuľkami a jednoduchými obrázkami), farebný (pre časopisy, knihy a iné dokumenty, kde záleží na farbe). Čím menej farieb, tým rýchlejšie je možné dokument spracovať.

Foto

Ako sme už povedali, na skenovanie môžete použiť nielen skener, ale aj fotografovanie. Tu však buďte opatrní – akékoľvek rozmazanie, rozmazanie a iné deformácie obrazu môžu ovplyvniť ďalšie rozpoznávanie a úpravu textu v naskenovanom dokumente.

Uznanie

Stránky sme teda naskenovali a dostali v elektronickej podobe. Potom otvoríme OCR program (napríklad FineReader) a začneme rozpoznávať text. Niektoré programy (vrátane nášho) robia tento proces s chybami. Potom bude potrebné oblasť s chybou vybrať manuálne.

Práca s textom

V oblasti Text môžete vybrať text. Všetky tabuľky a obrázky je možné vymazať. Ale aby ste mohli pracovať s nezvyčajnými a vzácnymi symbolmi, budete musieť pracovať s perami. Takto to vyzerá v programe:

snímky

Táto oblasť v programe sa používa na prácu s obrázkami a oblasťami textu, ktoré bolo ťažké rozpoznať.

Tabuľky

Tlačidlo zvýraznenia tabuľky vám pomáha pri práci s tabuľkami. Táto funkcia však nie je dobre vyvinutá. Niekedy je na prácu s tabuľkami jednoduchšie použiť editor obrázkov. To ušetrí veľa času a nervov a všetko môžete neskôr doladiť v bežnom Worde.

Extra prvky

Ak sú na stránke prvky, ktoré absolútne nepotrebujete alebo sú zbytočné, vyberte nepotrebnú oblasť a odstráňte ju pomocou gumy. Stačí prepnúť do režimu úprav a vykonať prácu. Navyše, čím viac nepotrebných prvkov odstránite, tým rýchlejšie prebehne proces rozpoznávania textu.

Kontrola chýb a ukladanie výsledkov práce

Ako sme už povedali, pri použití nekvalitných, rozmazaných, neostrých obrázkov alebo dokumentov so zriedkavými znakmi sa môžu vyskytnúť chyby. Preto si doklad po procese uznávania vždy skontrolujte.

Našiel? Skvelé - stačí zadať postavu, ktorú chcete. Mimochodom, program má režim kontroly, ktorý vám pomôže rýchlo a bez vašej účasti skontrolovať dokument na chyby programu. A hneď po ukončení kontroly môžete dokument priamo importovať z programu (uložiť vo formáte) do programu Word alebo iného programu.

Typ kopírovania

Pri ukladaní dokumentu (v režime úprav) budete vyzvaní, aby ste ho uložili v troch typoch kópií. Presná kópia- Toto je úplná kópia naskenovaného dokumentu so všetkým vykonaným formátovaním. Ak potom plánujete upraviť text po skenovaní vo Worde, potom je najlepšie zvoliť túto možnosť.

Upraviteľná kópia pomáha uložiť už upravený text. Dobré, ak máte na práci veľa dodatočných úprav. Obyčajný text – Ideálne pre tých, ktorí chcú skončiť s obyčajným textom bez všetkých ostatných prvkov na stránke.

To je vlastne všetko. Je to náročné, zdĺhavé a zdĺhavé, ale je oveľa rýchlejšie naskenovať a rozpoznať text (aj ručne písaný) pomocou programu, ako prepísať 100 500 dokumentov ručne. Ak nemáte čas ani na to, obráťte sa na študentskú službu. Tu rýchlo, lacno a efektívne vykonáte všetko, čo potrebujete.

Niekedy nie je čas na vytvorenie nového dokumentu a musíte urýchlene:

  • upravovať naskenovaný výkres alebo diagram, pridávať doplnky, komentáre k dokumentu;
  • vložiť polia na vyplnenie do naskenovaného výkresu formulára dokumentu;
  • stačí získať čistý dokument bez škvŕn a zbytočného špinavého pozadia.

Na tento účel je potrebné naskenovaný dokument najskôr previesť na čiernobiely, v prípade potreby odstrániť zošikmenie a očistiť od „odpadkov“.
Predpokladám otázku - prečo nepovoliť čiernobiely režim pri skenovaní? Je to možné, ale kvalita výsledného obrazu v tomto prípade bude rádovo nižšia ako v uvažovanom príklade.

Na tento účel existujú špecializované programy, ako napríklad Spotlight Pro, ale ich používanie je náročné a ich zvládnutie trvá dlho.

Chcem ponúknuť jednoduchšiu, ale efektívnejšiu možnosť spracovania naskenovaných dokumentov pomocou ABBYY FineReader 9.0 OCR.

Môžete skenovať dokument priamo z rozhrania programu alebo vložiť už naskenovaný obrázok na spracovanie.

Pre prehľadnosť a skomplikovanie úlohy zoberieme už naskenovaný výtlačok knihy so zošikmenými stranami a stranami, ktoré z času na čas zožltli. Pomocou ABBYY FineReader 9.0 skonvertujeme obrázok na čiernobiely, opravíme zošikmenie a očistíme ho od nečistôt.

  1. Spustite ABBYY FineReader a v ponuke servis, vyberte tím možnosti.
    V okne, ktoré sa otvorí, na karte Skenovať / Otvoriť, označte položku Nespracovávajte prijaté obrázky, keďže text nespoznáme – stačí nám obrázok. Výber parametrov Spracovanie obrazu:
  2. Teraz očistíme obrázok od trosiek - malých bodiek. Ak to chcete urobiť, stačí stlačiť tlačidlo 1-3 krát Jasný obraz, pri dodržaní procesu odstraňovania odpadu. prvé stlačenie vymaže menšie bodky a ďalšie stlačenie odstráni väčšie.

    Oblasť výkresu pred začiatkom procesu čistenia nečistôt.

    Časť výkresu po jednom stlačení tlačidla Jasný obraz

    Výrez výkresu po druhom stlačení tlačidla Jasný obraz

  3. Teraz zostáva vyčistiť obraz od veľkých „škvŕn“ a tmavých oblastí. To možno vykonať pomocou nástroja Guma .
    Princíp fungovania tohto nástroja sa líši od práce podobných nástrojov iných bežných grafických editorov a samozrejme k lepšiemu. V tomto prípade nie je potrebné po neúmyselnom vymazaní užitočných informácií „pohybovať“ ikonou listu nad obrázkom a pravidelne vyberať príkaz na zrušenie. Výberom tejto časti môžete vymazať časť obrázka v programe ABBYY FineReader.
    Podržte stlačené ľavé tlačidlo myši a vyberte časť obrázka ľubovoľnej veľkosti a po uistení sa, že vo vybratej časti sú zahrnuté iba prvky určené na vymazanie, tlačidlo uvoľnite. Zvýraznená oblasť bola vymazaná.
  4. Skúmame výsledný vyčistený výkres a na jednej zo stránok nájdeme malú nuanciu. Riadky textu sú mierne zdeformované. Ukazuje sa však, že tejto chyby skenovania sa dá ľahko zbaviť. Stlačte gombík Opravte skreslené struny a chyba bola odstránená.

    Časť obrazu pred korekciou skreslenia čiary

    Časť obrazu po korekcii skreslenia čiary

  5. To je všetko, výsledkom je čistý obraz, bez deformácií a skreslení čiar.

Dá sa vytlačiť bez plytvania prebytočnou farbou na škvrny a nečistoty, poslať e-mailom priateľovi, bez výčitiek svedomia za nekvalitné skenovanie, ako aj uložiť na budúce použitie v niektorom z podporovaných formátov.

Ak chcete uložiť obrázok v ponuke Súbor, vyberte tím Uložiť obrázok ako ...... Vyberte si niektorý z podporovaných formátov:
Čiernobiela bitová mapa (* .bmp; * .dib; * .rle)
Bitová mapa, šedá (* .bmp; * .dib; * .rle)
Farba bitovej mapy (* .bmp; * .dib; * .rle)
DCX čiernobiele (* .dcx)
DCX sivá (* .dcx)
DCX Color (* .dcx)
JBIG2 (* .jb2; * .jbig2)
JPEG 2000 sivá (* .jp2; * .j2k)
JPEG 2000 farba (* .jp2; * .j2k)
JPEG sivá (* .jpg; * .jpeg)
Farba JPEG (* .jpg; * .jpeg)
PCX čiernobiele (* .pcx)
PCX sivá (* .pcx)
Farba PCX (* .pcx)
PNG, čiernobiely (* .png)
PNG, sivá (* .png)
PNG, farba (* .png)
TIFF, čiernobiely, nekomprimovaný (* .tif; * .tiff)
TIFF, čiernobiely, balíky (* .tif; * .tiff)
TIFF, čiernobiely, kompresia: ZIP (* .tif; * .tiff)
TIFF, čiernobiely, kompresia: LZW (* .tif; * .tiff)
TIFF, čiernobiely, Skupina 4 (* .tif; * .tiff)
TIFF, sivý, nekomprimovaný (* .tif; * .tiff)
Šedé balíčky TIFF (* .tif; * .tiff)
TIFF, šedá, kompresia: JPEG (* .tif; * .tiff)
TIFF, šedá, kompresia: ZIP (* .tif; * .tiff)
TIFF, šedá, kompresia: LZW (* .tif; * .tiff)
TIFF, color, uncompressed (* .tif; * .tiff)
Farebné balíčky TIFF (* .tif; * .tiff)
TIFF, farba, kompresia: JPEG (* .tif; * .tiff)
TIFF, farba, kompresia: ZIP (* .tif; * .tiff)
TIFF, farba, kompresia: LZW (* .tif; * .tiff)
PDF (* .pdf)


Vyčistené skeny strán od "smetí" a s opraveným skreslením čiar.

Chcel by som poznamenať, že mnohí v súčasnosti prekladajú svoje dokumenty (nákresy, schémy, knihy ...) do elektronickej podoby. Pri veľkom množstve práce je na tieto účely pohodlnejšie použiť fotoaparát. Pri niektorých modeloch skenerov a fotoaparátov, ktoré podporujú funkciu snímania dokumentov, je súčasťou balenia aj ABBYY FineReader. Pri výbere nástroja na prevod dokumentov do elektronickej podoby by ste to mali vziať do úvahy, pretože FineReader, berúc do úvahy jeho hlavný účel - optické rozpoznávanie znakov, nie je o nič menej užitočným programom pre tých, ktorí pracujú s dokumentmi, ako textový editor.

Skener je zariadenie, ktoré rozpoznáva objekty, obrázky alebo dokumenty a zapisuje ich vizuálny obraz do grafického súboru, ktorý je možné rôznymi spôsobmi upravovať. Za akým účelom sa táto operácia zvyčajne vykonáva? Ako upravím naskenovaný dokument?

V tomto prípade by sa slovo „úprava“ malo chápať takto:

Úprava ako úprava obrázka

Ako sme uviedli vyššie, skener pri spracovaní dokumentu alebo iného objektu následne vytvorí na základe svojho obrazu statický obrázok vo forme samostatného grafického súboru – napríklad vo formáte Jpeg. Potreby úprav sú najčastejšie nasledovné:

  • úpravy povrchu (zmena veľkosti, prevrátenie, otočenie o určený počet stupňov, úprava vyváženia farieb);
  • úprava obrazových prvkov (zmena ich vzhľadu, mazanie, pridávanie nových).

Povrchovú korekciu obrazu prijatého zo skenera je možné vykonať pomocou najdostupnejších typov softvéru, ktorý je štandardne nainštalovaný v systéme Windows. Aký je najjednoduchší program na úpravu naskenovaného dokumentu? Pravdepodobne to bude Paint. Dôležité možnosti úpravy súboru sa nachádzajú v ponuke programu, ako aj na paneli nástrojov jeho rozhrania.

Spustenie programu Maľovanie je veľmi jednoduché: mali by ste kliknúť (vo Windowse až po verziu 7 vrátane) „Štart“ a potom – „Všetky programy“ – „Štandard“ – Maľovanie. Potom pomocou rozhrania tohto softvéru otvorte požadovaný súbor a vykonajte v ňom potrebné úpravy.

Zložitejší postup – úprava prvkov obrázka – môže zahŕňať najširšiu škálu možných operácií: od nanesenia malých úprav alebo písmen na obrázok až po jeho zlúčenie s iným grafickým súborom vo forme koláže. V závislosti od zložitosti príslušného postupu bude potrebné použiť jeden alebo iný typ softvéru.

Ak sú operácie s obrázkom jednoduché (napríklad záležitosť je obmedzená na kreslenie písmen na ňom), môžete použiť rovnakú farbu. Na paneli nástrojov tohto programu, ktorý sa nachádza v jeho rozhraní vľavo, musíte vybrať "Text". Pomocou neho sa na obrázok aplikujú tlačené písmená.

Úprava textu a iných formátovacích objektov na obrázku

Ako upravím naskenované dokumenty pomocou určených programov? Tieto riešenia fungujú nasledovne: spracujú obrázok, rozpoznajú text a iné formátovacie objekty, ktoré sa na ňom nachádzajú, a potom ich vložia do samostatného súboru, ktorý je možné otvoriť pomocou textových editorov - Word, OpenOffice a ich analógov - a voľne upravovať.

Následne môžete zmenený text (tabuľky, zoznamy) umiestniť na rovnaký naskenovaný obrázok, z ktorého bol pôvodne rozpoznaný. Na vykonanie tohto postupu je potrebné otvoriť príslušný grafický súbor v editačnom programe - napríklad Maľovanie, v jednom okne, v druhom - rozpoznaný a upravený text (tabuľky, zoznamy). Po aktivácii druhého okna musíte urobiť snímku obrazovky textu (snímka obrazovky aktuálneho obrázka na obrazovke monitora) pomocou klávesu Print Screen Sysrq, potom ju vložiť do programu Paint (pomocou kombinácie Ctrl a V) a potom ho podľa potreby umiestnite na naskenovaný obrázok...

Podobná potreba môže vzniknúť napríklad pre dizajnéra obálok časopisov, ktorý potrebuje upraviť text na ňom umiestnený a ak z nejakého dôvodu nemá k dispozícii zdrojový súbor. Dokáže rozpoznať potrebné odseky z papierovej strany publikácie, urobiť v nich úpravy a potom ich už v upravenej podobe znovu umiestniť na naskenovaný obrázok strany.



Páčil sa vám článok? Zdieľaj to