Contacte

Curățarea documentelor scanate de resturi, eliminând deformarea și deformarea liniilor. Cum se editează un document scanat? Textul scanat poate fi convertit pentru corecții

După scanarea unui document, puteți deschide documentul în Word pentru a-l edita. Metoda depinde de versiunea de Office instalată pe computer.

Scanați un document ca fișier PDF și editați-l în Word

Sfat: Conversia este cea mai bună pentru documentele care sunt în mare parte text.

    Scanați documentul conform instrucțiunilor pentru scaner și salvați-l pe computer ca fișier PDF.

    În Word, deschideți meniul fişier > Deschis.

    Navigați la folderul fișierului PDF de pe computer și faceți clic pe butonul Deschis.

    Va apărea un mesaj care spune că Word convertește fișierul PDF într-un document Word editabil. Faceți clic pe butonul Bine.

Este posibil să nu existe o potrivire completă pagină cu pagină între documentul convertit și original. De exemplu, rupturile de rând și de pagină pot fi în alte locuri. Pentru mai multe informații, consultați Deschiderea PDF-urilor în Word.

informatii suplimentare

Opțiunea „de la scaner sau cameră” pentru scanarea documentelor și imaginilor nu este disponibilă în Word 2010. În schimb, puteți scana documentul folosind un scaner și puteți salva fișierul pe computer.

Microsoft Office Document Imaging a fost eliminat din Office 2010, dar îl puteți instala pe computer utilizând una dintre opțiunile descrise în Instalarea aplicației MODI pentru utilizare cu Microsoft Office 2010 .

Înainte de a începe

    Deschideți Microsoft Office Document Imaging căutând în meniul Start Windows.

    În meniu Fişier selectați o echipă Deschis.

    Găsiți documentul scanat și faceți clic pe butonul Deschis.

    După ce porniți Microsoft Office Document Imaging, apăsați CTRL+A pentru a selecta întregul document, apoi apăsați CTRL+C.

    Lansați Microsoft Word.

    Pe fila Fişier apasa butonul Crea.

    Faceți dublu clic pe un element document nou.

    Apăsați CTRL+V pentru a lipi conținutul documentului scanat într-un fișier nou.

Opțiunea „de la scaner sau cameră” pentru scanarea documentelor și imaginilor nu este disponibilă în Microsoft Office Word 2007. În schimb, puteți scana un document folosind un scaner și puteți salva fișierul pe computer.

Pasul 1: Instalați Microsoft Office Document Imaging

    Închideți toate programele.

    Sfat: Vă recomandăm să imprimați această secțiune înainte de a părăsi toate programele.

    Deschideți Panoul de control: faceți clic dreapta pe butonul Start Windows și selectați Panou de control sau tastați în caseta de căutare Windows element panou de control .

    Pe panouri de control clic Programe, și apoi - Programe si caracteristici.

    Faceți clic dreapta pe numele versiunii instalate de Microsoft Office sau faceți clic dreapta Microsoft Office Word 2007(în funcție de dacă Word este instalat ca parte a Office sau ca program autonom), apoi faceți clic Schimbare.

    Selectați Adăugați sau eliminați componente, apoi faceți clic pe butonul Continua.

    In sectiune Opțiuni de instalare faceți clic pe semnul plus (+) de lângă componentă Instrumente de birou.

    Faceți clic pe săgeata de lângă componentă Imagini de documente Microsoft Office, selecteaza o optiune Rulați totul de pe computerul meu, apoi faceți clic pe butonul Continua.

Pasul 2: Creați un document care poate fi modificat.

Scanați documentul urmând instrucțiunile pentru scaner.

Înainte de a începe Convertiți fișierul creat de scaner în format TIFF. Puteți converti fișierul cu Paint sau alt program.

Acum aveți un document pe care îl puteți edita. Nu uitați să salvați noul fișier pentru a nu pierde modificările.

Este posibil să schimbi textul scanat? Pot edita textul scanat astfel încât să îl pot folosi în alte scopuri mai târziu? Da, dragi prieteni! Astăzi nu este doar posibil, ci și destul de ușor de făcut.

Dacă aveți nevoie, dorință, precum și unele capacități tehnice, vă va fi ușor să:

  • scanarea textului scris de mână (de exemplu, rezumat),
  • scanarea textului dintr-o fotografie sau imagine,
  • editare,
  • recunoașterea textului după scanare,
  • conversia textului sub forma unei imagini în text simplu, în care puteți modifica textul scanat (de exemplu, într-un document pdf) al unui document etc.

În general, astăzi puteți face același lucru cu textul dintr-o imagine ca și cu textul obișnuit dintr-un document Word. Iar acest lucru este vital și util pentru cei care se ocupă în mod constant de numeroase documente și petrec mult timp - adică și pentru studenți. Să ne dăm seama cum se face.

Care este diferența dintre scanare și recunoaștere?

După cum sa dovedit, scanarea și recunoașterea textului sunt două lucruri diferite. Scanarea foilor unui document este traducerea acestuia a textului în formă electronică. Acest lucru se realizează printr-un scaner sau folosind fotografia convențională pe un smartphone sau cameră digitală.

Recunoașterea este transformarea unui document (text) scanat într-o formă electronică.

Apropo! Pentru cititorii noștri există acum o reducere de 10% la orice fel de muncă

De ce avem nevoie pentru a scana și a recunoaște textul dintr-o fotografie?

Pentru a scana și a recunoaște text, nu ne putem lipsi de unele lucruri:

  1. Scanner. De fapt, rolul unui scaner poate fi îndeplinit nu numai de acest tip de echipament, ci și de o cameră (într-un smartphone, de exemplu). Dacă utilizați un scaner, asigurați-vă că computerul are driverele de sistem și programele necesare pentru funcționarea completă a acestuia. Dacă nu aveți un scanner, dar veți cumpăra unul, acordați atenție vitezei de procesare pe coală. Unele dispozitive procesează o foaie în 10 secunde, altele vor avea nevoie de 30 sau mai mult. Și dacă trebuie să lucrați cu materiale în vrac de 300-400 de coli, atunci acest factor contează.
  2. Programe de recunoaștere a textului sau servicii online. Am scris deja un articol despre serviciile care ajută la recunoașterea textului după scanarea unui document printr-un scaner. Dar acum am dori să vă recomandăm ABBYY FineReader. În ciuda faptului că este plătit, funcționalitatea sa este cu adevărat impresionantă. Și dacă lucrezi cu volume uriașe de documente, acesta va deveni asistentul tău indispensabil. Cu toate acestea, există și omologul său gratuit Cunei Form, care face o treabă excelentă de scanare și OCR online. Adevărat, funcționalitatea sa este foarte limitată în comparație cu omologul precedent.
  3. Documente de scanat. Elevii au deseori de-a face cu scanarea unui document sub formă de reviste, articole, cărți, rezumate, tipărite, de unde adesea trebuie să copiați textul mai târziu. Și chiar așa, sub formă de sfaturi - înainte de a începe scanarea, încercați să căutați aceste documente în rețea. Dacă ai folosit deja aceste materiale înainte de tine, există o șansă imensă ca o persoană bună să fi făcut deja toată munca pentru tine. Atk, tot ce trebuie să faceți este să copiați textul documentului scanat finit și să editați textul după scanare.

Opțiuni de scanare a textului

Așadar, am cumpărat scanerul, am pregătit documentele, am instalat programele. Ce urmeaza? În continuare, va trebui să facem setările necesare, care, de asemenea, uneori ajută la ușurarea sarcinii, de exemplu, recunoașterea textului scanat într-un anumit format, editarea textului după scanare într-un anumit mod și așa mai departe.

În general, calitatea și viteza muncii dvs. vor depinde de setări. Deci, hai să ne dăm seama împreună.

Calitate DPI

Aceasta este rezoluția imaginii care va fi importantă la editarea textului din documentul scanat. Setați calitatea în setări la cel puțin 300 DPI și, dacă este posibil, mai mult. Cu cât această valoare este mai mare, cu atât imaginea va fi mai clară după scanare.

Și viteza de procesare va depinde de claritate. Adică corectați sau modificați textul scanat, textul foii scanate va fi mai rapid, iar programul va face mai puține erori (da, programele greșesc și ele, dar în primul rând).

Chroma

Datorită acestui parametru, puteți influența viteza de scanare a textului. De regulă, scanerele au 3 moduri: alb-negru (potrivit pentru foi cu text tipărit simplu), gri (potrivit pentru lucrul cu documente cu tabele și imagini simple), color (pentru reviste, cărți și alte documente unde culoarea contează). ). Cu cât culoarea este mai mică, cu atât viteza de procesare a documentului este mai rapidă.

O fotografie

După cum am spus, pentru scanare, puteți utiliza nu numai un scaner, ci și fotografiere. Dar fiți atenți aici - orice neclaritate, neclaritate și alte distorsiuni ale imaginii pot afecta recunoașterea și editarea ulterioară a textului din documentul scanat.

Recunoaştere

Așadar, am scanat și am primit paginile în formă electronică. Apoi deschidem programul pentru recunoaștere (de exemplu, FineReader) și începem să recunoaștem textul. Unele programe (inclusiv al nostru) fac acest proces cu erori. Apoi, zona cu eroarea va trebui selectată manual.

Lucrați cu text

Puteți selecta text în zona Text. Orice tabele și imagini pot fi șterse. Dar pentru a lucra cu simboluri neobișnuite și rare, va trebui să lucrați cu pixuri. Iată cum arată în program:

Imagini

Această zonă din program este folosită pentru a lucra cu imagini și cu acele zone de text care sunt greu de recunoscut.

Mese

Butonul de selecție a tabelelor vă ajută să lucrați cu tabele. Cu toate acestea, această caracteristică nu este bine dezvoltată. Uneori este mai ușor să utilizați Editorul de imagini pentru a lucra cu tabele. Acest lucru va economisi mult timp și nervi, iar apoi puteți finaliza totul într-un cuvânt obișnuit.

Elemente suplimentare

Dacă există elemente pe pagină de care nu aveți absolut nevoie sau sunt inutile, selectați o zonă inutilă și ștergeți-o cu o radieră. Este suficient să treci în modul de editare și să lucrezi. Mai mult, cu cât eliminați mai multe elemente inutile, cu atât mai rapid va avea loc procesul de recunoaștere a textului.

Eroare la verificarea și salvarea rezultatelor muncii

După cum am spus deja, erorile pot apărea atunci când utilizați imagini de calitate scăzută, neclare, neclare sau documente cu caractere rare. Prin urmare, verificați întotdeauna documentul după procesul de recunoaștere.

Găsite? Grozav - introduceți doar caracterul dorit. Apropo, programul are un mod de verificare care vă va ajuta rapid și fără participarea dumneavoastră să verificați documentul pentru erori de program. Și imediat după încheierea verificării, puteți importa direct documentul din program (salvați-l într-un format) în Word sau în orice alt program.

tip de copiere

Când salvați un document (în modul de editare), vi se va solicita să îl salvați în trei tipuri de copii. Copie exactă este o copie completă a documentului scanat cu toată formatarea făcută. Dacă mai târziu intenționați să editați textul după scanarea în Word, atunci cel mai bine este să alegeți această opțiune.

Copie editabilă ajută la salvarea textului deja editat. Bun pentru atunci când aveți o mulțime de post-editare de făcut. Text simplu - Ideal pentru cei care doresc să aibă text simplu fără toate celelalte elemente ale paginii.

Asta e tot. Este dificil, lung și plictisitor, dar este mult mai rapid să scanezi și să recunoști textul (chiar și scris de mână) cu un program decât să rescrii manual 100.500 de documente. Ei bine, dacă nici nu aveți timp să faceți acest lucru, contactați serviciul pentru studenți pentru ajutor. Aici vei face rapid, ieftin și eficient tot ce ai nevoie.

Uneori nu există timp pentru a crea un document nou și trebuie să faceți urgent:

  • editați desenul sau diagrama scanat, faceți completări, comentarii la document;
  • introduceți câmpuri pentru a completa imaginea scanată a formularului de document;
  • obțineți doar un document curat, fără pete și fundal foarte murdar.

Pentru a face acest lucru, documentul scanat trebuie mai întâi convertit în alb-negru, dacă este necesar, eliminați deformarea și curățați-l de „gunoi”.
Prevăd întrebarea - de ce să nu activați modul alb-negru când scanați? Este posibil, dar calitatea imaginii rezultate în acest caz va fi cu un ordin de mărime mai mică decât în ​​exemplul considerat.

Există programe specializate în acest scop, precum Spotlight Pro, dar sunt greu de utilizat și necesită o perioadă considerabilă de timp pentru a le stăpâni.

Aș dori să ofer o modalitate mai simplă, dar mai eficientă de procesare a documentelor scanate folosind ABBYY FineReader 9.0 OCR.

Puteți scana un document direct din interfața programului sau puteți introduce o imagine deja scanată pentru procesare.

Pentru claritate și complicare a sarcinii, vom lua o întindere deja scanată a cărții, cu pagini deformate și îngălbenite din când în când. Folosind programul ABBYY FineReader 9.0, vom converti desenul în alb-negru, vom corecta deformarea și îl vom curăța de resturile.

  1. Lansăm programul ABBYY FineReader și în meniu Serviciu, alegeți o comandă Opțiuni.
    În fereastra care se deschide, în filă Scanare/Deschidere, marcați articolul Nu procesați imaginile primite, deoarece nu vom recunoaște text - avem nevoie doar de o imagine. Alegerea opțiunilor Procesarea imaginii:
  2. Acum să ștergem imaginea resturilor - puncte mici. Pentru a face acest lucru, pur și simplu apăsați butonul de 1-3 ori imagine clară, în timp ce monitorizează procesul de îndepărtare a gunoiului. prima apăsare elimină punctele mai mici, iar apăsările ulterioare elimină punctele mai mari.

    Secțiunea desenului înainte de începerea procesului de îndepărtare a resturilor.

    Secțiune a desenului după un singur clic pe buton imagine clară

    Secțiune a desenului după a doua apăsare a butonului imagine clară

  3. Acum, rămâne să curățați imaginea de „petele” mari și zonele întunecate. Puteți face acest lucru cu instrumentul Radieră .
    Principiul de funcționare al acestui instrument diferă de munca instrumentelor similare ale altor editori grafici obișnuiți și, desigur, în bine. În acest caz, nu este nevoie să vă agitați cu pictograma frunză de deasupra imaginii, alegând periodic comanda de anulare după informații utile șterse accidental. Puteți șterge o secțiune a unei imagini în ABBYY FineReader selectând această secțiune.
    Ținând apăsat butonul stâng al mouse-ului, selectați o zonă a imaginii de orice dimensiune și, asigurându-vă că zona selectată include doar elemente destinate ștergerii, eliberați butonul. Zona desemnată a fost curățată.
  4. Examinăm desenul curățat rezultat, iar pe una dintre pagini găsim o mică nuanță. Rândurile de text sunt ușor distorsionate. Dar se dovedește că acest defect de scanare poate fi ușor eliminat. Apăsăm butonul Remediați corupția liniei iar defectul a fost remediat.

    Secțiune de imagine înainte de corectarea distorsiunii liniei

    Secțiune de imagine după corectarea distorsiunii de linie

  5. Asta e tot, imaginea s-a dovedit curată, fără distorsiuni și distorsiuni de linii.

Poate fi imprimat fără a pierde vopsea suplimentară pe pete și murdărie, poate fi trimis prin e-mail unui prieten, fără remușcări pentru o scanare de calitate scăzută și, de asemenea, salvat pentru utilizare ulterioară în oricare dintre formatele acceptate.

Pentru a salva o imagine în meniu Fişier, alegeți o comandă Salveaza imaginea ca.... Alegeți oricare dintre formatele acceptate:
Bitmap, alb-negru (*.bmp; *.dib; *.rle)
Bitmap, gri (*.bmp; *.dib; *.rle)
Bitmap, culoare (*.bmp; *.dib; *.rle)
DCX alb și negru (*.dcx)
DCX Gri (*.dcx)
Culoare DCX (*.dcx)
JBIG2 (*.jb2; *.jbig2)
JPEG 2000 gri (*.jp2; *.j2k)
Culoare JPEG 2000 (*.jp2; *.j2k)
JPEG gri (*.jpg; *.jpeg)
JPEG, culoare (*.jpg; *.jpeg)
PCX Alb-negru (*.pcx)
PCX gri (*.pcx)
Culoare PCX (*.pcx)
PNG, alb-negru (*.png)
PNG, gri (*.png)
PNG, culoare (*.png)
TIFF, alb-negru, necomprimat (*.tif; *.tiff)
TIFF, alb-negru, pachete (*.tif; *.tiff)
TIFF, alb-negru, compresie: ZIP (*.tif; *.tiff)
TIFF, alb-negru, compresie: LZW (*.tif; *.tiff)
TIFF, alb-negru, grupa 4 (*.tif; *.tiff)
TIFF, gri, necomprimat (*.tif; *.tiff)
TIFF, Gri, Pachete (*.tif; *.tiff)
Compresie TIFF gri: JPEG (*.tif; *.tiff)
TIFF, gri, compresie: ZIP (*.tif; *.tiff)
TIFF, gri, compresie: LZW (*.tif; *.tiff)
TIFF, culoare, necomprimat (*.tif; *.tiff)
TIFF, culoare, pachete (*.tif; *.tiff)
TIFF, culoare, compresie: JPEG (*.tif; *.tiff)
TIFF, culoare, compresie: ZIP (*.tif; *.tiff)
TIFF, culoare, compresie: LZW (*.tif; *.tiff)
PDF (*.pdf)


Scanări ale paginilor curățate din „gunoi” și cu distorsiunea corectă a liniilor.

Aș dori să remarc că mulți își convertesc în prezent documentele (desene, diagrame, cărți ...) în formă electronică. Cu o cantitate mare de muncă, este mai convenabil să utilizați o cameră în aceste scopuri. Cu unele modele de scanere și camere care acceptă funcția de recapturare a documentelor, programul ABBYY FineReader este inclus în kit. Atunci când alegeți un instrument pentru conversia documentelor în formă electronică, ar trebui să luați în considerare acest lucru, deoarece FineReader, ținând cont de scopul său principal - recunoașterea optică a textului, nu este un program mai puțin util pentru cei care lucrează cu documente decât un editor de text.

Un scanner este un dispozitiv care recunoaște obiecte, imagini sau documente și le scrie imaginea vizuală într-un fișier grafic care poate fi editat în diferite moduri. Care este scopul acestei operațiuni? Cum se editează un document scanat?

Cuvântul „editare” în acest caz înseamnă:

Editare ca modificare a imaginii

După cum am menționat mai sus, scanerul, procesând un document sau alt obiect, creează ulterior o imagine statică pe baza imaginii sale sub forma unui fișier grafic separat - de exemplu, în format Jpeg. Cele mai frecvente nevoi de editare sunt:

  • reglarea suprafeței (redimensionare, reflectare, rotire cu un număr dat de grade, reglare a echilibrului de culoare);
  • editarea elementelor de imagine (schimbarea aspectului acestora, ștergerea, adăugarea unora noi).

Corectarea suprafeței imaginii primite de la scaner poate fi efectuată folosind cele mai accesibile tipuri de software care sunt instalate implicit în Windows. Care este cel mai simplu program de editare a unui document scanat? Probabil va fi Paint. Opțiuni importante de editare a fișierelor se află în meniul programului, precum și în bara de instrumente a interfeței sale.

Pornirea Paint este foarte ușoară: ar trebui să faceți clic (în Windows până la versiunea 7 inclusiv) „Start”, apoi - „Toate programele” - „Accesorii” - Paint. Apoi, folosind interfața acestui software, deschideți fișierul dorit și faceți ajustările necesare acestuia.

O procedură mai complexă - editarea elementelor de imagine - poate implica cea mai largă gamă de operații posibile: de la aplicarea unor mici retușuri sau litere la o imagine până la îmbinarea acesteia cu un alt fișier grafic sub formă de colaj. În funcție de complexitatea procedurii corespunzătoare, va fi necesar să utilizați unul sau altul tip de software.

Dacă operațiunile cu imaginea sunt simple (de exemplu, cazul se limitează la aplicarea de litere), atunci puteți folosi aceeași vopsea. În bara de instrumente a acestui program, care se află în interfața sa din stânga, trebuie să selectați „Text”. Cu acesta, literele imprimate sunt aplicate imaginii.

Editarea textelor și a altor obiecte de formatare dintr-o imagine

Cum editez documentele scanate cu aceste programe? Aceste soluții funcționează astfel: procesează imaginea, recunosc textul și alte obiecte de formatare prezente pe ea și apoi le pun într-un fișier separat, care, la rândul său, poate fi deschis folosind editori de text - Word, OpenOffice și analogii lor - și editați liber.

Ulterior, puteți plasa textul modificat (tabele, liste) pe aceeași imagine scanată din care a fost recunoscut în forma sa originală. Pentru a efectua această procedură, este necesar să deschideți fișierul grafic corespunzător într-un program de editare - de exemplu, Paint, într-o fereastră, în alta - textul recunoscut și editat (tabele, liste). După ce ați activat a doua fereastră, trebuie să faceți o captură de ecran a textului (un instantaneu al imaginii curente de pe ecranul monitorului) folosind tasta Print Screen Sysrq, apoi să o inserați în Paint (folosind combinația Ctrl și V) și apoi plasați-l pe imaginea scanată după cum este necesar.

O nevoie similară poate apărea, de exemplu, pentru un designer de coperți de reviste care trebuie să editeze textul plasat pe ea și dacă din anumite motive nu are fișierul sursă. El poate recunoaște paragrafele necesare din pagina de hârtie a publicației, le poate face corecturi și apoi le poate re-așeza, deja într-o formă modificată, pe imaginea scanată a paginii.



Ți-a plăcut articolul? Împărtășește-l