Contacts

Nettoyage des documents numérisés des débris, élimination du biais et de la distorsion des lignes. Comment modifier un document numérisé ? Le texte numérisé peut-il être converti pour des corrections ?

Après avoir numérisé le document, vous pouvez ouvrir le document dans Word pour le modifier. La méthode dépend de la version d'Office installée sur votre ordinateur.

Numérisez un document sous forme de fichier PDF et modifiez-le dans Word

Conseils: La conversion fonctionne mieux pour les documents contenant principalement du texte.

    Numérisez le document conformément aux instructions du scanner et enregistrez-le sur votre ordinateur en tant que fichier PDF.

    Dans Word, ouvrez le menu déposer > Ouvert.

    Accédez au dossier du fichier PDF sur votre ordinateur et cliquez sur Ouvert.

    Un message s'affiche indiquant que Word convertit le PDF en un document Word modifiable. Cliquez sur le bouton d'accord.

Il se peut qu'il n'y ait pas une correspondance complète page par page du document converti avec l'original. Par exemple, des sauts de ligne et de page peuvent apparaître ailleurs. Pour plus d'informations, voir Ouverture de fichiers PDF dans Word.

Information additionnelle

L'option Scanner ou Appareil photo pour numériser des documents et des images n'est pas disponible dans Word 2010. À la place, vous pouvez numériser le document à l'aide du scanner et enregistrer le fichier sur votre ordinateur.

Microsoft Office Document Imaging a été supprimé d'Office 2010, mais vous pouvez l'installer sur votre ordinateur à l'aide de l'une des options décrites dans Installer MODI pour une utilisation avec Microsoft Office 2010.

Avant de continuer

    Ouvrez Microsoft Office Document Imaging en recherchant dans le menu Démarrer de Windows.

    au menu Déposer choisis une équipe Ouvert.

    Trouvez le document numérisé et cliquez sur le bouton Ouvert.

    Une fois Microsoft Office Document Imaging démarré, appuyez sur CTRL + A pour sélectionner l'intégralité du document, puis appuyez sur CTRL + C.

    Démarrez Microsoft Word.

    Dans l'onglet Déposer appuie sur le bouton Créer.

    Double-cliquez sur l'élément nouveau document.

    Appuyez sur CTRL + V pour coller le contenu du document numérisé dans un nouveau fichier.

L'option Scanner ou Appareil photo pour numériser des documents et des images n'est pas disponible dans Microsoft Office Word 2007. À la place, vous pouvez numériser le document à l'aide du scanner et enregistrer le fichier sur votre ordinateur.

Étape 1 : installer Microsoft Office Document Imaging

    Quittez tous les programmes.

    Conseils: Nous vous recommandons d'imprimer cette section avant de quitter tous les programmes.

    Ouvrez le Panneau de configuration : faites un clic droit sur le bouton Démarrer de Windows et sélectionnez Panneau de commande ou tapez dans les fenêtres du champ de recherche élément du panneau de commande .

    Sur le panneaux de contrôle Cliquez sur Programmes, puis - Programmes et fonctionnalités.

    Faites un clic droit sur le nom de la version installée de Microsoft Office ou faites un clic droit Microsoft Office Word 2007(selon que Word est installé dans le cadre d'Office ou en tant que programme autonome), puis cliquez sur monnaie.

    Veuillez sélectionner Ajouter ou supprimer des composants puis cliquez sur Continuez.

    Au chapitre Possibilités d'installation cliquez sur le signe plus (+) à côté du composant Outils bureautiques.

    Cliquez sur la flèche à côté du composant Imagerie de documents Microsoft Office, sélectionnez une option Tout exécuter depuis mon ordinateur puis cliquez sur Continuez.

Étape 2 : créez un document qui peut être modifié.

Scannez votre document en suivant les instructions de votre scanner.

Avant de continuer Convertissez le fichier généré par le scanner au format TIFF. Vous pouvez convertir le fichier à l'aide de Paint ou d'un autre programme.

Vous avez maintenant un document que vous pouvez modifier. N'oubliez pas d'enregistrer le nouveau fichier afin de ne pas perdre vos modifications.

Est-il possible de changer le texte scanné ? Puis-je modifier le texte numérisé afin de pouvoir l'utiliser ultérieurement à d'autres fins ? Oui, chers amis ! Aujourd'hui, c'est non seulement possible, mais aussi assez facile à faire.

S'il y a un besoin, une envie, ainsi que quelques capacités techniques, ce sera facile pour vous :

  • numérisation de texte manuscrit (par exemple, un synopsis),
  • numériser du texte à partir d'une photo ou d'une image,
  • édition,
  • OCR après numérisation,
  • convertir du texte sous forme d'image en texte brut, dans lequel vous pouvez modifier le texte numérisé (par exemple, dans un document pdf) d'un document, etc.

En général, aujourd'hui, vous pouvez faire la même chose avec le texte de l'image qu'avec le texte ordinaire d'un document Word. Et cela est d'une importance vitale et utile pour ceux qui traitent constamment de nombreux documents et passent beaucoup de temps - c'est-à-dire aussi pour les étudiants. Voyons comment c'est fait.

Quelle est la différence entre la numérisation et la reconnaissance ?

Il s'est avéré que la numérisation et la reconnaissance de texte sont deux choses différentes. La numérisation des feuilles d'un document est sa traduction du texte sous forme électronique. Cela se fait via un scanner ou en utilisant la photographie conventionnelle sur un smartphone ou un appareil photo numérique.

La reconnaissance est la conversion d'un document numérisé (texte) sous forme électronique.

D'ailleurs! Pour nos lecteurs, il y a maintenant une remise de 10% sur tout type de travail

De quoi avons-nous besoin pour numériser et reconnaître le texte d'une photo ?

Pour la numérisation et la reconnaissance de texte, nous ne pouvons pas nous passer de quelques éléments :

  1. Scanner... En effet, le rôle d'un scanner peut être assuré non seulement par ce type d'équipement, mais également par une caméra (dans un smartphone par exemple). Si vous utilisez un scanner, assurez-vous que votre ordinateur dispose des pilotes système et des logiciels nécessaires à son bon fonctionnement. S'il n'y a pas de scanner, mais que vous allez en acheter un, faites attention à la vitesse de traitement d'une feuille. Certains appareils traitent une feuille en 10 secondes, d'autres en auront besoin de 30 ou plus pour cela. Et si vous devez travailler avec des matériaux volumineux de 300 à 400 feuilles, ce facteur est important.
  2. Logiciel OCR ou services en ligne... Nous avons déjà écrit un article sur les services qui aident à reconnaître du texte après avoir numérisé un document via un scanner. Mais maintenant, nous aimerions vous recommander ABBYY FineReader. Malgré le fait qu'il soit payant, sa fonctionnalité est vraiment impressionnante. Et si vous travaillez avec d'énormes volumes de documents, elle deviendra votre assistante irremplaçable. Cependant, il existe également son formulaire analogique gratuit Cunei, qui fait un excellent travail de numérisation et de reconnaissance de texte en ligne. Certes, sa fonctionnalité est très limitée par rapport au frère précédent.
  3. Documents à numériser... Les étudiants doivent souvent numériser un document sous forme de magazines, d'articles, de livres, de synopsis, d'imprimés, à partir desquels ils doivent souvent copier le texte. Et juste comme ça, sous forme de conseils - avant de commencer la numérisation, essayez de rechercher ces documents sur le net. Si vous avez déjà utilisé ces matériaux auparavant, il y a de fortes chances que la personne aimable ait déjà fait tout le travail pour vous. Atk qu'il vous suffit de copier le texte du document numérisé terminé et de commencer à éditer le texte après la numérisation.

Options de numérisation de texte

Ainsi, le scanner a été acheté, les documents ont été préparés, les programmes ont été installés. Et après? Ensuite, nous devrons effectuer les réglages nécessaires, qui contribuent également parfois à faciliter considérablement la tâche, par exemple, reconnaître le texte numérisé dans un certain format, éditer le texte après la numérisation dans un certain mode, etc.

En général, la qualité et la rapidité de votre travail dépendront des paramètres. Alors réglons ça ensemble.

Qualité PPP

C'est la résolution de l'image qui sera importante lors de l'édition de texte dans le document numérisé. Réglez la qualité dans les paramètres sur au moins 300 DPI, et si possible, plus. Plus cette valeur est élevée, plus l'image sera claire après la numérisation.

Et la vitesse de traitement dépendra de la clarté. C'est-à-dire que pour corriger ou modifier le texte numérisé, le texte de la feuille numérisée sera plus rapide et le programme fera également moins d'erreurs (oui, les programmes se trompent également, mais tout d'abord).

Chromaticité

Grâce à ce paramètre, vous pouvez influencer la vitesse de numérisation du texte. En règle générale, les scanners ont 3 modes : noir et blanc (convient pour les feuilles avec du texte imprimé ordinaire), gris (convient pour travailler avec des documents avec des tableaux et des images simples), couleur (pour les magazines, livres et autres documents où la couleur compte ). Moins il y a de couleur, plus le document peut être traité rapidement.

photo

Comme nous l'avons déjà dit, pour numériser, vous pouvez utiliser non seulement un scanner, mais également photographier. Mais faites attention ici - tout flou, flou et autres distorsions d'image peuvent affecter la reconnaissance et l'édition ultérieures du texte dans le document numérisé.

Reconnaissance

Nous avons donc scanné et reçu les pages sous forme électronique. Ensuite, nous ouvrons un programme OCR (par exemple, FineReader) et commençons à reconnaître le texte. Certains programmes (y compris le nôtre) font ce processus avec des erreurs. Ensuite, la zone avec une erreur devra être sélectionnée manuellement.

Travailler avec du texte

Dans la zone Texte, vous pouvez sélectionner du texte. Tous les tableaux et images peuvent être supprimés. Mais pour travailler avec des symboles inhabituels et rares, vous devrez travailler avec des stylos. Voici à quoi cela ressemble dans le programme :

Images

Cette zone du programme est utilisée pour travailler avec des images et des zones de texte difficiles à reconnaître.

les tables

Le bouton de mise en surbrillance du tableau vous aide à travailler avec des tableaux. Cependant, cette fonctionnalité n'est pas bien développée. Parfois, il est plus facile d'utiliser l'éditeur d'images pour travailler avec des tableaux. Cela vous fera gagner beaucoup de temps et de nerfs, et vous pourrez tout affiner plus tard dans un Word ordinaire.

Éléments supplémentaires

S'il y a des éléments sur la page dont vous n'avez absolument pas besoin ou qui sont inutiles, sélectionnez la zone inutile et supprimez-la avec la gomme. Il suffit de passer en mode édition et d'effectuer le travail. De plus, plus vous supprimez d'éléments inutiles, plus le processus de reconnaissance de texte sera rapide.

Vérification des erreurs et enregistrement des résultats de travail

Comme nous l'avons dit précédemment, des erreurs peuvent se produire lorsque vous utilisez des images ou des documents de mauvaise qualité, flous, flous et comportant des caractères rares. Par conséquent, vérifiez toujours le document après le processus de reconnaissance.

Vous l'avez trouvé ? Super - il suffit d'entrer le caractère que vous voulez. Soit dit en passant, le programme dispose d'un mode de vérification qui vous aidera rapidement et sans votre participation à vérifier le document pour les erreurs de programme. Et immédiatement après la fin de la vérification, vous pouvez importer directement le document du programme (le sauvegarder au format) dans un Word ou tout autre programme.

Type de copie

Lors de l'enregistrement d'un document (en mode édition), vous serez invité à l'enregistrer en trois types de copies. Copie exacte- Il s'agit d'une copie complète du document numérisé avec tout le formatage effectué. Si vous envisagez ensuite de modifier le texte après la numérisation dans Word, il est préférable de choisir cette option.

Copie modifiable aide à enregistrer le texte déjà édité. Bien si vous avez beaucoup de post-édition à faire. Texte brut - Idéal pour ceux qui veulent se retrouver avec du texte brut sans tous les autres éléments de la page.

C'est tout, en fait. C'est difficile, long et fastidieux, mais il est beaucoup plus rapide de numériser et de reconnaître du texte (même manuscrit) avec un programme que de réécrire 100 500 documents à la main. Eh bien, si vous n'avez pas le temps de le faire non plus, contactez le service aux étudiants pour obtenir de l'aide. Ici, vous exécuterez rapidement, à moindre coût et efficacement tout ce dont vous avez besoin.

Parfois, vous n'avez pas le temps de créer un nouveau document et vous devez de toute urgence :

  • modifier le dessin ou le diagramme numérisé, ajouter des ajouts, des commentaires au document ;
  • insérer des champs à remplir dans le dessin numérisé du formulaire de document ;
  • obtenez simplement un document propre sans taches ni arrière-plan sale inutile.

Pour ce faire, le document numérisé doit d'abord être converti en noir et blanc, si nécessaire, supprimer le biais, et nettoyé des "ordures".
Je prévois une question - pourquoi ne pas activer le mode noir et blanc lors de la numérisation ? C'est possible, mais la qualité de l'image résultante sera dans ce cas d'un ordre de grandeur inférieur à celui de l'exemple considéré.

Il existe des programmes spécialisés à cet effet, comme Spotlight Pro, mais ils sont difficiles à utiliser et longs à maîtriser.

Je souhaite offrir une option plus simple mais plus efficace pour le traitement des documents numérisés à l'aide d'ABBYY FineReader 9.0 OCR.

Vous pouvez numériser un document directement à partir de l'interface du programme ou insérer une image déjà numérisée pour le traitement.

Pour plus de clarté et de complication de la tâche, nous prendrons une copie déjà numérisée du livre, avec des pages de travers et des pages qui ont jauni de temps en temps. À l'aide d'ABBYY FineReader 9.0, nous allons convertir l'image en noir et blanc, corriger l'inclinaison et la nettoyer des débris.

  1. Lancez ABBYY FineReader et dans le menu Un service, choisissez l'équipe Options.
    Dans la fenêtre qui s'ouvre, dans l'onglet Numériser / Ouvrir, cochez l'élément Ne pas traiter les images reçues, puisque nous ne reconnaîtrons pas le texte - nous n'avons besoin que d'une image. Choix des paramètres Traitement d'image:
  2. Débarrassons maintenant l'image des débris - de petits points. Pour ce faire, appuyez simplement sur le bouton 1 à 3 fois Image claire, tout en observant le processus d'enlèvement des ordures. la première pression supprime les points plus petits et la pression suivante supprime les plus gros.

    La zone du dessin avant le début du processus de nettoyage des débris.

    Coupe du dessin après avoir appuyé une fois sur le bouton Image claire

    Coupe du dessin après la deuxième pression sur le bouton Image claire

  3. Maintenant, il reste à effacer l'image des grandes "taches" et des zones sombres. Cela peut être fait à l'aide de l'outil La gomme .
    Le principe de fonctionnement de cet outil diffère du travail d'outils similaires d'autres éditeurs graphiques courants, et bien sûr pour le mieux. Dans ce cas, il n'est pas nécessaire de "remuer" l'icône de feuille sur l'image, en sélectionnant périodiquement la commande d'annulation, après avoir involontairement effacé des informations utiles. Vous pouvez effacer une section d'une image dans ABBYY FineReader en sélectionnant cette section.
    Tout en maintenant le bouton gauche de la souris enfoncé, sélectionnez une section de l'image de n'importe quelle taille, et après vous être assuré que seuls les éléments destinés à être supprimés sont inclus dans la section sélectionnée, relâchez le bouton. La zone en surbrillance a été effacée.
  4. Nous examinons le dessin nettoyé résultant et sur l'une des pages, nous trouvons une petite nuance. Les lignes de texte sont légèrement déformées. Mais il s'avère que ce défaut de numérisation peut être facilement éliminé. Appuyez sur le bouton Corriger les chaînes déformées, et le défaut a été corrigé.

    Une partie de l'image avant de corriger la distorsion de ligne

    Coupe de l'image après correction de la distorsion de la ligne

  5. C'est tout, le résultat est une image nette, sans distorsions ni distorsion des lignes.

Il peut être imprimé sans gaspiller l'excès de peinture sur les taches et la saleté, envoyé par e-mail à un ami, sans remords pour une numérisation de mauvaise qualité, ainsi qu'enregistré pour une utilisation future dans l'un des formats pris en charge.

Pour enregistrer une image dans le menu Déposer, choisissez l'équipe Enregistrer l'image sous ...... Choisissez l'un des formats pris en charge :
Bitmap noir et blanc (* .bmp; * .dib; * .rle)
Bitmap, gris (* .bmp; * .dib; * .rle)
Couleur bitmap (* .bmp; * .dib; * .rle)
DCX noir et blanc (* .dcx)
Gris DCX (* .dcx)
Couleur DCX (* .dcx)
JBIG2 (* .jb2; * .jbig2)
JPEG 2000 gris (* .jp2; * .j2k)
Couleur JPEG 2000 (* .jp2; * .j2k)
JPEG Gris (* .jpg; * .jpeg)
Couleur JPEG (* .jpg; * .jpeg)
PCX noir et blanc (* .pcx)
Gris PCX (* .pcx)
Couleur PCX (* .pcx)
PNG, noir et blanc (* .png)
PNG, gris (* .png)
PNG, couleur (* .png)
TIFF, noir et blanc, non compressé (* .tif; * .tiff)
TIFF, noir et blanc, packbits (* .tif; * .tiff)
TIFF, noir et blanc, compression : ZIP (* .tif; * .tiff)
TIFF, noir et blanc, compression : LZW (* .tif; * .tiff)
TIFF, noir et blanc, Groupe4 (* .tif; * .tiff)
TIFF, gris, non compressé (* .tif; * .tiff)
TIFF Gray Packbits (* .tif; * .tiff)
TIFF, Gris, Compression : JPEG (* .tif; * .tiff)
TIFF, gris, compression : ZIP (* .tif; * .tiff)
TIFF, gris, compression : LZW (* .tif; * .tiff)
TIFF, couleur, non compressé (* .tif; * .tiff)
Packbits de couleurs TIFF (* .tif; * .tiff)
TIFF, couleur, compression : JPEG (* .tif; * .tiff)
TIFF, couleur, compression : ZIP (* .tif; * .tiff)
TIFF, couleur, compression : LZW (* .tif; * .tiff)
PDF (* .pdf)


Scans de pages nettoyés des "poubelles" et avec correction de la distorsion des lignes.

Je voudrais noter que beaucoup traduisent actuellement leurs documents (dessins, schémas, livres...) sous forme électronique. Avec une grande quantité de travail, il est plus pratique d'utiliser un appareil photo à ces fins. Avec certains modèles de scanners et d'appareils photo prenant en charge la fonction de capture de documents, ABBYY FineReader est inclus dans le package. Lors du choix d'un outil de conversion de documents sous forme électronique, vous devez en tenir compte, car FineReader, compte tenu de son objectif principal - la reconnaissance optique de caractères, n'est pas un programme moins utile pour ceux qui travaillent avec des documents qu'un éditeur de texte.

Un scanner est un appareil qui reconnaît des objets, des images ou des documents et écrit leur image visuelle dans un fichier graphique qui peut être modifié de diverses manières. Dans quel but cette opération est-elle habituellement effectuée ? Comment modifier un document numérisé ?

Dans ce cas, le mot « édition » doit être compris comme suit :

Édition en tant que modification d'image

Comme nous l'avons noté ci-dessus, le scanner, lors du traitement d'un document ou d'un autre objet, crée ensuite une image statique basée sur son image sous la forme d'un fichier graphique séparé - par exemple, au format Jpeg. Le plus souvent, les besoins d'édition sont les suivants :

  • ajustements de surface (redimensionnement, retournement, rotation d'un nombre spécifié de degrés, ajustement de la balance des couleurs);
  • édition d'éléments d'image (modification de leur apparence, suppression, ajout de nouveaux).

La correction superficielle de l'image reçue du scanner peut être effectuée à l'aide des types de logiciels les plus accessibles installés par défaut sous Windows. Quel est le programme le plus simple pour éditer un document numérisé ? Ce sera probablement Paint. Des options importantes pour éditer un fichier se trouvent dans le menu du programme, ainsi que sur la barre d'outils de son interface.

Le démarrage de Paint est très simple : il faut cliquer (sous Windows jusqu'à la version 7 incluse) "Démarrer", puis - "Tous les programmes" - "Standard" - Paint. Ensuite, à l'aide de l'interface de ce logiciel, ouvrez le fichier souhaité et effectuez les ajustements nécessaires.

Une procédure plus complexe - l'édition d'éléments d'image - peut impliquer le plus large éventail d'opérations possibles : de l'application d'une petite retouche ou de lettres à une image jusqu'à sa fusion avec un autre fichier graphique sous la forme d'un collage. Selon la complexité de la procédure correspondante, il sera nécessaire d'utiliser l'un ou l'autre type de logiciel.

Si les opérations avec l'image sont simples (par exemple, le problème se limite à dessiner des lettres dessus), alors vous pouvez utiliser le même Paint. Dans la barre d'outils de ce programme, qui se trouve dans son interface à gauche, vous devez sélectionner "Texte". Avec lui, des lettres imprimées sont appliquées à l'image.

Modification du texte et d'autres objets de mise en forme dans l'image

Comment modifier des documents numérisés à l'aide des programmes spécifiés ? Ces solutions fonctionnent comme suit : elles traitent une image, reconnaissent le texte et les autres objets de mise en forme qui s'y trouvent, puis les saisissent dans un fichier séparé, qui, à son tour, peut être ouvert à l'aide d'éditeurs de texte - Word, OpenOffice et leurs analogues - et éditer librement.

Par la suite, vous pouvez placer le texte modifié (tableaux, listes) sur la même image numérisée à partir de laquelle il a été reconnu à l'origine. Pour effectuer cette procédure, il est nécessaire d'ouvrir le fichier graphique correspondant dans un programme d'édition - par exemple Paint, dans une fenêtre, dans l'autre - le texte reconnu et édité (tableaux, listes). Après avoir activé la deuxième fenêtre, vous devez prendre une capture d'écran du texte (une capture d'écran de l'image actuelle sur l'écran du moniteur) à l'aide de la touche Print Screen Sysrq, puis la coller dans Paint (en utilisant la combinaison Ctrl et V), et puis placez-le sur l'image numérisée comme requis ...

Un besoin similaire peut survenir, par exemple, pour un concepteur de couverture de magazine qui doit éditer le texte placé dessus, et si pour une raison quelconque il n'a pas le fichier source. Il peut reconnaître les paragraphes nécessaires de la page papier de la publication, les modifier, puis les replacer, déjà sous une forme modifiée, sur l'image scannée de la page.



Vous avez aimé l'article ? Partagez-le