Limpieza de documentos escaneados de residuos, eliminando sesgos y distorsiones de línea. ¿Cómo editar un documento escaneado? ¿Se puede convertir el texto escaneado para correcciones?

Después de escanear un documento, puede abrirlo en Word para editarlo. El método depende de qué versión de Office esté instalada en su computadora.

Escanea un documento como archivo PDF y edítalo en Word

Consejo: La conversión es mejor para documentos que son en su mayoría texto.

Escanee el documento de acuerdo con las instrucciones del escáner y guárdelo en su computadora como un archivo PDF.

En Word, abre el menú. expediente > Abierto.

Busque la carpeta del archivo PDF en su computadora y haga clic en el botón Abierto.

Aparecerá un mensaje que indica que Word está convirtiendo el archivo PDF en un documento de Word editable. Clic en el botón OK.

Es posible que no haya una coincidencia completa página por página entre el documento convertido y el original. Por ejemplo, los saltos de línea y de página pueden estar en otros lugares. Para obtener más información, consulte Abrir archivos PDF en Word.

información adicional

La opción "desde el escáner o la cámara" para escanear documentos e imágenes no está disponible en Word 2010. En su lugar, puede escanear su documento con un escáner y guardar el archivo en su computadora.

Microsoft Office Document Imaging se eliminó de Office 2010, pero puede instalarlo en su computadora usando una de las opciones descritas en Instalar la aplicación MODI para usar con Microsoft Office 2010.

Antes de continuar

Abra Imágenes de documentos de Microsoft Office buscando en el menú Inicio de Windows.

En el menú Expediente selecciona un equipo Abierto.

Busque el documento escaneado y haga clic en el botón Abierto.

Después de iniciar Imágenes de documentos de Microsoft Office, presione CTRL+A para seleccionar todo el documento y luego presione CTRL+C.

Inicie Microsoft Word.

en la pestaña Expediente presiona el botón Crear.

Haga doble clic en un elemento nuevo documento.

Presione CTRL+V para pegar el contenido del documento escaneado en un nuevo archivo.

La opción "desde el escáner o la cámara" para escanear documentos e imágenes no está disponible en Microsoft Office Word 2007. En su lugar, puede escanear un documento con un escáner y guardar el archivo en su computadora.

Paso 1: Instale las imágenes de documentos de Microsoft Office

Cierra todos los programas.

Consejo: Le recomendamos que imprima esta sección antes de salir de todos los programas.

Abra el Panel de control: haga clic con el botón derecho en el botón Inicio de Windows y seleccione Panel de control o escriba en el cuadro de búsqueda de Windows elemento del panel de control .

Sobre el paneles de control hacer clic Programas, y luego - Programas y características.

Haga clic con el botón derecho en el nombre de la versión instalada de Microsoft Office o haga clic con el botón derecho en Microsoft Office Word 2007(dependiendo de si Word está instalado como parte de Office o como un programa independiente) y luego haga clic en cambiar.

Seleccione Agregar o quitar componentes y luego haga clic en el botón Continuar.

En la sección Opciones de instalación haga clic en el signo más (+) junto al componente Herramientas de oficina.

Haga clic en la flecha junto al componente Imágenes de documentos de Microsoft Office, Seleccione una opción Ejecutar todo desde mi computadora y luego haga clic en el botón Continuar.

Paso 2: Cree un documento que se pueda modificar.

Escanee el documento siguiendo las instrucciones del escáner.

Antes de continuar Convierta el archivo creado por el escáner a formato TIFF. Puede convertir el archivo con Paint u otro programa.

Ahora tiene un documento que puede editar. No olvide guardar el nuevo archivo para no perder los cambios.

¿Es posible cambiar el texto escaneado? ¿Puedo editar el texto escaneado para poder usarlo para otros fines más adelante? ¡Sí, queridos amigos! Hoy en día no sólo es posible, sino bastante fácil de hacer.

Si tiene la necesidad, el deseo y algunas capacidades técnicas, le resultará fácil:

escaneo de texto escrito a mano (por ejemplo, resumen),
escanear texto de una foto o imagen,
edición,
reconocimiento de texto después de escanear,
convertir texto en forma de imagen a texto sin formato, en el que puede cambiar el texto escaneado (por ejemplo, en un documento pdf) de un documento, etc.

En general, hoy en día se puede hacer lo mismo con el texto de una imagen que con el texto normal de un documento de Word. Y hacer esto es vital y útil para aquellos que se ocupan constantemente de una gran cantidad de documentación y pasan mucho tiempo, es decir, también para los estudiantes. Vamos a averiguar cómo se hace.

¿Cuál es la diferencia entre escaneo y reconocimiento?

Al final resultó que, el escaneo y el reconocimiento de texto son dos cosas diferentes. Escanear hojas de un documento es su traducción de texto a formato electrónico. Esto se hace a través de un escáner o usando fotografía convencional en un teléfono inteligente o cámara digital.

El reconocimiento es la transformación de un documento escaneado (texto) en un formato electrónico.

¡Por cierto! Para nuestros lectores ahora hay un 10% de descuento en cualquier tipo de trabajo

¿Qué necesitamos para escanear y reconocer el texto de una foto?

Para escanear y reconocer texto, no podemos prescindir de algunas cosas:

Escáner. En realidad, el papel de un escáner puede ser realizado no solo por este tipo de equipo, sino también por una cámara (en un teléfono inteligente, por ejemplo). Si está utilizando un escáner, asegúrese de que su computadora tenga los controladores del sistema y los programas necesarios para su funcionamiento completo. Si no tienes un escáner, pero vas a comprar uno, presta atención a la velocidad de procesamiento por hoja. Algunos dispositivos procesan una hoja en 10 segundos, otros necesitarán 30 o más. Y si tiene que trabajar con materiales a granel de 300-400 hojas, entonces este factor importa.
Programas de reconocimiento de texto o servicios en línea. Ya hemos escrito un artículo sobre servicios que ayudan a reconocer texto después de escanear un documento a través de un escáner. Pero ahora nos gustaría recomendarle ABBYY FineReader. A pesar de que es de pago, su funcionalidad es realmente impresionante. Y si trabaja con grandes volúmenes de documentos, se convertirá en su asistente indispensable. Sin embargo, también existe su contraparte gratuita Cunei Form, que hace un excelente trabajo de escaneo y OCR en línea. Es cierto que su funcionalidad es muy limitada en comparación con la contraparte anterior.
Documentos para escanear. Los estudiantes a menudo tienen que lidiar con el escaneo de un documento en forma de revistas, artículos, libros, resúmenes, impresiones, de donde a menudo es necesario copiar el texto más tarde. Y así, en forma de consejo: antes de comenzar a escanear, intente buscar estos documentos en la red. Si ya ha utilizado estos materiales antes que usted, existe una gran posibilidad de que una persona amable ya haya hecho todo el trabajo por usted. Atk, todo lo que tiene que hacer es copiar el texto del documento escaneado terminado y editar el texto después de escanearlo.

Opciones de escaneo de texto

Así que compramos el escáner, preparamos los documentos, instalamos los programas. ¿Que sigue? A continuación, deberemos realizar las configuraciones necesarias, que también a veces ayudan a facilitar mucho la tarea, por ejemplo, para reconocer el texto escaneado en un formato determinado, editar el texto después de escanear en un modo determinado, etc.

En general, la calidad y la velocidad de su trabajo dependerán de la configuración. Entonces, resolvámoslo juntos.

calidad de ppp

Esta es la resolución de imagen que será importante al editar texto en el documento escaneado. Establezca la calidad en la configuración en al menos 300 DPI y, si es posible, más. Cuanto mayor sea este valor, más clara será la imagen después de escanear.

Y la velocidad de procesamiento dependerá de la claridad. Es decir, corrija o cambie el texto escaneado, el texto de la hoja escaneada será más rápido y el programa cometerá menos errores (sí, los programas también cometen errores, pero lo primero es lo primero).

croma

Gracias a este parámetro, puede influir en la velocidad de escaneo de texto. Como regla general, los escáneres tienen 3 modos: blanco y negro (adecuado para hojas con texto impreso sin formato), gris (adecuado para trabajar con documentos con tablas e imágenes simples), color (para revistas, libros y otros documentos donde el color es importante). ). Cuanto más pequeño sea el color, más rápida será la velocidad de procesamiento del documento.

Una fotografía

Como hemos dicho, para escanear, puede usar no solo un escáner, sino también fotografiar. Pero tenga cuidado aquí: cualquier desenfoque, borrosidad y otras distorsiones de la imagen pueden afectar el posterior reconocimiento y edición del texto en el documento escaneado.

Reconocimiento

Entonces, escaneamos y recibimos las páginas en formato electrónico. Luego abrimos el programa de reconocimiento (por ejemplo, FineReader) y empezamos a reconocer el texto. Algunos programas (incluido el nuestro) realizan este proceso con errores. Luego, el área con el error deberá seleccionarse manualmente.

trabajar con texto

Puede seleccionar texto en el área Texto. Se pueden eliminar todas las tablas e imágenes. Pero para trabajar con símbolos inusuales y raros, deberá trabajar con bolígrafos. Así es como se ve en el programa:

Imágenes

Esta área del programa se utiliza para trabajar con imágenes y con aquellas áreas de texto que son difíciles de reconocer.

mesas

El botón de selección de tablas le ayuda a trabajar con tablas. Sin embargo, esta característica no está bien desarrollada. A veces es más fácil usar el editor de imágenes para trabajar con tablas. Esto ahorrará mucho tiempo y nervios, y luego podrá finalizar todo en un Word normal.

Elementos adicionales

Si hay elementos en la página que absolutamente no necesita o son inútiles, seleccione un área innecesaria y elimínela con un borrador. Basta con cambiar al modo de edición y trabajar. Además, cuantos más elementos innecesarios elimine, más rápido ocurrirá el proceso de reconocimiento de texto.

Comprobación de errores y guardado de resultados de trabajo

Como ya hemos dicho, los errores pueden ocurrir cuando utiliza imágenes borrosas, borrosas o de baja calidad o documentos con caracteres raros. Por lo tanto, siempre verifique el documento después del proceso de reconocimiento.

¿Fundar? Genial, simplemente ingrese el carácter deseado. Por cierto, el programa tiene un modo de verificación que lo ayudará rápidamente y sin su participación a verificar el documento en busca de errores del programa. E inmediatamente después del final de la verificación, puede importar directamente el documento del programa (guardarlo en un formato) a Word o cualquier otro programa.

tipo de copia

Cuando guarde un documento (en modo de edición), se le pedirá que lo guarde en tres tipos de copias. Copia exacta es una copia completa del documento escaneado con todo el formato realizado. Si luego planea editar el texto después de escanear en Word, entonces es mejor elegir esta opción.

Copia editable ayuda a guardar el texto ya editado. Es bueno para cuando tienes que hacer muchas posedición. Texto sin formato: ideal para aquellos que desean terminar con texto sin formato sin todos los demás elementos de la página.

Eso es todo. Es difícil, largo y tedioso, pero es mucho más rápido escanear y reconocer texto (incluso escrito a mano) con un programa que reescribir 100.500 documentos manualmente. Bueno, si tampoco tienes tiempo para hacer esto, comunícate con el servicio de estudiantes para obtener ayuda. Aquí harás todo lo que necesites de forma rápida, económica y eficiente.

A veces no hay tiempo para crear un nuevo documento y necesita urgentemente:

editar el dibujo o diagrama escaneado, hacer adiciones, comentarios al documento;
insertar campos para completar la imagen escaneada del formulario del documento;
solo obtenga un documento limpio sin manchas y un fondo extra sucio.

Para hacer esto, primero se debe convertir el documento escaneado a blanco y negro, si es necesario, eliminar la deformación y limpiarlo de "basura".
Preveo la pregunta: ¿por qué no activar el modo en blanco y negro al escanear? Es posible, pero la calidad de la imagen resultante en este caso será un orden de magnitud menor que en el ejemplo considerado.

Existen programas especializados para este propósito, como Spotlight Pro, pero son difíciles de usar y requieren una cantidad considerable de tiempo para dominarlos.

Me gustaría ofrecer una forma más simple pero más eficiente de procesar documentos escaneados usando ABBYY FineReader 9.0 OCR.

Puede escanear un documento directamente desde la interfaz del programa o insertar una imagen ya escaneada para su procesamiento.

Para mayor claridad y complicación de la tarea, tomaremos una extensión del libro ya escaneada, con páginas torcidas y amarillentas de vez en cuando. Usando el programa ABBYY FineReader 9.0, convertiremos el dibujo a blanco y negro, corregiremos la inclinación y lo limpiaremos de escombros.

Lanzamos el programa ABBYY FineReader y en el menú Servicio, elige un comando Opciones.
En la ventana que se abre, en la pestaña Escanear/Abrir, marca el artículo No procesar las imágenes recibidas, ya que no reconoceremos texto, solo necesitamos una imagen. Elegir opciones Procesamiento de imágenes:
Ahora eliminemos la imagen de escombros: pequeños puntos. Para hacer esto, simplemente presione el botón 1-3 veces imagen clara, mientras supervisa el proceso de eliminación de basura. la primera pulsación elimina los puntos más pequeños y las pulsaciones posteriores eliminan los puntos más grandes.
La sección del dibujo antes de que comenzara el proceso de eliminación de escombros.

Sección del dibujo después de un solo clic en el botón imagen clara

Sección del dibujo después de la segunda pulsación del botón imagen clara
Ahora, queda por limpiar la imagen de grandes "manchas" y áreas oscuras. Puedes hacerlo con la herramienta Goma .
El principio de funcionamiento de esta herramienta difiere del trabajo de herramientas similares de otros editores gráficos comunes y, por supuesto, para mejor. En este caso, no es necesario jugar con el ícono de la hoja sobre la imagen, seleccionando periódicamente el comando de cancelación después de borrar información útil accidentalmente. Puede borrar una sección de una imagen en ABBYY FineReader seleccionando esta sección.
Manteniendo presionado el botón izquierdo del mouse, seleccione un área de la imagen de cualquier tamaño y, asegurándose de que el área seleccionada incluya solo elementos destinados a eliminarse, suelte el botón. El área designada ha sido despejada.
Examinamos el dibujo limpio resultante, y en una de las páginas encontramos un pequeño matiz. Las líneas de texto están ligeramente distorsionadas. Pero resulta que este defecto de escaneo se puede eliminar fácilmente. Presionamos el botón Arreglar corrupción de línea y el defecto ha sido arreglado.
Sección de imagen antes de la corrección de distorsión de línea

Sección de imagen después de la corrección de distorsión de línea
Eso es todo, la imagen resultó limpia, sin distorsiones ni distorsiones de líneas.

Puede imprimirse sin desperdiciar pintura extra en manchas y suciedad, enviarse por correo electrónico a un amigo, sin remordimientos por un escaneo de baja calidad, y también guardarse para uso futuro en cualquiera de los formatos admitidos.

Para guardar una imagen en el menú Expediente, elige un comando Guardar imagen como.... Elija cualquiera de los formatos admitidos:
Mapa de bits, blanco y negro (*.bmp; *.dib; *.rle)
Mapa de bits, gris (*.bmp; *.dib; *.rle)
Mapa de bits, color (*.bmp; *.dib; *.rle)
DCX en blanco y negro (*.dcx)
Gris DCX (*.dcx)
Color DCX (*.dcx)
JBIG2 (*.jb2; *.jbig2)
JPEG 2000 gris (*.jp2; *.j2k)
JPEG 2000 color (*.jp2; *.j2k)
JPEG gris (*.jpg; *.jpeg)
JPEG, color (*.jpg; *.jpeg)
PCX en blanco y negro (*.pcx)
PCX gris (*.pcx)
Color PCX (*.pcx)
PNG, blanco y negro (*.png)
PNG, gris (*.png)
PNG, color (*.png)
TIFF, blanco y negro, sin comprimir (*.tif; *.tiff)
TIFF, blanco y negro, paquetes (*.tif; *.tiff)
TIFF, blanco y negro, compresión: ZIP (*.tif; *.tiff)
TIFF, blanco y negro, compresión: LZW (*.tif; *.tiff)
TIFF, B y N, Grupo 4 (*.tif; *.tiff)
TIFF, gris, sin comprimir (*.tif; *.tiff)
TIFF, gris, paquetes (*.tif; *.tiff)
Compresión de grises TIFF: JPEG (*.tif; *.tiff)
TIFF, gris, compresión: ZIP (*.tif; *.tiff)
TIFF, gris, compresión: LZW (*.tif; *.tiff)
TIFF, color, sin comprimir (*.tif; *.tiff)
TIFF, color, paquetes (*.tif; *.tiff)
TIFF, color, compresión: JPEG (*.tif; *.tiff)
TIFF, color, compresión: ZIP (*.tif; *.tiff)
TIFF, color, compresión: LZW (*.tif; *.tiff)
PDF (*.pdf)

Escaneos de página limpios de "basura" y con distorsión de línea corregida.

Me gustaría señalar que muchos están convirtiendo actualmente sus documentos (dibujos, diagramas, libros...) en formato electrónico. Con una gran cantidad de trabajo, es más conveniente usar una cámara para estos fines. Con algunos modelos de escáneres y cámaras que admiten la función de volver a capturar documentos, el programa ABBYY FineReader está incluido en el kit. Al elegir una herramienta para convertir documentos en formato electrónico, debe tener esto en cuenta, ya que FineReader, teniendo en cuenta su objetivo principal: el reconocimiento óptico de texto, no es un programa menos útil para quienes trabajan con documentos que un editor de texto.

Un escáner es un dispositivo que reconoce objetos, imágenes o documentos y escribe su imagen visual en un archivo gráfico que se puede editar de varias maneras. ¿Cuál es el objetivo de esta operación? ¿Cómo editar un documento escaneado?

La palabra "editar" en este caso significa:

Edición como modificación de imagen

Como señalamos anteriormente, el escáner, al procesar un documento u otro objeto, crea posteriormente una imagen estática basada en su imagen en forma de un archivo gráfico separado, por ejemplo, en formato Jpeg. Las necesidades de edición más comunes son:

ajuste de superficie (cambio de tamaño, reflexión, rotación en un número determinado de grados, ajuste de balance de color);
editar elementos de imagen (cambiar su apariencia, eliminar, agregar otros nuevos).

La corrección de la superficie de la imagen recibida del escáner se puede realizar utilizando los tipos de software más accesibles que están instalados en Windows de forma predeterminada. ¿Cuál es el programa más fácil para editar un documento escaneado? Probablemente será Paint. Las opciones importantes de edición de archivos se encuentran en el menú del programa, así como en la barra de herramientas de su interfaz.

Iniciar Paint es muy fácil: debe hacer clic (en Windows hasta la versión 7 inclusive) "Inicio", luego - "Todos los programas" - "Accesorios" - Paint. Luego, utilizando la interfaz de este software, abra el archivo deseado y realice los ajustes necesarios.

Un procedimiento más complejo, la edición de elementos de imagen, puede implicar la más amplia gama de operaciones posibles: desde aplicar pequeños retoques o letras a una imagen hasta fusionarlo con otro archivo gráfico en forma de collage. Según la complejidad del trámite correspondiente, será necesario utilizar uno u otro tipo de software.

Si las operaciones con la imagen son simples (por ejemplo, el caso se limita a aplicarle letras), entonces puede usar el mismo Paint. En la barra de herramientas de este programa, que se encuentra en su interfaz a la izquierda, debe seleccionar "Texto". Con él, se aplican letras impresas a la imagen.

Edición de textos y otros objetos de formato en una imagen

¿Cómo edito documentos escaneados con estos programas? Estas soluciones funcionan así: procesan la imagen, reconocen el texto y otros objetos de formato presentes en ella, y luego los colocan en un archivo separado que, a su vez, puede abrirse con editores de texto (Word, OpenOffice y sus análogos). y editar libremente.

Posteriormente, puede colocar el texto modificado (tablas, listas) en la misma imagen escaneada a partir de la cual se reconoció en su forma original. Para llevar a cabo este procedimiento, es necesario abrir el archivo gráfico correspondiente en un programa de edición, por ejemplo, Paint, en una ventana, en otra, el texto reconocido y editado (tablas, listas). Después de activar la segunda ventana, debe tomar una captura de pantalla del texto (una instantánea de la imagen actual en la pantalla del monitor) con la tecla Print Screen Sysrq, luego pegarla en Paint (con la combinación Ctrl y V) y luego colóquelo en la imagen escaneada según sea necesario.

Una necesidad similar puede surgir, por ejemplo, para un diseñador de portadas de revistas que necesita editar el texto colocado en ella, y si por alguna razón no tiene el archivo fuente. Puede reconocer los párrafos necesarios de la página en papel de la publicación, corregirlos y luego volver a colocarlos, ya modificados, en la imagen escaneada de la página.