Contactos

Archivo. Algoritmos para comprimir datos sin pérdida, ¿cuál es el grado de compresión de los archivos?


Los archivos están diseñados para archivar, (embalar) los archivos comprimiendo la información almacenada en ellos, para ahorrar espacio en los discos.

La compresión de la información es el proceso de convertir la información almacenada en el archivo, al formulario en el que la redundancia en su representación y, en consecuencia, requiere una cantidad menor de memoria de almacenamiento.

La compresión de la información en los archivos se produce por sostenerredundancia de varias maneras,por ejemplo, al simplificar los códigos, las excepciones de la broca constante de caracteres o una secuencia de repetición de símbolos, la introducción del coeficiente de repetición de símbolos, etc. Aplique varios algoritmos para dicha compresión de información.

Puede destruirse como uno y varios archivos que se colocan en forma comprimida a un archivo o archivo de archivo.

Archivo de archivo. (Archivo, o Archivo de archivos) - esto es especialel archivo organizado que contiene uno o no.¿Cuántos archivos hay en la información comprimida o no comprimida?nombres de archivo, fecha y hora de su creación o modificados.pRECAUCIÓN, TAMAÑOS, etc.

El propósito de embalar archivos. Generalmente, lo que garantiza una colocación más compacta de información sobre el disco, reduciendo el tiempo y, en consecuencia, el costo de transmitir información sobre los canales de comunicación en redes de computadoras. Es más, embalaje en un ARarchivo de grupo de archivos de surfsimplifica significativamente su transferencia de una computadora a otra, acorta la hora para copiar archivos a los discos, le permite proteger la información del acceso no autorizado, promueve la protección contra la infección con virus informáticos.

El grado de compresión depende del programa-Archiver utilizado, el método de compresión y el tipo de archivo de origen. Los archivos de texto y los archivos de datos están más comprimidos para los cuales la relación de compresión puede alcanzar el 80-90%, los archivos de programas ejecutables y los módulos de carga son más pequeños, 5-40%. Los archivos de archivo casi no se comprimen.

Los programas de archivo se distinguen por los métodos de compresión utilizados, lo que afecta respectivamente el grado de compresión.

Goma (Desembalaje)- proceso de recuperación de archivosdesde el archivo exactamente en este formulario, lo que tenían antes de descargar en ARcolmena.Al desempacar, los archivos se recuperan del archivo y se colocan en el disco o en RAM.

Los archivos de archivos grandes en volumen se pueden colocar en varios volúmenes. Dichos archivos se llaman multi-volumen. Tomás - esta es una parte integral de un archivo multi-volumen.Creación de un archivo de varias partes, puede grabarle partes en varios disquetes.


Los principales tipos de programas de archivo.

A pesar del hecho de que el volumen de memoria externa de la computadora está en crecimiento constantemente, la necesidad de archivar no disminuye. Esto se explica por el hecho de que el archivo es necesario no solo para ahorrar espacio en la memoria, sino también para un almacenamiento confiable de copias de información valiosa, así como para transferir información rápidamente en la red a otras computadoras.

Además, la posibilidad de fracaso de los portadores de información magnética, el efecto destructivo de los virus obligan a los usuarios a realizar una copia de seguridad de la información valiosa a otros medios (de repuesto).

El proceso de escribir un archivo al archivo de archivo se llama archivado (embalaje, compresión), y eliminando el archivo del archivo. descompuesto (Desembalaje). Archivo empacado (comprimido) llamado archivo.

Archivado La información es una conversión de información a la que disminuye el volumen del archivo, y la cantidad de información sigue siendo la misma.

El grado de compresión de la información depende de los contenidos del archivo, así como del método de archivo seleccionado. El grado (calidad) de la compresión de archivos se caracteriza por coeficiente compresivo K C.Definido como la relación del volumen del archivo comprimido. V C. al alcance del archivo fuente V o., expresado como un porcentaje:

El menor valor Kccuanto mayor sea el grado de compresión de la información.

Todos los métodos existentes de compresión de la información se pueden dividir en dos clases: embalaje sin pérdida Información (algoritmo reversible) y embalaje con pérdida Información (algoritmo irreversible). En el primer caso, la información inicial se puede restaurar con precisión por la información envasada disponible. En el segundo caso, el mensaje desempaquetado diferirá del mensaje de origen.

El trabajo de los Archiverses se basa en el hecho de que encuentran áreas y espacios repetidos en los archivos, marquelos en el archivo de archivo y luego se restauran los archivos iniciales al desempacar.

Los programas de embalaje (o archivadores) le permiten colocar copias de los archivos en el archivo y recuperar archivos del archivo, ver el diseño del archivo y probar su integridad, eliminar archivos en el archivo y actualizarlos, configure una contraseña al extraer archivos del archivo, etc.

Los diferentes programas de archivo se distinguen por el formato de archivos de archivo, velocidad de velocidad, grado de compresión, kit de servicio (menú completo para el usuario), facilidad de uso (interfaz), la presencia de asistencia, tamaño propio.

Una serie de archivos hacen posible crear archivos multi-volumos, archivos autoextraíbles, archivos que contienen directorios.

Más popular Y los siguientes adornos de Archivers son ampliamente utilizados: ARJ, PKZIP / PKUNZIP, RAR, ACE, LHA, ICE, PAK, PKARC / PKXARC, ZOO, HYPER, AIN.

El más altamente eficiente Son RAR, ACE, ARJ ARCHIVERS.

Proporcionan el mayor grado de compresión de información y tienen la mayor velocidad. El RAR ARCHIVER tiene una interfaz gráfica práctica y le permite leer archivos de texto que están en el archivo RAR y en Archives ARJ y ZIP. El AIN Archiver tiene una interfaz de habla rusa. El WinRAR-95 y WinZip archivan solo funcionan en el entorno de Windows. Se necesitan cuando se trabaja con nombres de archivos largos y rusos en Windows. Actualmente, estos archivadores se utilizan con mayor frecuencia.


Sección 3. Software de aplicación TI

Todos los algoritmos de compresión operan en el flujo de entrada de información para obtener un flujo de salida más compacto con una cierta conversión. Las principales características técnicas de los procesos de compresión y los resultados de su trabajo son:

· El grado de compresión es la relación del volumen de origen y flujos resultantes;

· La velocidad de compresión es el tiempo dedicado a la compresión de una cierta cantidad de información del flujo de entrada para obtener de él un flujo de salida equivalente;

· Calidad de compresión: el valor que muestra cuánto se empaqueta el flujo de salida cuando se aplica la re-compresión a lo largo del mismo o otro algoritmo.

Los algoritmos que eliminan la redundancia de la grabación de datos se denominan algoritmos de compresión de datos, o algoritmos de archivo. Actualmente, hay una gran variedad de programas de compresión de datos basados \u200b\u200ben varias formas básicas.

Todos los algoritmos de compresión de datos se dividen en:

) Algoritmos de compresión sin pérdida, al usar qué datos sobre la recepción se restauran sin los más mínimos cambios;

) Algoritmo de compresión con pérdidas que se eliminan de la información de flujo de datos que afecta ligeramente la esencia de los datos, o en general no responde por la persona.

Hay dos métodos principales de archivo sin pérdida:

algoritmo Huffman (Ing. Huffman), que se enfoca en comprimir secuencias de bytes, no relacionadas entre sí,

lempel-Ziva Algorithm (Ing. Lempel, ZIV), enfocado en comprimir cualquier tipo de textos, es decir, utilizando el hecho de repetidas repetidas "palabras": bytes secuencias.

Casi todos los programas de archivo populares sin pérdida (ARJ, RAR, ZIP, etc.) utilizan la combinación de estos dos métodos: el algoritmo LZH.

Algoritmo Hufffman.

El algoritmo se basa en el hecho de que algunos caracteres del conjunto estándar de 256 caracteres en texto arbitrario pueden ocurrir más a menudo que en medio del período de repetición, mientras que otros, respectivamente, son menos probables. Por lo tanto, si $ + O es el conjunto de caracteres comunes para usar secuencias de bits cortas, menos de 8 longitudes, y para grabar caracteres raros, largo, entonces el tamaño del archivo total disminuirá.

Lempel-Ziva Algorithm. El clásico algoritmo Lempel-Ziva -LZ77, llamado este año de su publicación, es extremadamente simple. Se formula de la siguiente manera: si una secuencia similar de bytes ya se ha cumplido en la corriente de salida previamente ganada, y el registro de su longitud y desplazamiento de la posición actual es más corta que esta secuencia, se escribe el enlace (offset, longitud) al archivo de salida, y no la secuencia en sí.

4.Productor de compresión de archivos

La información de compresión en archivos de archivo se realiza eliminando la redundancia de varias maneras, por ejemplo, al simplificar los códigos, excluyendo los bits constantes o que representan símbolos repetidos o una secuencia de símbolos repetidos como un coeficiente de repetición y caracteres correspondientes. Los algoritmos de dicha compresión de la información se implementan en programas de archivos especiales (la más famosa de los cuales ARJ / ARJFOLDER, PKZIP / PKUNZIP / WINZIP, RAR / WINRAR) se utilizan para comprimirse como uno y varios archivos que se colocan en un formulario comprimido en el llamado archivo de archivo o archivo.

El propósito del embalaje de archivos generalmente garantiza la colocación más compacta de información sobre el disco, la reducción del tiempo y, en consecuencia, el costo de transmitir información sobre los canales de comunicación en las redes de computadoras. Por lo tanto, el principal indicador de la efectividad de un programa-archiver es el grado de compresión de los archivos.

El grado de compresión de archivos se caracteriza por el coeficiente de COP, definido como la relación del volumen del archivo VC comprimido al volumen del archivo de origen VO, expresado como un porcentaje (en algunas fuentes, utiliza la relación inversa):

Ks \u003d (vc / vo) * 100%

El grado de compresión depende del programa utilizado, el método de compresión y el tipo de archivo de origen.

Las imágenes gráficas, los archivos de texto y los archivos de datos, para los cuales la relación de compresión puede alcanzar el 5 al 40%, están menos comprimidos, los archivos de programas ejecutables y los módulos de carga del KS \u003d 60% están comprimidos. Los archivos de archivo casi no se comprimen. Es fácil de explicar si sabe que la mayoría de los programas de archivo se utilizan para comprimir las variantes del algoritmo LZ77 (LEMPEL-ZIVA), cuya esencia es la codificación especial de las secuencias de bytes recurrentes (Símbolos de lectura). La frecuencia de ocurrencia de tales repeticiones es más alta en textos y gráficos de puntos y casi se reduce a cero en archivos.

Además, los programas de archivo aún difieren en la implementación de algoritmos de compresión, que afecta respectivamente el grado de compresión.

Algunos programas archivados incluyen además fondos destinados a reducir la relación de compresión de la COP. Por lo tanto, en el programa WinRAR, se implementa un mecanismo de archivo continuo, cuando se usa que se puede lograr con un 10-50% de relación de compresión más alta que los métodos habituales, especialmente si se empaqueta un número significativo de contenidos pequeños del mismo tipo.

Características de los valores dependientes del archivador. Es decir, cuanto mayor sea la velocidad de la compresión, menor será el grado de compresión y viceversa.

El mercado de la computadora ofrece muchos archivadores: cada uno tiene su propio conjunto de formatos compatibles, sus ventajas y contras, su propio círculo de admiradores, santos creen que el mejor Archiver utilizado por ellos es el mejor. No disuadiremos a nadie, solo intentaremos apreciar imparcialmente los archivadores más populares en términos de funcionalidad y eficiencia. Como tal, asignaremos WinZIP, WinRAR, WINCE, 7-ZIP: están liderando por el número de descargas en servidores de software. No es aconsejable considerar los archivadores restantes, ya que el porcentaje de usuarios que aplican su (a juzgar por el número de descargas) es pequeño.

Introducción Archivadores que usamos constantemente. En nuestro sitio hay una descripción detallada (aunque una larga escrita) del programa de archivo más popular ( Archivadores: vista lateral) No repetiremos aquí, pero nos ocuparemos solo con algoritmos de compresión que se aplican en estos programas. ¿Cuál es el problema aquí? Los archivers modernos nos brindan la oportunidad de elegir el uso de varios algoritmos de compresión. Aquí, por ejemplo, las características de algunos programas ...

Formatos archivados

Arcador Embalaje y desembalaje Solo desempaquetar
Winzip. Cremallera. TAR, GZIP, BH, ARJ, LZH, ARC
Winrar Rar, cremallera. Taxi, arj, lzh, tar, gz, ace, ueue, bz2, jar, jso
Contraerse de dolor As, zip, lha, mscab Rar, arco, atj, gzip, zoológico de alquitrán
7-ZIP. 7Z, ZIP, GZIP, TAR, BZIP2 Rar, taxi, arj, cpio, rpm, deb, división
Arcador de energía Tar, bh, taxi, lha, zip Rar, ace, arj, gzip, bzip2, arco, zoológico

Dependiendo de las circunstancias, aplicamos al archivador como compresor, desde donde desea comprimir información para una transmisión más rápida a través de canales de comunicación (correo e Internet). En otros casos, la función de archivar a sí misma es más importante, es decir, la conversión de información en una vista compacta (un archivo) para deshacerse del objetivo y, además, para reducir la ubicación ocupada en el disco a expensas. de la tabla de archivos. En consecuencia, un gran interés es el indicador de compresión de la información original y la tasa de tasa de procesamiento de información de origen. El propósito de nuestro estudio es determinar los indicadores absolutos y relativos del grado de compresión y velocidad de algoritmos (formatos), que se proporcionan a nuestra disposición por los archivos especificados en la tabla ...

El contenido del estudio se planifica de la siguiente manera:

1. Creación de un conjunto de información integrado y privado (por tipo de archivo) (carpetas) para pruebas (pruebas).

2. Realización de pruebas preliminares en un conjunto complejo y refinamiento (basado en los resultados) de un plan para poseer pruebas locales.

3. Procesamiento y análisis de resultados con el fundamento para recomendaciones sobre la aplicación práctica de diferentes algoritmos de archivo (formatos).

Como indicador de compresión, se toma la proporción de porcentaje del tamaño de una carpeta comprimida a su tamaño inicial, y la velocidad de procesamiento es como parte del rendimiento del tamaño original en kilobytes durante el tiempo de reciclaje en segundos. En realidad, las mediciones se realizan solo en relación con el tiempo (cronómetro). El error de medición de tiempo puede distorsionar el indicador de velocidad cuando este indicador es muy grande (más de 1000 kb / s). En otros casos, el error puede ser descuidado.

Determinar las características generales de los formatos principales del archivo.

Para las pruebas, se utilizó un material que simula una "canasta de usuario", compuesta por los archivos DOC, HTM, JPG, MP3, PDF, formato TXT,. La canasta contiene 359 carpetas y 3337 archivos, y tiene un tamaño total de 208893 KB (aproximadamente 204 MB). La composición de este dial se da en la siguiente tabla:

Composición de los archivos de marcación para pruebas.

Un tipo Número de carpetas Número de archivos Tamaño, KRIB En disco, kb
TXT. 0 2 34781 34783
Htm. 329 2869 30913 36962
DOC 3 24 31443 31474
PDF. 0 1 33691 33694
JPG. 26 430 40493 41382
MP3 1 11 37571 37589

TOTAL 359 3337 208893 215884

Cada prueba consistió en el ciclo de archivo con una fijación del tiempo de funcionamiento del archivador desde el momento de presionar el botón Agregar hasta que la ventana se abra con el contenido del archivo de archivo resultante.

Programas probados:

WinZip 8.1 SR-1
WinRAR 3.30.
Winace 2.5
7zip 3.13
Power Archiver 8.70 07b


Información de configuración del sistema

Procesador Intel Celeron 1700MHz
256 MB (DDR SDRAM)
HDD ST360015A (60 GB, 7200PRM)
Windows 2000 Pro, SP3

Los resultados de la prueba se dan en las siguientes tablas:

Resultados de la prueba para formato zip

Arcador / Modo Tamaño, KRIB Tiempo, min.-sec. Compresión Velocidad, krib / s

Winzip.
Sin compresión 208893 - - -
Norma 146408 2-00 70.0% 1740
Máximo 145884 2-45 69.8% 1266
Rápido 147690 1-58 70.7% 1770
Muy rapido 149450 1-50 71.5% 1899

Winrar
Por lo general 146 078 2-22 69.9% 1471
Máximo 145881 3-07 69.8% 1117

Contraerse de dolor
Norma 146 418 2-28 70.1% 1411
Máximo 145844 2-40 69.8% 1305

7-ZIP.
Norma / deflación. 145 480 3-22 69.6% 1034
Ultra / deflación. 145 341 5-55 69.6% 588
Ultra / deflate64. 144924 6-10 69.4% 565

Arcador de energía
Norma 146074 3-40 69.9% 950
Máximo 145948 3-42 69.9% 941

En general, la compresión obtenida por el formato ZIP es de aproximadamente un pedido, y poco depende del Archiver, con la excepción del arqueiver de 7 cremallera, en el que se puede mejorar algo cambiando el método de compresión y para el formato ZIP. El tamaño de los diccionarios (WinRAR y 7-Zip Archivers) específicamente en esta serie de pruebas no ha cambiado, y se instala automáticamente (por defecto).

Modo Tamaño, KRIB Tiempo, min.-sec. Compresión Velocidad, krib / s
Sin compresión 208893 - - -
Tienda. 209129 0-58 100.1% 3601
Lo más rápido 144017 6-00 68.9% 580
Rápido. 143281 6-22 68.6% 547
Normal 142830 6-40 68.4% 522
Bien. 139826 6-58 66.9% 499
Mejor 140023 7-25 67.0% 469
Mejor (64kb) 140685 5-40 67.3% 614

En la configuración del modo, es posible cambiar el tamaño del diccionario dentro de 64 - 4096 kilobytes. De forma predeterminada, se establece el tamaño máximo (4096 KB), con el cual los resultados se obtienen en esta tabla. Solo en la mejor cadena (64kb), el tamaño mínimo se estableció: 64 kilobytes. Obviamente, el cambio obtenido en la compresión y la velocidad puede servir como análogo para todas las demás líneas de esta tabla.
Se verificaron filas de bien y mejor, y sus valores fueron totalmente confirmados, por lo que la transición ilógica entre ellos no puede considerarse una consecuencia de errores en las pruebas.

Resultados de la prueba de formato ACE

Modo Tamaño, KRIB Tiempo, min.-sec. Compresión Velocidad, krib / s
Sin compresión 208893 - - -
Normal 132978 8-30 63.7% 410
Máximo 132918 8-42 63.6% 400
Bien. 132925 9-50 63.6% 354
Rápido. 133216 8-53 63.8% 397
Súper rápido. 133273 8-46 63.8% 397
Tienda. 209136 1-48 100.1% 1934

CAMBIOS EN EL MODO DE OPERACIÓN DEL ARCHIVER WINACE En nuestro caso, poco afectan a los indicadores de compresión: la dispersión está dentro de las décimas del porcentaje.

Resultados de la prueba de formato 7Z

Modo Tamaño, KRIB Tiempo, min.-sec. Compresión Velocidad, krib / s
Sin compresión 208893 - - -
Normal 130964 9-24 64.2% 362
Máximo 130000 13-51 63.7% 246
Rápido 141922 4-16 69.6% 797
Ultra (1 MB) 131392 8-47 64.4% 387
Ultra (6 MB) 130101 11-40 63.8% 291
Ultra (12 MB) 129871 12-47 63.7% 266
Ultra (24 MB) - - - -
Ultra (desinflar) 141171 3-15 69.2% 1046
Ultra (PPMD) 140171 8-45 68.7% 389
Ultra (bzip2) 135342 7-32 66.4% 451

Nota:

Para formato de 7Z, el Archiver le permite instalar:

- Nivel (rápido, normal, máximo, ultra),
- Método (LZMA, PPMD, BZIP2, DEFLATE),
- Tamaño del tamaño (32KB - 192 MB),
- Tamaño de la palabra (8 - 255).

Como podemos ver, es posible una gran cantidad de combinaciones de la configuración del modo Archiver, que puede confundirse. Puedes ser guiado por las siguientes parcelas:

- Cuanto mayor sea el tamaño del diccionario, mayor será la compresión y la hora del paquete. La compresión aumenta lentamente, y el tiempo de envasado, crece mucho.

- Lo mismo - en términos del tamaño de la palabra.

- Las configuraciones óptimas se instalan en sí mismas (configuración predeterminada), y no puede grabarlas sin necesidad.


Resultados de la prueba de formato de la cabina

Modo Tamaño, KRIB Tiempo, min.-sec. Compresión Velocidad, krib / s
Sin compresión 208893 - - -

PowerArchiver
Medio. 140444 9-55 67.2% 351
Máximo 137152 15-55 65.6% 219

Contraerse de dolor
Norma 144374 3-24 69.1% 1024
Máximo 138538 12-54 66.3% 270

El formato de la cabina (archivo del gabinete) se basa en algoritmos MS-ZIP y LZX, compatibles y aplicados por Microsoft. Los desempaquetes de formato están disponibles en Windows 98 y más. El algoritmo tiene un código abierto y puede ser aplicado libremente por todos los programadores.

Resultados de las pruebas de los formatos BH y LHA

Modo Tamaño, KRIB Tiempo, min.-sec. Compresión Velocidad, krib / s
Sin compresión 208893 - - -

PowerArchiver, Formato LHA
Norma. 147518 4-40 70.6% 746
Máximo 147518 4-47 70.6% 728

PowerArchiver, Formato BH
Norma. 145912 2-16 69.8% 1536
Máximo 145718 2-34 69.8% 1356

Los indicadores de formatos de archivo LHA \u200b\u200by BH tienen el nivel de indicadores del formato de archivo de ZIP, y no se ven algunas ventajas.

En general, como se puede ver, los mejores indicadores de compresión son proporcionados por formatos ACE y 7Z. Los mejores indicadores de rendimiento, mostraron formatos ZIP y BH. Se planea que las pruebas adicionales se realizan de acuerdo con el mismo esquema de concepto, pero con "Cestas" de composición homogénea, con formatos de archivo: TXT, HTML, DOC, JPG, MP3, PDF.

Definición de compresibilidad de archivos de diferentes formatos.

Para garantizar esta serie de pruebas, se compilaron formatos de archivos completamente homogéneos, y se excluyeron los archivos repetitivos en el conjunto. Se tomaron archivos EXE y DLL de la carpeta del sistema de Windows sin ninguna selección. El hecho es que los archivos de formato EXE ya están comprimidos y su compresión adicional, no tiene sentido. Se dan las características establecidas en la siguiente tabla:

Formatos de archivo en los conjuntos de pruebas

Formato Terreno de juego Archivos Tamaño total, KB
TXT. 0 27 35096
Htm. 7 1371 25076
DOC 1 33 37211
PDF. 0 1 33691
JPG. 26 430 40493
MP3 2 11 37571
exe 0 316 32446
Dll 0 184 40323
Xls. 6 15 17228
CHM. 0 69 33940
Mpeg 0 24 46606
Wav 0 1 30804
Bip 0 15 31713
AVI. 0 89 9261

Al probar, se usó solo el modo normal (normal) del funcionamiento del Archiver. Al mismo tiempo, cada formato del archivo fue creado por su propio Archiver (WinZip, Winrar, Winke, 7-Zip), se usó un Archiver de Power para empacar en formato CAB, que no tiene su propio formato (corporativo) .

Compresibilidad de archivos dependiendo del formato de archivo

Formato Cremallera. Rar As. 7z. Taxi.
TXT. 43.7% 37.8% 37.4% 34.3% 36.3%
Htm. 29.2% 28.3% 9.09% 7.75% 15.0%
DOC 8.76% 6.39% 5.47% 5.21% 6.49%
PDF. 97.7% 97.4% 97.8% 97.5% 97.3%
JPG. 98.5% 98.5% 85.0% 85.1% 97.9%
MP3 98.1% 97.9% 98.1% 97.9% 97.7%
exe 46.9% 42.1% 37.8% 32.7% 39.3%
Dll 45.6% 39.6% 37.6% 34.3% 39.6%
Xls. 11.8% 8.27% 7.44% 5.97% 8.49%
CHM. 98.6% 98.8% 99.0% 99.6% 98.6%
Mpeg 95.3% 94.7% 94.8% 94.5% 94.4%
AVI. 86.1% 84.1% 84.5% 82.7% 83.4%
Wav 92.2% 62.8% 62.6% 87.0% 92.1%
Bip 63.5% 31.9% 30.6% 51.5% 56.2%

Promedio 65.5% 59.2% 56.2% 58.3% 61.6%

Como comentario a la tabla, puede observar lo siguiente:

- La mejor compresión en los formatos principales de los archivos de origen es proporcionada por el formato de archivo 7Z.

- El mejor indicador en promedio tiene un formato ACE de archivo debido a la compresión registrada de los formatos WAV y BMP.

Si hablamos de la compresibilidad de los archivos de origen, se puede observar lo siguiente: La tasa de compresión depende del formato del archivo de origen, a veces que implica la compresión de datos interna. Si el archivo está pre-sellado de acuerdo con sus algoritmos, entonces la compresibilidad de su arqueiver es pequeña. Por ejemplo, el archivo de formato CHM es una versión compactada del archivo de formato HTML y, en consecuencia, la compresibilidad de ellas es diferente. Lo mismo que vemos con respecto a WAV y MP3, BMP y JPG, etc.

Velocidad del archivador, krib / s

Formato Cremallera. Rar As. 7z. Taxi.
TXT. 2064 408 386 217 226
Htm. 2507 836 627 643 411
DOC 7400 2862 1550 1378 886
PDF. 2246 293 370 387 370
JPG. 2670 587 337 368 287
MP3 2348 458 368 335 332
exe 2318 773 601 416 433
Dll 2016 858 672 474 434
Xls. 4300 1436 1148 507 224
CHM. 1886 556 365 357 323
Mpeg 2453 583 416 370 338
AVI. 1852 617 463 370 356
Wav 2370 1711 1184 354 288
Bip 2883 1269 933 401 373

Promedio 2838 856 609 485 385

Esta tabla demuestra una regla obvia: para la mejor compresión, ya casi siempre es necesario pagar la velocidad de embalaje.

Compresibilidad de diferentes formatos de archivo. Adición

Formato Cremallera. Rar As. 7z.
VXD. 55.1% 52.5% 43.3% 40.8%
Infancia 14.9% 13.3% 13.2% 12.3%
VBP. 78.3% 72.6% 26.0% 18.5%
Gif. 90.0% 94.3% 87.2% 86.1%
SCR. 88.8% 88.0% 88.1% 87.9%
Dat. 23.1% 20.1% 20.5% 18.0%
Ini. 35.6% 33.2% 32.5% 30.2%

Promedio 55.1% 53.4% 44.4% 42.0%

Esta tabla contiene datos adicionales sobre la compresibilidad de los formatos de archivo. Aquí se realizó pruebas sin arreglar el tiempo en conjuntos de volumen pequeño (100-200 KB). Como se puede ver, en todos los formatos, la mejor compresión da el formato de archivo 7z.

Además, como ejemplo, daré los resultados del embalaje de la distribución real del Programa Norton Antivirus. El embalaje se realizó en modo normal, se obtuvieron además las opciones autoextractivas para los mismos archivos. El resultado de esta prueba se muestra en la siguiente tabla (la última columna es un tiempo aproximado de cargar la distribución empaquetada a través de la red con una conexión de módem convencional a una velocidad de 2.7 kb en un segundo):

Archivo de formato Tamaño, KRIB Hora Compresión Tiempo de descarga, Hora.-Min.
Sin compresión 47410 - - 4-53
Cremallera. 29045 0-21 61.3% 2-59
Rar 26619 1-15 56.1% 2-44
As. 23838 1-30 50.3% 2-27
7z. 22871 1-50 48.2% 2-21
Taxi. 26804 2-22 56.5% 2-45
Exe (rar) 26671 1-15 56.3% 2-45
EXE (ACE) 23903 1-30 50.4% 2-28
EXE (7Z) 22941 1-52 48.4% 2-22

Los resultados de la tabla demuestran claramente que:

Al transferir archivos a través de la red, se requiere prácticamente el embalaje.

El embalaje con buena compresión puede reducir el tiempo de transferencia de archivos, en nuestro caso, media hora.

El uso de formatos prometedores de ACE y 7Z está bastante absuelto ahora en forma de archivos autoextraíbles. Esta circunstancia es deseable considerar a los distribuidores de productos de software en Internet.

El archivador de 7 zip es un buen programa con un alto grado de compresión y tiene las comodidades mínimas necesarias. Puede, en particular, eliminar y ver archivos individuales sin un archivo común que desempaqueta. Al mismo tiempo, los archivos están abiertos por aplicaciones asociativas del sistema. Puede complementar el archivo con archivos individuales.

Conclusión

El programa de archivos sigue siendo una herramienta indispensable de embalaje y compresión de información digital. La información procesada ahorra significativamente el lugar de los encargados y el tiempo de transmisión sobre los canales de comunicación. Los formatos de embalaje con cremallera y rasar más populares y usados \u200b\u200bson ahora. Otros formatos, por ejemplo, ARJ, ICE, PAC, ARC y algunos todavía están concurridos gradualmente y encadenados. Pero la tecnología de embalaje no se detiene. Los archivos están en demanda, por lo tanto, los programadores están buscando continuamente métodos de compresión más eficientes. Esto se evidencia por los resultados de nuestro experimento. Realmente existen al menos dos formatos de archivo (ACE y 7Z), que son significativamente superiores a la cremallera armoniosa y RAR en la compresión. El uso de estos formatos reducirá significativamente el tiempo de transferencia en Internet, que corresponde a los intereses de numerosos usuarios ...

Actualización el 24 de mayo de 2004.

En esta sección, consideraremos el efecto de la opción sólida sobre el desempeño de los archivadores. Recuerde que el embalaje con la opción sólida conduce al hecho de que no puede agregar un archivo al archivo y no puede eliminar un archivo separado de él, el archivo está envasado y desempaquetado solo. En general, esto puede causar ciertos inconvenientes al usar dichos archivos. Pero a veces tales inconvenientes pueden tener un valor secundario en comparación con los beneficios.

Las pruebas adicionales se han realizado exactamente como se describe en la sección principal en los mismos conjuntos de material. Teniendo en cuenta la tabla de pruebas adicionales "Los resultados de las pruebas de formato RAR" del texto principal comenzaron a parecerse a este ...

Resultados de la prueba de formato rar

Modo Tamaño, KRIB Tiempo, min.-sec. Compresión Velocidad, krib / s
Sin compresión 208893 - - -
Tienda. 209129 0-58 100.1% 3601
Lo más rápido 144017 6-00 68.9% 580
Rápido. 143281 6-22 68.6% 547
Normal 142830 6-40 68.4% 522
Normal (sólido) 131664 9-14 63.0% 377
Bien. 139826 6-58 66.9% 499
Bueno (sólido) 129314 8-24 61.9% 414
Mejor 140023 7-25 67.0% 469
Lo mejor (sólido) 129527 8-36 62.0% 405
Mejor (64kb) 140685 5-40 67.3% 614

Configuración de WinRar Archiver incluye:

1. Elegir un método de compresión (normal, tienda, más rápido, rápido, bueno, mejor).

2. Selección de modificaciones:
- Agregar y reemplazar archivos,
- Añadir y actualizar archivos,
- solo archivos frescos existentes,
- Sincronizar contenidos axchive.

3. Seleccione la opción:
- Eliminar archivos después de archivar,
- Crear archivo SFX,
- crear un archivo sólido,
- Poner la verificación de autohenelicidad,
- Poner el registro de recuperación,
- Prueba de archivos archivados,
- Archivo de bloqueo.

Es fácil ver que más de cien células son posibles que definen el funcionamiento del Archiver. En consecuencia, la gama de resultados para este formato y este archivador resultó ser una relación de compresión bastante grande: 61.9 - 68.9%, velocidad: 377 - 614 KB / s.

La opción sólida también tiene el archivador Winace. Pero en este archivador, el archivo de fabricación sólido está habilitado constantemente (predeterminado) y, por lo tanto, ingresó los resultados de las pruebas. Por lo tanto, se permitió la injusticia solo para el formato RAR y el Archiver WinRAR.

Teniendo en cuenta las nuevas circunstancias, la mesa del líder según el grado de compresión se ve así:

1. RAR (bueno, sólido) - 61.9%.

2. 7-ZIP (MÁXIMO) - 62.2%.

3. Ace (bueno) - 63.6%.

Una tabla complementaria de los resultados del envasado de la distribución real del Programa Norton Antivirus ("Un ejemplo de los envases de distribución de Norton Antivirus") comenzó a parecerse a este ...

Ejemplo de envasado de distribución de Norton Antivirus

Archivo de formato Tamaño, KRIB Hora Compresión Tiempo de descarga, Hora.-Min.
Sin compresión 47410 - - 4-53
Cremallera. 29045 0-21 61.3% 2-59
Rar 26619 1-15 56.1% 2-44
Rar (normal, sólido) 22745 1-21 48.0% 2-20
Rar (bueno, sólido) 22680 1-28 47.8% 2-20
As. 23838 1-30 50.3% 2-27
7z. 22871 1-50 48.2% 2-21
Taxi. 26804 2-22 56.5% 2-45
Exe (rar) 26671 1-15 56.3% 2-45
Exe (rar, normal, sólido) 22797 1-29 48.1% 2-21
EXE (ACE) 23903 1-30 50.4% 2-28
EXE (7Z) 22941 1-52 48.4% 2-22

Los resultados de esta tabla también confirman que el Archiver WinRAR puede proporcionar la máxima compresión, y este indicador es el líder. En comparación con el formato ZIP, la carga de la misma distribución en formato RAR se puede realizar durante 39 minutos en corto ...

En la tabla con los resultados de los resultados de las pruebas de formato 7Z, nuestro lector Alexander Rykhlov encontró un error en el cálculo del indicador de compresión. Alexander Muchas gracias, y la tabla corregida "Los resultados de las pruebas de formato 7Z" comenzaron a parecerse a este ...

130101 11-40 62.3% 291
Ultra (12 MB) 129871 12-47 62.2% 266
Ultra (24 MB) - - - -
Ultra (desinflar) 141171 3-15 67.6% 1046
Ultra (PPMD) 140171 8-45 67.1% 389
Ultra (bzip2) 135342 7-32 64.8% 451

Nota: En el modo Ultra (LZMA), al especificar el tamaño de un diccionario en 24 megabytes, la velocidad disminuyó tanto que la prueba era imposible.

Conclusión


La cría tuvo una sensación de que el Archivador WinRAR no era tan bueno como muchos usuarios lo consideraban, no se llevó a cabo. Nuestras pruebas confirmaron que las características técnicas de este Archiver realmente hoy son las más altas. Los indicadores muy cercanos tienen un arcador de 7-cremallera, pero este último sigue siendo algo inferior al líder. Para obtener la compresión máxima en el Archiver Winrar, debe habilitar la opción sólida (por defecto, está deshabilitado), otras configuraciones (normales, buenas, etc.): tienen un valor más pequeño.

3. Indicador de la compresión de archivos.

La información de compresión en archivos de archivo se realiza eliminando la redundancia de varias maneras, por ejemplo, al simplificar los códigos, excluyendo los bits constantes o que representan símbolos repetidos o una secuencia de símbolos repetidos como un coeficiente de repetición y caracteres correspondientes. Los algoritmos de dicha compresión de la información se implementan en programas de archivos especiales (la más famosa de los cuales ARJ / ARJFOLDER, PKZIP / PKUNZIP / WINZIP, RAR / WINRAR) se utilizan para comprimirse como uno y varios archivos que se colocan en un formulario comprimido en el llamado archivo de archivo o archivo.

El propósito del embalaje de archivos generalmente garantiza la colocación más compacta de información sobre el disco, la reducción del tiempo y, en consecuencia, el costo de transmitir información sobre los canales de comunicación en las redes de computadoras. Por lo tanto, el principal indicador de la efectividad de un programa-archiver es el grado de compresión de los archivos.

El grado de compresión de archivos se caracteriza por el coeficiente de COP, definido como la relación del volumen del archivo VC comprimido al volumen del archivo de origen VO, expresado como un porcentaje (en algunas fuentes, utiliza la relación inversa):

Ks \u003d (vc / vo) * 100%

El grado de compresión depende del programa utilizado, el método de compresión y el tipo de archivo de origen.

Las imágenes gráficas, los archivos de texto y los archivos de datos, para los cuales la relación de compresión puede alcanzar el 5 al 40%, están menos comprimidos, los archivos de programas ejecutables y los módulos de carga del KS \u003d 60% están comprimidos. Los archivos de archivo casi no se comprimen. Es fácil de explicar si sabe que la mayoría de los programas de archivo se utilizan para comprimir las variantes del algoritmo LZ77 (LEMPEL-ZIVA), cuya esencia es la codificación especial de las secuencias de bytes recurrentes (Símbolos de lectura). La frecuencia de ocurrencia de tales repeticiones es más alta en textos y gráficos de puntos y casi se reduce a cero en archivos.

Además, los programas de archivo aún difieren en la implementación de algoritmos de compresión, que afecta respectivamente el grado de compresión.

Algunos programas archivados incluyen además fondos destinados a reducir la relación de compresión de la COP. Por lo tanto, en el programa WinRAR, se implementa un mecanismo de archivo continuo, cuando se usa que se puede lograr con un 10-50% de relación de compresión más alta que los métodos habituales, especialmente si se empaqueta un número significativo de contenidos pequeños del mismo tipo.

Características de los valores dependientes del archivador. Es decir, cuanto mayor sea la velocidad de la compresión, menor será el grado de compresión y viceversa.

El mercado de la computadora ofrece muchos archivadores: cada uno tiene su propio conjunto de formatos compatibles, sus ventajas y contras, su propio círculo de admiradores, santos creen que el mejor Archiver utilizado por ellos es el mejor. No disuadiremos a nadie, solo intentaremos apreciar imparcialmente los archivadores más populares en términos de funcionalidad y eficiencia. Como tal, asignaremos WinZIP, WinRAR, WINCE, 7-ZIP: están liderando por el número de descargas en servidores de software. No es aconsejable considerar los archivadores restantes, ya que el porcentaje de usuarios que aplican su (a juzgar por el número de descargas) es pequeño.

Dado que en la tarea, cada par de valores (,) ocurre una vez, la tabla de correlación tomará la forma de una sola matriz. Así que los promedios condicionales coinciden con los valores. De ello se deduce que la relación de correlación es igual a 1 y, por lo tanto, ...

Aproximación de funciones por el método de mínimos cuadrados.

A continuación, aproxima la función con una función cuadrática. Para determinar los coeficientes, y use el sistema (3.2.1) utilizando las sumas totales de la tabla 3 ubicadas en las celdas B29, C29, D29, E29, F29, G29 y H29, instale el sistema (2.1.4) en el Forma de (3.2 ...

Tipos de Archivers

Se han desarrollado una gran cantidad de métodos diversos, sus modificaciones y subespecies para la compresión de datos. Los archivadores modernos, por regla general, utilizan simultáneamente varios métodos al mismo tiempo. Puedes destacar algunos de los ...

¿Cómo puedo clasificar los sistemas de información de acuerdo con el grado de automatización?

Clasificación de la tecnología de la información.

Las tecnologías de la información deben clasificarse principalmente en el alcance del uso y en el grado de uso de las computadoras. Hay áreas de tecnología de la información, como la ciencia, la educación, la cultura, la economía ...

Como una de las etapas necesarias en la creación de un sistema de seguridad efectivo, Empresas, EID, realizará un análisis de la vulnerabilidad de la compañía "Fitmax" ...

La sustancia matemática del grado de vulnerabilidad de un objeto de actividad de la información en el ejemplo de la empresa LLC "Fitmax"

Para cada uno de los canales, se realiza cálculos de la probabilidad del grado de seguridad de la información. Canal acústico: canal vibroacústico: factor humano: basado en los datos obtenidos ...

Microprocesador: Cita, Composición, Características principales

Hay varios archivos para trabajar con archivos en Windows. La primera es "Carpetas de disco" en mi carpeta de computadora. Con su ayuda, puede llegar a cualquier archivo deseado en cualquier carpeta y en cualquier disco. Sin embargo, este método está lejos de ser perfecto ...

Sistema de búsqueda

1. Los sistemas de información manual se caracterizan por la falta de medios técnicos modernos para procesar la información y la implementación de todas las operaciones por el hombre. Por ejemplo, sobre el trabajo del gerente en la firma donde faltan las computadoras ...

El indicador principal de la eficiencia de la puerta del vendedor-consultor es proporcionada por ellos la proporción de los resultados en el volumen total del tráfico del cliente relacionado con él, un indicador de la asistencia productiva del vendedor ...

Cálculo de los parámetros de un motor eléctrico ahorro de energía asíncrono.

Las características de los grados de protección de las máquinas eléctricas se denotan por dos IP latinas (protección internacional) y dos dígitos ...

Sistema de comercio electrónico y estadística para la venta de repuestos automotrices.

Es importante analizar el número de visitantes no solo nuevos, sino también devueltos de su tienda en línea. Esto le permitirá evaluarlo en cuanto a su sitio es interesante para la audiencia objetivo. Además, los visitantes de retorno siempre son más fáciles ...



¿Te gustó el artículo? Compártelo