Contacts

Les archives. Algorithmes pour la compression des données sans perte quel est le degré de compression des fichiers


Les archives sont conçues pour archiver, les fichiers (emballage) en comprimant les informations stockées dans elles, afin de sauvegarder une place sur les disques.

La compression des informations est le processus de conversion d'informations stockées dans le fichier, au formulaire à laquelle la redondance de sa représentation nécessite donc une quantité de mémoire de stockage inférieure.

La compression des informations dans les fichiers est produite en soutenantla redondance de différentes manières,par exemple, en simplifiant les codes, les exceptions du bit constant de caractères ou d'une séquence répétée de symboles, l'introduction du coefficient de répétition des symboles, etc. Appliquer divers algorithmes pour une telle compression d'informations.

Il peut être déchiqueté comme un et plusieurs fichiers placés sous une forme compressée dans un fichier d'archive ou une archive.

Fichier d'archive. (archives ou archives de fichiers) - ceci est spécialle fichier organisé contenant un ou noncombien de fichiers sont dans des informations de forme et de service compressées ou non compresséesnoms de fichier, date et heure de leur création ou modifieprudence, tailles, etc.

Le but de l'emballage des fichiers Assurer un placement plus compact d'informations sur le disque, réduire le temps et, en conséquence, le coût de la transmission d'informations sur les canaux de communication dans des réseaux informatiques. En outre, emballage dans un arfichier de groupe de fichiers survesimplifie de manière significative leur transfert d'un ordinateur à un autre, raccourcit le temps nécessaire pour copier des fichiers vers des disques, vous permet de protéger les informations de l'accès non autorisé, favorise la protection contre l'infection par des virus informatiques.

Le degré de compression dépend du programme-archiveur utilisé, de la méthode de compression et du type de fichier source. Les fichiers texte et les fichiers de données sont les plus bien compressés pour lesquels le taux de compression peut atteindre 80-90%, les fichiers de programmes exécutables et de modules de chargement sont plus petits - 5-40%. Les fichiers d'archives ne compressent presque pas.

Les programmes d'archivage sont distingués par les méthodes de compression utilisées, ce qui affecte respectivement le degré de compression.

Caoutchouc (Déballage)- processus de récupération de fichierde l'archive exactement sous cette forme, ce qu'ils avaient avant le téléchargement en arruche.Lors du déballage, les fichiers sont extraits de l'archive et placés sur le disque ou dans la RAM.

Les fichiers d'archives volumineux importants peuvent être placés dans plusieurs volumes. Ces archives sont appelées multi-volumes. À M - cela fait partie intégrante d'une archive multi-volumes.Création d'une archive de plusieurs parties, vous pouvez enregistrer des pièces informatiques en plusieurs disques de disquettes.


Les principaux types de programmes d'archives.

Malgré le fait que le volume de la mémoire externe de l'ordinateur augmente constamment, le besoin d'archivage ne diminue pas. Cela s'explique par le fait que l'archivage est nécessaire non seulement pour économiser de l'espace en mémoire, mais également pour un stockage fiable des copies d'informations précieuses, ainsi que de transférer rapidement des informations sur le réseau à d'autres ordinateurs.

En outre, la possibilité d'une défaillance des transporteurs d'informations magnétiques, l'effet destructeur des virus oblige les utilisateurs à sauvegarder des informations précieuses à d'autres médias (articles de rechange).

Le processus d'écriture d'un fichier dans le fichier d'archive est appelé archivage (emballage, compression) et élimination du fichier de l'archive - déchaînement (déballage). Fichier emballé (compressé) appelé archiver.

Archivage Les informations sont une telle conversion d'informations sur lesquelles le volume de fichier diminue et la quantité d'informations reste la même.

Le degré de compression des informations dépend du contenu du fichier, ainsi que de la méthode d'archive sélectionnée. Le degré (qualité) de la compression de fichier est caractérisé par coefficient de compression K C.défini comme le rapport du volume du fichier compressé V. à la portée du fichier source V o., exprimé en pourcentage:

Plus la valeur est petite K cplus le degré de compression des informations.

Toutes les méthodes existantes de compression des informations peuvent être divisées en deux classes: emballage sans perte informations (algorithme réversible) et emballage avec perte informations (algorithme irréversible). Dans le premier cas, les informations initiales peuvent être rétablies avec précision par les informations emballées disponibles. Dans le second cas, le message décompressé diffère du message source.

Le travail des architons est basé sur le fait qu'ils trouvent des zones et des espaces répétés dans les fichiers, les marquent dans le fichier d'archives, puis les fichiers initiaux sont restaurés lors du déballage.

Les programmes d'emballage (ou archives) vous permettent de placer des copies de fichiers dans les archives et de récupérer des fichiers de l'archive, affichez la conception de l'archive et testez son intégrité, supprimez les fichiers dans l'archive et mettez-les à la mise à jour, définir un mot de passe lors de l'extraction de fichiers de l'archive, etc.

Différents programmes d'archivage se distinguent par le format des fichiers d'archives, une vitesse de vitesse, du degré de compression, un kit de service (menu complet de l'utilisateur), la facilité d'utilisation (interface), la présence d'assistance, la taille propre.

Un certain nombre de destinotes permettent de créer des archives multi-volumes, des archives à extraction automatique, des archives contenant des répertoires.

Le plus populaire Et les archiveurs suivants sont largement utilisés: ARJ, PKZIP / PKUNZIP, RAR, ACE, LHA, ICE, PAK, PKARC / PKXARCC, ZOO, HYPER, AIN.

Le plus efficace Sont rar, as, archives ARJ.

Ils fournissent le plus grand degré de compression d'informations et ont la vitesse la plus élevée. L'archiver RAR possède une interface graphique pratique et vous permet de lire des fichiers texte situés dans l'archive RAR et dans les archives ARJ et ZIP. L'AIN Archiver a une interface russophone. Les archives WinRar-95 et Winzip ne fonctionnent que dans l'environnement Windows. Ils sont nécessaires lorsque vous travaillez avec des noms de fichiers longs et russes dans Windows. Actuellement, ces architons sont le plus souvent utilisés.


Section 3. Logiciel d'application informatique

Tous les algorithmes de compression fonctionnent dans le flux d'entrée d'informations afin d'obtenir un flux de sortie plus compact avec une certaine conversion. Les principales caractéristiques techniques des processus de compression et les résultats de leur travail sont les suivants:

· Le degré de compression est le rapport du volume de la source et des flux résultants;

· La vitesse de compression est le temps passé à la compression d'une certaine quantité d'informations du flux d'entrée pour en obtenir un flux de sortie équivalent;

· Qualité de compression - la valeur montrant combien le flux de sortie est emballé lorsque la ré-compression est appliquée sur le même ou plusieurs algorithmes.

Les algorithmes qui éliminent la redondance de l'enregistrement de données sont appelés algorithmes de compression de données ou algorithmes d'archivage. Actuellement, il existe une grande variété de programmes de compression de données basés sur plusieurs manières de base.

Tous les algorithmes de compression de données sont divisés en:

) Algorithmes de compression sans perte, lors de l'utilisation de quelles données à la réception est restaurée sans les moindres changements;

) Algorithmes de compression avec des pertes retirées des informations de flux de données qui affectent légèrement l'essence des données, ou généralement irréveillantes par la personne.

Il y a deux méthodes d'archivage principales sans perte:

algorithme Huffman (Eng. Huffman), qui est axé sur la compression des séquences d'octets, qui ne sont pas liées les unes aux autres,

l'algorithme de Lempel-Ziva (Eng. Lempel, ZIV), axé sur la compression des types de textes, c'est-à-dire en utilisant le fait de répéter des "mots" répétés - des séquences d'octets.

Presque tous les programmes d'archivage populaires sans perte (ARJ, rar, zip, etc.) utilisent la combinaison de ces deux méthodes - l'algorithme LZH.

Algorithme Huffman.

L'algorithme repose sur le fait que certains caractères de l'ensemble standard de 256 caractères dans le texte arbitraire peuvent survenir plus souvent au milieu de la période de répétition, tandis que d'autres, respectivement, sont moins probables. Par conséquent, si $ + O est l'ensemble de caractères communs pour utiliser des séquences de bits courtes, moins de 8 longueurs et pour l'enregistrement de caractères rares - long, la taille totale du fichier diminuera.

Algorithme de Lempel-Ziva. L'algorithme classique de Lempel-Ziva -LZ77, appelée cette année de sa publication, est extrêmement simple. Il est formulé comme suit: Si une séquence similaire d'octets s'est déjà rencontrée dans le flux de sortie précédemment gagné, et l'enregistrement de sa longueur et de décalage de la position actuelle est plus court que cette séquence elle-même, la liaison (décalage, longueur) est écrite. au fichier de sortie et non à la séquence elle-même.

4. COMPRESSION DE FICHIER DEPRODUCER

Les informations de compression dans les fichiers d'archivage sont effectuées en éliminant la redondance de différentes manières, par exemple, en simplifiant les codes, à l'exclusion des bits constants ou de représenter des symboles répétés ou une séquence de symboles répétée sous forme de coefficient de répétition et de caractères correspondants. Les algorithmes de cette compression d'informations sont mis en œuvre dans des programmes archivés spéciaux (les plus célèbres desquels ARJ / ARJFolder, PKZIP / PKUNZIP / WINZPIP, RAR / WINRAR) sont utilisés pour être compressés comme un et plusieurs fichiers placés sous une forme compressée. dans le dossier d'archive ou archive.

Le but de l'emballage des fichiers assure généralement une mise en place plus compacte d'informations sur le disque, la réduction du temps et, en conséquence, le coût de la transmission d'informations sur les canaux de communication dans des réseaux informatiques. Par conséquent, l'indicateur principal de l'efficacité d'un programme-archiveur est le degré de compression des fichiers.

Le degré de compression de fichier caractérisé par le coefficient de la COP, défini comme le rapport du volume du fichier VC compressé sur le volume du fichier source VO, exprimé en pourcentage (dans certaines sources qu'il utilise le rapport inverse):

KS \u003d (VC / VO) * 100%

Le degré de compression dépend du programme utilisé, de la méthode de compression et du type de fichier source.

Les images graphiques, les fichiers texte et les fichiers de données, pour lesquels le taux de compression peut atteindre 5 à 40%, sont moins compressés, les fichiers de programmes exécutables et les modules de chargement du KS \u003d 60% sont comprimés. Les fichiers d'archives ne compressent presque pas. Il est facile d'expliquer si vous savez que la plupart des programmes d'archivage sont utilisés pour comprimer les variantes de l'algorithme LZ77 (Lempel-Ziva), dont l'essence consiste à coder spécial des séquences d'octets récurrents (symboles de lecture). La fréquence de survenue de ces répétitions est la plus élevée dans les textes et le graphique à point et est presque réduit à zéro dans les archives.

De plus, les programmes d'archivage diffèrent toujours dans la mise en œuvre d'algorithmes de compression, qui affectent respectivement le degré de compression.

Certains programmes archivés incluent en outre des fonds visant à réduire le ratio de compression des flics. Donc, dans le programme WinRar, un mécanisme d'archivage continu est mis en œuvre, lors de l'utilisation desquels peut être obtenu de 10 à 50% de taux de compression plus élevé que les méthodes habituelles, en particulier si un nombre important de petits contenus du même type est emballé.

Caractéristiques des architons - Valeurs dépendantes du dos. C'est-à-dire que plus la vitesse de compression est grande, plus le degré de compression et vice versa.

Le marché informatique offre de nombreux architons - chacun a son propre ensemble de formats pris en charge, leurs avantages et leurs inconvénients, leur propre cercle d'admirateurs, sacré que le meilleur archiveur utilisé par eux est le meilleur. Nous ne dissuaderons personne - essayez simplement d'apprécier de manière impartiale les architons les plus populaires en termes de fonctionnalité et d'efficacité. En tant que tels, nous allons attribuer Winzip, Winrar, Wince, 7-Zip - ils dirigent par le nombre de téléchargements sur des serveurs logiciels. Il est à peine conseillé de considérer les archives restants, car le pourcentage d'utilisateurs appliquant leur (juger par le nombre de téléchargements) est petit.

Introduction Archivateurs Nous utilisons constamment. Sur notre site, il existe une description détaillée (bien écrite) du programme d'archives le plus populaire ( Archiver: Vue latérale) Nous ne répéterons pas ici, mais nous ne traiterons que des algorithmes de compression qui s'appliquent dans ces programmes. Quel est le problème ici? Les archives modernes nous fournissent la possibilité de choisir parmi plusieurs algorithmes de compression. Ici, par exemple, les caractéristiques de certains programmes ...

Formats archivés

Archiveur Emballage et déballage Seulement déballer
Winzip. Zipper. Goudron, gzip, bh, arj, lzh, arc
Winrar Rar, zip. Cabine, Arj, Lzh, Tar, Gz, As, Uue, Bz2, Jar, Jso
Grimacer Ace, Zip, LHA, MSCAB Rar, arc, atj, gzip, zoo de goudron
7-zip. 7z, zip, gzip, goudron, bzip2 Rar, taxi, arj, cpio, rpm, deb, divisé
Camionneur de puissance Goudron, bh, taxi, lha, zip Rar, as, arj, gzip, bzip2, arc, zoo

Selon les circonstances, nous appliquons l'archiveur en tant que compresseur, à partir desquels vous souhaitez compresser des informations pour une transmission plus rapide via des canaux de communication (courrier et Internet). Dans d'autres cas, la fonction d'archivage elle-même est plus importante, c'est-à-dire la conversion d'informations en une vue compacte (un fichier) pour se débarrasser de la cible et, en outre, réduire l'emplacement occupé sur le disque à la charge de la table de fichiers. En conséquence, un grand intérêt est l'indicateur de compression des informations originales et du taux de taux de traitement des informations source. Le but de notre étude est de déterminer les indicateurs absolus et relatifs du degré de compression et de vitesse des algorithmes (formats), fournis à notre disposition par les architons spécifiés dans la table ...

Le contenu de l'étude est prévu comme suit:

1. Création d'un fichier d'informations intégré et privé (par des types de fichiers) (dossiers) pour les tests (tests).

2. Réalisation de tests préliminaires sur un ensemble complexe et un raffinement (sur la base des résultats) d'un plan pour de nouveaux tests locaux.

3. Traitement et analyse des résultats avec la justification des recommandations sur l'application pratique d'algorithmes d'archivage différents (formats).

En tant qu'indicateur de compression, le pourcentage de la taille d'un dossier comprimé à sa taille initiale est pris et la vitesse de traitement est dans le cadre des performances de la taille d'origine en kilo-octets pendant le temps de recyclage en quelques secondes. En réalité, les mesures ne sont effectuées que par rapport au temps (chronomètre). L'erreur de mesure de l'heure peut déformer l'indicateur de vitesse lorsque cet indicateur est très grand (plus de 1000 kb / s). Dans d'autres cas, l'erreur peut être négligée.

Détermination des caractéristiques générales des principaux formats d'archives

Pour les tests, un matériau qui simule un "panier utilisateur", composé des fichiers du format DOC, HTM, JPG, MP3, PDF, TXT, a été utilisé. Le panier contient 359 dossiers et 3337 fichiers et a une taille totale de 208893 KB (environ 204 Mo). La composition de ce cadran est donnée dans le tableau suivant:

Composition des fichiers de numérotation pour les tests

Un type Nombre de dossiers Nombre de fichiers Taille, Krib Sur disque, KB
SMS. 0 2 34781 34783
HTM. 329 2869 30913 36962
Doc 3 24 31443 31474
Pdf. 0 1 33691 33694
Jpg. 26 430 40493 41382
Mp3 1 11 37571 37589

LE TOTAL 359 3337 208893 215884

Chaque test consistait au cycle d'archivage avec une fixation de l'opération d'archivage du moment de la pression du bouton Ajouter jusqu'à ce que la fenêtre s'ouvre avec le contenu du fichier d'archive résultant.

Programmes testés:

WinZip 8.1 SR-1
WinRar 3.30.
WINACE 2.5
7ZIP 3.13
ARCHIVER POWER 8.70 07B


Informations sur la configuration du système

Processeur Intel Celeron 1700mHz
256 Mo (DDR SDRAM)
HDD ST360015A (60 gb, 7200PRM)
Windows 2000 Pro, SP3

Les résultats des tests sont donnés dans les tableaux suivants:

Résultats de test pour le format zip

Archiver / mode Taille, Krib Temps, min.-sec. Compression Vitesse, krib / s

Winzip.
Sans compression 208893 - - -
Norme 146408 2-00 70.0% 1740
Maximum 145884 2-45 69.8% 1266
Vite 147690 1-58 70.7% 1770
Très vite 149450 1-50 71.5% 1899

Winrar
D'habitude 146 078 2-22 69.9% 1471
Maximum 145881 3-07 69.8% 1117

Grimacer
Norme 146 418 2-28 70.1% 1411
Maximum 145844 2-40 69.8% 1305

7-zip.
Norme / dégonfler. 145 480 3-22 69.6% 1034
Ultra / déflate. 145 341 5-55 69.6% 588
Ultra / déflate64. 144924 6-10 69.4% 565

Camionneur de puissance
Norme 146074 3-40 69.9% 950
Maximum 145948 3-42 69.9% 941

En général, la compression obtenue par le format zip est d'une commande environ, et ne dépend que de l'archiveur - à l'exception de l'archiveur 7-zip, dans lequel elle peut être quelque peu améliorée en modifiant la méthode de compression et pour le format ZIP. La taille des dictionnaires (archives WinRar et 7 zip) spécifiquement dans cette série de tests n'a pas changé et installé automatiquement (par défaut).

Mode Taille, Krib Temps, min.-sec. Compression Vitesse, krib / s
Sans compression 208893 - - -
Magasin. 209129 0-58 100.1% 3601
Le plus rapide 144017 6-00 68.9% 580
Vite. 143281 6-22 68.6% 547
Normal 142830 6-40 68.4% 522
Bien. 139826 6-58 66.9% 499
Meilleur 140023 7-25 67.0% 469
Meilleur (64kb) 140685 5-40 67.3% 614

Dans le réglage du mode, il est possible de changer la taille du dictionnaire dans les 64 à 4096 kilo-octets. Par défaut, la taille maximale (4096 Ko) est définie sur laquelle les résultats sont obtenus dans ce tableau. Seulement dans la meilleure chaîne (64 Ko) La taille minimale a été définie - 64 kilo-octets. De toute évidence, le changement obtenu de la compression et de la vitesse peut servir d'analogue à toutes les autres lignes de cette table.
Des rangées de bonnes et meilleures ont été vérifiées et leurs valeurs ont été entièrement confirmées, la transition illogique entre elles ne peut être considérée comme une conséquence des erreurs lors des tests.

Résultats du test au format ACE

Mode Taille, Krib Temps, min.-sec. Compression Vitesse, krib / s
Sans compression 208893 - - -
Normal 132978 8-30 63.7% 410
Maximum 132918 8-42 63.6% 400
Bien. 132925 9-50 63.6% 354
Vite. 133216 8-53 63.8% 397
Super rapide. 133273 8-46 63.8% 397
Magasin. 209136 1-48 100.1% 1934

Changements dans le mode de fonctionnement de l'archiveur Winace dans notre cas, peu d'incidences d'indicateurs de compression - la dispersion est dans les dixièmes du pourcentage.

7Z résultats de test de format

Mode Taille, Krib Temps, min.-sec. Compression Vitesse, krib / s
Sans compression 208893 - - -
Normal 130964 9-24 64.2% 362
Maximum 130000 13-51 63.7% 246
Vite 141922 4-16 69.6% 797
Ultra (1 Mo) 131392 8-47 64.4% 387
Ultra (6 Mo) 130101 11-40 63.8% 291
Ultra (12 Mo) 129871 12-47 63.7% 266
Ultra (24 Mo) - - - -
Ultra (dégonfler) 141171 3-15 69.2% 1046
Ultra (PPMD) 140171 8-45 68.7% 389
Ultra (bzip2) 135342 7-32 66.4% 451

Noter:

Pour 7Z Format, l'archiveur vous permet d'installer:

- niveau (rapide, normal, maximum, ultra),
- méthode (lzma, ppmd, bzip2, dégonfler),
- taille de taille (32kb - 192 Mo),
- Taille du mot (8 - 255).

Comme nous pouvons le constater, un très grand nombre de combinaisons de la configuration du mode archiveur sont possibles, ce qui peut être confondu. Vous pouvez être guidé par les colis suivants:

- Plus la taille du dictionnaire est grande, plus la compression et l'heure de l'emballage sont grandes. La compression augmente lentement et le temps d'emballage devient beaucoup.

- la même chose - en termes de taille du mot.

- Les paramètres optimaux sont installés eux-mêmes (paramètres par défaut) et vous ne pouvez pas les tirer sans nécessiter.


Résultats du test au format de la taxi

Mode Taille, Krib Temps, min.-sec. Compression Vitesse, krib / s
Sans compression 208893 - - -

Powerarchiver
Moyen. 140444 9-55 67.2% 351
Maximum 137152 15-55 65.6% 219

Grimacer
Norme 144374 3-24 69.1% 1024
Maximum 138538 12-54 66.3% 270

Le format de la cabine (Fichier d'armoire) est basé sur les algorithmes MS-ZIP et LZX, pris en charge et appliqués par Microsoft. Les déballeurs de format sont disponibles sous Windows 98 et plus. L'algorithme a un code ouvert et peut être appliqué librement par tous les programmeurs.

Test des résultats des formats BH et LHA

Mode Taille, Krib Temps, min.-sec. Compression Vitesse, krib / s
Sans compression 208893 - - -

PowerAchiver, format LHA
Norma. 147518 4-40 70.6% 746
Maximum 147518 4-47 70.6% 728

PowerAchiver, format BH
Norma. 145912 2-16 69.8% 1536
Maximum 145718 2-34 69.8% 1356

Les indicateurs des formats d'archives LHA et BH ont le niveau d'indicateurs du format d'archives de zip, et certains avantages ne sont pas considérés.

En général, comme on peut le voir, les meilleurs indicateurs de compression sont fournis par des formats ACE et 7Z. Les meilleurs indicateurs de performance - ont montré des formats ZIP et BH. D'autres tests sont prévus pour être effectués selon le même projet de concept, mais avec des "paniers" de composition homogène, avec des formats de fichier: TXT, HTML, DOC, JPG, MP3, PDF.

Définition de compressibilité des fichiers de formats différents

Pour assurer cette série de tests, des formats de fichiers complètement homogènes ont été compilés et les fichiers répétitifs de l'ensemble ont été exclus. Les fichiers EXE et DLL ont été prélevés dans le dossier Système Windows sans aucune sélection. Le fait est que les fichiers de format EXE sont déjà compressés et leur compression supplémentaire - n'a pas de sens. Les caractéristiques définies sont données dans le tableau suivant:

Formats de fichier dans les ensembles de test

Format Terrain Des dossiers Taille totale, KB
SMS. 0 27 35096
HTM. 7 1371 25076
Doc 1 33 37211
Pdf. 0 1 33691
Jpg. 26 430 40493
Mp3 2 11 37571
EXE 0 316 32446
Dll 0 184 40323
XLS. 6 15 17228
Chm. 0 69 33940
MPEG 0 24 46606
Wav 0 1 30804
BMP 0 15 31713
Avi. 0 89 9261

Lors du test, seul le mode de fonctionnement normal (normal) de l'archiveur a été utilisé. Dans le même temps, chaque format de l'archive a été créé par son propre archiveur (Winzip, WinRar, Wince, 7-Zip), un archiveur de puissance a été utilisé pour emballer le format de la taxi, qui n'a pas son propre format (corporatif). .

Compressibilité du fichier en fonction du format d'archive

Format Zipper. Rar As 7z Taxi.
SMS. 43.7% 37.8% 37.4% 34.3% 36.3%
HTM. 29.2% 28.3% 9.09% 7.75% 15.0%
Doc 8.76% 6.39% 5.47% 5.21% 6.49%
Pdf. 97.7% 97.4% 97.8% 97.5% 97.3%
Jpg. 98.5% 98.5% 85.0% 85.1% 97.9%
Mp3 98.1% 97.9% 98.1% 97.9% 97.7%
EXE 46.9% 42.1% 37.8% 32.7% 39.3%
Dll 45.6% 39.6% 37.6% 34.3% 39.6%
XLS. 11.8% 8.27% 7.44% 5.97% 8.49%
Chm. 98.6% 98.8% 99.0% 99.6% 98.6%
MPEG 95.3% 94.7% 94.8% 94.5% 94.4%
Avi. 86.1% 84.1% 84.5% 82.7% 83.4%
Wav 92.2% 62.8% 62.6% 87.0% 92.1%
BMP 63.5% 31.9% 30.6% 51.5% 56.2%

Moyenne 65.5% 59.2% 56.2% 58.3% 61.6%

En tant que commentaire sur la table, vous pouvez noter les éléments suivants:

- La meilleure compression sur les principaux formats de fichiers source est fournie par le format d'archives 7z.

- Le meilleur indicateur en moyenne a une archive ACE Format en raison de la compression enregistrée des formats WAV et BMP.

Si nous parlons de la compressibilité des fichiers source, on peut noter les éléments suivants: le taux de compression dépend du format de fichier source, impliquant parfois une compression de données interne. Si le fichier est pré-scellé en fonction de ses algorithmes, la compressibilité de son archiveur est petite. Par exemple, le fichier de format CHM est une version compactée du fichier de format HTML et, en conséquence, la compressibilité d'eux est différente. La même chose que nous voyons en ce qui concerne WAV et MP3, BMP et JPG, etc.

Vitesse de l'archiveur, Krib / s

Format Zipper. Rar As 7z Taxi.
SMS. 2064 408 386 217 226
HTM. 2507 836 627 643 411
Doc 7400 2862 1550 1378 886
Pdf. 2246 293 370 387 370
Jpg. 2670 587 337 368 287
Mp3 2348 458 368 335 332
EXE 2318 773 601 416 433
Dll 2016 858 672 474 434
XLS. 4300 1436 1148 507 224
Chm. 1886 556 365 357 323
MPEG 2453 583 416 370 338
Avi. 1852 617 463 370 356
Wav 2370 1711 1184 354 288
BMP 2883 1269 933 401 373

Moyenne 2838 856 609 485 385

Ce tableau démontre une règle évidente - pour la meilleure compression, il est presque toujours nécessaire de payer la vitesse d'emballage.

Compressibilité des différents formats de fichiers. Une addition

Format Zipper. Rar As 7z
VXD. 55.1% 52.5% 43.3% 40.8%
Inf 14.9% 13.3% 13.2% 12.3%
VBP. 78.3% 72.6% 26.0% 18.5%
Gif. 90.0% 94.3% 87.2% 86.1%
SCR. 88.8% 88.0% 88.1% 87.9%
Dat. 23.1% 20.1% 20.5% 18.0%
Ini. 35.6% 33.2% 32.5% 30.2%

Moyenne 55.1% 53.4% 44.4% 42.0%

Ce tableau contient des données supplémentaires sur la compressibilité des formats de fichiers. Ici, les tests ont été effectués sans fixer le temps sur des ensembles de petits volumes (100-200 Ko). Comme on peut le voir, dans tous les formats, la meilleure compression donne au format archive 7z.

En outre, comme exemple, je donnerai les résultats de l'emballage de la réelle distribution du programme Norton Antivirus. L'emballage a été effectué en mode normal, les options auto-extraites pour les mêmes archives ont également été obtenues. Le résultat de ce test est affiché dans le tableau suivant (la dernière colonne est une période approximative de chargement de la distribution emballée sur le réseau avec une connexion modem classique à une vitesse de 2,7 kb dans une seconde):

Archives de format Taille, Krib Temps Compression Temps de téléchargement, heure.-min.
Sans compression 47410 - - 4-53
Zipper. 29045 0-21 61.3% 2-59
Rar 26619 1-15 56.1% 2-44
As 23838 1-30 50.3% 2-27
7z 22871 1-50 48.2% 2-21
Taxi. 26804 2-22 56.5% 2-45
EXE (rar) 26671 1-15 56.3% 2-45
EXE (ACE) 23903 1-30 50.4% 2-28
EXE (7Z) 22941 1-52 48.4% 2-22

Les résultats de la table démontrent clairement que:

Lorsque vous transférez des fichiers sur le réseau - l'emballage est pratiquement requis.

L'emballage avec une bonne compression peut réduire le temps de transfert de fichier, dans notre cas - une demi-heure.

L'utilisation d'ACE prometteuse et de formats 7Z est tout à fait acquitté sous la forme d'archives auto-extraites. Cette circonstance est souhaitable d'envisager des distributeurs de produits logiciels sur Internet.

L'archiveur à 7 zip est un bon programme avec un degré élevé de compression et dispose des commodités utilisateur minimum minimum nécessaires. Vous pouvez notamment supprimer et afficher des fichiers individuels sans déballage d'archives communes. Dans le même temps, les fichiers sont ouverts par des applications associatives du système. Vous pouvez compléter les archives avec des fichiers individuels.

Conclusion

Le programme d'archives reste un outil indispensable d'emballage et de compression des informations numériques. Les informations traitées enregistre de manière significative le lieu des gardiens et du temps de transmission sur les canaux de communication. Les formats d'emballage à glissière et les plus populaires et les plus utilisés sont maintenant. D'autres formats, par exemple, arj, glace, pac, arc et certains sont encore peuplés progressivement et enchaînés. Mais la technologie d'emballage ne reste pas encore. Les archives sont en demande, donc les programmeurs recherchent en permanence des méthodes de compression plus efficaces. Ceci est mis en évidence par les résultats de notre expérience. Existe vraiment au moins deux formats d'archives (ACE et 7Z), qui sont significativement supérieurs au zip harmonieux et rar sur la compression. L'utilisation de ces formats réduira considérablement le temps de transfert sur Internet, ce qui correspond aux intérêts de nombreux utilisateurs ...

Mise à jour le 24 mai 2004

Dans cette section, nous examinerons l'effet de l'option solide sur la performance des archiveurs. Rappelez-vous que l'emballage avec l'option solide conduit au fait que vous ne pouvez pas ajouter de fichier à l'archive et vous ne pouvez pas supprimer un fichier séparé de celui-ci, l'archive est emballée et déballée uniquement. En général, cela peut causer certains inconvénients lors de l'utilisation de telles archives. Mais parfois, de tels inconvénients peuvent avoir une valeur secondaire par rapport aux avantages.

Des tests supplémentaires ont été effectués exactement comme décrit dans la section principale sur les mêmes ensembles de matériaux. Prise en compte de la table d'essai supplémentaire "Résultats du format RAR" du texte principal a commencé à ressembler à ceci ...

Résultats de test de format rar

Mode Taille, Krib Temps, min.-sec. Compression Vitesse, krib / s
Sans compression 208893 - - -
Magasin. 209129 0-58 100.1% 3601
Le plus rapide 144017 6-00 68.9% 580
Vite. 143281 6-22 68.6% 547
Normal 142830 6-40 68.4% 522
Normal (solide) 131664 9-14 63.0% 377
Bien. 139826 6-58 66.9% 499
Bon (solide) 129314 8-24 61.9% 414
Meilleur 140023 7-25 67.0% 469
Meilleur (solide) 129527 8-36 62.0% 405
Meilleur (64kb) 140685 5-40 67.3% 614

La mise en place de l'archiveur WinRar comprend:

1. Choisir une méthode de compression (normale, magasin, la plus rapide, rapide, bonne, meilleure).

2. Sélection des modifications:
- Ajouter et remplacer des fichiers,
- ajouter et mettre à jour des fichiers,
- Nouveaux fichiers existants uniquement,
- Synchroniser les contenus Axchive.

3. Sélectionnez l'option:
- Supprimer des fichiers après l'archivage,
- Créer une archive SFX,
- créer des archives solides,
- mettre la vérification de l'autohénlicité,
- mettre un enregistrement de récupération,
- tester des fichiers archivés,
- Archives de verrouillage.

Il est facile de voir que plus d'une centaine de cellules sont possibles qui définissent le fonctionnement de l'archiveur. En conséquence, la gamme de résultats pour ce format et cet archiveur s'est avéré être un ratio de compression assez large: 61,9 à 68,9%, vitesse: 377 - 614 kb / s.

L'option solide a également l'archiveur Winace. Mais dans cet archiveur, la marque Solid Archive est activée de manière constante (par défaut) et est donc entrée les résultats du test. Ainsi, l'injustice n'était autorisée que pour le format RAR et l'archiver WinRar.

Compte tenu des nouvelles circonstances, la table du leader en fonction du degré de compression ressemble à ceci:

1. RAR (bon, solide) - 61,9%.

2. 7-Zip (maximum) - 62,2%.

3. ACE (bon) - 63,6%.

Un tableau complémentaire des résultats de l'emballage de la réelle distribution du programme Norton Antivirus ("Un exemple de l'emballage de distribution Norton AntiVirus") a commencé à ressembler à ceci ...

Exemple d'emballage de distribution d'antivirus Norton

Archives de format Taille, Krib Temps Compression Temps de téléchargement, heure.-min.
Sans compression 47410 - - 4-53
Zipper. 29045 0-21 61.3% 2-59
Rar 26619 1-15 56.1% 2-44
Rar (normal, solide) 22745 1-21 48.0% 2-20
Rar (bon, solide) 22680 1-28 47.8% 2-20
As 23838 1-30 50.3% 2-27
7z 22871 1-50 48.2% 2-21
Taxi. 26804 2-22 56.5% 2-45
EXE (rar) 26671 1-15 56.3% 2-45
EXE (rar, normal, solide) 22797 1-29 48.1% 2-21
EXE (ACE) 23903 1-30 50.4% 2-28
EXE (7Z) 22941 1-52 48.4% 2-22

Les résultats de ce tableau confirment également que l'archiveur WinRar peut fournir une compression maximale et cet indicateur est le leader. En comparaison avec le format zip, le chargement de la même distribution au format RAR peut être effectué pendant 39 minutes en bref ...

Dans la table avec les résultats des résultats des tests de format 7Z, notre lecteur Alexander Rykhlov a trouvé une erreur dans le calcul de l'indicateur de compression. Alexandre merci beaucoup, et la table corrigée "7z Format Test Résultats" a commencé à ressembler à ceci ...

130101 11-40 62.3% 291
Ultra (12 Mo) 129871 12-47 62.2% 266
Ultra (24 Mo) - - - -
Ultra (dégonfler) 141171 3-15 67.6% 1046
Ultra (PPMD) 140171 8-45 67.1% 389
Ultra (bzip2) 135342 7-32 64.8% 451

Noter: En mode Ultra (LZMA), lors de la spécification de la taille d'un dictionnaire dans 24 mégaoctets, la vitesse a tellement diminué que le test était impossible.

Conclusion


La reproduction avait une sensation que l'archiveur WinRar n'était pas aussi bon que de nombreux utilisateurs le considèrent, n'a pas eu lieu. Nos tests ont confirmé que les caractéristiques techniques de cet archiveur sont vraiment les plus élevées. Les indicateurs très proches ont un archiveur de 7-zip, mais ce dernier est encore un peu inférieur au leader. Pour obtenir la compression maximale de l'archiveur WinRar, vous devez activer l'option solide (par défaut, il est désactivé), d'autres paramètres (normal, bon, etc.) - ont une valeur plus faible.

3. Indicateur de compression de fichier

Les informations de compression dans les fichiers d'archivage sont effectuées en éliminant la redondance de différentes manières, par exemple, en simplifiant les codes, à l'exclusion des bits constants ou de représenter des symboles répétés ou une séquence de symboles répétée sous forme de coefficient de répétition et de caractères correspondants. Les algorithmes de cette compression d'informations sont mis en œuvre dans des programmes archivés spéciaux (les plus célèbres desquels ARJ / ARJFolder, PKZIP / PKUNZIP / WINZPIP, RAR / WINRAR) sont utilisés pour être compressés comme un et plusieurs fichiers placés sous une forme compressée. dans le dossier d'archive ou archive.

Le but de l'emballage des fichiers assure généralement une mise en place plus compacte d'informations sur le disque, la réduction du temps et, en conséquence, le coût de la transmission d'informations sur les canaux de communication dans des réseaux informatiques. Par conséquent, l'indicateur principal de l'efficacité d'un programme-archiveur est le degré de compression des fichiers.

Le degré de compression de fichier caractérisé par le coefficient de la COP, défini comme le rapport du volume du fichier VC compressé sur le volume du fichier source VO, exprimé en pourcentage (dans certaines sources qu'il utilise le rapport inverse):

KS \u003d (VC / VO) * 100%

Le degré de compression dépend du programme utilisé, de la méthode de compression et du type de fichier source.

Les images graphiques, les fichiers texte et les fichiers de données, pour lesquels le taux de compression peut atteindre 5 à 40%, sont moins compressés, les fichiers de programmes exécutables et les modules de chargement du KS \u003d 60% sont comprimés. Les fichiers d'archives ne compressent presque pas. Il est facile d'expliquer si vous savez que la plupart des programmes d'archivage sont utilisés pour comprimer les variantes de l'algorithme LZ77 (Lempel-Ziva), dont l'essence consiste à coder spécial des séquences d'octets récurrents (symboles de lecture). La fréquence de survenue de ces répétitions est la plus élevée dans les textes et le graphique à point et est presque réduit à zéro dans les archives.

De plus, les programmes d'archivage diffèrent toujours dans la mise en œuvre d'algorithmes de compression, qui affectent respectivement le degré de compression.

Certains programmes archivés incluent en outre des fonds visant à réduire le ratio de compression des flics. Donc, dans le programme WinRar, un mécanisme d'archivage continu est mis en œuvre, lors de l'utilisation desquels peut être obtenu de 10 à 50% de taux de compression plus élevé que les méthodes habituelles, en particulier si un nombre important de petits contenus du même type est emballé.

Caractéristiques des architons - Valeurs dépendantes du dos. C'est-à-dire que plus la vitesse de compression est grande, plus le degré de compression et vice versa.

Le marché informatique offre de nombreux architons - chacun a son propre ensemble de formats pris en charge, leurs avantages et leurs inconvénients, leur propre cercle d'admirateurs, sacré que le meilleur archiveur utilisé par eux est le meilleur. Nous ne dissuaderons personne - essayez simplement d'apprécier de manière impartiale les architons les plus populaires en termes de fonctionnalité et d'efficacité. En tant que tels, nous allons attribuer Winzip, Winrar, Wince, 7-Zip - ils dirigent par le nombre de téléchargements sur des serveurs logiciels. Il est à peine conseillé de considérer les archives restants, car le pourcentage d'utilisateurs appliquant leur (juger par le nombre de téléchargements) est petit.

Étant donné que dans la tâche, chaque paire de valeurs (,) se produit une fois, la table de corrélation prendra la forme d'une matrice unique. Des moyennes si conditionnelles coïncident avec les valeurs. Il s'ensuit que la relation de corrélation est égale à 1 et, donc ...

Approximation des fonctions par la méthode des moindres carrés

Ensuite, approchez-la de la fonction avec une fonction quadratique. Pour déterminer les coefficients et utiliser le système (3.2.1) à l'aide de la somme totale du tableau 3 situé dans les cellules B29, C29, D29, E29, F29, G29 et H29, installez le système (2.1.4) dans la forme de (3.2 ...

Types de archives

Un grand nombre de méthodes diverses, leurs modifications et leurs sous-espèces pour la compression de données ont été développées. Les archives modernes, en règle générale, utilisent simultanément plusieurs méthodes en même temps. Vous pouvez mettre en évidence une partie de la principale ...

Comment puis-je classer les systèmes d'information en fonction du degré d'automatisation?

Classification des technologies de l'information

Les technologies de l'information doivent être classées principalement sur le champ d'utilisation et par le degré d'utilisation des ordinateurs. Il existe des domaines de technologie de l'information tels que la science, l'éducation, la culture, l'économie ...

En tant que l'une des étapes nécessaires à la création d'un système de sécurité efficace, les entreprises, EID, effectueront une analyse de la vulnérabilité de la société "Fitmax" ...

Joint mathématique du degré de vulnérabilité d'un objet d'activité de l'information sur l'exemple de l'entreprise LLC "Fitmax"

Pour chacun des canaux, les calculs de la probabilité du degré de sécurité de l'information sont effectués. Channel acoustique: canal vibroacoustique: facteur humain: sur la base des données obtenues ...

Microprocesseur: nomination, composition, caractéristiques principales

Plusieurs fichiers fonctionnent avec des fichiers sous Windows. Le premier est "Dossiers de disque" dans mon dossier d'ordinateur. Avec leur aide, vous pouvez accéder à n'importe quel fichier désiré dans n'importe quel dossier et sur n'importe quel disque. Cependant, cette méthode est loin d'être parfaite ...

Système de recherche

1. Les systèmes d'information manuelle sont caractérisés par le manque de moyens techniques modernes d'informations de traitement et de la mise en œuvre de toutes les opérations de l'homme. Par exemple, sur le travail du gestionnaire dans l'entreprise où les ordinateurs manquent ...

L'indicateur principal de l'efficacité de la porte du vendeur-consultant est fourni par eux la part des résultats dans le volume total du trafic client en rapportant - un indicateur de la participation productive du vendeur ...

Calcul des paramètres d'un moteur électrique à économie d'énergie asynchrone

Les caractéristiques des degrés de protection des machines électriques sont notées par deux IP latine (protection internationale) et deux chiffres ...

Système de commerce électronique et de statistique pour la vente de pièces de rechange automobile

Il est important d'analyser le nombre de nouveaux clients non seulement, mais également des visiteurs de votre boutique en ligne. Cela vous permettra d'évaluer aussi loin que votre site est intéressant pour le public cible. De plus, les visiteurs de retour sont toujours plus faciles ...



Avez-vous aimé l'article? Partagez-le