Contacte

Arhive. Algoritmi pentru comprimarea datelor fără pierderi Care este gradul de comprimare a fișierelor


Arhivele sunt concepute pentru a arhiva (ambalare) fișiere prin comprimarea informațiilor stocate în ele, pentru a economisi spațiu pe discuri.

Comprimarea informațiilor este procesul de transformare a informațiilor stocate în fișier, la forma la care redundanța în reprezentarea sa și, în consecință, necesită o cantitate mai mică de memorie de stocare.

Compresia informațiilor în fișiere este produsă prin susținerearedundanță în diferite moduri,de exemplu, prin simplificarea codurilor, excepțiile de bit constantă de caractere sau o secvență repetată de simboluri, introducerea coeficientului de repetare a simbolului etc. Aplicați diverse algoritmi pentru o astfel de comprimare a informațiilor.

Acesta poate fi blocat ca unul și mai multe fișiere plasate într-un formular comprimat într-un fișier de arhivă sau arhivă.

Fișier de arhivare. (arhivă sau arhivă de fișiere) - acest lucru este specialdosarul organizat care conține unul sau nucâte fișiere sunt în formă comprimată sau necomprimată și informații de serviciunumele de fișiere, data și ora creației lor sau modificăatenție, dimensiuni etc.

Scopul de ambalare a fișierelor De obicei, asigurând plasarea mai compactă a informațiilor pe disc, reducerea timpului și, în consecință, costul transmiterii informațiilor asupra canalelor de comunicare în rețelele de calculatoare. În plus, ambalare într-o singură arsurveri de fișiere de fișiere de fișieresimplifică semnificativ transferul de la un computer la altul, scurtează timpul pentru a copia fișierele pe discuri, vă permite să protejați informațiile de la accesul neautorizat, promovează protecția împotriva infecției cu viruși de calculator.

Gradul de compresie depinde de programul-archiver utilizat, metoda de compresie și tipul de fișier sursă. Fișierele text și fișierele de date sunt cele mai bine comprimate pentru care raportul de compresie poate ajunge la 80-90%, fișierele programelor executabile și modulele de încărcare sunt mai mici - 5-40%. Fișierele de arhivă aproape nu comprimă.

Programele de arhivare se disting prin metodele de compresie utilizate, care respectiv afectează gradul de comprimare.

Rubberhiving. (Despachetare)- procesul de recuperare a fișierelordin arhiva exact în această formă, ceea ce au avut înainte de a descărca în ARstup.Când despachetați, fișierele sunt preluate din arhivă și sunt plasate pe disc sau în memoria RAM.

Fișierele de arhivă mari în volum pot fi plasate în mai multe volume. Astfel de arhive sunt numite multi-volum. Tom - aceasta este o parte integrantă a unei arhive multi-volum.Crearea unei arhive din mai multe părți, puteți să-l înregistrați în mai multe discuri de floppy.


Principalele tipuri de programe de arhivă.

În ciuda faptului că volumul memoriei externe a computerului este în continuă creștere, nevoia de arhivare nu scade. Acest lucru se explică prin faptul că arhivarea este necesară nu numai pentru a economisi spațiu în memorie, ci și pentru depozitarea fiabilă a copiilor informațiilor valoroase, precum și pentru a transfera rapid informații despre rețea către alte computere.

În plus, posibilitatea eșecului transportatorilor de informații magnetice, efectul distructiv al virușilor Forțează utilizatorii să crească informații valoroase la alte mijloace media.

Procesul de scriere a unui fișier în fișierul de arhivă este numit arhivare (ambalare, compresie) și eliminarea fișierului din arhivă - dezarhivare (despachetare). Fișier ambalat (comprimat) numit arhiva.

Arhivare Informațiile sunt o astfel de conversie a informațiilor la care volumul fișierului scade, iar cantitatea de informații rămâne aceeași.

Gradul de comprimare a informațiilor depinde de conținutul fișierului, precum și de metoda de arhivă selectată. Gradul (calitatea) comprimării fișierelor este caracterizat de coeficientul de compresie K C.definit ca raportul dintre volumul fișierului comprimat V C. la scopul fișierului sursă V O., exprimată ca procent:

Cu cât valoarea este mai mică K C.cu atât este mai mare gradul de comprimare a informațiilor.

Toate metodele existente de comprimare a informațiilor pot fi împărțite în două clase: ambalaje fără pierdere informații (algoritm reversibil) și ambalarea cu pierderi informații (algoritm ireversibil). În primul caz, informațiile inițiale pot fi restaurate cu precizie prin informațiile ambalate disponibile. În al doilea caz, mesajul despachetat va diferi de mesajul sursă.

Activitatea arhivei se bazează pe faptul că găsesc zone și spații repetate în fișiere, marchează-le în fișierul de arhivă și apoi fișierele inițiale sunt restaurate atunci când despachetați.

Programele de ambalare (sau arhivările) vă permit să plasați copii ale fișierelor în arhivă și să preluați fișierele din arhivă, să vizualizați designul arhivei și să vă încercați integritatea, să ștergeți fișierele din arhivă și să le actualizați, setați o parolă atunci când extrageți fișiere din arhivă etc.

Diferite programe de arhivare se disting prin formatul fișierelor de arhivă, viteza de viteză, gradul de comprimare, kit de service (meniul complet pentru utilizator), ușurința de utilizare (interfață), prezența asistenței, dimensiunea proprie.

Un număr de arhivuri fac posibilă crearea arhivelor cu mai multe volume, arhive de auto-extragere, arhive care conțin directoare.

Cel mai popular Următorii arctori sunt utilizați pe scară largă: ARJ, PKZIP / PKUNZIP, RAR, ACE, LHA, ICE, PAK, PKARC / PKXARC, ZOO, HIPER, AIN.

Cel mai eficient Sunt RAR, ACE, Arhive Arj.

Acestea oferă cel mai mare grad de comprimare a informațiilor și au cea mai mare viteză. Arhidruul RAR are o interfață grafică la îndemână și vă permite să citiți fișiere text care se află în arhiva RAR și în arhivele ARJ și ZIP. Arhiverul Ain are o interfață de limbă rusă. Arcul WinraR-95 și Winzip funcționează numai în mediul Windows. Sunt necesare atunci când lucrați cu nume de fișiere lungi și ruse în Windows. În prezent, aceste arhivuri sunt cele mai des utilizate.


Secțiunea 3. Software-ul aplicației IT

Toate algoritmii de compresie funcționează în fluxul de informații de intrare pentru a obține un flux mai compact de ieșire cu o anumită conversie. Principalele caracteristici tehnice ale proceselor de compresie și rezultatele lucrărilor lor sunt:

· Gradul de compresie este raportul dintre volumul sursei și fluxurilor rezultate;

· Viteza de compresie este timpul petrecut pe comprimarea unei anumite cantități de informații ale fluxului de intrare pentru a obține de la acesta un flux de ieșire echivalent;

· Calitate de compresie - valoarea care arată cât de mult este ambalat fluxul de ieșire atunci când re-comprimarea este aplicată pe același sau alt algoritm.

Algoritmi care elimină redundanța înregistrărilor de date sunt numite algoritmi de compresie a datelor sau algoritmi de arhivare. În prezent, există o varietate de programe de compresie de date bazate pe mai multe moduri de bază.

Toate algoritmii de compresie a datelor sunt împărțiți în:

) Algoritmi de comprimare fără pierdere, atunci când se utilizează datele de la recepție, fără nici o modificare cea mai mică;

) Algoritmi de compresie cu pierderi care sunt eliminate din informațiile despre fluxul de date care afectează ușor esența datelor sau, în general, nu răspunde de către persoana respectivă.

Există două metode principale de arhivare fără pierderi:

algoritmul Huffman (eng. Huffman), care se concentrează pe secvențele de bytes, care nu sunt legate între ele,

algoritmul Lempel-Ziva (eng. LEMPEL, ZIV), axat pe comprimarea oricăror tipuri de texte, care este, folosind faptul că "cuvinte" repetate repetate - secvențe octetice.

Aproape toate programele populare de arhivare fără pierderi (ARJ, RAR, ZIP etc.) utilizează combinația acestor două metode - algoritmul LZH.

Algoritm huffman.

Algoritmul se bazează pe faptul că unele caractere din standardul de 256 de caractere din textul arbitrar pot apărea mai des decât mijlocul perioadei de repetare, în timp ce altele, respectiv, sunt mai puțin probabil. Prin urmare, dacă $ + O este setul de caractere comune pentru a utiliza secvențe de biți scurt, mai puțin de 8 lungime și pentru înregistrarea caracterelor rare - lungime, atunci dimensiunea totală a fișierului va scădea.

LEMPEL-ZIVA algoritm. Algoritmul clasic Lempel-Ziva -LZ77, numit în acest an de publicare, este extrem de simplu. Este formulat după cum urmează: dacă o secvență similară de octeți sa întâlnit deja în fluxul de ieșire câștigat anterior, iar înregistrarea lungimii și offsetului său din poziția curentă este mai scurtă decât această secvență, legătura (offset, lungime) este scrisă la fișierul de ieșire și nu secvența însăși.

4. Compresie de fișiereProducătoare

Informațiile de comprimare în fișierele de arhivă se face prin eliminarea redundanței în diferite moduri, de exemplu, prin simplificarea codurilor, excluzând biți constanți sau reprezentând simboluri repetate sau o secvență de simbol repetat ca coeficient de repetare și caractere corespunzătoare. Algoritmii unei astfel de compresie a informațiilor sunt implementate în programe speciale arhivate (cele mai renumite din care ARJ / ARJFOLDER, PKZIP / PKUNZIP / WINZIP, RAR / WinRAR) sunt utilizate ca unul și mai multe fișiere care sunt plasate într-o formă comprimată în așa-numitul fișier de arhivă sau arhivă.

Scopul ambalajului de fișiere asigură, de obicei, plasarea mai compactă a informațiilor pe disc, reducerea timpului și, în consecință, costul de transmitere a informațiilor asupra canalelor de comunicare în rețelele de calculatoare. Prin urmare, indicatorul principal al eficacității unui program de program este gradul de comprimare a fișierelor.

Gradul de comprimare a fișierelor se caracterizează prin coeficientul de COP, definit ca raportul dintre volumul fișierului VC comprimat la volumul fișierului sursă VO, exprimat ca procent (în unele surse utilizează raportul invers):

KS \u003d (VC / VO) * 100%

Gradul de compresie depinde de programul utilizat, de metoda de compresie și de tipul de fișier sursă.

Imaginile grafice, fișierele text și fișierele de date, pentru care raportul de compresie pot ajunge la 5 - 40%, sunt mai puțin comprimate, fișierele programelor executabile și modulele de încărcare ale KS \u003d 60% sunt comprimate. Fișierele de arhivă aproape nu comprimă. Este ușor de explicat dacă știți că majoritatea programelor de arhivare sunt folosite pentru a comprima variantele algoritmului LZ77 (LEMPEL-ZIVA), a cărei esență este la codificarea specială a secvențelor octeților recurente (citite - simboluri). Frecvența apariției unor astfel de repetări este cea mai mare în texte și graficul punct și este aproape redus la zero în arhive.

În plus, programele de arhivare diferă încă în implementarea algoritmilor de compresie, care respectiv afectează gradul de comprimare.

Unele programe arhivate includ suplimentar fonduri care vizează reducerea raportului de compresie a poliției. Deci, în programul WinRAR, este implementat un mecanism de arhivare continuă, atunci când se utilizează care poate fi realizat cu 10-50% mai mare raport de compresie decât metodele obișnuite, mai ales dacă este ambalat un număr semnificativ de conținuturi mici de același tip.

Caracteristicile valorilor dependente de arhorie. Aceasta este, cu atât este mai mare viteza de compresie, cu atât este mai scăzut gradul de compresie și invers.

Piața calculatorului oferă numeroase arhiteții - fiecare are propriul său set de formate sprijinite, avantajele lor și contra, propriul lor cerc de admiratori, cred că cel mai bun arhivă folosit de ei este cel mai bun. Nu vom descuraja pe nimeni - încercați doar să apreciem imparțial cele mai populare arhite-uri din punct de vedere al funcționalității și eficienței. Ca atare, vom aloca Winzip, Winrar, Wince, 7-Zip - ele conduc după numărul de descărcări pe serverele software. Este greu de recomandat să se ia în considerare celelalte arhivite, deoarece procentul de utilizatori care aplică (judecând după numărul de descărcări) este mic.

Introducere Arhivații pe care îl folosim în mod constant. Pe site-ul nostru există o descriere detaliată (deși o lungă) a celui mai popular program de arhivare ( Arhisterul: Vedere laterală) Nu vom repeta aici, dar vom face față numai algoritmilor de compresie care se aplică în aceste programe. Care este problema aici? Arhitele moderne ne oferă ocazia de a alege să folosim mai multe algoritmi de compresie. Aici, de exemplu, caracteristicile unor programe ...

Formate arhivate

Archiver Ambalare și despachetare Doar despachetarea
WinZip. Zip. Gar, gzip, bh, arj, lzh, arc
Winrar. RAR, ZIP. Cab, ARJ, LZH, TAR, GZ, ACE, UUE, BZ2, Jar, JSO
VÂNĂTĂȚI ACE, ZIP, LHA, MSCAB RAR, ARC, ATJ, GZIP, ZOO GAR
7-zip. 7Z, ZIP, GZIP, TAR, BZIP2 RAR, CAB, ARJ, CPIO, RPM, Deb, Split
Power Archiver TAR, BH, CAB, LHA, ZIP RAR, ACE, ARJ, GZIP, BZIP2, Arc, Zoo

În funcție de circumstanțe, aplicăm arhivatorul ca compresor, de la care doriți să comprimați informații pentru o transmisie mai rapidă prin canale de comunicare (poștă și Internet). În alte cazuri, funcția de arhivare este mai importantă, adică conversia informațiilor într-o vizualizare compactă (un fișier) pentru a scăpa de țintă și, în plus, pentru a reduce locația ocupată pe disc pe cheltuială a tabelului de fișiere. În consecință, un mare interes este indicatorul de comprimare a informațiilor originale și a ratei de procesare a informațiilor sursă. Scopul studiului nostru este de a determina indicatorii absoluți și relativi ai gradului de comprimare și viteză al algoritmilor (formate), care sunt furnizate în dispoziția noastră de către arhivurile specificate în tabel ...

Conținutul studiului este planificat după cum urmează:

1. Crearea unui set de informații (dosare) integrat și privat (prin fișiere) pentru testare (teste).

2. Realizarea testelor preliminare pe un set complex și rafinament (pe baza rezultatelor) unui plan pentru teste locale ulterioare.

3. Prelucrarea și analiza rezultatelor cu rațiunea pentru recomandări privind aplicarea practică a diferitelor algoritmi de arhivare (formate).

Ca indicator al comprimării, se ia procentul de dimensiune a unui folder comprimat la dimensiunea sa inițială și viteza de prelucrare este ca parte a performanței dimensiunii originale în kilobyte în timpul reciclării timpului în secunde. De fapt, măsurătorile sunt efectuate numai în raport cu timpul (cronometru). Eroarea de măsurare a timpului poate denatura indicatorul de viteză când acest indicator este foarte mare (mai mult de 1000 KB / s). În alte cazuri, eroarea poate fi neglijată.

Determinarea caracteristicilor generale ale principalelor formate de arhivă

Pentru testare, a fost utilizat un material care simulează un "coș de utilizator", compus din fișierele DOC, HTM, JPG, MP3, PDF, TXT Format,. Coșul conține 359 de dosare și 3337 de fișiere și are o dimensiune totală de 208893 kb (aproximativ 204 MB). Compoziția acestui cadran este dată în tabelul următor:

Compoziția fișierelor de apelare pentru testare

Un fel Numărul de foldere Numărul de fișiere Dimensiune, Krib. Pe disc, kb
TXT. 0 2 34781 34783
HTM. 329 2869 30913 36962
Doc. 3 24 31443 31474
PDF. 0 1 33691 33694
JPG. 26 430 40493 41382
MP3. 1 11 37571 37589

TOTAL 359 3337 208893 215884

Fiecare test a constat în ciclul de arhivare cu o fixare a timpului de operare de arhivare din momentul apăsării butonului de adăugare până când fereastra se deschide cu conținutul fișierului de arhivă rezultat.

Programe testate:

WinZip 8.1 SR-1
Winrar 3.30.
Winace 2.5.
7ZIP 3.13.
Power Archiver 8.70 07b


Informații despre configurația sistemului

Procesor Intel Celeron 1700Mhz
256 MB (DDR SDRAM)
HDD ST360015A (60 GB, 7200PRM)
Windows 2000 Pro, SP3

Rezultatele testului sunt date în tabelele următoare:

Rezultatele testelor pentru format ZIP

ARCHIVER / MODE. Dimensiune, Krib. Timp, min.-sec. Comprimare Viteza, krib / s

WinZip.
Fără compresie 208893 - - -
Normă 146408 2-00 70.0% 1740
Maxim 145884 2-45 69.8% 1266
Rapid 147690 1-58 70.7% 1770
Foarte rapid 149450 1-50 71.5% 1899

Winrar.
Obișnuit 146 078 2-22 69.9% 1471
Maxim 145881 3-07 69.8% 1117

VÂNĂTĂȚI
Normă 146 418 2-28 70.1% 1411
Maxim 145844 2-40 69.8% 1305

7-zip.
Normă / deflare. 145 480 3-22 69.6% 1034
Ultra / deflați-vă. 145 341 5-55 69.6% 588
Ultra / deflate64. 144924 6-10 69.4% 565

Power Archiver
Normă 146074 3-40 69.9% 950
Maxim 145948 3-42 69.9% 941

În general, compresia obținută de formatul ZIP este de aproximativ o comandă și depinde puțin de arhivă - cu excepția arhivorului de 7 zip, în care poate fi oarecum îmbunătățită prin schimbarea metodei de compresie și pentru format ZIP. Dimensiunea dicționarelor (WinRAR și ARHOURITE 7-ZIP) în special în această serie de teste nu sa schimbat și instalate automat (în mod implicit).

Mod. Dimensiune, Krib. Timp, min.-sec. Comprimare Viteza, krib / s
Fără compresie 208893 - - -
Magazin. 209129 0-58 100.1% 3601
Cel mai rapid 144017 6-00 68.9% 580
Rapid. 143281 6-22 68.6% 547
Normal 142830 6-40 68.4% 522
Bun. 139826 6-58 66.9% 499
Cel mai bun 140023 7-25 67.0% 469
Cel mai bun (64kb) 140685 5-40 67.3% 614

În setarea modului, este posibilă modificarea dimensiunii dicționarului în 64 - 4096 kilobytes. Implicit, dimensiunea maximă (4096 kB) este setată la, cu care rezultatele sunt obținute în acest tabel. Numai în cel mai bun șir (64kb) a fost setată dimensiunea minimă - 64 kilobytes. Evident, schimbarea obținută în comprimare și viteză poate servi drept analog pentru toate celelalte linii din acest tabel.
Rândurile de bine și cele mai bune au fost verificate, iar valorile lor au fost confirmate pe deplin, astfel încât tranziția ilogică între ele nu poate fi considerată o consecință a erorilor în testarea.

Rezultatele testului de format ACE

Mod. Dimensiune, Krib. Timp, min.-sec. Comprimare Viteza, krib / s
Fără compresie 208893 - - -
Normal 132978 8-30 63.7% 410
Maxim 132918 8-42 63.6% 400
Bun. 132925 9-50 63.6% 354
Rapid. 133216 8-53 63.8% 397
Foarte repede. 133273 8-46 63.8% 397
Magazin. 209136 1-48 100.1% 1934

Modificări în modul de funcționare a arhiviverului Winace în cazul nostru, indicatoarele de compresie afectează puțin - Scatter se află în câmpurile procentuale.

Rezultatele testului format 7z

Mod. Dimensiune, Krib. Timp, min.-sec. Comprimare Viteza, krib / s
Fără compresie 208893 - - -
Normal 130964 9-24 64.2% 362
Maxim 130000 13-51 63.7% 246
Rapid 141922 4-16 69.6% 797
Ultra (1 MB) 131392 8-47 64.4% 387
Ultra (6 MB) 130101 11-40 63.8% 291
Ultra (12 MB) 129871 12-47 63.7% 266
Ultra (24 MB) - - - -
Ultra (deflați-vă) 141171 3-15 69.2% 1046
Ultra (PPMD) 140171 8-45 68.7% 389
Ultra (BZIP2) 135342 7-32 66.4% 451

Notă:

Pentru format 7z, arhivatorul vă permite să instalați:

- nivel (rapid, normal, maxim, ultra),
- metoda (LZMA, PPMD, BZIP2, deflate),
- dimensiunea dimensiunii (32kb - 192 MB),
- Dimensiunea cuvântului (8 - 255).

După cum putem vedea, este posibil un număr foarte mare de combinații ale configurației modului de arhivare, care pot fi confundate. Puteți fi ghidat de următoarele parcele:

- Cu cât este mai mare dimensiunea dicționarului, cu atât este mai mare compresia și timpul pachetului. Compresia crește încet, iar timpul de ambalare - crește foarte mult.

- Același lucru - în ceea ce privește dimensiunea cuvântului.

- Setările optime sunt instalate (setări implicite) și nu le puteți împușca fără necesar.


Formatul cabinei Rezultatele testelor

Mod. Dimensiune, Krib. Timp, min.-sec. Comprimare Viteza, krib / s
Fără compresie 208893 - - -

Powerarchiver
Mediu. 140444 9-55 67.2% 351
Maxim 137152 15-55 65.6% 219

VÂNĂTĂȚI
Normă 144374 3-24 69.1% 1024
Maxim 138538 12-54 66.3% 270

Formatul cabinei (fișierul Cabinet) se bazează pe algoritmii MS-ZIP și LZX, acceptați și aplicați de Microsoft. Formatul Unpackers sunt disponibile în Windows 98 și mai mare. Algoritmul are un cod deschis și poate fi aplicat în mod liber de către toți programatorii.

Rezultatele testelor formatelor BH și LHA

Mod. Dimensiune, Krib. Timp, min.-sec. Comprimare Viteza, krib / s
Fără compresie 208893 - - -

Powerarchiver, format LHA
Norma. 147518 4-40 70.6% 746
Maxim 147518 4-47 70.6% 728

Powerarchiver, format BH
Norma. 145912 2-16 69.8% 1536
Maxim 145718 2-34 69.8% 1356

Indicatorii formatelor de arhivă LHA și BH au nivelul indicatorilor din format de arhivă al ZIP, iar unele avantaje nu sunt vizualizate.

În general, după cum se poate observa, cele mai bune indicatoare de compresie sunt furnizate de formatele ACE și 7Z. Cei mai buni indicatori de performanță - au arătat formate zip și bh. Sunt planificate teste suplimentare conform aceleiași scheme de concepte, dar cu "coșuri" de compoziție omogenă, cu formate de fișiere: TXT, HTML, DOC, JPG, MP3, PDF.

Definiția comprimabilității fișierelor de diferite formate

Pentru a asigura această serie de teste, au fost compilate formate de fișiere complet omogene, iar fișierele repetitive din set au fost excluse. Fișierele exe și dll au fost preluate din folderul sistemului Windows fără nici o selecție. Faptul este că fișierele formate exe sunt deja comprimate și compresia lor ulterioară - nu are sens. Caracteristicile setate sunt date în următorul tabel:

Formate de fișiere în seturi de testare

Format Pas Fișiere. Dimensiunea totală, KB
TXT. 0 27 35096
HTM. 7 1371 25076
Doc. 1 33 37211
PDF. 0 1 33691
JPG. 26 430 40493
MP3. 2 11 37571
exe 0 316 32446
DLL. 0 184 40323
XLS. 6 15 17228
CHM. 0 69 33940
MPEG. 0 24 46606
Wav. 0 1 30804
BMP. 0 15 31713
Avi. 0 89 9261

La testarea, a fost utilizat numai modul de funcționare normal (normal) al arhivei. În același timp, fiecare format al arhivei a fost creat de propriul său arhivă (WinZip, Winrar, Wince, 7-Zip), un arhivator de putere a fost folosit pentru a împacheta în formatul cabinei, care nu are propriul format (corporativ) .

Fișier de comprimabilitate în funcție de formatul de arhivă

Format Zip. Rar. As 7z. Taxi.
TXT. 43.7% 37.8% 37.4% 34.3% 36.3%
HTM. 29.2% 28.3% 9.09% 7.75% 15.0%
Doc. 8.76% 6.39% 5.47% 5.21% 6.49%
PDF. 97.7% 97.4% 97.8% 97.5% 97.3%
JPG. 98.5% 98.5% 85.0% 85.1% 97.9%
MP3. 98.1% 97.9% 98.1% 97.9% 97.7%
exe 46.9% 42.1% 37.8% 32.7% 39.3%
DLL. 45.6% 39.6% 37.6% 34.3% 39.6%
XLS. 11.8% 8.27% 7.44% 5.97% 8.49%
CHM. 98.6% 98.8% 99.0% 99.6% 98.6%
MPEG. 95.3% 94.7% 94.8% 94.5% 94.4%
Avi. 86.1% 84.1% 84.5% 82.7% 83.4%
Wav. 92.2% 62.8% 62.6% 87.0% 92.1%
BMP. 63.5% 31.9% 30.6% 51.5% 56.2%

In medie 65.5% 59.2% 56.2% 58.3% 61.6%

Ca comentariu la masă, puteți observa următoarele:

- Cea mai bună comprimare a formatelor principale ale fișierelor sursă este furnizată de formatul de arhivare 7z.

- Cel mai bun indicator în medie are formatul Arhiva Ace datorită înregistrării comprimării formatelor WAV și BMP.

Dacă vorbim despre compresibilitatea fișierelor sursă, atunci pot fi observate următoarele: viteza de compresie depinde de formatul fișierului sursă, uneori implicând comprimarea datelor interne. Dacă fișierul este pre-sigilat în funcție de algoritmii săi, atunci compresibilitatea arhiteciei sale este mică. De exemplu, fișierul Format CHM este o versiune compactată a fișierului Format HTML și, în consecință, compresibilitatea acestora este diferită. Același lucru vedem cu privire la WAV și MP3, BMP și JPG și așa mai departe.

Viteza de arhivare, Krib / s

Format Zip. Rar. As 7z. Taxi.
TXT. 2064 408 386 217 226
HTM. 2507 836 627 643 411
Doc. 7400 2862 1550 1378 886
PDF. 2246 293 370 387 370
JPG. 2670 587 337 368 287
MP3. 2348 458 368 335 332
exe 2318 773 601 416 433
DLL. 2016 858 672 474 434
XLS. 4300 1436 1148 507 224
CHM. 1886 556 365 357 323
MPEG. 2453 583 416 370 338
Avi. 1852 617 463 370 356
Wav. 2370 1711 1184 354 288
BMP. 2883 1269 933 401 373

In medie 2838 856 609 485 385

Acest tabel demonstrează o regulă evidentă - pentru cea mai bună compresie, este aproape întotdeauna necesară pentru a plăti viteza de ambalare.

Compresibilitatea diferitelor formate de fișiere. Plus

Format Zip. Rar. As 7z.
Vxd. 55.1% 52.5% 43.3% 40.8%
Inf. 14.9% 13.3% 13.2% 12.3%
VBP. 78.3% 72.6% 26.0% 18.5%
Gif. 90.0% 94.3% 87.2% 86.1%
SCR. 88.8% 88.0% 88.1% 87.9%
Dat. 23.1% 20.1% 20.5% 18.0%
INI. 35.6% 33.2% 32.5% 30.2%

In medie 55.1% 53.4% 44.4% 42.0%

Acest tabel conține date suplimentare privind compresibilitatea formatelor de fișiere. Aici a fost efectuată testarea fără a se stabili timpul pe seturi de volum mic (100-200 kB). După cum se poate vedea, în toate formatele, cea mai bună comprimare dă formatul arhivei 7z.

În plus, ca exemplu, voi da rezultatele ambalajului distribuției reale a programului Norton Antivirus. Ambalajul a fost efectuat în modul normal, au fost obținute în plus opțiunile de auto-extragere pentru aceleași arhive. Rezultatul acestui test este arătat în tabelul următor (ultima coloană este un moment aproximativ de încărcare a distribuției ambalate în rețea cu o conexiune modem convențională la o viteză de 2,7 kb într-o secundă):

Formatul arhivei Dimensiune, Krib. Timp Comprimare Descărcați ora, ora.-Min.
Fără compresie 47410 - - 4-53
Zip. 29045 0-21 61.3% 2-59
Rar. 26619 1-15 56.1% 2-44
As 23838 1-30 50.3% 2-27
7z. 22871 1-50 48.2% 2-21
Taxi. 26804 2-22 56.5% 2-45
Exe (RAR) 26671 1-15 56.3% 2-45
Exe (ACE) 23903 1-30 50.4% 2-28
Exe (7z) 22941 1-52 48.4% 2-22

Rezultatele tabelului demonstrează clar că:

Când transferați fișierele din rețea - ambalajul este practic necesar.

Ambalajul cu compresie bună poate reduce timpul de transfer de fișiere, în cazul nostru - o jumătate de oră.

Utilizarea formatelor ACE și 7Z promițătoare este destul de achitată acum sub formă de arhive de auto-extragere. Această circumstanță este de dorit să se ia în considerare distribuitorii de produse software pe Internet.

Arhiverul 7-Zip este un program bun cu un grad ridicat de compresie și are facilitățile minime de utilizare necesare. Puteți, în special, să ștergeți și să vizualizați fișierele individuale fără despachetarea comună de arhivă. În același timp, fișierele sunt deschise de aplicațiile asociative ale sistemului. Puteți completa arhiva cu fișiere individuale.

Concluzie

Programul de arhivare rămâne un instrument indispensabil de ambalare și comprimare a informațiilor digitale. Informațiile prelucrate economisesc semnificativ locul deținătorilor și timpul de transmisie asupra canalelor de comunicare. Cele mai populare și utilizate formate de ambalare ZIP și RAR sunt acum. Alte formate, de exemplu, ARJ, ICE, PAC, ARC și altele sunt încă aglomerate și înlănțuite. Dar tehnologia de ambalare nu sta în regulă. Arhivele sunt solicitate, prin urmare, programatorii caută continuu pentru metode de compresie mai eficiente. Acest lucru este evidențiat de rezultatele experimentului nostru. Există într-adevăr cel puțin două formate de arhivă (ACE și 7Z), care sunt semnificativ superioare cu fermoar armonios și rar pe compresie. Utilizarea acestor formate va reduce în mod semnificativ timpul de transfer pe Internet, ceea ce corespunde intereselor numeroaselor utilizatori ...

Actualizare la 24 mai 2004

În această secțiune, vom lua în considerare efectul opțiunii solide asupra performanței arhitecilor. Amintiți-vă că ambalajul cu opțiunea solidă duce la faptul că nu puteți adăuga un fișier în arhivă și nu puteți elimina un fișier separat de la acesta, arhiva este ambalată și numai neplăcută. În general, acest lucru poate provoca anumite inconveniente atunci când se utilizează astfel de arhive. Dar, uneori, astfel de inconveniente pot avea o valoare secundară în comparație cu beneficiile.

Testarea suplimentară a fost efectuată exact așa cum este descris în secțiunea principală de pe aceleași seturi de materiale. Având în vedere tabelul de testare suplimentar "rezultatele testului format RAR" ale textului principal a început să arate ca acesta ...

Rezultatele testului format RAR

Mod. Dimensiune, Krib. Timp, min.-sec. Comprimare Viteza, krib / s
Fără compresie 208893 - - -
Magazin. 209129 0-58 100.1% 3601
Cel mai rapid 144017 6-00 68.9% 580
Rapid. 143281 6-22 68.6% 547
Normal 142830 6-40 68.4% 522
Normal (solid) 131664 9-14 63.0% 377
Bun. 139826 6-58 66.9% 499
Bun (solid) 129314 8-24 61.9% 414
Cel mai bun 140023 7-25 67.0% 469
Cel mai bun (solid) 129527 8-36 62.0% 405
Cel mai bun (64kb) 140685 5-40 67.3% 614

Configurarea Arhiverului WinRAR include:

1. Alegerea unei metode de compresie (normală, magazin, cel mai rapid, rapid, bun, cel mai bun).

2. Selectarea modificărilor:
- Adăugați și înlocuiți fișierele,
- Adăugați și actualizați fișiere,
- numai fișiere proaspete existente,
- Sincronizează conținutul axchive.

3. Selectați opțiunea:
- ștergerea fișierelor după arhivare,
- Creați arhiva SFX,
- Creați o arhivă solidă,
- Pune verificarea împotriva alochenicității,
- pune recordul de recuperare,
- testarea fișierelor arhivate,
- Arhiva de blocare.

Este ușor de văzut că mai mult de o sută de celule sunt posibile care să definească funcționarea arhivei. În consecință, gama de rezultate pentru acest format și acest arhiv sa dovedit a fi destul de mare - raport de compresie: 61,9 - 68,9%, viteza: 377 - 614 kb / s.

Opțiunea solidă are, de asemenea, arhivatorul Winace. Dar în acest arhivă, arhiva solidă este activată în mod constant (implicită) și, prin urmare, introdusă rezultatele testului. Astfel, nedreptatea a fost permisă numai pentru format RAR și Winrar Archiver.

Având în vedere noile circumstanțe, masa liderului în funcție de gradul de compresie arată astfel:

1. RAR (bun, solid) - 61,9%.

2. 7-ZIP (maxim) - 62,2%.

3. Ace (bun) - 63,6%.

Un tabel complementar al rezultatelor ambalajului distribuției reale a programului Norton Antivirus ("Un exemplu al ambalajului de distribuție Norton Antivirus") a început să arate ca acesta ...

Exemplu de ambalare de distribuție Norton Antivirus

Formatul arhivei Dimensiune, Krib. Timp Comprimare Descărcați ora, ora.-Min.
Fără compresie 47410 - - 4-53
Zip. 29045 0-21 61.3% 2-59
Rar. 26619 1-15 56.1% 2-44
Rar (normal, solid) 22745 1-21 48.0% 2-20
Rar (bun, solid) 22680 1-28 47.8% 2-20
As 23838 1-30 50.3% 2-27
7z. 22871 1-50 48.2% 2-21
Taxi. 26804 2-22 56.5% 2-45
Exe (RAR) 26671 1-15 56.3% 2-45
Exe (RAR, normal, solid) 22797 1-29 48.1% 2-21
Exe (ACE) 23903 1-30 50.4% 2-28
Exe (7z) 22941 1-52 48.4% 2-22

Rezultatele acestui tabel confirmă, de asemenea, că arhivarul WinRAR poate oferi compresie maximă, iar acest indicator este liderul. În comparație cu formatul ZIP, încărcarea aceleiași distribuții în format RAR poate fi efectuată timp de 39 de minute pe scurt ...

În tabel, cu rezultatele rezultatelor testului format 7z, cititorul nostru Alexander Rykhlov a găsit o eroare la calcularea indicatorului de compresie. Alexander vă mulțumesc foarte mult, iar tabelul corectat "Rezultatele testului format 7z" a început să arate ca aceasta ...

130101 11-40 62.3% 291
Ultra (12 MB) 129871 12-47 62.2% 266
Ultra (24 MB) - - - -
Ultra (deflați-vă) 141171 3-15 67.6% 1046
Ultra (PPMD) 140171 8-45 67.1% 389
Ultra (BZIP2) 135342 7-32 64.8% 451

Notă: În modul ultra (LZMA), când specificați dimensiunea unui dicționar în 24 megaocteți, viteza a scăzut atât de mult încât testul a fost imposibil.

Concluzie


Creșterea a avut o senzație că arhivarul WinRAR nu a fost la fel de bun ca mulți utilizatori consideră că nu au avut loc. Testarea noastră a confirmat că caracteristicile tehnice ale acestui arhiverist într-adevăr sunt cele mai înalte. Indicatori foarte apropiați au un arhivă de 7 zip, dar acesta din urmă este încă inferior liderului în gradul de dezvoltare și calități de secție. Pentru a obține compresia maximă în Winrar Archiver, trebuie să activați opțiunea solidă (în mod implicit este dezactivată), alte setări (normale, bune etc.) - au o valoare mai mică.

3. Indicator de compresie a fișierelor

Informațiile de comprimare în fișierele de arhivă se face prin eliminarea redundanței în diferite moduri, de exemplu, prin simplificarea codurilor, excluzând biți constanți sau reprezentând simboluri repetate sau o secvență de simbol repetat ca coeficient de repetare și caractere corespunzătoare. Algoritmii unei astfel de compresie a informațiilor sunt implementate în programe speciale arhivate (cele mai renumite din care ARJ / ARJFOLDER, PKZIP / PKUNZIP / WINZIP, RAR / WinRAR) sunt utilizate ca unul și mai multe fișiere care sunt plasate într-o formă comprimată în așa-numitul fișier de arhivă sau arhivă.

Scopul ambalajului de fișiere asigură, de obicei, plasarea mai compactă a informațiilor pe disc, reducerea timpului și, în consecință, costul de transmitere a informațiilor asupra canalelor de comunicare în rețelele de calculatoare. Prin urmare, indicatorul principal al eficacității unui program de program este gradul de comprimare a fișierelor.

Gradul de comprimare a fișierelor se caracterizează prin coeficientul de COP, definit ca raportul dintre volumul fișierului VC comprimat la volumul fișierului sursă VO, exprimat ca procent (în unele surse utilizează raportul invers):

KS \u003d (VC / VO) * 100%

Gradul de compresie depinde de programul utilizat, de metoda de compresie și de tipul de fișier sursă.

Imaginile grafice, fișierele text și fișierele de date, pentru care raportul de compresie pot ajunge la 5 - 40%, sunt mai puțin comprimate, fișierele programelor executabile și modulele de încărcare ale KS \u003d 60% sunt comprimate. Fișierele de arhivă aproape nu comprimă. Este ușor de explicat dacă știți că majoritatea programelor de arhivare sunt folosite pentru a comprima variantele algoritmului LZ77 (LEMPEL-ZIVA), a cărei esență este la codificarea specială a secvențelor octeților recurente (citite - simboluri). Frecvența apariției unor astfel de repetări este cea mai mare în texte și graficul punct și este aproape redus la zero în arhive.

În plus, programele de arhivare diferă încă în implementarea algoritmilor de compresie, care respectiv afectează gradul de comprimare.

Unele programe arhivate includ suplimentar fonduri care vizează reducerea raportului de compresie a poliției. Deci, în programul WinRAR, este implementat un mecanism de arhivare continuă, atunci când se utilizează care poate fi realizat cu 10-50% mai mare raport de compresie decât metodele obișnuite, mai ales dacă este ambalat un număr semnificativ de conținuturi mici de același tip.

Caracteristicile valorilor dependente de arhorie. Aceasta este, cu atât este mai mare viteza de compresie, cu atât este mai scăzut gradul de compresie și invers.

Piața calculatorului oferă numeroase arhiteții - fiecare are propriul său set de formate sprijinite, avantajele lor și contra, propriul lor cerc de admiratori, cred că cel mai bun arhivă folosit de ei este cel mai bun. Nu vom descuraja pe nimeni - încercați doar să apreciem imparțial cele mai populare arhite-uri din punct de vedere al funcționalității și eficienței. Ca atare, vom aloca Winzip, Winrar, Wince, 7-Zip - ele conduc după numărul de descărcări pe serverele software. Este greu de recomandat să se ia în considerare celelalte arhivite, deoarece procentul de utilizatori care aplică (judecând după numărul de descărcări) este mic.

Deoarece în sarcină, fiecare pereche de valori (,) are loc o dată, tabelul de corespondență va lua forma unei singure matrice. Astfel, mediile condiționale coincid cu valorile. Rezultă că relația de corelare este egală cu 1 și, prin urmare, ...

Apropierea funcțiilor prin metoda celor mai mici pătrate

Apoi, aproximează funcția cu o funcție patratic. Pentru a determina coeficienții și utilizați sistemul (3.2.1) utilizând sumele totale ale tabelului 3 situate în celulele B29, C29, D29, E29, F29, G29 și H29, instalați sistemul (2.1.4) în Forma de (3.2 ...

Tipuri de arhivare

Au fost dezvoltate un număr mare de metode diverse, modificările și subspecii lor pentru compresia datelor. Arhitele moderne, de regulă, folosesc simultan mai multe metode în același timp. Puteți evidenția unele dintre principalele ...

Cum pot clasifica sistemele informatice în funcție de gradul de automatizare?

Clasificarea tehnologiei informației

Tehnologiile informaționale ar trebui clasificate în primul rând pe domeniul de utilizare și de gradul de utilizare a computerelor. Există domenii de tehnologie de informare, cum ar fi știința, educația, cultura, economia ...

Ca una dintre etapele necesare pentru crearea unui sistem eficient de securitate, întreprinderile, EID, va efectua o analiză a vulnerabilității companiei "Fitmax" ...

Fundamentarea matematică a gradului de vulnerabilitate a unui obiect de activitate de informații pe exemplul întreprinderii LLC "FITMAX"

Pentru fiecare dintre canale, se efectuează calcule ale probabilității gradului de securitate a informației. Canal acustic: canal vibroacustic: factor uman: pe baza datelor obținute ...

Microprocesor: numire, compoziție, caracteristici principale

Există mai multe fișiere pentru a lucra cu fișiere în Windows. Primul este "Dosare de discuri" din dosarul computerului meu. Cu ajutorul lor, puteți ajunge la orice fișier dorit în orice folder și pe orice disc. Cu toate acestea, această metodă este departe de a fi perfectă ...

Sistem de căutare

1. Sistemele de informare manuală se caracterizează prin lipsa mijloacelor tehnice moderne de prelucrare a informațiilor și implementarea tuturor operațiunilor de către om. De exemplu, despre activitatea managerului în firma în care lipsesc computerele ...

Principalul indicator al eficienței ușii de consultant vânzător este furnizat de aceștia ponderea rezultatelor în volumul total al traficului clientului referitor la acesta - un indicator al prezenței productive a vânzătorului ...

Calculul parametrilor unui motor electric de economisire a energiei asincrone

Caracteristicile gradelor de protecție a mașinilor electrice sunt notate cu două IP-uri latine (protecție internațională) și două cifre ...

E-Commerce și Sistem de Statistică pentru vânzarea de piese de schimb auto

Este important să analizăm numărul nu numai de noi, ci și la returnarea vizitatorilor magazinului dvs. online. Acest lucru vă va permite să evaluați în măsura în care site-ul dvs. este interesant pentru publicul țintă. În plus, vizitatorii de întoarcere este întotdeauna mai ușoară ...



Ți-a plăcut articolul? Împărtășește-l