Kapcsolatok

Bináris kód értékek. Bináris kód. Előjeles kettős komplement bináris szám

08. 06.2018

Dmitrij Vasszijarov blogja.

Bináris kód – hol és hogyan használják?

Ma különösen örülök, hogy találkozhattunk, kedves olvasóim, mert olyan tanárnak érzem magam, aki már az első órán elkezdi megismertetni az osztályt a betűkkel és a számokkal. És mivel a digitális technológia világában élünk, elmondom, mi az a bináris kód, ami az alapjuk.

Kezdjük a terminológiával, és megtudjuk, mit jelent a bináris. A pontosítás kedvéért térjünk vissza a szokásos számításunkhoz, amelyet „tizedesnek” neveznek. Vagyis 10 számjegyet használunk, ami lehetővé teszi a különböző számokkal való kényelmes kezelést és a megfelelő nyilvántartások vezetését.

Ezt a logikát követve a bináris rendszer csak két karakter használatát teszi lehetővé. Esetünkben ezek csak „0” (nulla) és „1” egy. És itt szeretném figyelmeztetni, hogy feltételezhetően más szimbólumok is lehetnek a helyükön, de pontosan ezek az értékek, amelyek a hiányt (0, üres) és a jel jelenlétét (1 vagy „stick”) jelzik, segítenek. jobban megértjük a bináris kód szerkezetét.

Miért van szükség bináris kódra?

A számítógépek megjelenése előtt különféle automata rendszereket alkalmaztak, amelyek működési elve a jel vételén alapult. Az érzékelő működésbe lép, az áramkör záródik, és egy bizonyos eszköz bekapcsol. Nincs áram a jeláramkörben – nincs működés. Az elektronikus eszközök tették lehetővé az előrehaladást az áramkörben lévő feszültség jelenléte vagy hiánya által képviselt információk feldolgozásában.

További bonyodalmuk az első processzorok megjelenéséhez vezetett, amelyek szintén ellátták feladatukat, egy bizonyos módon váltakozó impulzusokból álló jelet dolgoztak fel. A program részleteiben most nem elmélyülünk, de számunkra a következők fontosak: az elektronikai eszközökről kiderült, hogy képesek megkülönböztetni a bejövő jelek adott sorozatát. Természetesen a feltételes kombinációt így is leírhatjuk: „jel van”; "nincs jel"; „jel van”; – van egy jel. Akár le is egyszerűsítheti a jelölést: „van”; "Nem"; "Van"; "Van".

De sokkal könnyebb egy jel jelenlétét „1” egységgel jelölni, hiányát pedig nulla „0”-val. Ekkor használhatunk helyette egy egyszerű és tömör bináris kódot: 1011.

Természetesen a processzortechnológia nagyot lépett előre, és a chipek mára már nem csak jelek sorozatát, hanem egyedi karakterekből álló, specifikus parancsokkal írt teljes programokat is képesek érzékelni.

De rögzítésükhöz ugyanazt a bináris kódot használják, amely nullákból és egyesekből áll, és megfelel a jel jelenlétének vagy hiányának. Hogy létezik-e vagy sem, nem számít. Egy chip esetében ezen opciók bármelyike ​​egyetlen információ, amelyet „bitnek” neveznek (a bit a hivatalos mértékegység).

Hagyományosan egy szimbólum több karakterből álló sorozatként is kódolható. Két jel (vagy hiányuk) csak négy opciót írhat le: 00; 01;10; 11. Ezt a kódolási módszert kétbitesnek nevezik. De ez is lehet:

  • A négybites (mint a fenti 1011-es bekezdés példájában) lehetővé teszi 2^4 = 16 szimbólumkombináció írását;
  • Nyolc bites (például: 0101 0011; 0111 0001). Egy időben ez volt a legnagyobb érdeklődés a programozásban, mert 2^8 = 256 értéket fed le. Ez lehetővé tette az összes decimális számjegy, a latin ábécé és a speciális karakterek leírását;
  • Tizenhat bites (1100 1001 0110 1010) és magasabb. De az ilyen hosszúságú rekordok már modern, összetettebb feladatokhoz valók. A modern processzorok 32 és 64 bites architektúrát használnak;

Őszintén szólva, nincs egyetlen hivatalos verzió, de előfordult, hogy a nyolc karakter kombinációja vált a tárolt információ standard mértékévé, amelyet „bájtnak” neveznek. Ez akár egy 8 bites bináris kódban írt betűre is alkalmazható. Szóval, kedves barátaim, ne feledjétek (ha valaki nem tudná):

8 bit = 1 bájt.

Ez már csak így van. Bár a 2 vagy 32 bites értékkel írt karaktert névleg bájtnak is nevezhetjük. A bináris kódnak köszönhetően egyébként meg tudjuk becsülni a fájlok bájtban mérhető mennyiségét, valamint az információ és az internetes átvitel sebességét (bit per másodperc).

Bináris kódolás működés közben

A számítógépek számára történő információrögzítés szabványosítására több kódrendszert fejlesztettek ki, amelyek közül az egyik, a 8 bites rögzítésre épülő ASCII terjedt el. A benne lévő értékek speciális módon vannak elosztva:

  • az első 31 karakter vezérlőkarakter (00000000 és 00011111 között). Szervizparancsokhoz, nyomtatóra vagy képernyőre történő kimenethez, hangjelzésekhez, szövegformázáshoz szolgál;
  • a következő 32-től 127-ig (00100000 – 01111111) latin ábécé és segédszimbólumok és írásjelek;
  • a többi, a 255.-ig (10000000 – 11111111) – alternatíva, a speciális feladatok táblázatának része és a nemzeti ábécék megjelenítése;

A benne lévő értékek dekódolása a táblázatban látható.

Ha úgy gondolja, hogy a „0” és az „1” kaotikus sorrendben helyezkedik el, akkor mélyen téved. Tetszőleges számot használva példaként, megmutatok egy mintát, és megtanítom, hogyan kell olvasni a bináris kóddal írt számokat. Ehhez azonban elfogadunk néhány egyezményt:

  • Egy 8 karakterből álló bájtot fogunk olvasni jobbról balra;
  • Ha közönséges számokban egyeseket, tízeseket, százasokat használunk, akkor itt (fordított sorrendben olvasva) minden bitre a „kettő” különböző hatványai vannak ábrázolva: 256-124-64-32-16-8- 4-2 -1;
  • Most megnézzük a szám bináris kódját, például 00011011. Ha a megfelelő pozícióban „1” jel van, akkor ennek a bitnek az értékeit vesszük, és a szokásos módon összegezzük. Ennek megfelelően: 0+0+0+32+16+0+2+1 = 51. Ennek a módszernek a helyességét a kódtáblázat megtekintésével ellenőrizheti.

Nos, érdeklődő barátaim, nem csak azt tudjátok, hogy mi a bináris kód, hanem azt is, hogyan kell átalakítani az általa titkosított információkat.

A modern technológia számára érthető nyelv

Természetesen a bináris kód processzoros eszközök általi olvasásának algoritmusa sokkal bonyolultabb. De bármit leírhatsz vele, amit szeretnél:

  • Szöveges információ formázási lehetőségekkel;
  • Számok és a velük végzett műveletek;
  • Grafikus és videó képek;
  • Hangok, beleértve a hallástartományunkon kívülieket is;

Ezenkívül a „prezentáció” egyszerűsége miatt a bináris információ rögzítésének különféle módjai lehetségesek:

  • A mágneses mező változtatásával ;
  • A bináris kódolás előnyeit szinte korlátlan lehetőség egészíti ki az információ bármilyen távolságra történő továbbítására. Ez az űrhajókkal és mesterséges műholdakkal folytatott kommunikációs módszer.

    Tehát ma a kettes számrendszer egy olyan nyelv, amelyet az általunk használt elektronikus eszközök többsége megért. És ami a legérdekesebb, hogy egyelőre nem terveznek más alternatívát.

    Úgy gondolom, hogy az általam bemutatott információk elegendőek lesznek az induláshoz. És akkor, ha ilyen igény felmerül, mindenki mélyebben elmélyülhet a téma önálló tanulmányozásában.

    Elköszönök, és egy kis szünet után egy új cikket készítek nektek a blogomon néhány érdekes témában.

    Jobb, ha te magad meséled el ;)

    Hamarosan találkozunk.

    Ha szeretné megtanulni a bináris számok olvasását, fontos megértenie a bináris számok működését. A bináris rendszert "2-es alap" számozási rendszerként ismerik, ami azt jelenti, hogy minden számjegyhez két lehetséges szám tartozik; egy vagy nulla. A nagy számokat extra bináris egyesek vagy nullák hozzáadásával írjuk fel.



    A bináris számok megértése


    A bináris fájlok olvasásának ismerete nem kritikus a számítógépek használatához. De jó megérteni a koncepciót, hogy jobban megértsük, hogyan tárolják a számítógépek a számokat a memóriában. Lehetővé teszi az olyan kifejezések megértését is, mint a 16 bites, 32 bites, 64 bites, valamint a memóriaméréseket, például a bájtokat (8 bit).



    A bináris kód "olvasása" általában azt jelenti, hogy a bináris számot 10-es (tizedes) számmá alakítják, amelyet az emberek ismernek. Ezt az átalakítást meglehetősen könnyű elvégezni a fejedben, ha megérted a bináris nyelv működését.

    Egy bináris számban minden számjegynek meghatározott jelentése van, kivéve, ha a számjegy nulla. Miután meghatározta ezeket az értékeket, egyszerűen össze kell adnia őket, hogy megkapja a bináris szám 10 jegyű decimális értékét. Ha látni szeretné, hogyan működik ez, vegye fel az 11001010 bináris számot.


    1. A bináris számok beolvasásának legjobb módja, ha a jobb szélső számjegytől kezdjük, és balra dolgozunk. Ennek az első helynek az erőssége nulla, vagyis ennek a számjegynek az értéke, ha nem nulla, akkor egyenlő nulla vagy egy két hatványával. Ebben az esetben, mivel a számjegy nulla, az adott hely értéke nulla lesz.



    2. Ezután lépjen a következő számjegyre. Ha egy, akkor számíts ki kettőt egy hatványig. Írja le ezt az értéket. Ebben a példában az érték kettő hatványa, amely egyenlő kettővel.



    3. Ismételje meg ezt a folyamatot, amíg el nem éri a bal szélső számot.



    4. A befejezéshez mindössze annyit kell tennie, hogy összeadja ezeket a számokat, hogy megkapja a bináris szám teljes decimális értékét: 128 + 64 + 0 + 0 + 8 + 0 + 2 + 0 = 202 .


    A jegyzet: Az egész folyamat egyenlet formájában való megjelenítésének másik módja a következő: 1 x 2 7 + 1 x 2 6 + 0 x 2 5 + 0 x 2 4 + 1 x 2 3 + 0 x 2 2 + 1 x 2 1 + 0 x 2 0 = 20.


    Bináris számok aláírással


    A fenti módszer előjel nélküli alap bináris számok esetén működik. A számítógépeknek azonban szükségük van arra, hogy negatív számokat bináris kóddal is ábrázoljanak.


    Emiatt a számítógépek előjeles bináris számokat használnak. Az ilyen típusú rendszerekben a bal szélső számjegyet előjelbitnek, a fennmaradó számjegyeket pedig amplitúdóbiteknek nevezik.


    Egy előjeles bináris szám olvasása majdnem ugyanaz, mint egy előjel nélküli, egy kis eltéréssel.


    1. Kövesse a fenti eljárást egy előjel nélküli bináris szám esetében, de hagyja abba, ha eléri a bal szélső bitet.



    2. Az előjel meghatározásához nézze meg a bal szélső bitet. Ha egy, akkor a szám negatív. Ha ez nulla, akkor a szám pozitív.



    3. Most végezze el ugyanazokat a számításokat, mint korábban, de alkalmazza a megfelelő előjelet a bal szélső bit által jelzett számra: 64 + 0 + 0 + 8 + 0 + 2 + 0 = -74 .


    4. Az előjeles bináris módszer lehetővé teszi a számítógépek számára, hogy pozitív vagy negatív számokat ábrázoljanak. Azonban a bevezető bitet fogyasztja, ami azt jelenti, hogy a nagy számok valamivel több memóriát igényelnek, mint az előjel nélküli bináris számok.

    Ez a lecke a „Kódolási információ. Bináris kódolás. Az információ mértékegységei." Ennek során a felhasználók megismerhetik az információkódolást, a számítógépek információfogalmát, a mértékegységeket és a bináris kódolást.

    Tantárgy:Információk körülöttünk

    Lecke: Információk kódolása. Bináris kódolás. Az információ mértékegységei

    Ez a lecke a következő kérdéseket fedi le:

    1. A kódolás, mint az információ-megjelenítési forma megváltoztatása.

    2. Hogyan ismeri fel a számítógép az információkat?

    3. Hogyan mérjük az információt?

    4. Az információ mértékegységei.

    A kódok világában

    Miért kódolják az emberek az információkat?

    1. Rejtsd el mások elől (Leonardo da Vinci tükörkriptográfiája, katonai titkosítás).

    2. Írja le röviden az információkat (rövidítés, rövidítés, útjelző táblák).

    3. A könnyebb feldolgozás és továbbítás érdekében (Morze kód, elektromos jelekké fordítás - gépi kódok).

    Kódolás információ megjelenítése valamilyen kód segítségével.

    Kód információ megjelenítésére szolgáló szimbólumrendszer.

    Az információ kódolásának módszerei

    1. Grafika (lásd 1. ábra) (rajzok és jelek segítségével).

    Rizs. 1. Jeljelző rendszer (forrás)

    2. Numerikus (számok használatával).

    Például: 11001111 11100101.

    3. Szimbolikus (ábécé szimbólumok használatával).

    Például: NKMBM CHGYOU.

    Dekódolás egy akció az információmegjelenítés eredeti formájának visszaállítására. A dekódoláshoz ismernie kell a kódot és a kódolási szabályokat.

    A kódolás és dekódolás eszköze a kódmegfelelőségi táblázat. Például a különböző számrendszerekben a megfelelés 24 - XXIV, az ábécé bármilyen szimbólummal (2. ábra).


    Rizs. 2. Rejtjelezési példa (forrás)

    Példák az információ kódolására

    Az információkódolásra példa a Morse-kód (lásd a 3. ábrát).

    Rizs. 3. Morse kód ()

    A morze csak 2 szimbólumot használ - egy pontot és egy kötőjelet (rövid és hosszú hang).

    Egy másik példa az információ kódolására a zászló ábécé (lásd 4. ábra).

    Rizs. 4. Zászló ábécé ()

    Egy másik példa a zászlók ábécéje (lásd 5. ábra).

    Rizs. 5. A zászlók ABC-je ()

    A kódolás jól ismert példája a zenei ábécé (lásd 6. ábra).

    Rizs. 6. Zenei ábécé ()

    Vegye figyelembe a következő problémát:

    A zászló ábécé táblázat segítségével (lásd 7. ábra) a következő problémát kell megoldani:

    Rizs. 7

    A rangidős tiszt, Lom sikeres vizsgát tesz Vrungel kapitánynak. Segíts neki elolvasni a következő szöveget (lásd 8. ábra):

    Főleg két jel van körülöttünk, például:

    Közlekedési lámpa: piros - zöld;

    Kérdés: igen - nem;

    Lámpa: be - ki;

    Lehetséges – nem lehetséges;

    Jó Rossz;

    Az igazság hazugság;

    Előre-hátra;

    Igen nem;

    Mindezek olyan jelek, amelyek 1 bitben jelzik az információ mennyiségét.

    1 bit - ez az információmennyiség lehetővé teszi, hogy a két lehetséges közül egyet válasszunk.

    Számítógép egy elektromos gép, amely elektronikus áramkörökön működik. Ahhoz, hogy a számítógép felismerje és megértse a bemeneti információkat, le kell fordítani számítógép (gép) nyelvére.

    Az előadónak szánt algoritmust számítógép számára érthető nyelven kell megírni, azaz kódolni.

    Ezek elektromos jelek: áram folyik vagy nem halad.

    Gépi bináris nyelv - "0" és "1" sorozat. Minden bináris szám lehet 0 vagy 1.

    A gépi bináris kód minden számjegye 1 bitnek megfelelő mennyiségű információt hordoz.

    Az információ legkisebb egységét képviselő bináris számot nevezzük b azt . Egy bit értéke 0 vagy 1 is lehet. A mágneses vagy elektronikus jel jelenléte a számítógépben 1-et, a 0 hiányát jelenti.

    Egy 8 bites sztringet hívunk b AZT . A számítógép ezt a karakterláncot külön karakterként (szám, betű) dolgozza fel.

    Nézzünk egy példát. Az ALICE szó 5 betűből áll, amelyek mindegyikét számítógépes nyelven egy bájt képviseli (lásd 10. ábra). Ezért Alice 5 bájtban mérhető.

    Rizs. 10. Bináris kód (forrás)

    A biteken és bájtokon kívül vannak más információegységek is.

    Bibliográfia

    1. Bosova L.L. Számítástechnika és IKT: Tankönyv 5. osztály számára. - M.: BINOM. Tudáslaboratórium, 2012.

    2. Bosova L.L. Számítástechnika: Munkafüzet 5. osztály számára. - M.: BINOM. Tudáslaboratórium, 2010.

    3. Bosova L.L., Bosova A.Yu. Számítástechnika órák az 5-6. évfolyamon: Módszertani kézikönyv. - M.: BINOM. Tudáslaboratórium, 2010.

    2. "Nyílt lecke" fesztivál ().

    Házi feladat

    1. §1.6, 1.7 (Bosova L.L. Informatika és IKT: Tankönyv 5. évfolyamnak).

    2. Oldal 28., 1., 4. feladatok; 30. o., 1., 4., 5., 6. feladatok (Bosova L.L. Informatika és IKT: Tankönyv 5. évfolyamnak).

    A karakterkészlet, amellyel a szöveget írják, meghívásra kerül ábécé.

    Az ábécé karaktereinek száma az erő.

    Képlet az információ mennyiségének meghatározásához: N=2b,

    ahol N az ábécé hatványa (karakterek száma),

    b – bitek száma (a szimbólum információs súlya).

    A 256 karakteres ábécé szinte az összes szükséges karaktert képes befogadni. Ezt az ábécét hívják elegendő.

    Mert 256 = 2 8, akkor 1 karakter súlya 8 bit.

    A 8 bites mértékegység kapta a nevet 1 bájt:

    1 bájt = 8 bit.

    A számítógépes szöveg minden karakterének bináris kódja 1 bájt memóriát foglal el.

    Hogyan jelennek meg a szöveges információk a számítógép memóriájában?

    A bájtonkénti karakterkódolás kényelme nyilvánvaló, mivel a bájt a memória legkisebb címezhető része, és ezért a processzor a szöveg feldolgozása során minden karaktert külön tud elérni. Másrészt a 256 karakter elég sok szimbolikus információ megjelenítéséhez.

    Felmerül a kérdés, hogy melyik nyolcbites bináris kódot rendeljük az egyes karakterekhez.

    Nyilvánvaló, hogy ez egy feltételes kérdés, sok kódolási módszert találhat ki.

    A számítógépes ábécé minden karaktere 0-tól 255-ig van számozva. Mindegyik szám egy nyolcbites bináris kódnak felel meg 00000000 és 11111111 között. Ez a kód egyszerűen a karakter sorozatszáma a bináris számrendszerben.

    Az olyan táblázatot, amelyben a számítógép ábécéjének minden karakteréhez sorszám van hozzárendelve, kódolási táblázatnak nevezzük.

    A különböző típusú számítógépek különböző kódolási táblákat használnak.

    Az asztal a PC-k nemzetközi szabványává vált ASCII(olvasd el az aski-t) (Amerikai szabványos információcsere kód).

    Az ASCII kódtábla két részre oszlik.

    Csak a táblázat első fele a nemzetközi szabvány, i.e. szimbólumok számokkal 0 (00000000), legfeljebb 127 (01111111).

    ASCII kódolású táblaszerkezet

    Sorozatszám

    Kód

    Szimbólum

    0 - 31

    00000000 - 00011111

    A 0 és 31 közötti számokat tartalmazó szimbólumokat általában vezérlőszimbólumoknak nevezik.
    Feladatuk a szöveg képernyőn való megjelenítésének vagy nyomtatásának vezérlése, hangjelzés megszólaltatása, szöveg megjelölése stb.

    32 - 127

    00100000 - 01111111

    A táblázat szabványos része (angol). Ide tartoznak a latin ábécé kis- és nagybetűi, decimális számok, írásjelek, mindenféle zárójelek, kereskedelmi és egyéb szimbólumok.
    A 32. karakter szóköz, azaz. üres hely a szövegben.
    Az összes többit bizonyos jelek tükrözik.

    128 - 255

    10000000 - 11111111

    A táblázat alternatív része (orosz).
    Az ASCII kódtábla második fele, az úgynevezett kódlap (128 kód, 10000000-től 11111111-ig végződő), különböző opciókkal rendelkezhet, mindegyik opciónak saját száma van.
    A kódlap elsősorban a latintól eltérő nemzeti ábécék elhelyezésére szolgál. Az orosz nemzeti kódolásoknál az orosz ábécé karakterei a táblázat ebbe a részébe kerülnek.

    Az ASCII kódtábla első fele


    Felhívjuk figyelmét, hogy a kódolási táblázatban a betűk (nagy- és kisbetűk) ábécé, a számok pedig növekvő sorrendben vannak. Ezt a lexikográfiai sorrend betartását a szimbólumok elrendezésében az ábécé szekvenciális kódolásának elvének nevezik.

    Az orosz ábécé betűinél a szekvenciális kódolás elvét is betartják.

    Az ASCII kódtábla második fele


    Sajnos jelenleg öt különböző cirill kódolás létezik (KOI8-R, Windows. MS-DOS, Macintosh és ISO). Emiatt gyakran problémák merülnek fel az orosz szöveg egyik számítógépről a másikra, egyik szoftverrendszerről a másikra való átvitelével.

    Kronológiailag az orosz betűk számítógépeken történő kódolásának egyik első szabványa a KOI8 ("8 bites információcsere kód") volt. Ezt a kódolást már a 70-es években használták az ES számítógépsorozat számítógépein, és a 80-as évek közepétől kezdték használni a UNIX operációs rendszer első oroszosított verzióiban.

    A 90-es évek elejétől, az MS DOS operációs rendszer dominanciájának idejétől megmaradt a CP866 kódolás ("CP" jelentése "kódlap", "kódlap").

    A Mac OS operációs rendszert futtató Apple számítógépek saját Mac kódolást használnak.

    Ezenkívül a Nemzetközi Szabványügyi Szervezet (ISO) egy másik, ISO 8859-5 nevű kódolást is jóváhagyott az orosz nyelv szabványaként.

    A jelenleg leggyakrabban használt kódolás a Microsoft Windows, rövidítve CP1251.

    A 90-es évek vége óta a karakterkódolás szabványosításának problémáját egy új nemzetközi szabvány, az ún. Unicode. Ez egy 16 bites kódolás, azaz. minden karakterhez 2 bájt memóriát foglal le. Természetesen ez 2-szeresére növeli az elfoglalt memória mennyiségét. De egy ilyen kódtábla legfeljebb 65 536 karakter felvételét teszi lehetővé. A Unicode szabvány teljes specifikációja tartalmazza a világ összes létező, kihalt és mesterségesen létrehozott ábécéjét, valamint számos matematikai, zenei, kémiai és egyéb szimbólumot.

    Próbáljuk meg egy ASCII tábla segítségével elképzelni, hogyan fognak kinézni a szavak a számítógép memóriájában.

    Szavak belső ábrázolása a számítógép memóriájában

    Néha előfordul, hogy egy másik számítógépről kapott orosz ábécé betűiből álló szöveget nem lehet olvasni - valamiféle „abrakadabra” látható a monitor képernyőjén. Ez azért történik, mert a számítógépek eltérő karakterkódolást használnak az orosz nyelvhez.

    Bináris kód bitmélysége, Információ átalakítása folytonos formából diszkrét formába, Bináris kódolás egyetemessége, Egységes és nem egységes kódok, Számítástechnika 7. osztály Bosova, Számítástechnika 7. osztály

    1.5.1. Információk átalakítása folyamatosból diszkrét formába
    Problémái megoldásához az embernek gyakran át kell alakítania a meglévő információkat egyik reprezentációs formából a másikba. Például a hangos olvasás során az információ diszkrét (szöveg) formából folyamatos (hang) lesz. Éppen ellenkezőleg, az orosz nyelvórán végzett diktálás során az információ folyamatos formából (a tanár hangja) diszkrét formává alakul át (diákok jegyzetei).
    A diszkrét formában bemutatott információk sokkal könnyebben továbbíthatók, tárolhatók vagy automatikusan feldolgozhatók. Ezért a számítástechnikában nagy figyelmet fordítanak az információk folytonosból diszkrét formába történő átalakításának módszereire.
    Az információ diszkretizálása az a folyamat, amely során az információt a folyamatos ábrázolási formából diszkrét formává alakítják át.
    Nézzük meg egy példa segítségével az információmintavételi folyamat lényegét.
    A meteorológiai állomásokon rögzítők vannak a légköri nyomás folyamatos rögzítésére. Munkájuk eredménye barogramok – görbék, amelyek megmutatják, hogyan változott a nyomás hosszú időn keresztül. Ezen görbék egyike, amelyet a készülék hét órás megfigyelés alatt rajzolt, az ábrán látható. 1.9.

    A kapott információk alapján összeállíthat egy táblázatot, amely tartalmazza a mérések elején és minden megfigyelési óra végén a műszer leolvasásait (1.10. ábra).

    Az így kapott táblázat nem ad teljesen teljes képet arról, hogyan változott a nyomás a megfigyelési időszak alatt: például nincs feltüntetve a megfigyelés negyedik órájában előforduló legmagasabb nyomásérték. De ha félóránként vagy 15 percenként táblázatba foglalja a megfigyelt nyomásértékeket, az új táblázat teljesebb képet ad a nyomás változásáról.
    Így a folytonos formában (barogram, görbe) bemutatott információkat némi pontosságvesztéssel alakítottuk át diszkrét formába (táblázatba).
    A jövőben megismerheti a hang- és grafikus információk diszkrét megjelenítésének módjait.

    A három bináris szimbólumból álló láncokat úgy kapjuk meg, hogy a jobb oldali kétjegyű bináris kódokat a 0 vagy 1 szimbólummal egészítjük ki. Ennek eredményeként a három bináris szimbólum kódkombinációi 8-szorosak – kétszer annyi, mint két bináris szimbólumé:
    Ennek megfelelően egy négybites bináris 16 kódkombinációt tesz lehetővé, egy ötbites - 32, egy hatbites - 64, stb. A bináris lánc hossza - a bináris kód karaktereinek száma - a bináris kód bitmélységének nevezzük.
    Vegye figyelembe, hogy:
    4 = 2 * 2,
    8 = 2 * 2 * 2,
    16 = 2 * 2 * 2 * 2,
    32 = 2 * 2 * 2 * 2 * 2 stb.
    Itt a kódkombinációk száma a bináris kód bitmélységével megegyező bizonyos számú azonos tényező szorzata.
    Ha a kódkombinációk számát N betűvel, a bináris kód bitmélységét az i betűvel jelöljük, akkor az azonosított mintát általános formában a következőképpen írjuk le:
    N = 2 * 2 * ... * 2.
    i tényezők
    A matematikában az ilyen termékeket a következőképpen írják:
    N = 2 i.
    A 2. i. bejegyzés a következőképpen olvasható: „2 az i-edik hatványhoz”.

    Feladat. A Multi törzs vezetője utasította miniszterét, hogy dolgozzon ki egy binárist, és fordítson le minden fontos információt. Milyen méretű binárisra lesz szükség, ha a Multi törzs által használt ábécé 16 karakterből áll? Írja le az összes kódkombinációt.
    Megoldás. Mivel a Multi tribe ábécé 16 karakterből áll, ezért 16 kódkombinációra van szükségük, ebben az esetben a bináris kód hosszát (bitmélységét) a következő arányból határozzuk meg: 16 = 2 i. Ezért i = 4.
    A négy 0-ból és 1-ből álló összes kódkombináció felírásához használjuk az 1. ábra diagramját. 1.13: 0000, 0001, 0010, 0011, 0100, 0101, 0110,0111,1000,1001,1010,1011,1100,1101,1110,1111.

    1.5.3. A bináris kódolás sokoldalúsága
    Ennek a résznek az elején megtanulta, hogy folyamatos formában ábrázolva szimbólumokkal fejezhető ki valamilyen természetes vagy formális nyelven. Egy tetszőleges ábécé karakterei viszont binárissá alakíthatók. Így bináris kód segítségével bármilyen természetes és formális nyelv, valamint képek és hangok ábrázolhatók (1.14. ábra). Ez a bináris kódolás egyetemességét jelenti.
    A bináris kódokat széles körben használják a számítástechnikában, és csak két elektronikus áramköri állapotot igényelnek - „be” (ez az 1-es számnak felel meg) és „kikapcsolva” (ez a 0 számnak felel meg).
    A bináris kódolás fő előnye a technikai megvalósítás egyszerűsége. A bináris kódolás hátránya a kapott kód nagy hossza.

    1.5.4. Egységes és nem egységes kódok
    Vannak egységes és nem egységes kódok. Az egységes kódok kódkombinációkban ugyanannyi szimbólumot tartalmaznak, az egyenetlenek eltérő számot tartalmaznak.
    Fent egységes bináris kódokat néztünk meg.
    A nem egységes kódra példa a Morse-kód, amelyben minden betűhöz és számhoz rövid és hosszú jelek sorozata van meghatározva. Tehát az E betű egy rövid jelnek („pont”), a Ш betű pedig négy hosszú jelnek (négy „kötőjelnek”) felel meg. Az Egyenetlen lehetővé teszi az üzenetátvitel sebességének növelését, mivel a továbbított információban leggyakrabban előforduló szimbólumok kódkombinációi a legrövidebbek.

    Az információ, amit ez a szimbólum ad, egyenlő a rendszer entrópiájával, és maximális abban az esetben, ha mindkét állapot egyformán valószínű; ebben az esetben az elemi szimbólum 1 (két egység) információt közvetít. Ezért az optimális kódolás alapja az a követelmény lesz, hogy a kódolt szövegben az elemi karakterek átlagosan egyforma gyakorisággal forduljanak elő.

    Mutassunk be egy módszert egy olyan kód létrehozására, amely kielégíti a megadott feltételt; Ez a módszer Shannon-Fano kódként ismert. Elképzelése az, hogy a kódolt szimbólumokat (betűket vagy betűkombinációkat) két nagyjából egyformán valószínű csoportra osztják: az első szimbólumcsoportnál a kombináció első helyére 0 kerül (a bináris szám első karaktere, amely a szimbólum); a második csoporthoz - 1. Ezután mindegyik csoportot ismét két, körülbelül egyformán valószínű alcsoportra osztjuk; az első alcsoport szimbólumai esetében a nulla a második helyre kerül; a második alcsoporthoz - egy stb.

    Mutassuk meg a Shannon-Fano kód megszerkesztésének elvét az orosz ábécé anyagából (18.8.1. táblázat). Számoljuk meg az első hat betűt ("-"-tól "t"-ig); valószínűségeiket (gyakoriságukat) összeadva 0,498-at kapunk; az összes többi betű ("n"-től "sf"-ig) körülbelül azonos valószínűséggel 0,502 lesz. Az első hat betű ("-"-től "t"-ig) binárisan 0 lesz, a többi betűnél ("n"-től "f"-ig) pedig egy lesz az első helyen. Ezután az első csoportot ismét két, nagyjából egyformán valószínű alcsoportra osztjuk: „-”-től „o”-ig és „e”-től „t”-ig; az első alcsoport összes betűjére a második helyre nullát teszünk, a második alcsoporté pedig egyet. Folytatjuk a folyamatot mindaddig, amíg minden felosztásban pontosan egy betű marad, amely egy bizonyos bináris számmal lesz kódolva. A mechanizmus A kód felépítéséhez a 18.8 .2 táblázat, magát a kódot pedig a 18.8.3 táblázat tartalmazza.

    18.8.2. táblázat.

    Bináris jelek

    18.8.3. táblázat

    A 18.8.3 táblázat segítségével bármilyen üzenetet kódolhat és dekódolhat.

    Példaként írjuk be az „információelmélet” kifejezést bináris kódba.

    01110100001101000110110110000

    0110100011111111100110100

    1100001011111110101100110

    Vegye figyelembe, hogy nem kell külön jellel elválasztani a betűket egymástól, mivel a dekódolás e nélkül is egyértelműen történik. Ezt a következő kifejezés dekódolásával ellenőrizheti a 18.8.2 táblázat segítségével:

    10011100110011001001111010000

    1011100111001001101010000110101

    010110000110110110

    („kódolási módszer”).

    Meg kell azonban jegyezni, hogy minden kódolási hiba (0 és 1 karakterek véletlenszerű összetévesztése) egy ilyen kóddal katasztrofális, mivel a hibát követő összes szöveg dekódolása lehetetlenné válik. Ezért ez a kódolási elv csak olyan esetekben ajánlható, amikor az üzenet kódolása és továbbítása során a hibák gyakorlatilag kiküszöbölhetők.

    Felmerül egy természetes kérdés: valóban optimális-e az általunk összeállított kód, hiba hiányában? A kérdés megválaszolásához keressük meg az elemi szimbólumonkénti átlagos információt (0 vagy 1), és hasonlítsuk össze a maximálisan lehetséges információval, amely egy bináris egységnek felel meg. Ehhez először meg kell keresni az átvitt szöveg egy betűjében található átlagos információt, azaz a betűnkénti entrópiát:

    ,

    hol van annak a valószínűsége, hogy a betű egy bizonyos állapotot vesz fel ("-", o, e, a,..., f).

    Az asztalról 18.8.1 van

    (két egység egy betű).

    A 18.8.2 táblázat segítségével meghatározzuk az elemi szimbólumok betűnkénti átlagos számát

    Az entrópiát elosztva elemi szimbólumonként kapunk információt

    (két egység).

    Így a karakterenkénti információ nagyon közel van az 1-es felső határához, az általunk választott kód pedig nagyon közel van az optimálishoz. A betűkódolási feladat keretein belül maradva ennél jobbat nem érhetünk el.

    Ne feledje, hogy egyszerű bináris betűszámok kódolásakor minden betűről öt bináris karakterből álló képünk lesz, és az egyik karakter információja

    (két egység),

    azaz észrevehetően kevesebb, mint az optimális betűkódolásnál.

    Meg kell azonban jegyezni, hogy a „betűvel” kódolás egyáltalán nem gazdaságos. Az a tény, hogy minden értelmes szöveg szomszédos betűi között mindig van függőség. Például az orosz nyelvben egy magánhangzó után nem lehet „ъ” vagy „ь”; „I” vagy „yu” nem jelenhet meg a sziszegők után; egymás után több mássalhangzó után nő a magánhangzó valószínűsége stb.

    Tudjuk, hogy ha függő rendszereket kombinálunk, a teljes entrópia kisebb, mint az egyes rendszerek entrópiáinak összege; ezért az összefüggő szövegrész által közvetített információ mindig kevesebb, mint a karakterenkénti információ szorozva a karakterek számával. Ezt a körülményt figyelembe véve gazdaságosabb kód konstruálható, ha nem minden betűt külön-külön kódolunk, hanem teljes betűtömböket. Például egy orosz szövegben érdemes néhány gyakran előforduló betűkombinációt teljesen kódolni, mint például a „tsya”, „ayet”, „nie” stb. A kódolt blokkok gyakorisága csökkenő sorrendben vannak elrendezve, akárcsak a betűk az asztalban. 18.8.1, és a bináris kódolás ugyanazon elv szerint történik.

    Egyes esetekben ésszerűnek bizonyul, ha nem is betűtömböket, hanem egész értelmes szövegrészeket kódolnak. Például, hogy tehermentesítse a távírót az ünnepek alatt, tanácsos a teljes szabványos szövegeket hagyományos számokkal kódolni, például:

    "Gratulálok az újévhez, jó egészséget és sok sikert kívánok a munkájához."

    Anélkül, hogy konkrétan a blokkkódolási módszerekre térnénk ki, az ide vonatkozó Shannon-tétel megfogalmazására szorítkozunk.

    Legyen egy információforrás és egy kommunikációs csatornával összekötött vevő (18.8.1. ábra).

    Ismert az információforrás termelékenysége, vagyis a forrásból időegységenként érkező bináris információs egységek átlagos száma (számszerűen megegyezik a források által időegységenként előállított üzenet átlagos entrópiájával). Ezenkívül legyen ismert a csatorna kapacitása, azaz az információ maximális mennyisége (például 0 vagy 1 bináris karakter), amelyet a csatorna ugyanabban az időegységben képes továbbítani. Felmerül a kérdés: mekkora legyen a csatornakapacitás ahhoz, hogy „megbirkózzon” feladatával, vagyis hogy az információ késedelem nélkül megérkezzen a forrásból a vevőhöz?

    Erre a kérdésre Shannon első tétele adja meg a választ. Fogalmazzuk meg itt bizonyítás nélkül.

    Shannon 1. tétele

    Ha a kommunikációs csatorna kapacitása nagyobb, mint az információforrás egységnyi időre eső entrópiája

    akkor mindig lehet kódolni egy kellően hosszú üzenetet, hogy azt egy kommunikációs csatorna késedelem nélkül továbbítsa. Ha éppen ellenkezőleg,

    akkor az információ késedelem nélküli átadása lehetetlen.



    Tetszett a cikk? Oszd meg