Contacte

Codificarea literelor rusești în html. Codificare HTML. În ce codificare pentru a salva pagina web. Fișier de testare pentru a verifica codificarea

Când creează un site, webmasterii începători au adesea întrebări: în ce codificare să creeze un site, cum diferă UTF-8 de Windows-1251 și cum să-l înregistreze în setul de caractere META al paginii HTML a site-ului. La toate aceste întrebări se răspunde în acest articol.

Ce este codificarea site-ului și cum funcționează

Codificarea poate fi reprezentată ca un tabel format din diferite litere, numere și alte caractere ușor de înțeles pentru oameni, care sunt codificate într-un anumit mod. Când deschideți un fișier text, care include pagini HTML, computerul citește din antetul fișierului în ce codificare a fost salvat și scoate textul în codificarea corespunzătoare, transformând datele computerului într-o formă care poate fi citită de om, comparând aceste date cu codificarea. masa. Dacă informațiile de codificare din antetul fișierului se potrivesc cu codarea în care sunt stocate datele în pagina HTML, atunci utilizatorul vede litere, numere și alte caractere familiare. Dacă există o nepotrivire, atunci, ca rezultat, un set de caractere de neînțeles este afișat utilizatorului, acest lucru se întâmplă mai ales în programele de e-mail vechi. Dacă utilizatorul a primit o scrisoare cu crăpături de neînțeles, atunci pur și simplu sortând prin diferite codificări, de obicei se dovedește a ghici și selecta pe cea în care este scrisă scrisoarea și, ca urmare, un set de caractere de neînțeles se transformă într-un text care este de înțeles pentru o persoană.

Același lucru se întâmplă și cu paginile HTML ale site-ului. Dacă documentul a fost salvat, de exemplu, în codificare UTF-8, iar documentul în sine are o etichetă META care indică faptul că este codificare Windows-1251, atunci browserul va compara din nou datele salvate în fișier cu tabelul de codificare. specificat pentru acesta și, deoarece caracterele sunt codificate în mod diferit, browserul va afișa un set de caractere de neînțeles în loc de textul obișnuit, sau unele dintre litere pot fi în formă normală, în timp ce alte litere sau simboluri pot fi afișate, pt. de exemplu, sub formă de semne de întrebare. Toate cele de mai sus se aplică și pentru afișarea numelor de fișiere.

Când creați un document nou într-un editor de text, este mai bine să vă asigurați imediat că este selectată codificarea dorită. Editorii moderni vă permit să convertiți textul unui document deschis de la o codificare la alta, iar Notepad-ul standard vă permite să selectați o codificare numai atunci când salvați fișierul.

Cele mai comune codificări

Din paragraful anterior, știi deja ce este codificarea și de ce este atât de important să o înregistrezi corect în codul paginilor site-ului. Să aflăm acum care dintre multele codificări este mai bine să alegem pentru viitorul site. Deoarece sistemul de operare Windows a fost întotdeauna cel mai comun și cel mai ușor de înțeles de învățat, majoritatea dezvoltatorilor web au creat pagini HTML în codificarea Windows-1251 (ANSI), care a fost folosită implicit. Dar Windows-1251 nu acceptă un număr foarte mare de litere și simboluri, iar dezvoltatorii doresc să folosească diferite săgeți, inimi, pătrate și alte simboluri în textele lor, inclusiv necesitatea de a combina cuvinte din diferite limbi într-un singur document, deci a fost înlocuit de mult timp a venit un UTF-8 mai extins și majoritatea dezvoltatorilor folosesc această codificare specială.

Probleme de codificare nu numai în pagina HTML

Un site, fie că este vorba doar de un set de documente HTML statice sau de scripturi dinamice complexe care generează pagini din mers, este găzduit pe un server web care funcționează și cu o anumită codificare. Și dacă serverul emite informații într-o singură codificare, iar paginile sau scripturile dvs. sunt salvate într-o codificare diferită, atunci din nou pot apărea probleme cu afișarea paginilor în browserul utilizatorului. Multe găzduiri vă permit să schimbați setările și să selectați codificarea în conformitate cu cea folosită în fișierele site-ului prin intermediul panoului de control sau să o înregistrați în fișierul .htaccess dacă găzduirea folosește popularul server web Apache.

Aproape niciun site modern nu se poate descurca fără utilizarea bazei de date MySQL și, de asemenea, poate deveni o sursă de probleme de codificare. Dacă fișierele site-ului sunt salvate într-o codificare, iar informațiile din baza de date sunt într-o alta, atunci pe pagină acea parte a informațiilor care este scoasă din baza de date poate fi afișată sub forma tuturor acelorași semne de întrebare sau alte semne de neînțeles. personaje. Pentru a evita problemele de codare, trebuie sa fie la fel si pentru serverul web, baza de date MySQL, in scripturi, in paginile HTML ale site-ului si in tag-ul META care este scris in codul HTML. Dacă există probleme cu afișarea textului, atunci verificați prezența unei probleme în toate cele de mai sus.

META Charset al unui document HTML

Pentru a informa browserul și motoarele de căutare în ce codificare sunt salvate paginile site-ului, în codul lor este scris META Charset.

Pentru codificarea Windows-1251:

Titlul paginii

Textul paginii




Pentru codificarea UTF-8:

Titlul paginii

Textul paginii




Acum știți ce este codificarea site-ului și unde să căutați probleme dacă textul este afișat incorect în orice parte a site-ului.

Copierea articolului este interzisă.

Aproape fiecare nou venit în domeniul dezvoltării web, mai devreme sau mai târziu, întâmpină probleme de codificare în proiectele lor. Și apoi, conform scenariului scris, bombardarea forumurilor începe cu întrebări despre cum să-i învingi pe cei urâți " krakozyabry". Marea majoritate a problemelor sunt cunoscute de mult și sunt tratate destul de ușor, trebuie doar să știi" unde doare si ce pastila sa ia„. Prin urmare, îmi propun să analizăm cele mai populare erori din cauza cărora apare această problemă și este posibil ca recomandările mele să vă salveze de la noi ciocniri cu acestea.

În primul rând, recomand cu tărie asta toate documentele erau în aceeași codificare iar baza de date, și anume câmpurile cu date șir, avea aceeași codificare. Este setat la crearea bazei de date sau puteți specifica o comparație pentru fiecare câmp individual. Dacă creați o bază de date folosind phpMyAdmin, atunci nu ar trebui să existe dificultăți: fila „Băzuri de date” > în câmpul de sub „Creează o bază de date” introduceți numele viitoarei baze de date > lângă lista derulantă „Comparații”. Dacă creați o bază de date cu o interogare sql, atunci scrieți ceva de genul acesta:

CREAȚI BAZĂ DE DATE DACĂ NU EXISTĂ `my_db_name` SET DE CARACTERE utf8 COLLATE utf8_general_ci;

Alegerea codificării depinde de tine, dar te-aș sfătui să alegi pentru documente " UTF-8 fără BOM"și comparație pentru bază" utf8_general_ci" (Unicode multilingv, fără diferențiere între majuscule și minuscule). Doar nu uitați să jucați în siguranță și să faceți un dump înainte de a manipula baza de date! Nu voi descrie aici ce este BOM, dar dacă este foarte figurativ și pe degete, atunci acesta este un astfel de marker invizibil care a fost planificat pentru a distinge între codificările UTF-16LE și UTF-16BE, dar din anumite motive s-a dovedit a fi nerevendicat și acum interferează cu web-dezvoltatorii trăiesc în pace;) BOM arată ca un simbol U+FEFF și se stabilește la începutul documentului. De ce este încă UTF-8? Iată cel puțin câteva motive... Puteți afișa cu ușurință atât în ​​chirilic, cât și un citat din poeziile sau caracterele chinezești ale lui Al-Mutanabbi pe ecran. Acest lucru se datorează faptului că în aceeași codificare Windows-1251 (cp1251) există doar 256 de caractere, în timp ce în UTF-8 există aproximativ o sută de mii dintre ele, plus caractere speciale, pictograme, pictograme etc. Dacă intenționați să utilizați cereri ajax pe site-ul dvs., atunci acest lucru adaugă și un plus codării UTF-8, deoarece obiectul XMLHttpRequest este prieten cu această codificare și va trebui să pervertiți cu alții și uneori fără succes. Același sitemap (sitemap.xml) care este utilizat pentru indexare de către motoarele de căutare funcționează numai dacă acest fișier este creat cu codificare UTF-8. În plus, această codificare este standardul pentru ca multe funcții PHP să funcționeze și este standardul recomandat de W3C.

Când se creează un document nou, totul este clar, dar cum rămâne cu unul existent în care este de dorit să schimbi codificarea? Una dintre cele mai ușoare moduri este să deschideți un document în Notepad++, selectați „ Codificări"și în listă" Convertiți în UTF-8 fără BOM„. Apoi, schimbați metaeticheta cu definiția de codificare:

Și pentru fișierele php, puteți seta antetul corespunzător, dar numai dacă fișierul nu este inclus într-un alt document, unde un astfel de antet va fi deja trimis mai devreme. Acest lucru se aplică atât antetului din metaeticheta, cât și celui trimis de funcția de antet:

Antet ("Content-Type: text/html; charset=utf-8");

Verificăm rezultatul în browser. Pot exista mai multe opțiuni aici:

  1. Totul este afișat bine și problema este închisă
  2. Datele scrise static sunt afișate în mod normal, dar datele din baza de date sunt încă aceleași „nebunești”
  3. Nimic nu s-a schimbat, iar codificarea rămâne strâmbă

Să începem cu ultimul punct. Proprietarii fericiți de servere dedicate sau VPS/VDS pot schimba codificarea directivei default_charsetîn fișierul de configurare php.ini. Pentru cei care nu au acces la php.ini sau au, dar trebuie să schimbe codificarea pentru un singur site, puteți utiliza fișierul .htaccess scriind următoarele în el:

# în principiu, linia de mai jos este suficientă: AddDefaultCharset UTF-8 # dar uneori pot fi necesare setări suplimentare: DefaultLanguage ru php_value default_charset "utf-8"

Fișierul .htaccess se află la rădăcina site-ului dvs. Dacă nu l-ați găsit acolo, atunci îl creăm noi înșine. Într-un bloc de note obișnuit, creați un document> " Salvează ca„> selectați tipul fișierului” Toate filele„> în câmpul „Nume fișier”, scrieți doar punctul și extensia „ .htaccess".

Să trecem la al doilea punct - dacă baza de date a fost transferată la codificarea dorită, dar datele din aceasta sunt afișate strâmb pe pagină. În primul rând, trebuie să vă asigurați că caracterele din baza de date în sine sunt afișate normal. Dacă codificarea nu a „plutește” acolo, atunci puteți fie să apelați din nou la fișierele de configurare, fie să faceți o solicitare imediat după conectarea la baza de date:

SETĂ NUMELE utf8;

* Scriu chiar eu textul cererii, dar de atunci Nu știu ce extensie folosiți pentru a lucra cu MySQL, vă voi arăta mai multe opțiuni:

// pentru mysql_* $db = mysql_connect("localhost", "nume utilizator", "parolă"); mysql_select_db("nume_db", $db); mysql_query("SET NAMES utf8"); // pentru versiunile PDO și php sub 5.3.6 $dbh = new PDO ("mysql:host=localhost;dbname=db_name", "username", "parola"); $dbh->exec("SET NAMES utf8"); // pentru versiunile PDO și php 5.3.6 și mai noi, poate fi specificat direct la crearea unui obiect $dbh = new PDO ("mysql:host=localhost;dbname=db_name;charset=utf8", "username", "parolă" ); // sau $db = PDO nou ("mysql:host=localhost;dbname=db_name", "username", "parola", array(PDO::MYSQL_ATTR_INIT_COMMAND => "SET NAMES utf8")); // pentru MySQLi $mysqli = new mysqli("localhost", "username", "parola", "db_name"); $mysqli->set_charset("utf8");

Deoarece am ridicat problema „mysql_* învechit”, vreau să vă atrag atenția asupra textului evidențiat cu roșu în documentația php. Merita gandit...
Dacă ați avut una dintre problemele standard, atunci urmând unii sau toți pașii de mai sus, problema cu codificarea va fi rezolvată pozitiv. Dar aș dori să menționez și câteva funcții care pot fi utile în situații non-standard. Puteți citi mai multe despre ele în documentație și voi da doar câteva exemple fără a intra în detalii:

Mb_internal_encoding() Cu această funcție, putem seta sau obține codificarea curentă a scriptului: mb_internal_encoding("UTF-8"); // setează echo mb_internal_encoding(); // nici un argument - obține mb_http_input() și mb_http_output() Două funcții care determină, setează sau obțin cererea HTTP sau codificarea caracterelor de ieșire: print_r(mb_http_input("I")); // determina codificarea datelor de intrare a cererii http mb_http_output("UTF-8"); // setează codificarea pentru ieşirea http echo mb_http_output(); // obține codificarea curentă a caracterelor din http-output iconv() Funcția convertește caracterele șirului în codificarea dorită: echo iconv("utf-8","cp1251","PџСЂРёРІРµС‚, РјРёСЂ!"); // Salut Lume! mb_convert_encoding() Funcția este similară cu iconv(), dar în opinia mea este mai bună, deoarece funcționează mai adecvat. echo mb_convert_encoding("Привет, РјРёСЂ!","cp1251","utf-8"); // Salut Lume!

Și, în general, nu uitați de analogii funcțiilor pentru lucrul cu șiruri multiocteți. Cel mai adesea, au același nume, dar cu prefix mb_. Este destul de ușor să simți diferența. Luați, de exemplu, funcțiile strlen()Și mb_strlen()și efectuați un experiment măsurând lungimea șirului:

// setează codificarea internă mb_internal_encoding("utf-8"); // nicio diferență pentru caracterele latine echo strlen("incode"); // 6 echo mb_strlen("incode"); // 6 // Dar cu chirilic dă afară - pichalka echo strlen("incode"); // 10 echo mb_strlen("incode"); // 5

Poate că cineva nu are nevoie să explice acest fenomen, dar pentru începători voi explica: chirilica este codificată în doi octeți și strlen() numără exact numărul de octeți dintr-un șir, nu numărul de litere. Deci, se dovedește că cinci caractere chirilice înmulțite cu două - obținem 10. Caracterele chinezești, dacă nu mă înșel, sunt în general codificate în trei octeți, așa că în viitor pentru astfel de cazuri, pentru a nu exista neînțelegeri, folosiți funcții adecvate.

Repet că aceste soluții sunt pentru cazuri comune și, în marea majoritate, rezolvă problema. Dar dacă aveți o situație în care toate aceste metode nu au funcționat, atunci scrieți aici, să încercăm să ne dăm seama împreună și să completam articolul cu o nouă „rețetă pentru o durere de cap”;) Lasă-mă să-mi iau concediu.

În acest articol, voi încerca să punct „și” (precum și „i”) în alegerea codificării pentru pagina HTML generată.

Când am început să construiesc site-uri web, am avut în mod constant probleme din cauza acestor codificări. Salvați pagina HTML, o încărcați pe server, o deschideți, bang și există erori. Bună, iată-ne.

Sau în mediul de depanare (de exemplu, mediul de dezvoltare locală „”), totul este în regulă, dar din nou de găzduire ei, naibii de krakozyabry, mă privesc cu nebunie.

Cât chin a fost cu motoarele. Dintr-o dată, nu este clar de ce, literele native rusești se transformă în...

Acum ne vom ocupa de această problemă în detaliu și veți ști clar în ce codificare să salvezi pagina htmlȘi prin care unelte.

Pentru a ne consolida înțelegerea reciprocă, să definim conceptul codificare. Deci aici este codificare este un tabel de corespondență între codurile mașinii și caracterele alfabetice. Există o secvență de caractere de mașină pe care un computer inteligent, în conformitate cu tabelul de coduri selectat, le înlocuiește cu litere pe care le înțelegem.

În anii 90 ai secolului trecut (ce vechime, dar încă îmi amintesc de calendarul din 1991 pe perete) erau 4 codificări pentru PC și încă una, proprie, pentru Mac. Ironia sorții constă în faptul că, în toate aceste codificări, caracterele latine erau asortate la coduri mașină după același algoritm, dar în ceea ce privește alfabetul chirilic, fiecare dintre codificări avea propria părere.

Toată această confuzie a dus la apariția krakozyabry. De exemplu, dacă cuvântul „ Întrebare”, tastat în codificare Windows-1251, afișare cu codificare KOI8-R, cuvântul „ bNO».

Slavă Domnului, anii 1990 sunt deja cu mult în urmă, iar din cinci coduri de înșelăciune, doar 2 sunt normale. Dar acest lucru este suficient pentru ca un webmaster începător să se piardă în doi pini. Nu-ți face griji, acum te scot din pădure!

Momentan alegerea pentru Codificarea documentelor HTML se află între windows-1251 și utf-8. Și acum atenție: utf-8 este mult mai bogat, mai puternic și viitorul este cu el. Deci vom salva fișierele HTML în utf-8.

Justifică-mi cuvintele;). UTF-8 conține caractere precum ↓. Și în windws-1251, în loc de aceste caractere, iată ce: > . Și în utf-8 există semnul „euro”; utf-8 vă permite, de asemenea, să combinați o mulțime de diferite caractere specifice utilizate în limbi precum georgiana, ebraică, chineză, japoneză într-un singur fișier HTML; Si deasemenea utf-8în codificări HTML- aceasta este o bună practică.

Sper că te-am convins și vei folosi Unicode (apropo, „utf-8” și „Unicode” sunt sinonime sau, mai precis, utf-8 este una dintre codificările familiei Unicode care a câștigat popularitate în rândul dezvoltatorilor web ).

Acum să aruncăm o privire mai atentă la instrumentele de transcodare a fișierelor pe care ți le recomand să le folosești, dragă cititor.

Instrumente pentru lucrul cu codificări de fișiere HTML

De fapt, sunt doar trei dintre ele:

  • PSPad. Editor de text gratuit, preferatul meu.
  • . Un alt editor de text bun și, de asemenea, gratuit.
  • ţesător de vise. Ei bine, sunteți familiarizat cu Dreamweaver de la mine .

Încărcați un fișier HTML pe PSPad.Și cum putem înțelege ce fel de codificare are subiectul de testare încărcat? Foarte simplu în bara de stare (mai jos) totul este scris clar.

Codificarea fișierului html deschis Windows-1251

Și acum, creând un nou document HTML, să ne ocupăm de codificarea acestuia.

Merg la meniul preferatului meu PSPad. Suntem interesați de articol Format. În el, vom pune o bifă în fața codificării utf-8.

Și astfel codarea viitorului fișier este Windows-1251

Acum despre cum modificați codificarea fișierelor html. Da, este foarte simplu:

Trebuie să faceți clic pe codificarea necesară în elementul de meniu Format iar codificarea se va schimba. După aceea, salvați fișierul, este recodat, treaba este gata.

Cu privire la Notepad++ totul este foarte asemănător cu situația descrisă mai sus. Doar pentru a lucra cu codificări trebuie să utilizați elementul de meniu Codificări.

Toată diferența constă în faptul că în cazul Notepad ++ există elemente de meniu special concepute pentru conversia codificărilor. Convertit... (Superflu după părerea mea, totul este mai simplu în PSPad și de aceea îl folosesc). În consecință, pe ele trebuie să faceți clic dacă doriți să modificați codificările fișierului nostru HTML.

Printre altele, atunci când salvăm în utf-8, avem de ales: fără BOM sau cu BOM. Noi, ca webmasteri, trebuie să folosim codificarea UTF-8 (fără BOM).

Iată ce ne va răspunde Wikipedia la întrebarea „ce este BOM”

Pentru a determina formatul de reprezentare Unicode într-un fișier text, se folosește o tehnică prin care la începutul textului este scris caracterul U + FEFF (spațiu fără lățime zero), numit și Marca de ordine a octetilor, BOM. Această metodă face posibilă distingerea între UTF-16LE și UTF-16BE deoarece caracterul U+FFFE nu există. De asemenea, uneori este folosit pentru a desemna formatul UTF-8, deși conceptul de endianness nu se aplică acestui format.

Dacă citiți textul de mai sus de 10 ori, scărpinați-vă, devine clar: pentru utf-8 BOM nu avem nevoie. În plus, dacă salvați fișierul cu scriptul php în codificare utf-8 cu BOM, atunci nu va funcționa, pentru că handler-ul nu va înțelege ce fel de prostie este scrisă la începutul fișierului script (mă refer la același spațiu non-ruptura cu lățime zero).

Ei bine, ei bine, rămâne să aruncăm o privire atentă ţesător de vise.

Când creați un fișier nou, acordați atenție codului în care va fi creat. Pentru a face acest lucru, în fereastra pentru crearea unui document nou Fișier → Nou (Ctrl+N) utilizați butonul Preferințe...

Și vedeți ce este setat ca codificare implicită:

Codificarea implicită a fișierului HTML generat în Dreamweaver

Transcodați fișierul HTML deschis în Dreamweaver posibil în dialog Proprietăți paginii, care este lansat din meniu ModificaProprietățile paginii (Ctrl + J).

Selectați codarea dorită, apăsați Bineși gata, sarcina de transcodare este finalizată (dar BOM-ul este încă inutil, nu bifați caseta).

Determinarea codificării de către browsere

Deci, fișierul nostru HTML este salvat în codificarea pe care am ales-o. Acum să ne ocupăm de întrebarea: Cum știe browserul despre codificarea folosită în acest fișier HTML?

Există trei opțiuni aici:

1. Noi înșine spunem browserului ce codificare este setată pentru acest fișier HTML. Acest lucru se face folosind eticheta META.

În exemplul de mai sus, browserul este instruit că fișierul HTML descărcat este salvat în codificare utf-8.

Dacă fișierul HTML este salvat în codificare Windows-1251, atunci:

Apropo, atunci când transcodați fișierele, nu uitați să schimbați directivele din eticheta META cu cele reale. Dreamweaver, când schimbă codificarea, face acest lucru automat, dar în alte editoare de text, trebuie să potriviți codificarea aplicată și directiva etichetei META.

HTML complet arată astfel (l citez pentru a înțelege întrebarea „unde este eticheta META cu directiva de codificare indicată”, fiți atenți la a patra linie):

Document fara titlu Ei bine, etc.

2. Folosind fișierul .htaccess. Uneori, serverul trece forțat anteturi pentru fișierele HTML descărcate și îi spune browserului codificarea implicită. În acest caz, browserul nu acordă atenție directivelor din eticheta META, ci afișează fișierul HTML în codificarea raportată de server. Pentru ca fișierul să fie încărcat în codificarea de care aveți nevoie (deseori găzduirea specifică forțat codificarea Windows-1251), un fișier numit „.htaccess” este creat în rădăcina directorului de găzduire.

Acest fișier este destinat pentru configurarea suplimentară a serverului. Efectul directivelor .htaccess se aplică tuturor fișierelor și subdirectoarelor care se află în directorul în care ați salvat fișierul .htaccess.

Puteți crea acest fișier, de exemplu, în Total Commander apăsând combinația de taste rapide Shift+F4și specificând numele fișierului creat .htaccess. Apoi, în editorul de text, sunt specificate directive pentru setări suplimentare de codare implicite.

Pentru fișierele HTML codificate utf-8în .htaccess trebuie să scrieți o linie:

AddDefaultCharset UTF-8

Pentru fișierele HTML în codificare Windows-1251:

AddDefaultCharsetWindows-1251

Dacă găzduirea dvs. este inteligentă și nu acordă atenție acestor directive, atunci puteți încerca:

Charset dezactivat pe AddDefaultCharset Off

Dacă acest lucru nu funcționează, atunci întreabă-ți gazda ce ar trebui să faci pentru a dezactiva codarea implicită :). Totul depinde de setările specifice de server ale furnizorului de găzduire.

3. Instrucțiune PHP care specifică codificarea implicită.În fișierul care trebuie afișat în codificarea dorită, indiferent de setările serverului furnizorului de găzduire, la început este indicată o directivă cu un cod php:

Acest cod php va trimite un antet de server cu codificarea implicită a browserului. În exemplul de mai sus, codificarea utf-8 va fi folosită pentru a afișa pagina.

Împotriva unor astfel de resturi, de obicei, nu există trucuri în setările serverului furnizorului de găzduire.

Vreau să observ că, pentru a procesa instrucțiunile php de către server, fișierul html trebuie să aibă extensia .php(de exemplu index.php).

Ai alte întrebări despre codificare? Scrieți în comentarii. Trebuie să rezolvăm aceste probleme odată pentru totdeauna 🙂

Care este codificarea paginii, în general - pentru ce este codarea paginii - ajută browserul să afișeze corect conținutul paginii. Există un număr mare de codificări pe care nu trebuie să le cunoaștem deloc. Și, desigur, pot apărea probleme cu codificarea paginii.

Cu siguranță ați văzut, când ați mers pe o anumită pagină a site-ului, pe ea erau simboluri de neînțeles, din care era imposibil să înțelegeți nimic - numit popular „krakozyabry”.

Navigare în pagină:

    Tipuri și tipuri de codificări

  1. Desigur, suntem interesați în primul rând de codificări care sunt legate în rusă.
    1.

    „utf-8” este o codificare universală.

    „windows-1251” este chirilic.

    Și aici, desigur, trebuie să spun despre experiența reală, care este deja planificată de 10 ani... și așa!

    La început, când am început prima dată, am început cu codificarea „windows-1251”, dar au existat întotdeauna unele probleme cu această codificare, va fi greu de reținut acum, dar în cele din urmă, am trecut la „utf- 8”

  2. Ce înseamnă desemnarea utf-8


  3. Și, desigur, trebuie să scriem câteva rânduri despre ce înseamnă de fapt această codificare „utf-8”:
    UTF-8 (din engleză Unicode Transformation Format, 8-bit - „Unicode transformation format, 8-bit”) este un standard comun de codificare a textului care vă permite să stocați și să transmiteți mai compact caractere Unicode utilizând un număr variabil de octeți (de la 1 până la 4) și este complet compatibil cu codificarea ASCII pe 7 biți.

    În principiu, avem nevoie ca datele noastre să fie afișate corect pe pagină...

  4. Cum se determină codificarea paginii?

  5. Într-un browser deschis, apăsați combinația de butoane ctrl + U. Ar trebui să se deschidă o pagină suplimentară cu codul!
  6. Unde este localizată codarea paginii?

  7. De obicei, codificarea este plasată pe pagină chiar la început, aici este un exemplu de codificare, aici codificarea paginii este pe linia 4. Si arata ca:

    Ceea ce înseamnă că pagina este făcută în codificare utf-8.

    Aceasta este una dintre cele mai comune codificări.

    Sau codificare chirilică:

  8. Cum se schimbă codificarea paginii html

  9. Dacă este simplu - fizic (fișier) -, atunci trebuie doar să îl deschideți într-un editor și să înlocuiți codarea cu cea de care aveți nevoie!
    Cum să schimbi codificarea paginii dacă ai un motor!? Fiecare motor are o anumită logică. Ca în orice scenariu. Ca o pagină obișnuită, motorul are blocuri din care colectează aceste pagini - trebuie doar să găsiți blocul care trimite codificarea în browser...
  10. Un exemplu de codificare incorectă.

  11. Uneori, această codificare cauzează diferite probleme...

    De exemplu, unele găzduiri pur și simplu nu acceptă această codificare.

    Așa va arăta pagina cu codificare ruptă.


  12. De ce apar bug-uri pe pagină!?

  13. De fapt, există mai multe motive pentru apariția așa-numitului krakozyabr!
    1.

    Codificarea incorectă a paginii, de exemplu, dacă setați codarea la chineză și scrieți textul chirilic, atunci ce ar trebui să se întâmple!? Browserul va înnebuni pur și simplu neștiind ce să îți arate și va arăta krakozyabry.

    Setare greșită a browserului. Sau browserul nu poate găsi automat acest șir pe pagină, ceea ce indică codificarea paginii.

    3. Serverul nu acceptă această codificare!

  14. Cum se schimbă codarea greșită!?

    1.

    Dacă vorbim despre pagina dvs. de pe site-ul dvs., atunci trebuie să vă deschideți pagina în notepad și să schimbați codificarea paginii. Dacă site-ul este pe motor, atunci trebuie să găsiți pagina principală în care este scrisă codificarea și să o schimbați cu cea corespunzătoare!

    Dacă browserul interpretează incorect codificarea. Apoi, trebuie să vă ocupați de browser.

    3. Dacă aceasta este o problemă de server, atunci ar trebui să încercați să faceți modificări fișierului .htaccess adăugând următoarea inscripție la acesta:



Ți-a plăcut articolul? Împărtășește-l