Contactos

Codificación de letras rusas en html. Codificación HTML. En qué codificación guardar la página web. Archivo de prueba para comprobar la codificación.

Al crear un sitio, los webmasters novatos a menudo tienen preguntas: en qué codificación crear un sitio, en qué se diferencia UTF-8 de Windows-1251 y cómo registrarlo en el META Charset de la página HTML del sitio. Todas estas preguntas tienen respuesta en este artículo.

¿Qué es la codificación de sitios y cómo funciona?

La codificación se puede representar como una tabla que consta de diferentes letras, números y otros caracteres comprensibles para los humanos, que están codificados de una determinada manera. Cuando abre un archivo de texto, que incluye páginas HTML, la computadora lee desde el encabezado del archivo en qué codificación se guardó y genera el texto en la codificación apropiada, convirtiendo los datos de la computadora en un formato legible por humanos al comparar estos datos con la codificación. mesa. Si la información de codificación del encabezado del archivo coincide con la codificación en la que se almacenan los datos en la página HTML, entonces el usuario ve letras, números y otros caracteres que le son familiares. Si hay una discrepancia, como resultado se muestra al usuario un conjunto de caracteres incomprensible, esto sucede especialmente en programas de correo antiguos. Si el usuario recibió una carta con grietas incomprensibles, simplemente clasificando diferentes codificaciones, generalmente logra adivinar y seleccionar aquella en la que está escrita la letra y, como resultado, un conjunto incomprensible de caracteres se convierte en un texto que es comprensible para una persona.

Lo mismo ocurre con las páginas HTML del sitio. Si el documento se guardó, por ejemplo, en codificación UTF-8 y el documento en sí tiene una etiqueta META que indica que tiene codificación Windows-1251, el navegador volverá a comparar los datos guardados en el archivo con la tabla de codificación. especificado para ello, y dado que los caracteres están codificados de manera diferente, el navegador mostrará un conjunto incomprensible de caracteres en lugar del texto habitual, o algunas de las letras pueden estar en forma normal, mientras que otras letras o símbolos pueden mostrarse, por ejemplo. por ejemplo, en forma de signos de interrogación. Todo lo anterior se aplica también a la visualización de nombres de archivos.

Al crear un nuevo documento en un editor de texto, es mejor asegurarse inmediatamente de que esté seleccionada la codificación deseada. Los editores modernos le permiten convertir el texto de un documento abierto de una codificación a otra, y el Bloc de notas estándar le permite seleccionar una codificación solo al guardar el archivo.

Las codificaciones más comunes.

Del párrafo anterior ya sabes qué es la codificación y por qué es tan importante registrarla correctamente en el código de las páginas del sitio. Averigüemos ahora cuál de las muchas codificaciones es mejor elegir para el futuro sitio. Dado que el sistema operativo Windows siempre ha sido el más común y el más comprensible de aprender, la mayoría de los desarrolladores web crearon páginas HTML en la codificación windows-1251 (ANSI), que se utilizaba de forma predeterminada. Pero Windows-1251 no admite una gran cantidad de letras y símbolos, y los desarrolladores quieren usar varias flechas, corazones, cuadrados y otros símbolos en sus textos, incluida la necesidad de combinar palabras de diferentes idiomas en un solo documento, por lo que Ha sido reemplazado durante mucho tiempo por un UTF-8 más extendido y la mayoría de los desarrolladores utilizan esta codificación en particular.

Problemas de codificación no sólo en la página HTML

El sitio, ya sea un conjunto de documentos HTML estáticos o scripts dinámicos complejos que generan páginas sobre la marcha, está alojado en un servidor web que también funciona con una codificación específica. Y si el servidor genera información en una codificación y sus páginas o scripts se guardan en una codificación diferente, nuevamente puede haber problemas al mostrar las páginas en el navegador del usuario. Muchos hostings te permiten cambiar la configuración y seleccionar la codificación de acuerdo con la utilizada en los archivos del sitio a través del panel de control o registrarla en el archivo .htaccess si el hosting utiliza el popular servidor web Apache.

Casi ningún sitio moderno puede funcionar sin utilizar la base de datos MySQL y también puede convertirse en una fuente de problemas de codificación. Si los archivos del sitio se guardan en una codificación y la información en la base de datos está en otra, entonces en la página esa parte de la información que se genera desde la base de datos se puede mostrar en forma de los mismos signos de interrogación u otros incomprensibles. caracteres. Para evitar problemas con la codificación, esta debe ser la misma para el servidor web, la base de datos MySQL, en los scripts, en las páginas HTML del sitio y en la etiqueta META que está escrita en el código HTML. Si hay problemas con la visualización del texto, verifique la presencia de un problema con todo lo anterior.

Juego de caracteres META de un documento HTML

Para informar al navegador y a los motores de búsqueda en qué codificación se guardan las páginas del sitio, se escribe META Charset en su código.

Para codificación windows-1251:

Título de la página

Texto de la página




Para codificación UTF-8:

Título de la página

Texto de la página




Ahora ya sabe qué es la codificación del sitio y dónde buscar problemas si el texto se muestra incorrectamente en cualquier parte del sitio.

Está prohibido copiar el artículo.

Casi todos los recién llegados al campo del desarrollo web, tarde o temprano, encuentran problemas de codificación en sus proyectos. Y luego, según el guión escrito, comienza el bombardeo de los foros con preguntas sobre cómo derrotar a los odiados " krakozyabry". La gran mayoría de los problemas se conocen desde hace mucho tiempo y se tratan con bastante facilidad, sólo hay que saberlo ". donde duele y que pastilla tomar". Por lo tanto, propongo analizar los errores más populares por los cuales aparece este problema y es posible que mis recomendaciones lo salven de futuras colisiones con ellos.

Primero, recomiendo encarecidamente que todos los documentos estaban en la misma codificación y la base de datos, es decir, los campos con datos de cadena, tenían la misma codificación. Se establece cuando se crea la base de datos, o puede especificar una comparación para cada campo individual. Si crea una base de datos usando phpMyAdmin, entonces no debería haber dificultades: la pestaña "Bases de datos" > en el campo bajo "Crear una base de datos" ingrese el nombre de su futura base de datos > al lado de la lista desplegable "Comparaciones". Si crea una base de datos con una consulta SQL, escriba algo como esto:

CREAR BASE DE DATOS SI NO EXISTE `my_db_name` CONJUNTO DE CARACTERES utf8 COLLATE utf8_general_ci;

La elección de la codificación depende de usted, pero le aconsejaría que elija documentos " UTF-8 sin lista de materiales"y comparación para la base" utf8_general_ci" (Unicode multilingüe, no distingue entre mayúsculas y minúsculas). ¡No olvides ir a lo seguro y hacer un volcado antes de manipular la base de datos! No describiré aquí qué es BOM, pero si es muy figurativo y está en los dedos, entonces este es un marcador tan invisible que se planeó para distinguir entre las codificaciones UTF-16LE y UTF-16BE, pero por alguna razón resultó ser no reclamado y ahora interfiere con la web -los desarrolladores viven en paz;) BOM parece un símbolo U+FEFF y se ubica al principio del documento. ¿Por qué sigue siendo UTF-8? He aquí al menos un par de razones... Puede mostrar fácilmente tanto cirílico como una cita de los poemas de Al-Mutanabbi o caracteres chinos en la pantalla. Esto se debe a que en la misma codificación Windows-1251 (cp1251) solo hay 256 caracteres, mientras que en UTF-8 hay alrededor de cien mil, además de caracteres especiales, pictogramas, iconos, etc. Si va a utilizar solicitudes ajax en su sitio, esto también agrega una ventaja a la codificación UTF-8, porque el objeto XMLHttpRequest es amigo de esta codificación y tendrá que pervertir con otros y, a veces, sin éxito. El mismo mapa del sitio (sitemap.xml) que utilizan los motores de búsqueda para la indexación solo funciona si este archivo se crea con codificación UTF-8. Además, esta codificación es el estándar para que funcionen muchas funciones PHP y es el estándar recomendado por el W3C.

Al crear un nuevo documento, todo está claro, pero ¿qué pasa con uno existente en el que es deseable cambiar la codificación? Una de las formas más sencillas es abrir un documento en Notepad++, seleccionar " Codificaciones" y en la lista " Convertir a UTF-8 sin BOM". A continuación, cambie la metaetiqueta con la definición de codificación:

Y para los archivos php, puede configurar el encabezado apropiado, pero solo si el archivo no está incluido en otro documento, donde dicho encabezado ya se habrá enviado antes. Esto se aplica tanto al encabezado de la metaetiqueta como al enviado por la función de encabezado:

Encabezado("Tipo de contenido: texto/html; charset=utf-8");

Comprobamos el resultado en el navegador. Puede haber varias opciones aquí:

  1. Todo se muestra bien y el problema está cerrado.
  2. Los datos escritos estáticamente se muestran normalmente, pero los datos de la base de datos siguen siendo los mismos "locos"
  3. Nada ha cambiado y la codificación sigue torcida.

Empecemos por el último punto. Los felices propietarios de servidores dedicados o VPS/VDS pueden cambiar la codificación de la directiva conjunto_caracteres predeterminado en el archivo de configuración php.ini. Para aquellos que no tienen acceso a php.ini o lo tienen, pero necesitan cambiar la codificación de un solo sitio, pueden usar el archivo .htaccess escribiendo lo siguiente en él:

# en principio, la siguiente línea es suficiente: AddDefaultCharset UTF-8 # pero a veces, es posible que se requieran configuraciones adicionales: DefaultLanguage ru php_value default_charset "utf-8"

El archivo .htaccess se encuentra en la raíz de su sitio. Si no lo encontró allí, lo creamos nosotros mismos. En un bloc de notas normal, cree un documento> " Guardar como"> seleccionar tipo de archivo" Todos los archivos"> en el campo "Nombre de archivo", escriba solo el punto y la extensión " .htaccess".

Pasemos al segundo punto: si la base de datos se transfirió a la codificación deseada, pero los datos que contiene se muestran torcidos en la página. Primero, debe asegurarse de que los caracteres de la base de datos se muestren normalmente. Si la codificación no "flotó" allí, puede volver a consultar los archivos de configuración o realizar una solicitud inmediatamente después de conectarse a la base de datos:

ESTABLECER NOMBRES utf8;

* Yo mismo escribo el texto de la solicitud, pero desde No sé qué extensión usas para trabajar con MySQL, te mostraré varias opciones:

// para mysql_* heredado $db = mysql_connect("localhost", "nombre de usuario", "contraseña"); mysql_select_db("nombre_bd", $db); mysql_query("ESTABLECER NOMBRES utf8"); // para versiones de PDO y php inferiores a 5.3.6 $dbh = new PDO("mysql:host=localhost;dbname=db_name", "username", "password"); $dbh->exec("ESTABLECER NOMBRES utf8"); // para PDO y php versiones 5.3.6 y posteriores, se puede especificar directamente al crear un objeto $dbh = new PDO("mysql:host=localhost;dbname=db_name;charset=utf8", "username", "password" ); // o $db = new PDO("mysql:host=localhost;dbname=db_name", "nombre de usuario", "contraseña", array(PDO::MYSQL_ATTR_INIT_COMMAND => "SET NAMES utf8")); // para MySQLi $mysqli = new mysqli("localhost", "nombre de usuario", "contraseña", "db_name"); $mysqli->set_charset("utf8");

Dado que planteé el problema de "mysql_* desactualizado", quiero llamar su atención sobre el texto resaltado en rojo en la documentación de PHP. Vale la pena pensar...
Si tuvo uno de los problemas estándar, siguiendo algunos o todos los pasos anteriores, el problema con la codificación se resolverá positivamente. Pero también me gustaría mencionar algunas funciones que pueden resultar útiles en situaciones no estándar. Puedes leer más sobre ellos en la documentación y solo daré un par de ejemplos sin entrar en detalles:

Mb_internal_encoding() Con esta función, podemos establecer u obtener la codificación del script actual: mb_internal_encoding("UTF-8"); // establece echo mb_internal_encoding(); // sin argumento - get mb_http_input() y mb_http_output() Dos funciones que determinan, configuran u obtienen la solicitud HTTP o la codificación de caracteres de salida: print_r(mb_http_input("I")); // determina la codificación de los datos de entrada de la solicitud http mb_http_output("UTF-8"); // establece la codificación para la salida http echo mb_http_output(); // obtiene la codificación de caracteres actual de la salida http iconv() La función convierte los caracteres de la cadena a la codificación deseada: echo iconv("utf-8","cp1251","PџСЂРёРІРμС‚, РјРёСЂ!"); // ¡Hola Mundo! mb_convert_encoding() La función es similar a iconv(), pero en mi opinión es mejor, porque funciona más adecuadamente. echo mb_convert_encoding("РџСЂРёРІРμС‚, РјРёСЂ!","cp1251","utf-8"); // ¡Hola Mundo!

Y, en general, no se olvide de los análogos de funciones para trabajar con cadenas multibyte. La mayoría de las veces tienen el mismo nombre, pero con el prefijo megabyte_. Es bastante fácil sentir la diferencia. Tomemos, por ejemplo, las funciones strlen() Y mb_strlen() y realiza un experimento midiendo la longitud de la cuerda:

// establece la codificación interna mb_internal_encoding("utf-8"); // no hay diferencia para los caracteres latinos echo strlen("incode"); // 6 echo mb_strlen("código"); // 6 // Pero con cirílico falla - pichalka echo strlen("incode"); // 10 echo mb_strlen("código"); // 5

Tal vez alguien no necesite explicar este fenómeno, pero para los principiantes les explicaré: el cirílico está codificado en dos bytes y strlen() cuenta exactamente el número de bytes de una cadena, no el número de letras. Entonces resulta que multiplicamos cinco caracteres cirílicos por dos: obtenemos 10. Los caracteres chinos, si no me equivoco, generalmente están codificados en tres bytes, por lo que en el futuro, para tales casos, para que no haya malentendidos, use el funciones apropiadas.

Repito que estas soluciones son para casos comunes y en la gran mayoría solucionan el problema. Pero si tiene una situación en la que todos estos métodos no funcionaron, escriba aquí, intentemos resolverlo juntos y complementar el artículo con una nueva "receta para el dolor de cabeza";) Déjeme despedirme.

En este artículo, intentaré poner un punto en la "y" (así como en la "i") en la elección de codificación para la página HTML generada.

Cuando comencé a crear sitios web, constantemente tenía problemas debido a estas codificaciones. Guardas la página HTML, la subes al servidor, la abres, haces clic y hay errores. Bueno hola, allá vamos.

O en el entorno de depuración (por ejemplo, el entorno de desarrollo local ""), todo está bien, pero desde el alojamiento nuevamente, malditos krakozyabry, me miran descaradamente.

Cuánto tormento hubo con los motores. De repente, no está claro por qué, las letras rusas nativas se convierten en ...

Ahora trataremos este asunto en detalle y sabrás claramente en qué codificación guardar la página html Y a través de qué herramientas.

Para fortalecer nuestro entendimiento mutuo, definamos el concepto codificación. Asi que aqui esta codificación es una tabla de correspondencia entre códigos de máquina y caracteres alfabéticos. Existe una secuencia de caracteres de máquina que una computadora inteligente, de acuerdo con la tabla de códigos seleccionada, reemplaza con letras que entendemos.

En los años 90 del siglo pasado (qué antigüedad, pero aún recuerdo el calendario de 1991 en la pared) había 4 codificaciones para el PC y una más, propia, para el Mac. La ironía del destino radica en el hecho de que en todas estas codificaciones los caracteres latinos se relacionaron con códigos de máquina según el mismo algoritmo, pero con respecto al alfabeto cirílico, cada una de las codificaciones tenía su propia opinión.

Toda esta confusión llevó a la aparición de krakozyabry. Por ejemplo, si la palabra " Pregunta”, escrito en codificación windows-1251, se muestra con codificación KOI8-R, la palabra “ NO».

Gracias a Dios, la década de 1990 ya quedó atrás y de cinco códigos de engaño, solo 2 son normales. Pero esto es suficiente para que un webmaster novato se pierda entre dos pinos. ¡No te preocupes, ahora te sacaré de este bosque!

Por el momento la elección de Codificaciones de documentos HTML se encuentra entre windows-1251 y utf-8. Y ahora atención: utf-8 es mucho más rico, más poderoso y el futuro está en él. Entonces guardaremos nuestros archivos HTML en utf-8.

Justifica mis palabras;). UTF-8 contiene caracteres como ↓. Y en windws-1251, en lugar de estos caracteres, esto es lo que: > . Y en utf-8 hay un signo "euro"; utf-8 también le permite combinar varios caracteres específicos utilizados en idiomas como georgiano, hebreo, chino y japonés en un archivo HTML; y también utf-8en codificaciones HTML- Esta es una buena práctica.

Espero haberte convencido y usarás Unicode (por cierto, "utf-8" y "Unicode" son sinónimos o, para ser más precisos, utf-8 es una de las codificaciones de la familia Unicode que ha ganado popularidad entre los desarrolladores web. ).

Ahora echemos un vistazo más de cerca a las herramientas de transcodificación de archivos que le recomiendo utilizar, querido lector.

Herramientas para trabajar con codificaciones de archivos HTML

En realidad, sólo hay tres de ellos:

  • PSPad. Editor de texto gratuito, mi favorito.
  • . Otro buen editor de texto y además gratuito.
  • tejedor de sueños. Bueno, estás familiarizado con Dreamweaver por mi .

Sube algún archivo HTML a PSPad.¿Y cómo podemos entender qué tipo de codificación tiene el sujeto de prueba cargado? De forma muy sencilla, en la barra de estado (abajo) está todo claramente escrito.

Codificación de archivos html abiertos windows-1251

Y ahora, creando un nuevo documento HTML, ocupémonos de su codificación.

Ir al menú de mi favorito PS Pad. Estamos interesados ​​en el artículo. Formato. En él, pondremos una marca de verificación delante de la codificación utf-8.

Y entonces la codificación del archivo futuro es windows-1251.

Ahora sobre como cambiar la codificación del archivo html. Sí, es muy sencillo:

Debe hacer clic en la codificación requerida en el elemento del menú. Formato y la codificación cambiará. Después de eso, guarde el archivo, se recodifica y el trabajo está hecho.

Sobre Bloc de notas++ Todo es muy similar a la situación descrita anteriormente. Solo para trabajar con codificaciones necesitas usar el elemento del menú. Codificaciones.

Toda la diferencia radica en el hecho de que en el caso de Notepad ++ hay elementos de menú especialmente diseñados para convertir codificaciones. Convertir... (Superfluo en mi opinión, todo es más sencillo en PSPad y por eso lo uso). En consecuencia, es en ellos donde debe hacer clic si desea cambiar las codificaciones de nuestro archivo HTML.

Entre otras cosas, al guardar en utf-8, tenemos una opción: sin lista de materiales o con lista de materiales. Nosotros, como webmasters, necesitamos utilizar codificación. UTF-8 (sin lista de materiales).

Esto es lo que Wikipedia nos responderá a la pregunta " ¿Qué es BOM»

Para determinar el formato de representación Unicode en un archivo de texto, se utiliza una técnica mediante la cual el carácter U + FEFF (espacio sin separación de ancho cero), también llamado marca de orden de bytes, BOM, se escribe al principio del texto. Este método permite distinguir entre UTF-16LE y UTF-16BE porque el carácter U+FFFE no existe. A veces también se utiliza para indicar el formato UTF-8, aunque el concepto de endianidad no se aplica a este formato.

Si lees el texto anterior 10 veces, te rascas la cabeza, queda claro: para utf-8 BOM no necesitamos. Además, si guarda el archivo con el script php en la codificación utf-8 con lista de materiales, entonces no funcionará, porque el controlador no entenderá qué tipo de tonterías está escrita al principio del archivo de script (me refiero al mismo espacio sin separación con ancho cero).

Bueno, bueno, queda por mirar de cerca. tejedor de sueños.

Al crear un archivo nuevo, preste atención a la codificación en la que se creará. Para hacer esto, en la ventana para crear un nuevo documento. Archivo → Nuevo (Ctrl+N) usa el botón Preferencias...

Y vea cuál está configurada como codificación predeterminada:

La codificación predeterminada del archivo HTML generado en Dreamweaver

Transcodificar un archivo HTML abierto en Dreamweaver posible en el dialogo Propiedades de la página, que se inicia desde el menú ModificarPropiedades de página (Ctrl + J).

Seleccione la codificación requerida, presione DE ACUERDO y eso es todo, la tarea de transcodificación está completa (pero la lista de materiales aún es innecesaria, no marque la casilla).

Determinación de la codificación por navegadores.

Entonces, nuestro archivo HTML se guarda en la codificación que hemos elegido. Ahora abordemos la pregunta: ¿Cómo sabe el navegador acerca de la codificación utilizada en este archivo HTML?

Hay tres opciones aquí:

1. Nosotros mismos le indicamos al navegador qué codificación está configurada para este archivo HTML. Esto se hace usando la etiqueta META.

En el ejemplo anterior, se le indica al navegador que el archivo HTML descargado se guarde en la codificación utf-8.

Si el archivo HTML se guarda con codificación Windows-1251, entonces:

Por cierto, al transcodificar archivos, no olvide cambiar las directivas de la etiqueta META por las reales. Dreamweaver, al cambiar la codificación, lo hace automáticamente, pero en otros editores de texto usted mismo debe hacer coincidir la codificación aplicada y la directiva de etiqueta META.

El HTML completo se ve así (lo cito para entender la pregunta "¿dónde está la etiqueta META con la directiva de codificación indicada?", preste atención a la cuarta línea):

Documento sin titulo Bueno, etc

2. Usando el archivo .htaccess. A veces, el servidor pasa a la fuerza los encabezados de los archivos HTML descargados y le indica al navegador la codificación predeterminada. En este caso, el navegador no presta atención a las directivas de la etiqueta META, sino que muestra el archivo HTML en la codificación informada por el servidor. Para que el archivo se cargue con la codificación que necesita (a menudo el alojamiento especifica a la fuerza la codificación Windows-1251), se crea un archivo llamado ".htaccess" en la raíz del directorio de alojamiento.

Este archivo está destinado a la configuración adicional del servidor. El efecto de las directivas .htaccess se aplica a todos los archivos y subdirectorios que se encuentran en el directorio donde guardó el archivo .htaccess.

Puede crear este archivo, por ejemplo, en Total Commander presionando la combinación de teclas de acceso rápido Mayús+F4 y especificando el nombre del archivo creado .htaccess. A continuación, en el editor de texto, se especifican directivas para configuraciones de codificación predeterminadas adicionales.

Para archivos HTML codificados en utf-8 en .htaccess necesitas escribir una línea:

Agregar conjunto de caracteres predeterminado UTF-8

Para archivos HTML con codificación Windows-1251:

Agregar conjunto de caracteres predeterminadoWindows-1251

Si su alojamiento es inteligente y no presta atención a estas directivas, puede intentar:

Charsetdisable activado AddDefaultCharset desactivado

Si esto no funciona, pregúntale a tu proveedor de alojamiento qué debes hacer para desactivar la codificación predeterminada :). Todo depende de la configuración específica del servidor del proveedor de hosting.

3. Instrucción PHP que especifica la codificación predeterminada. En el archivo que debe mostrarse en la codificación deseada, independientemente de la configuración del servidor del proveedor de hosting, al principio se indica una directiva con un código php:

Este código php enviará un encabezado de servidor con la codificación predeterminada del navegador. En el ejemplo anterior, se utilizará la codificación utf-8 para mostrar la página.

Contra este tipo de chatarra, por lo general, no hay trucos en la configuración del servidor del proveedor de hosting.

Quiero señalar que para que el servidor procese las instrucciones php, el archivo html debe tener la extensión .php(por ejemplo index.php).

¿Tiene alguna otra pregunta sobre codificación? Escribe en los comentarios. Necesitamos resolver estos problemas de una vez por todas 🙂

¿Cuál es la codificación de la página, en general? ¿Para qué sirve la codificación de la página? Ayuda al navegador a mostrar correctamente el contenido de la página. Hay una gran cantidad de codificaciones que no necesitamos saber en absoluto. Y por supuesto, puede haber problemas con la codificación de la página.

Seguramente viste, cuando entraste a alguna página del sitio, que había símbolos incomprensibles en ella, de los cuales era imposible entender nada, popularmente llamado "krakozyabry".

Navegación de página:

    Tipos y tipos de codificaciones.

  1. Por supuesto, lo que más nos interesa son las codificaciones vinculadas al idioma ruso.
    1.

    "utf-8" es una codificación universal.

    "windows-1251" es cirílico.

    Y aquí, por supuesto, debo decir sobre la experiencia real, que ya está planificada para 10 años... ¡y así!

    Al principio, cuando comencé, comencé con la codificación "windows-1251", pero siempre hubo algunos problemas con esta codificación, será difícil recordarlo ahora, pero al final cambié a "utf- 8”

  2. ¿Qué significa la designación utf-8?


  3. Y, por supuesto, necesitamos escribir un par de líneas sobre lo que realmente significa esta codificación "utf-8":
    UTF-8 (del formato de transformación Unicode en inglés, 8 bits - "formato de transformación Unicode, 8 bits") es un estándar de codificación de texto común que le permite almacenar y transmitir caracteres Unicode de forma más compacta utilizando un número variable de bytes (de 1 a 4) y es totalmente compatible con codificación ASCII de 7 bits.

    En principio necesitamos que nuestros datos se muestren correctamente en la página…

  4. ¿Cómo determinar la codificación de la página?

  5. En un navegador abierto, presione la combinación de botones Ctrl + U. ¡Debería abrirse una página adicional con el código!
  6. ¿Dónde se encuentra la codificación de la página?

  7. Por lo general, la codificación se coloca en la página al principio, aquí hay un ejemplo de codificación, aquí la codificación de la página está en la línea 4. Y parece:

    Lo que significa que la página está hecha en codificación utf-8.

    Esta es una de las codificaciones más comunes.

    O codificación cirílica:

  8. Cómo cambiar la codificación de la página HTML

  9. Si es simple, físico (archivo), entonces solo necesita abrirlo en algún editor y reemplazar la codificación por la que necesita.
    ¿Cómo cambiar la codificación de la página si tienes un motor? Cada motor tiene una lógica determinada. Como en cualquier guión. Como una página normal, el motor tiene bloques a partir de los cuales recopila estas páginas; solo necesita encontrar el bloque que envía su codificación al navegador...
  10. Un ejemplo de codificación incorrecta.

  11. A veces esta codificación causa diferentes problemas...

    Por ejemplo, algunos hostings simplemente no soportan esta codificación.

    Así es como se verá la página con la codificación rota.


  12. ¿Por qué aparecen errores en la página?

  13. De hecho, ¡hay varias razones para la aparición del llamado krakozyabr!
    1.

    Codificación de página incorrecta, bueno, por ejemplo, si configura la codificación en chino y escribe texto en cirílico, ¿qué debería pasar? El navegador simplemente se volverá loco sin saber qué mostrarle y mostrará krakozyabry.

    Configuración incorrecta del navegador. O el navegador no puede encontrar automáticamente esta cadena en la página, lo que indica la codificación de la página.

    3. ¡El servidor no admite esta codificación!

  14. ¿Cómo cambiar la codificación incorrecta?

    1.

    Si estamos hablando de su página en su sitio, entonces debe abrir su página en el Bloc de notas y cambiar la codificación de la página. Si el sitio está en el motor, entonces debe encontrar la página principal en la que está escrita la codificación y cambiarla por la apropiada.

    Si el navegador interpreta incorrectamente la codificación. Entonces necesitas lidiar con el navegador.

    3. Si se trata de un problema del servidor, debería intentar realizar cambios en el archivo .htaccess agregándole la siguiente inscripción:



¿Te gustó el artículo? Compártelo