El tamaño de una grabación de tres horas como 192 Kbps. Los conceptos erróneos más comunes sobre el tema del sonido digital. El sonido de CD de audio con licencia mejor que sus copias

La tasa de bits se indica como una de las características principales de grabaciones de video y audio. La mayoría de los usuarios se utilizaron para pensar que define la calidad del archivo que se está descargando. Pero, ¿qué son los bitrados y cómo caracterizan realmente los archivos de música y los videos? Considera esto con más detalle.

¿Qué son los bitrados?

La tasa de bits es un valor que muestra el número de unidades de información (MEGABIT o KILOBIT), que se fija en un segundo de la reproducción de archivos. En consecuencia, se mide en megabits por segundo (MBPS) o kilobits por segundo (Kbps). De lo contrario, la tasa de bits se puede describir como un ancho de banda de ancho de banda. Esta característica es importante para aquellos que desean convertir archivos, porque con la misma duración, la tasa de bits más grande conducirá a un aumento en el archivo. Además del tamaño, la calidad del sonido cambia. Reducir el tamaño al reducir la tasa de bits se llama compresión.

Un musical común es un archivo de audio, comprimido en tal medida que el disco estándar se coloca hasta 12 horas de música. Al mismo tiempo, la calidad sigue siendo lo suficientemente alta debido a la compresión psicoacústica: de toda la gama, se eliminan los sonidos con esas frecuencias y los volúmenes de volumen, que no son capturados por el oído humano. Los sonidos seleccionados se forman en bloques separados, llamados marcos. Los marcos tienen la misma duración del sonido y comprimen en un algoritmo dado. Cuando se juega la música, la señal se recrea de bloques decodificados en una secuencia específica.

¿Cuál es la compresión comúnmente utilizada?

La velocidad de bits de audio es la mayoría de las veces, 256 Kbps. Con este valor, la grabación de audio se comprime en la cantidad de aproximadamente 6 veces, debido a que se puede grabar un disco 6 veces más música que antes de la compresión. Si la tasa de bits se reduce a 128 Kbps, entonces un disco se ajustará ya 12 veces más música, pero la calidad del sonido será notablemente más baja. La música registrada como 128 kbit / s se ofrece más a menudo para escuchar en Internet, ya que en la búsqueda de aumentar la velocidad de carga de la página de los dueños de recursos, vaya a cualquier sacrificio. Muchos usuarios observan que su calidad está lejos de ser perfecta.

Ahora, cuando quedó claro qué son las tuercas, es hora de determinar su nivel óptimo. Ambos amantes y profesionales están infinitamente argumentando cómo la tasa de bits afecta la calidad del sonido y afecta a todos. En los álbumes musicales, como regla general, se indica un bitrance. El mismo disco registrado como 128 kbps y 256 kbps variará según el precio dos veces.

Tarta de bits óptima bajo diferentes condiciones de escucha

Para muchas personas, la compresión de doce veces no representa ningún daño, mientras que otros argumentan que no pueden escuchar música con bitrancos más bajos de 320 kbps. Paradójicamente, pero aquellos y otros tienen razón. El hecho es que, en última instancia, la calidad de la reproducción no depende de las condiciones de reproducción e incluso del tipo de música.

Por ejemplo, la canción se reproduce en la grabadora de cinta instalada en el automóvil nacional. En este caso, la calidad en 192 Kbps será bastante suficiente. Una mayor tasa de bits mejorará la calidad del sonido, pero la diferencia no se notará debido al alto nivel de ruido durante el viaje. Si la música se reproduce en una computadora doméstica o jugador portátilRequiere al menos 256 Kbps. Si la señal no está sujeta a cambios, se transmite a dispositivos externos y se muestra en columnas importadas costosas, se debe recurrir a una compresión mínima. Es posible cuando bittate 320 Kbps.

Tarta de bits óptima para varios estilos musicales.

La música con una tasa de bits alta no siempre es necesaria. La música popular, por regla general, suena bastante bien cuando Bitty 192-256 Kbps. Más alta calidad Es posible establecer, pero no tiene sentido en esto: las canciones pop son de corta duración, por lo que el espacio de ahorro en los discos debe ser una prioridad. Además, la calidad de los registros de origen también es mediocre, por lo que el aumento en la tasa de bits puede no afectar la calidad del archivo jugable. Para escuchar en el transporte y en las partes no oficiales, la calidad promedio es suficiente.

Si estamos hablando Acerca de la música clásica, las obras de grupos de rock legendarios o canciones de derechos de autor raros, entonces la calidad debe ser sobre todo. Al comprar dicha música, debe mirar la tasa de bits especificada en el embalaje del disco. Si la canción está cargada de Internet, entonces dicha información debe estar presente en la página de descarga. Además, la tasa de bits se muestra en el jugador durante la reproducción.

Archivos de video de bits

Se dijo anteriormente que tal bits de grabaciones de audio. Pero ¿qué es un video de bitrate? Dado que el video se juega como una secuencia de sonidos e imágenes, la definición de la tasa de bits será similar. La presencia del video detecta el archivo, pero en última instancia, la imagen para el procesador es el mismo ceros y unidades que sonidos. El principio de cifrado de información es el mismo para todos los tipos de archivos.

En los últimos años, se convirtió en un formato MP3 de moda y de moda terrible. En cualquier bandeja que vende CD de computadora, puede encontrar fácilmente más de una docena de discos de la "Antología completa del Grupo XXX", y debajo de la inscripción de este tipo modesto - MP3. La mayoría de las veces para la imagen completa en las portadas, hay una calidad de CD de la frase de moda, entonces usted se refiere a la calidad, como Audio-CD. Se trata de esto que no solo será la siguiente historia, sobre MP3, lo que suceden sobre la calidad del sonido en MP3.

Acerca de Formato MP3

Para empezar, entenderemos un poco con el área temática. ¿Qué representa esto a este MP3 en general?

MP3, más correcto Nombre MPEG-1 Capa 3 - Estándar para comprimir información de audio con pérdidas. Al mismo tiempo, el objetivo principal de crear la norma fue garantizar el sonido de origen "idéntico" máximo, así como minimizar el volumen de datos almacenados. Para esto, se creó un esquema de codificación original, en la primera etapa, el sonido digitalizado se divide en componentes de frecuencia que pasan a través de una serie de filtros.

La principal diferencia entre MP3 de las normas previamente existentes está en filtración. Los desarrolladores estándar crearon el llamado modelo psicoacústico: un modelo que tiene en cuenta algunas características de la audiencia humana, y sobre la base de este modelo a partir de la señal de audio, esas frecuencias se filtran, la ausencia de la que no se nota la audición. En la segunda etapa, la corriente resultante se codifica de acuerdo con el algoritmo Huffman con una tabla estática. El resultado y será un flujo de MP3.

Además, las etiquetas ID3 también se pueden agregar al archivo MP3 (Etiquetas que contienen el nombre de la canción, el intérprete, la información) y la información de diversas información.

Modos de compresión y bitt.

El ancho de la corriente: la velocidad de bits determina cuántos bits son necesarios para codificar 1 segundo de música. El estándar MP3 regula las corrientes de 8kbit / s a \u200b\u200b320kbit / s. La tasa de bits más típica es de 128kbit / s.

Sobre la base de la corriente, es fácil calcular cuánto ocupará un minuto de música, debe dividir la broca a las 8 (el número de bits en la bate) y multiplica por 60 (segundos por minuto): obtenemos el número de kilobytes. Para el flujo ya mencionado de 128kbit / s, será de 128/8 * 60 \u003d 960 kilobytes o cerca de megabytes por minuto de grabación.

Es bastante natural que cuanto mayor sea la tasa de bits, más se pueden guardar los detalles del sonido, suena más realista. En la selección de la tasa de bits al codificar, debe sacrificar cualquier calidad a favor del tamaño pequeño, o el tamaño a favor de la calidad.

El modo de compresión MP3 más fácil es un modo amargo constante (CBR, tormenta de bits constante). Anteriormente, a casi 100% de ensamblajes MP3, se usó una tasa de bits de 128kbit / s anteriormente, y la inscripción de calidad del CD estaba presente en los discos. Francamente, es solo una mentira unexting. En la práctica, para distinguir el sonido de dicho MP3 del sonido del CD de audio, es imposible no solo en la acústica más barata.

El nivel de calidad en una tasa de bits de 128kbit / s es aproximadamente el nivel de la grabadora de cinta media en la película fresca puede ser un poco mejor. También puede agregar que esta tasa de bits está muy extendida en las entradas disponibles en Internet.

Para simplificar el análisis de las tasas de bits más altas, escribiré su malla: 128kbit / s, 160kbit / s, 192kbit / s, 224kbit / s, 256kbit / s, 320kbit / s. Por lo tanto, los bits 160 y 192kbit / s ya son notablemente mejores en calidad que 128kbit / s, pero los archivos recibidos aún no son tan altos. Los "Artifacts" (FAWS) codec son casi imperceptibles (al menos en mi sistema).

Con un bitret de 224, nunca tuve que reunirme en mi forma pura, por lo que no puedo decir nada sobre su calidad, pero debe ser más alto que en el paso anterior de la escalera de la escalera de Bitrates. Además, no cumplí comentarios que cubran esta tasa de bits. Aparentemente, es de alguna manera debido al hecho de que la primera tasa de bits de 256kbit / s se reconoce en términos de la precisión de la transmisión de sonido, casi una falta completa de distorsión. En las instrucciones del codec codec, esta tasa de bits se llama incluso la calidad del estudio. Y el techo - 320kbit / s está diseñado para aquellos cuya calidad es más cara, o para propietarios de equipos de alta calidad de alta calidad o incluso de alta calidad.

Ahora recurrimos a un problema ligeramente más complejo: el modo de la tasa de bits variable (VBR, la división de bits de variable). Aquí, el concepto de bitrate es muy borroso, los códecs "para el usuario" generalmente usan el ajuste solo en calidad (como el catalizador de audio Xing). Otro (cojo) te permite preguntar opciones extra - Minimal y máximo bitt de bits, de nuevo calidad.

Al codificar el códec VBR, selecciona la propia tasa de bits deseada, según los parámetros que se le proporcionan, y durante el fragmento codificado, la tasa de bits puede cambiar. Se utiliza un modelo psicoacústico ya mencionado para evaluar la tasa de bits deseada. Sin embargo, el modelo (ya que no es perfecto, nada en nuestro mundo es perfecto) a veces muestra resultados incorrectos. Esto conduce a la inclusión de la evaluación, y, en consecuencia, la caída de la calidad del sonido en realidad audible.

En este caso, los desarrolladores del códec cojo se recomiendan en este caso para establecer el umbral mínimo de la tasa de bits para evitar resultados muy malos. Las variedades de VBR se refieren y codifican ABR (Tarta de bits promedio), promedió la tasa de bits. Recientemente, solo se escuchan respuestas positivas sobre este modo en las revisiones, especialmente ABR en 256kbit / s. Este modo funciona casi tan bien como VBR, con la excepción de que el códec mantiene el valor específico promedio. Actualmente, me conoce solo un códec que tiene el modo ABR, es cojo.

Códec de elección

Literalmente, recientemente, el usuario que quería obtener una calidad decente mp3 no era muy gran elección - Este es un códecs basado en ISO (basado en el CODEC CODEC CODEC publicado por la organización internacional de Standarts), o códec de IIS Fraunhofer (Instituto - Desarrollador MP3). Más códecs en productos XING.

Honish diferentes comentarios, y haciendo una pequeña investigación, llegué a la conclusión sobre la sucursal de la firma de la firma Xing, esto ... son mejores que no deben usar. Incluso en versiones relativamente nuevas, todos sus productos que pueden crear MP3 incorporados significa hacerlo lo más posible.

También hay una gran cantidad de artesanías "pioneras", codiciadas en un estanque en el códec Xing (casi todos contienen un archivo tompg.exe como parte). Durante mucho tiempo, su principal ventaja fue la velocidad (en detrimento de la calidad), pero hoy en día, el códec cojo muestra una velocidad comparable con mayor calidad. Además, los productos de Xing generalmente hablan cuesta dinero, mientras que LAME es libre por definición.

A continuación, iré a IIS Fraunhofer productos. Todos sus programas para la compresión MP3, disponibles de forma gratuita, están altamente cortados en las capacidades de sus versiones. productos comerciales. Luego, todos sus códecs no se desarrollaron durante mucho tiempo, y no contienen nuevas herramientas, soportando VBR / ABR, además, sin diferencia en la velocidad especial. La única aplicación justificada: compresión en bittles por debajo de 128 kbit / s, realizaron optimización especial para bits bajos (lugares, sin embargo, con una violación de la norma).

Los diferentes códecs basados \u200b\u200ben el código ISO sufren en principio con la misma desventaja: compresión de baja calidad en las bittillas por debajo de 192kbit / s. Además, la mayoría de ellos (incluyendo Bladeenc) son bastante lentos.

En mi opinión, lo más. opción óptima es el codec codec. Comenzó como un códec libre según el Código ISO, durante el proceso de desarrollo, ha crecido y ahora todas las revisiones al comparar MP3 con otros formatos se utilizan precisamente como una referencia para MP3. Hace poco más de un año, el proyecto LAME finalmente se libró del código ISO y ahora se puede considerar un códec completamente independiente.

El desarrollo del códec es bastante intensivo, se actualiza constantemente, correctamente errores. Además, es posible usar LAME no solo en Windows, sino también para varias opciones para sistemas UNIX, también funciona en DOS puros. Nuevamente, el código fuente es completamente gratuito, el código fuente está disponible (para que los amantes se lo coman), los archivos binarios ya compilados (.exe y.dll) están disponibles en varios sitios, optimizados para diferentes procesadores.

También hay una versión ligeramente recortada del codificador LAME - GOGO-NO-CODA, que muestra resultados fantásticos (dos veces más rápido que el LAME rápido).

Entonces, ¿qué es el bitrato y qué modo usar?

Teniendo en cuenta todo lo anterior, recomendaría poner un archivo MP3 con un flujo de 320 kbit / s, un modo CBR o 256kbit / s, ABR. El primero en mi opinión es algo preferible, porque Obtienes la calidad más accesible dentro del formato. Para grabaciones para "escuchar y borrar" un par de veces, es razonable usar ABR 192KBIT / S.

Y una más: es mejor no usar la tasa de bits para un almacenamiento largo por debajo de 192kbit / s, si solo se realizó el registro con el que se realizó MP3, no está constantemente a la mano (aunque recuerde que el registro analógico en la cinta magnética se está deteriorando con el tiempo).

Muy a menudo, el argumento de que escucho a favor de los bittles bajos y la "curva" de la compresión es "Tengo mala acústica, y todavía no puedo escuchar la diferencia". Todo puede cambiar, o tiene que usar su archivo en un equipo decente, y no será posible llegar al registro inicial. La respuesta no es absolutamente completa, puedo traer el caso de mi propia práctica.

En nuestra ciudad, Pavlovo, una vez fue un pequeño club, donde se tocó la música de la computadora (MP3 con una tasa de bits no superior a 160kbit / s). El club falleció además, y la computadora con archivos de música se trasladó a otra firma involucrada en eventos masivos. ¡Imagina que tomaron para torcer esta música en la parte inferior de la ciudad! Horror, cuando todos los defectos presentados por el embalaje en una tasa de bits tan pequeños se escucharon en una acústica más o menos decente. El sonido era peor que con su grabadora de cintas junto al mar con casetes semi-avanzados. Sería razonable evitar la repetición de los errores de otras personas, ¿verdad?

Equipo de prueba y software

Ordenador: Athlon TB 650MHZ, M / B Acorp 7kta 100MHz FSB, RAM de 128 MB PC-133, HDD Quantum 40GB 5400RPM, SoundBlaster 16 VIBRA, AC97 CODEC.
Sistema de audio: Amplificador de Radiotehnika U-7111, un par de altavoces Radiotehnika S-90B.
Por: Windows98 SE, Winamp 2.75, EAC 0.9PB11, LAME 3.90A, GOGO-NO-CODA 3.07A

La procesión triunfante del formato de grabación de sonido de la capa MPEG-1 3 (en la sorpresa de la designación MP3) se explica por el hecho de que se propuso una forma simple y efectiva de compresión. archivo de sonidopermitiéndote almacenar disco estándar CD-ROM hasta 12 horas de calidad de música aceptable.

Si decimos que se simplifica, la capa de algoritmo MPEG-1 3 se basa en el método de la llamada compresión "psicoacústica", cuando los sonidos del espectro no están excluidos, no se perciben audífonos de frecuencia y niveles de volumen. El espectro se "purifica" de tal manera, el espectro se divide en bloques separados (marcos) de la misma duración y se contrae de acuerdo con los requisitos especificados. Cuando se juega, la señal se forma a partir de la secuencia de marcos decodificados.

El grado de compresión depende de los parámetros de la flujo de audio, que deben obtenerse en la salida después de decodificar el archivo.

El parámetro principal que determina la calidad del sonido y el grado de compresión es el llamado (lo que es) bit - Ancho de banda, medido en bits por segundo.

Cuanto más este indicador, el mejor calidad Relación de sonido y menos compresión. Dado que casi todos los archivos MP3 se registran en modo estéreo con una frecuencia de codificación 44 kHz y una profundidad de 16 bits que definen los factores de sonido limpios se convierten en: una fuente de grabación de códecs usados \u200b\u200by una tasa de bits seleccionada.

La palabra códec está formada por una combinación de palabras de encoder + decodificador. Este software es un módulo que le permite codificar o decodificar archivos de sonido o video de acuerdo con su propio algoritmo.

La velocidad de flujo promedio de 256 kbps proporciona una relación de compresión de aproximadamente 6: 1, para otros valores, el grado de compresión varía proporcionalmente. Por lo tanto, con una corriente de 256 kbps, puede grabar música de seis CD de audio ordinario a un CD, y con una transmisión de 128 kbit / s, desde doce discos musicales convencionales.

Con respecto al valor de la tasa de bits, proporcionando una buena calidad de sonido correspondiente a la calidad de la reproducción de CD de audio, hay controversias interminables entre los amantes y los profesionales.

Algunos consideran suficientes Los Kbps de nivel 128, otros satisfacen solo el valor de flujo máximo - 320 Kbps. En toda probabilidad, el derecho y otros son la diferencia solo en lo que se escribe y en qué condiciones se reproduce.

La magnitud de la tasa de bits con la que se codificó el sonido digitalizado se indica generalmente en la cubierta del CD. Por ejemplo, colección completa Beatles Group Music se puede comprar en tres discos con una tasa de bits de 128 kbps o seis discos con una tasa de bits de 256 kbps.

Está claro que en el segundo caso, el costo de compra será el doble de caro, pero también la calidad es mejor.

Si la música suena en el automóvil de producción nacional, el hilo 192 Kbps proporcionará una calidad de sonido suficiente, aún no escuchará lo mejor debido a ruido extranjero. Para escuchar una computadora o jugador independiente ( Mpz-Peroter) acepta una corriente de 256 Kbps.

Pero si la señal cambia sin cambios al dispositivo externo y se muestra en columnas de alta calidad, el flujo máximo posible es deseable: 320 Kbps. Sobre la base de las consideraciones enumeradas, el Universal se puede considerar un flujo de 256 Kbps: con la grabación de buena calidad, proporcionará una reproducción adecuada en la mayoría de los casos.

Para transmitir música a través de Internet, un valor de transmisión suele ser de 128 kbps. Al mismo tiempo, la calidad del sonido "como si" deja mucho que desear.

Para grabar música popular con una tasa de bits superior a 192-256 kbit / s no tiene sentido: las canciones viven mucho tiempo, y los registros originales a menudo no se distinguen por una alta calidad. Al final, es posible pagar y bajo el sonido de la "grabadora".

Es otra clase de clásicos y trabajos raros con derechos de autor. Y bajo los clásicos, entendemos no solo Bach ni Mozart. Hoy en día, los Beatles, LED, Zeppelin y Vysotsky, y Tsoi, y muchos otros autores pueden ser considerados un clásico.

Si no presta atención a la tasa de bits especificada en el paquete al comprar un CD, puede ver el valor en la cadena del reproductor durante la reproducción de archivos.

Bitret (del inglés bitrate.) Los archivos de audio llaman al número de bits (unidades de información) utilizadas para almacenar una segunda grabación. La unidad más común de medición de la tasa de bits es el número de kilobit por segundo (KBPS, KBPS). El bitrate es una de las características clave de los archivos multimedia que afecta su calidad y tamaño. Con una tasa de bits grande, la música o el video se registraron, mejor será su calidad y el "volumen" será registros.

Por consiguiente, el cambio en el valor de la tasa de bits en una dirección u otro puede aumentar o disminuir el tamaño del archivo. Pero con la influencia en la calidad de las grabaciones, todo es más complicado. Mientras que una disminución en el valor de la tasa de bits naturalmente conduce a un deterioro de la calidad archivo fuente.La operación de calidad opuesta no afecta. Incluso si establece la velocidad de bits máxima, la calidad del sonido y el ciervo de video de su archivo seguirán siendo las mismas.

Como puede ver, no es posible aumentar la tasa de bits del registro de un significado especial: como resultado, recibirá un archivo más grande con la misma calidad. Pero para reducir la tasa de bits para reducir el tamaño de la grabación, es muy posible. ¿Quieres intentar cambiar el bitrate de tus canciones o películas? Descargue el convertidor de video MOVAVI: un programa conveniente con el que puede cambiar fácilmente las divulgaciones de bits de secuencia de audio y audio, ya sean archivos en formatos Populares MP3, WMA, AVI y MP4 o registros colocados en contenedores más exóticos. La instrucción está escrita en el ejemplo de trabajar con archivos de audio.

1. Instale el programa para cambiar la tasa de bits.

Descarga y ejecuta la distribución de la película Converter Movavi. Siga las instrucciones en pantalla para instalar el programa. Al final de la instalación, el convertidor se iniciará automáticamente.

2. Añadir archivos al programa.

presiona el botón Agregar archivos, Seleccione Añadir audio y poner en el programa archivos . El programa admite muchos formatos de medios, por lo que el formato de archivo de entrada puede ser casi cualquiera. Cambie el MP3, WMA, AAC Audio Files BitRate. Trate de reducir el video Bitrate: trabaje con grabación de video en AVI, MP4, DivX y varios formatos de video HD. ¡El programa le ayudará a hacer frente a una amplia gama de tareas de conversión de archivos multimedia!

3. Seleccione Formato de conservación

Antes de cambiar la velocidad de bits, seleccione el formato en el que se guardarán sus grabaciones de audio. Para hacer esto, haga clic en la pestaña Audio Y seleccione el formato apropiado de la lista. Al elegir a favor de este o en ese formato de audio, haga clic en su nombre y en la lista de la lista, seleccione uno de los valores de bits disponibles (opción no está disponible para formatos FLAC, OGG, WAV y M4A). Si no desea cambiar la velocidad de bits estándar especificada en el perfil seleccionado, puede omitir el siguiente paso y proceder a la conversión.

4. Establecer la velocidad de bits deseada

Presione el botón de marcha a la derecha del campo Formato de salida. En la lista Tipo de tasa de bits Escoger

Fiable I. programa efectivo Para grabar video de la pantalla en HD. Capture el video de programas, transmisiones en línea e incluso conversaciones en Skype y guarda clips en cualquier formato popular, así como para ver en dispositivos móviles.

Se toma la tasa de bits para usar cuando se mide la velocidad de transmisión efectiva del flujo de datos a través del canal, es decir, el tamaño mínimo del canal, que puede omitir esta corriente sin demora.

BitRate se expresa por bits por segundo (BIT / C, bps.), así como valores derivados con kilo- (kbit / s, kbps.), mega- (MBIT / S, MBPS.) etc. etc.

Tasa de transferencia de datos usando bits por segundo bloque (símbolo: "bit / s"), a menudo aplicado en combinación con consolas del sistema de medición de la unidad internacional (C), como "kilo" (1 kbps \u003d 1024 bt / s), " MEGA "(1 Mbps \u003d 1024 Kbps), GIGA (1 GB / C \u003d 1024 Mbps) o" TERA "(1 TBIT / C \u003d 1024 GB / s). La abreviatura no estándar "BPS" se usa a menudo para reemplazar el símbolo estándar "BIT / S", de modo que, por ejemplo, "1 Mbps" se usa para designar un millón de bits por segundo. Un byte por segundo (1 b / c) corresponde a 8 bits / s.

Características

En la transmisión de formatos de video y audio (por ejemplo, MPEG y MP3) utilizando la compresión con pérdida de calidad, el parámetro de bits expresa la relación de compresión de rosca y, por lo tanto, determina el tamaño del canal para el cual se comprime el flujo de datos. La mayoría de las veces, la tasa de bits de sonido y video se mide en kilobatos por segundo (ENG. kilobit por segundo, kbps), menos probable, en megabits por segundo (solo para video).

Hay tres modos de compresión de datos de transmisión:

CBR (Esp. Velocidad de bits constante.) - con un constante amargo;
Vbr (Esp. Bitrata variable.) - con la división de bits variable;
ABR. (Esp. Bitrance promedio.) - con la tasa de bits promediada.

Tasa de transferencia de información

Nivel físico de tasa de bits pura, tasa de transferencia de información, tasa de bits útil, frecuencia de carga útil, velocidad de datos netas, velocidad de transmisión de engranajes codificados, tasa de transferencia de datos eficiente o velocidad de alimentación de alambre (lenguaje no oficial) canal digital La comunicación es la capacidad sin tener en cuenta el protocolo de colocación física, para MULTIPLEX, un ejemplo con una separación temporal de los bits de marcos de canales (TDM), reservados con códigos de corrección directa de errores (FEC), ecualizador de caracteres de capacitación y otras codificaciones de canales. Los códigos resistentes al ruido son comunes, especialmente en los sistemas. comunicación inalámbrica , estándares de módem de banda ancha o moderno de alta velocidad. redes locales Basado en el cobre. El nivel físico de la tasa de bits pura es la velocidad de transferencia de datos, medida en el punto de control en la interfaz entre el nivel de canal y el nivel físico, y, por lo tanto, puede incluir una línea de transferencia de datos, así como una carga de nivel.

En módems I. sistemas inalámbricos, se usa a menudo la adaptación de las líneas de comunicación (adaptación automática de la velocidad de datos y la modulación y / o errores del esquema de codificación, la calidad de la señal). En este contexto, el término del pico de bits significa una tasa de bits pura del modo de transmisión más rápido y menos confiable que se usa, por ejemplo, [cuando la distancia es muy cortocircuito] Entre el remitente y transmisor. Algunos sistemas operativos y hardware de red Puede detectar la "velocidad de conexión" (lenguaje no oficial) de un acceso particular a un dispositivo de red o comunicación, lo que implica la velocidad de transferencia de datos limpia actual. Cabe señalar que la velocidad de la línea del término en algunos libros de texto se define como la tasa de transmisión bruta en los bits, y en otros, como una tasa de transferencia de datos limpia.

La relación entre la tasa de bits acumulada y la tasa de transferencia de datos netas depende de la tasa del código PI de acuerdo con lo siguiente.

Bitrato permanente

Bitrato permanente - una variante de la codificación de datos de transmisión, en la que el usuario especifica inicialmente la tasa de bits requerida, que no cambia en todo el archivo.

Su principal dignidad es la capacidad de predecir con bastante precisión el tamaño del archivo de destino.

Sin embargo, la opción con una constante amarga no es muy adecuada para las obras musicales, cuyo sonido se cambia dinámicamente con el tiempo, ya que no proporciona un tamaño / calidad de relación óptima.

Bitt de variable

DE bitt de variable El códec selecciona el valor de la tasa de bits en función de los parámetros (nivel de la calidad deseada), y durante el fragmento codificado, la tasa de bits puede variar. Al comprimir el sonido, la velocidad de bits deseada se determina sobre la base de un modelo psicoacústico. Este método Da la mejor calidad / tamaño del archivo de salida, pero su tamaño exacto es muy poco previsible. Dependiendo de la naturaleza del sonido (o imágenes, en el caso de la codificación de video), el tamaño del archivo recibido puede diferir varias veces.

Promediado bitrance

Promediado bitrance Es un híbrido de bittners permanentes y variables: el valor en KBIT / C está establecido por el usuario, y el programa lo varía en algunos límites. Sin embargo, en contraste con el VBR, el códec con precaución utiliza el máximo y los valores mínimos posibles, no en riesgo del valor promedio para el usuario especificado por el usuario. Este método permite que el más flexible establezca la velocidad de procesamiento (para audio, puede ser cualquier número entre 8 y 320 kbps, contra números, múltiples 16 en el método CBR) y con una precisión mucho mayor (en comparación con VBR) para predecir el tamaño del archivo de salida.

MP3

Compresión de audio de compresión MP3 con pérdida de datos. La calidad del sonido se mejora con el aumento en la tasa de bits:

32 kbit / s - como regla general, solo aceptable para el habla
96 Kbps: usualmente se usan para transmitir el sonido de la transmisión de habla o de baja calidad
128 o 160 Kbps - el nivel inicial de codificación de música
192 Kbps - Calidad de codificación de música aceptable
256 Kbps - alta calidad Codificación de música
320 Kbps - de la máxima calidad Codificación admitida por MP3 estándar

Otro audio

700 BPS: la tasa de bits más baja utilizada por el códec CODEC de Speur Source Speur Open; La voz es apenas reconocida, BitRate 1.2 Kbit / s da mucho mejor sonido
800 bits / c - El nivel mínimo requerido para el reconocimiento de voz, utilizado en códecs de habla especializados FS-1015
2.15 kbit / s - tasa de bits mínima CODEC SPEEX con código abierto
6 Kbps - Minimal BitRate Opus Opus Codec con código abierto
8 Kbps - Calidad de sonido de teléfono usando códecs de voz

audio de alta calidad

Aquí veremos cómo elegir la tasa de bits correcta para su transmisión de Internet. Y así, Bitrate es la calidad del video. Lo que es más alto, cuanto mayor sea la calidad. Si haces un flujo de calidad con una imagen magnífica, entonces solo necesitas levantar la tasa de bits y todo? No importa cómo. Stream Stream está en línea, respectivamente, toda esta tasa de bits alta toma el canal de Internet y será imposible verlo. Por lo tanto, debe tener en cuenta su Internet e Internet de su audiencia. No todos están estirados fibra. Entonces, por encima de 2 Mbps, no se recomienda poner a Bitraine.

La segunda cosa para prestar atención es, la llamada relación de bit / píxeles. Esta fórmula se ve simple:

bit / (píxeles * marcos)

¿Qué significa esta fórmula? Supongamos que codificamos la corriente con una resolución de 100px x 100px, 25 fps (cuadros por segundo) y colocamos un tormento de bits de 250 kbps (kilóbito por segundo). Entonces, por un segundo, un tamaño de video de 10,000 píxeles (cien i Multiplice cien) destaca 25 marcos y 250 kilocitos. Resulta 10 kilóbitos (10,000 bits) para cada marco (250/25). Dividimos los bits asignados al marco, en el tamaño de los píxeles, obtenemos la relación del bit / píxel, cuánta información se asigna para la "codificación" de un píxel.

Cuanto más se destaca la información, cuanto mayor sea la calidad.

En nuestro ejemplo, la actitud de bit / pixel es: (10,000 bits por cuadro) / (10,000 píxeles) \u003d 1. Será un poco demasiado. Completo gran calidad Se puede obtener con la proporción. 0,1 -0,15 . Por nuestro ejemplo, habría suficiente bittate ~ 32-35 Kbps.

Calcule las relaciones de bits / píxeles estimadas para los permisos más comunes:

720p: 1280 × 720 puntos:

Bitrate 1500kbps - 1500000 / ((1280 * 720) * 25) \u003d 1500000/23040000 \u003d 0.065
BitRate 2500Kbps - 2500000 / ((1280 * 720) * 25) \u003d 2500000/23040000 \u003d 0.109
Bitrate 3500kbps - 3500000 / ((1280 * 720) * 25) \u003d 3500000/23040000 \u003d 0.152

1080p: 1920 × 1080 puntos:

Bitrate 1500kbps - 1500000 / ((1920 * 1080) * 25) \u003d 1500000/51840000 \u003d 0.029 ( como puede ver, la calidad con la misma tasa de bits será peor en algún lugar 2.5 veces, por lo que para 1080R necesita una tasa de bits más grande que para 720p)
BitRate 5000Kbps - 5000000 / ((1920 * 1080) * 25) \u003d 5000000/23040000 \u003d 0.096
Bitrate 7500Kbps - 7500000 / ((1920 * 1080) * 25) \u003d 7500000/23040000 \u003d 0,145
BitRate 10000Kbps - 10000000 / ((1920 * 1080) * 25) \u003d 10000000/23040000 \u003d 0.192

¿Qué conclusiones se pueden hacer? El primero, es lo principal, no puede proporcionar permiso a la tasa de bits necesaria, no intente odiar. ¿Quieres odiar de todos modos? Reducir o permiso o FPS. Bit de escritura / píxel al menos a 0.075-0.1, y mejor.

Calidad

Resolución

Bitrate de vídeokbps.

Bitrate de audiokbps.

Marcos FPS / SEC

Códec de vídeo

h.264.perfil

Códec de audio

Canal de audio

240 pag. (426 x 240)

400 (300-700)

AAC o mp3

270p. (480x270)

400 (300-700)

AAC o mp3

360p (640x360)

750 (400-1000)

AAC o mp3

480p. (854x480)

1000 (500-2000)

AAC o mp3

540p (960x540)

1000 (800 - 2000)

AAC o mp3

Mono o
Estéreo.

720p (1280x720)

2500 (1560-4000)

AAC o mp3

Mono o
Estéreo.

720p (1280x720)

3800 (2500-6000)

AAC o mp3

Mono o
Estéreo.

1080p (1920x1080)

4500 (3000-6000)

AAC o mp3

Mono o
Estéreo.

1080p (1920x1080)

6800 (4500-9000)

AAC o mp3

Mono o
Estéreo.

1440p) (2560x1440)

9000 (6000-13000)

AAC o mp3

Mono o
Estéreo.

1440p (2560x1440)

13000 (9000-18000)

AAC o mp3

Mono o
Estéreo.

4k / 2160R. (3840x2106)

23000 (13000-34000)

AAC o mp3

Mono o
Estéreo.

4k / 2160R. (3840x2106)

35000 (20000-51000)

AAC o mp3

Mono o
Estéreo.

Inicio / Instrucciones / Seleccionamos una tasa de bits para Streaming

Nota: Para una mejor comprensión del siguiente texto, le recomiendo que se familiarice con los fundamentos del sonido digital.

S: Cuanto más bitt., Cuanto mejor sea la pista.

R: Este no es siempre el caso. Para empezar, te recuerdo que un poco de t. (Bitrate, no a bitraid). De hecho, esta es la tasa de flujo de datos en kilobits por un segundo al jugar. Es decir, si tomamos el tamaño de la pista en kilobits y dividimos su duración en segundos, obtenemos su tasa de bits - t. N. Normalmente, no es demasiado diferente a la tasa de bits de AUDIO BIT (la razón de la diferencia es la presencia de metadatos: etiquetas, imágenes "cosidas", etc.).

Ahora tome un ejemplo: la tasa de bits de un audio de PCM sin comprimir grabado en el CD de audio habitual se calcula de la siguiente manera: 2 (canal) * 16 (bit en cada muestra) * 44100 (muestras por segundo) \u003d 1411200 (bit / s) \u003d 1411.2 Kbps. Ahora, dejaremos la pista cualquier códec PIERNSINS ("Sin pérdida": "Encuadernación", es decir, tal que no conduzca a la pérdida de ningún DATOS), por ejemplo, el códec FLAC. Como resultado, obtendremos una tasa de bits por debajo del original, pero la calidad permanecerá sin cambios, aquí está la primera refutación.

Todavía vale la pena agregar algo. La tasa de bits en la salida con la compresión sin pérdida puede resultar los más diferentes (pero, como regla general, es menor que la de audio sin comprimir), depende de la complejidad de la señal compresible, o más bien de la redundancia de los datos. Por lo tanto, las señales más simples se comprimen mejor (es decir, tenemos un tamaño de archivo más pequeño con la misma duración \u003d\u003e Pequeña tasa de bits), y más complejos, peor. Es por eso música clásica Sin pérdida tiene una tasa de bits más pequeña que, digamos, Rock. Pero es necesario enfatizar que la tasa de bits aquí no es de ninguna manera un indicador de la calidad del material de sonido.

Ahora hablemos de compresión con pérdida (con pérdidas). En primer lugar, es necesario entender que hay muchos codificadores y formatos diferentes, e incluso dentro de un formato, la calidad de la codificación en los diferentes codificadores puede diferir (por ejemplo, QuickTime AAC codifica mucho mejor que la FAAC obsoleta), no a Mencione la superioridad de los formatos modernos (Ogg Vorbis, AAC, Opus) sobre MP3. En pocas palabras, de las dos pistas idénticas codificadas por diferentes codificadores con una tasa de bits, algún tipo de sonido mejor y algún tipo de peor.

Además, hay tal cosa como apoplevertido. Es decir, puede realizar una pista en formato MP3 con un amargo de 96 Kbps y convertirlo a MP3 320 Kbps. La calidad no solo mejora (después de todo, los datos perdidos en la codificación anterior de 96 kbit / con los datos ya no están regresando), incluso se deteriorará. Vale la pena indicar que en cada etapa de codificación con pérdida (con cualquier tipo de bit y cualquier codificador), se realiza una cierta parte de la distorsión en el audio.

Y aún más. Hay otro matiz. Si, digamos, la tasa de bits de la transmisión de audio es de 320 Kbps, esto no significa que los 320 Kbps fueron a la codificación de ese segundo. Esto es característico de la codificación con un constante amargo y para aquellos casos en que una persona, con la esperanza de obtener el máximo, la calidad está forzando demasiado la tasa de bits permanente (como ejemplo: configurando 512 Kbps CBR para Nero AAC). Como se sabe, el número de bits destacados en este o ese marco está regulado por un modelo psicoacústico. Pero en el caso, cuando la cantidad asignada es mucho más baja que la tasa de bits establecida, no guarda ni siquiera un bit de depósito (lea sobre los términos en el artículo "¿Qué es CBR, ABR, VBR?") - Como resultado, nosotros Obtenga inútiles "bits cero" que simplemente "terminen" el tamaño del marco hasta el deseado (es decir, aumente el tamaño del flujo al especificado). Por cierto, es fácil verificar: apriete el archivo resultante con un archivador (mejor que 7z) y observa el grado de compresión, cuanto más sean los bits más cero (ya que conducen a la redundancia), mayor será el maravilloso. lugar.

S: DVD-AUDIO suena mejor que el CD de audio (24 bits vs 16, 96 kHz vs 44.1, etc.)

R: En principio, es bastante lógico, e incluso en parte la verdad, pero solo las personas generalmente se ven solo en los números y, muy, rara vez piensan en el efecto de uno u otro parámetro.

Entonces, considera comenzar el bit. Este parámetro responde a cualquier cosa que no sea el rango dinámico, es decir. La diferencia entre los sonidos más tranquilos y ruidosos (en DB). En audio digital, el nivel máximo es 0 DBFS, y el mínimo se limita al nivel de ruido, es decir, en realidad, el rango dinámico del módulo es igual al nivel de ruido. Para un rango dinámico de audio de 16 bits calculado como 20 * log (2 ^ 16)? 96.33 (DB). En este caso, el rango dinámico de la orquesta sinfónica es de hasta 75 dB (en su mayoría aproximadamente 40-50 dB).

Y ahora imagina condiciones reales. El nivel de ruido en la habitación es de aproximadamente 40 dB (no olvides que DB: el valor es relativo. En este caso, el umbral de audición se acepta en 0 dB), el volumen máximo de música alcanza 110 dB (para que haya Sin incomodidad): obtenemos una diferencia de 70 dB. Por lo tanto, resulta que el rango dinámico de más de 70 dB en este caso es simplemente inútil. Ese es el rango de arriba o sonidos fuertes alcanzará un umbral doloroso, o sonidos silenciosos Será absorbido por los ruidos circundantes. Lograr el nivel de ruido ambiental Menos de 15 dB es muy difícil (ya que este nivel es el volumen de la respiración humana y otro ruido debido al factor humano), como resultado, el rango de 95 dB es completamente suficiente para escuchar música.

Ahora sobre la frecuencia de muestreo (frecuencia de muestra, frecuencia de muestreo). Este parámetro es responsable de la frecuencia de cuantización en el tiempo y afecta directamente la frecuencia máxima de la señal, que puede describirse por la presentación de audio. En el teorema de Kotelnikov, es igual a la mitad de la frecuencia de muestreo. Es decir, para la frecuencia habitual de las costuras en 44100 Hz, la frecuencia máxima de los componentes de la señal es de 22050 Hz. Frecuencia máxima. Que es percibido por el oído humano, justo por encima de 20,000 Hz (y al nacer; a medida que el umbral está creciendo hasta 16,000 Hz).

Lea las descargas en formato 24/192 - Por qué no tienen sentido.

S: Los diferentes reproductores de software sonan de manera diferente (e. G. foobar2000 es mejor que Winamp, etc.)

R: Para entender por qué este no es el caso, es necesario averiguar qué es el jugador del programa. En esencia, este es un decodificador, manejadores (opcional), complemento de salida (una de las interfaces: Asio, DirectSound, Wasapi., Etc.), y por supuesto la GUI (usuario). T. K. El decodificador en el 99.9% de los casos funciona de acuerdo con un algoritmo estándar, y el complemento de salida es solo parte del programa que transmite el flujo de una tarjeta de sonido a través de una de las interfaces, entonces el motivo de las diferencias solo puede ser manipuladores. Pero el hecho es que los manejadores generalmente se apagan de forma predeterminada (o deben estar apagados, ya que la cosa principal para buen jugador - Ser capaz de pasar el sonido en el formulario "prístino"). Como resultado, el tema de la comparación solo puede ser capacidades Procesamiento y salida en los que, por cierto, no hay necesidad de una muy a menudo. Pero incluso si esa necesidad es, entonces esta es una comparación de los manipuladores, y no los jugadores.

Aquí también me gustaría mencionar mi y, quizás, molestos a los usuarios que admiran el cambio "enorme" en el sonido después de la configuración descrita, en el 95% de los casos, es la autoimpresión (excepto aquellos casos en que se convirtió en algunos casos. Apagado durante su configuración "Mejora" u otro controlador, estropaje de la imagen completa). Qué triste, ganando de todos estos trucos con Replaygain, resamplers y LIMITES - Mezera. Conclusión: quiero realmente sonido de alta calidad - comprarte HI-FI ACUSTICA y tarjeta de audio profesional.

S: Versiones diferentes Los conductores suenan de manera diferente

R: Basado en esta declaración se encuentra una ignorancia banal de los principios de la tarjeta de sonido. El conductor es software necesario para interactuar de manera efectiva el dispositivo con sistema operativo así como por lo general proporcionando interfaz gráfica Usuario para administrar el dispositivo, sus parámetros, etc. El controlador de la tarjeta de sonido proporciona el reconocimiento de una tarjeta de sonido como una tarjeta de sonido, informa OS en los formatos compatibles, proporciona la transmisión de PCM sin comprimir (generalmente) el hilo en la tarjeta, y También da acceso a la configuración. Además, en el caso del procesamiento de software (CPU), el controlador puede contener varios DSP (manejadores). Por lo tanto, primero, cuando los efectos están deshabilitados y procesan, si el controlador no proporciona una transmisión precisa de PCM a la tarjeta, se considera un error burdo, un error crítico. Y sucede casi nunca. Por otro lado, las diferencias entre los controladores pueden actualizar los algoritmos de procesamiento (rempliers, efectos), aunque también sucede muy rara vez. Además, los efectos y cualquier procesamiento por parte del conductor aún deben apagar / bypass para lograr la más alta calidad.

Por lo tanto, las actualizaciones del conductor se centran principalmente en mejorar la estabilidad del trabajo y la eliminación de los errores asociados con el procesamiento. Ninguno, ni otro en nuestro caso en la calidad de la reproducción no afecta, porque en 999 casos de 1000, el conductor no afecta el sonido.

S: El sonido de CD de audio con licencia mejor que sus copias

R: Si no hay errores (no relacionados) Lea / Grabaciones durante la copia unidad óptica El dispositivo en el que se reproducirá la copia del disco, no hay problemas con su lectura, entonces una declaración de este tipo es erróneamente y se refuta erróneamente.

S: El modo de codificación estéreo da mejor calidad que el estéreo conjunto

R: Esta ilusión se refiere principalmente a los MP3 LAME, ya que todos los codificadores modernos (AAC, Vorbis, Musepack) utilizan solomodo estéreo conjunto (y esto ya dice algo)

Para empezar, vale la pena mencionar que el modo estéreo conjunto se usa con éxito con compresión sin pérdida. Su esencia radica en el hecho de que la señal antes de la codificación se niega a la suma del canal derecho e izquierdo (MID) y en su diferencia (lado), y luego se produce la misma codificación de estas señales. El límite (para la misma información en el canal derecho e izquierdo) obtiene ahorros de datos duales. Y, ya que en la mayoría de la información musical en los canales derecha e izquierda es bastante similar, este método es muy efectivo y le permite aumentar significativamente el grado de compresión.

En el principio con pérdida de lo mismo. Pero aquí, en el modo de tasa de bits permanente, la calidad de los fragmentos con información similar en dos canales aumentará (en el límite a doble), y para el modo VBR en los lugares, simplemente disminuirá la tasa de bits (no olvide que la tarea principal Del modo VBR, mantiene estatalmente la calidad de codificación especificada, utilizando la velocidad de bits mínima posible). Dado que durante la prioridad de codificación con pérdida (cuando la distribución de bits) se le da por la cantidad de canales para evitar el deterioro del estereopanorama, se utiliza para cambiar dinámicamente entre los modos estéreo de la junta (medio / lado) y los habituales (izquierda / derecha) Estéreo sobre la base de marcos. Por cierto, la causa de este error fue la imperfección del algoritmo de conmutación en versiones anteriores de LAME, así como la presencia de un modo de articulación forzada, en el que no existe una detección automática. EN versiones recientes El modo de articulación LAME está habilitado de forma predeterminada y no se recomienda cambiarlo.

S: El espectro más amplio, mejor será el registro (sobre espectrogramas, el rango de AUCDTTECT y la frecuencia)

R: Hoy en día, en los foros, desafortunadamente, la calidad de la pista en la pista del espectrograma es muy común. Obviamente, debido a la simplicidad de este método. Pero, como lo demuestra la práctica, en realidad, todo es mucho más complicado.

Y el punto aquí es qué. El espectrograma demuestra visualmente la distribución de la potencia de la señal de frecuencia, pero no puede dar una vista completa del sonido de grabación, la presencia de distorsión y artefactos de compresión. Es decir, de hecho, todo lo que puede ser determinado por el espectrograma es rango de frecuencia (y parcialmente - densidad del espectro en la región de RF). Es decir, en el mejor de los casos, al analizar el espectrograma que puede revelar el aparte. Comparando los mismos espectrogramas de pistas obtenidas al codificar por varios codificadores, con el original, el absurdo completo. Sí, puede identificar las diferencias en el espectro, pero para determinar si (y en qué medida) serán percibidos por el oído humano, casi imposible. No debemos olvidar que la tarea de la codificación de pérdidas es garantizar que el resultado indistinguible oreja humana Desde el original (de ninguna manera con el ojo).

Lo mismo se aplica a la evaluación de la calidad de la codificación al analizar las pistas en el AUCDTECT, el Administrador de tareas AUCDTECT, el analizador TAU, FOOCDTECT es solo un shell para uno de los especies. programa de consola AUCDTECT). El algoritmo AUCDTECT también analiza realmente el rango de frecuencia y solo le permite determinar (con una parte determinada de la probabilidad), si se aplicó la compresión MPEG en cualquiera de las etapas de codificación. El algoritmo está afilado por MP3, por lo tanto, es fácil "engañar" utilizando los códecs Vorbis, AAC y Musepack, de modo que incluso si el programa escribe "100% CDDA", esto no significa que el audio codificado esté 100% correspondiente a la fuente.

Y, volviendo directamente a los espectros. También es popular el deseo de algunos "entusiastas" por cualquier cosa para deshabilitar el filtro de PAESS (LC) en el codificador cojo. Aquí, en la cara, malinterpretando los principios de codificación y psicoacústica. Primero, el codificador reduce las frecuencias altas con un solo objetivo: para guardar datos y usarlas para codificar el rango de frecuencia más audible. El rango de frecuencia extendido puede afectar fatalmente la calidad general del sonido y conducir a artefactos de codificación audible. Además, la desconexión del corte en 20 kHz es generalmente completamente innecesaria, ya que la frecuencia por encima de la persona simplemente no escucha.

S: Hay un cierto ajuste preestablecido del ecualizador "mágico" capaz de mejorar significativamente el sonido.

R: Esto no es completamente así, primero, porque cada configuración individual (auriculares, acústica, tarjeta de sonido) Tiene sus propios parámetros (en particular, su respuesta de frecuencia de amplitud). Y, por lo tanto, cada configuración debe ser su enfoque único. Simplemente ponga, existe un preajuste de tal igualizador, pero difiere para diferentes configuraciones. Su esencia es ajustar la respuesta de la frecuencia, a saber, en la "alineación" de fallas y estallidos no deseados.

Además, entre las personas distantes del trabajo directo con sonido, la configuración de un ecualizador gráfico "charla" es muy popular, lo que realmente representa el aumento en el nivel del LF y los componentes de RF, pero al mismo tiempo conduce a la muficia. de voces y herramientas, el espectro del sonido que se encuentra en el área de frecuencia media.

S: Antes de convertir la música a otro formato, debería "exprimir" en WAV

R: Inmediatamente tenga en cuenta que en WAV implica datos PCM (modulación de código de pulso) en el contenedor de onda (archivo con la extensión * .wav). Estos datos no son más que la secuencia de bits (ceros y unidades) por grupos de 16, 24 o 32 (dependiendo del bit), cada uno de los cuales es el código de amplitud binaria de las muestras correspondientes (por ejemplo, para 16 bits en decimal Representación Estos son valores de -32768 a +32768).

Entonces, el hecho es que cualquier manejador de sonido, ya sea un filtro o codificador, generalmente funciona solo Con estos valores, eso es solo Con datos sin comprimir. Esto significa que para convertir el sonido, digamos, de FLAC en APE, solo necesario Primer decodificar FLAC en PCM, y luego codificar PCM en APE. Así es como reembolsar archivos de ZIP a RAR, primero debe desempaquetar la cremallera.

Sin embargo, si utiliza un convertidor o simplemente codificador de consola avanzada, la transformación intermedia en PCM se presenta sobre la marcha, a veces incluso sin grabar en temporal Archivo wav. Es esto e introduce a las personas en error, parece que los formatos se convierten directamente a uno a otro, pero de hecho, en dicho programa, hay un decodificador de un formato de entrada que realiza una conversión carecra a PCM.

Por lo tanto, la transformación manual en WAV no le dará absolutamente nada más que el exceso de tiempo.

Deposite los mitos populares sobre el sonido digital.

2017-10-01115: 27.

Software de Audiophile

Nota: Para una mejor comprensión del siguiente texto, le recomiendo que se familiarice con los fundamentos del sonido digital.

Además, muchos de los puntos afectados a continuación están iluminados en mi publicación "una vez más sobre la verdad triste: ¿de dónde viene el buen sonido?" .

Cuanto más bitt., Cuanto mejor sea la pista.

Este no es siempre el caso. Para empezar, te recuerdo que un poco de t. (Bitrate, no a bitraid). De hecho, esta es la tasa de flujo de datos en kilobits por un segundo al jugar. Es decir, si tomamos el tamaño de la pista en kilobits y dividimos su duración en segundos, obtenemos su tasa de bits - t. N. Normalmente, no es demasiado diferente a la tasa de bits de AUDIO BIT (la razón de la diferencia es la presencia de metadatos: etiquetas, imágenes "cosidas", etc.).

Ahora tome un ejemplo: la velocidad de bits del audio PCM sin comprimir grabado en el CD de audio habitual se calcula de la siguiente manera: 2 (canal) × 16 (bit en cada muestra) × 44100 (muestras por segundo) \u003d 1411200 (bit / s) \u003d 1411.2 Kbps. Ahora, dejaremos la pista cualquier códec por pérdida de pérdida ("sin pérdida": "vinculación", es decir, tal que no conduzca a una pérdida de ninguna información), como el codec de FLAC. Como resultado, obtendremos una tasa de bits por debajo del original, pero la calidad permanecerá sin cambios, aquí está la primera refutación.

Aquí vale la pena agregar algo más. La tasa de bits en la salida con la compresión sin pérdida puede resultar los más diferentes (pero, como regla general, es menor que la de audio sin comprimir), depende de la complejidad de la señal compresible, o más bien de la redundancia de los datos. Por lo tanto, las señales más simples se comprimen mejor (es decir, tenemos un tamaño de archivo más pequeño con la misma duración \u003d\u003e Pequeña tasa de bits), y más complejos, peor. Es por eso que la música clásica en la pérdida de pérdida tiene una tasa de bits más pequeña que, por ejemplo, roca. Pero es necesario enfatizar que la tasa de bits aquí no es de ninguna manera un indicador de la calidad del material de sonido.

Ahora hablemos de compresión con pérdida (con pérdidas). En primer lugar, es necesario comprender que hay muchos codificadores y formatos diferentes, e incluso dentro de un formato, la calidad de la codificación en los diferentes codificadores puede diferir (por ejemplo, QuickTime AAC codifica mucho mejor que la FAAC obsoleta), no mencionar la superioridad de los formatos modernos (Ogg Vorbis, AAC, Opus) sobre MP3. En pocas palabras, de las dos pistas idénticas codificadas por diferentes codificadores con una tasa de bits, algún tipo de sonido mejor y algún tipo de peor.

Además, hay tal cosa como apoplevertido. Es decir, puede realizar una pista en formato MP3 con una tasa de bits de 96 Kbps y convertirla a MP3 320 Kbps. La calidad no solo mejora (después de todo, los datos perdidos en la codificación anterior de 96 kbit / con los datos ya no están regresando), incluso se deteriorará. Vale la pena indicar que en cada etapa de codificación con pérdida (con cualquier tipo de bit y cualquier codificador), se realiza una cierta parte de la distorsión en el audio.

Y aún más. Hay otro matiz. Si, digamos, la tasa de bits de la secuencia de audio es de 320 Kbps, esto no significa que los 320 Kbps se hicieron a la codificación del segundo. Esto es característico de la codificación con un constante amargo y para aquellos casos en que una persona, con la esperanza de obtener la máxima calidad, obliga demasiado a la tasa de bits permanente (como ejemplo, configurando 512 Kbps CBR para Nero AAC). Como se sabe, el número de bits destacados en este o ese marco está regulado por un modelo psicoacústico. Pero en el caso, cuando la cantidad asignada es mucho más baja que la tasa de bits establecida, no guarda ni siquiera un bit de depósito (lea sobre los términos en el artículo "¿Qué es CBR, ABR, VBR?") - Como resultado, nosotros Obtenga inútiles "bits cero" que simplemente "terminen" el tamaño del marco hasta el deseado (es decir, aumente el tamaño del flujo al especificado). Por cierto, es fácil verificar: apriete el archivo resultante con un archivador (mejor que 7z) y observa el grado de compresión, cuanto más sean los bits más cero (ya que conducen a la redundancia), mayor será el maravilloso. lugar.

Los códecs perosos (MP3 y otros) pueden enviar con música electrónica moderna, pero no pueden codificar cualitativamente la música clásica (académica), en vivo, música de herramientas

La "ironía del destino" aquí es que, de hecho, todo es exactamente lo contrario. Como se sabe, la música académica en la gran mayoría de los casos debe ser principios melódicos y armónicos, así como la composición de la herramienta. Desde un punto de vista matemático, esto provoca una composición armónica relativamente simple de la música. Por lo tanto, el predominio de las consonanzas produce un número menor de armónicos laterales: por ejemplo, para la quinta (el intervalo en el que las frecuencias básicas de dos sonidos difieren una y media). El total para dos sonidos será cada segundo armónico, para cuartos de galón. , donde las frecuencias difieren en un tercio, cada tercio, y etc. Además, la presencia de relaciones de frecuencia fija debido al uso del sistema templado uniformemente también simplifica la composición espectral de la música clásica. La composición instrumental viva de los clásicos causa ruido en ella, característica de la música electrónica, la distorsión, los saltos de amplitud aguda, así como la ausencia de un exceso de componentes de alta frecuencia.

Los factores enumerados anteriormente conducen al hecho de que la música clásica es mucho más fácil de comprimir, en primer lugar, puramente matemáticamente. Si recuerda, la compresión matemática está funcionando a expensas de la redundancia (describiendo fragmentos similares de información utilizando un número menor de bits), así como a expensas de la predicción (T.n. predictores Se predice el comportamiento de la señal, y luego solo la desviación de la señal real del predicho se codifica, cuanto más precisamente coincidieron, se necesitan menos bits para la codificación). En este caso, una composición espectral y armonía relativamente simple causan una alta redundancia, cuya eliminación proporciona un grado significativo de compresión, y un pequeño número de ráfagas y componentes de ruido (que son señales aleatorias e impredecibles) determinan la buena previsibilidad matemática de la Parte abrumadora de la información. Y ya no estoy hablando de un volumen promedio relativamente pequeño de pistas clásicas y aproximadamente los intervalos de silencio con frecuencia, para la codificación de la que se requiere información prácticamente. Como resultado, podemos cortar sin pérdida, por ejemplo, una música única instrumental a los bittles inferiores a menos de 320 kbps (los codificadores TAK y OFR son completamente capaces de tales).

Entonces, primero, el hecho es que la compresión matemática subyacente a la codificación sin pérdidas es también uno de los pasos de codificación de pérdida (lea que está claro acerca de la codificación de MP3). Y, en segundo lugar, dado que la transformación de Fourier se usa en pérdida (descomposición de la señal de armónicos), entonces la simplicidad de la composición espectral incluso facilita doblemente el código de operación. Como resultado, comparando las muestras originales y codificadas de la música clásica en una masa ciega, nos sorprende que no podamos encontrar ninguna diferencia, incluso con una tasa de bits relativamente baja. Y lo gracioso es que cuando comenzamos a reducir completamente la tasa de bits de codificación, lo primero que detecta las diferencias: el ruido de fondo en el registro.

En cuanto a la música electrónica, con los codificadores de TI representaron muy difícil: los componentes de ruido tienen una redundancia mínima, y \u200b\u200bjunto con saltos afilados (algún tipo de sierras) son señales extremadamente impredecibles (para que los codificadores se "afilan" bajo sonidos naturales, lo que se lleva perfectamente ), la transformación directa y inversa de Fourier con la basura de armónicos individuales, un modelo psicoacústico inevitablemente da los efectos de pre-y post-eco, la audibilidad de la cual el codificador no siempre es fácil de evaluar ... Añadir a este nivel alto Componentes de RF - y obtener un gran número de Muestras asesinas, con las que incluso los codificadores más avanzados no hacen frente a los codificadores más avanzados, curiosamente, precisamente entre la música electrónica.

También sorprendentes de las opiniones de "audición experimentada" y músicos que, con una completa falta de comprensión de los principios de la codificación con pérdidas, comienzan a argumentar que escuchan cómo las herramientas en la música después de la codificación comienzan a falsificar, las frecuencias son flotantes, etc. puede tener Ha sido justo para los jugadores de casete de dopaje con detonación, pero en audio digital, todo es preciso: el componente de frecuencia permanece o descartado, para cambiar la tonalidad aquí, simplemente no hay necesidad. Además: la presencia de una persona auditiva musical no significa la presencia de una audiencia de buena frecuencia (por ejemplo, la capacidad de percibir frecuencias\u003e 16 kHz, que no está de acuerdo con esto) y no le facilita la búsqueda de Los artefactos de codificación de pérdida, ya que la distorsión se caracteriza por muy específicos y requieren la experiencia de la comparación ciega con precisión audio, necesite saber qué y dónde mirar.

DVD-AUDIO suena mejor que el CD de audio (24 bits contra 16, 96 kHz contra 44.1, etc.)

Desafortunadamente, las personas generalmente se ven solo en números y rara vez piensan en el efecto de uno u otro parámetro a la calidad objetiva.

Considera comenzar el bit. Este parámetro no es responsable de nada que no sea el rango dinámico, es decir, por la diferencia entre los sonidos más silenciosos y ruidosos (en DB). En el audio digital, el nivel máximo es 0 DBFS (FS - escala completa), y el mínimo se limita al nivel de ruido, es decir, en realidad, el rango dinámico del módulo es igual al nivel de ruido. Para un audio de 16 bits, el rango dinámico se calcula como 20 × Log 10 2 16, que es 96.33 WB. En este caso, el rango dinámico de la orquesta sinfónica es de hasta 75 dB (en su mayoría aproximadamente 40-50 dB).

Y ahora imagina condiciones reales. El nivel de ruido en la habitación es de aproximadamente 40 dB (no olvides que DB: el valor es relativo. En este caso, el umbral de audición se acepta en 0 dB), el volumen máximo de música alcanza 110 dB (para que haya Sin incomodidad): obtenemos una diferencia de 70 dB. Por lo tanto, resulta que el rango dinámico de más de 70 dB en este caso es simplemente inútil. Es decir, cuando el rango superior o los sonidos fuertes alcanzarán un umbral doloroso, o los ruidos circulares serán absorbidos por los ruidos circundantes. Lograr el nivel de ruido circundante Menos de 15 dB es muy difícil (ya que hay un volumen de respiración humana y otro ruido debido, fisiología humana), como resultado, el rango de 95 dB para escuchar música es bastante suficiente.

Lo mejor de todo, este tema se describe en el artículo de descarga en formato 24/192: por qué no tienen sentido.

Los diferentes reproductores de software sonan de manera diferente (e. G. foobar2000 es mejor que Winamp, etc.)

Para entender por qué este no es el caso, debemos averiguar qué es el jugador del programa. En esencia, este es un decodificador, manipuladores (opcional), complemento de salida (en una de las interfaces: Asio, DirectSound, Wasapi., Etc.), y, por supuesto, la GUI (interfaz gráfica del usuario). T. K. El decodificador en el 99.9% de los casos funciona de acuerdo con un algoritmo estándar, y el complemento de salida es solo parte del programa que transmite el flujo de una tarjeta de sonido a través de una de las interfaces, entonces el motivo de las diferencias solo puede ser manipuladores. Pero el hecho es que los manejadores generalmente se apagan de forma predeterminada (o deben estar apagados, ya que la cosa principal para buen jugador - Ser capaz de pasar el sonido en el formulario "prístino"). Como resultado, el tema de la comparación solo puede ser capacidades Procesamiento y salida en los que, por cierto, no hay necesidad de una muy a menudo. Pero incluso si esa necesidad es, entonces esta es una comparación de los manipuladores, y no los jugadores.

Diferentes versiones del conductor suenan de manera diferente.

Sobre la base de esta declaración se encuentra una ignorancia banal de los principios de la tarjeta de sonido. El conductor es softwarerequerido para la interacción efectiva del dispositivo con el sistema operativo, por lo general, proporciona una interfaz gráfica de usuario para administrar el dispositivo, sus parámetros, etc. El controlador de la tarjeta de sonido proporciona un reconocimiento de tarjeta de sonido como una tarjeta de sonido dispositivos de WindowsDe acuerdo con los formatos admitidos por la tarjeta, proporciona la transmisión de PCM sin comprimir (en la mayoría de los casos) el flujo de la tarjeta, y también da acceso a la configuración. Además, en el caso del procesamiento de software (CPU), el controlador puede contener varios DSP (manejadores). Por lo tanto, primero, cuando los efectos están deshabilitados y procesan, si el controlador no proporciona una transmisión precisa de PCM a la tarjeta, se considera un error burdo, un error crítico. Y sucede casi nunca. Por otro lado, las diferencias entre los controladores pueden estar actualizando los algoritmos de procesamiento (rempliers, efectos), aunque esto no ocurre a menudo. Además, para lograr los efectos de la más alta calidad y cualquier procesamiento por parte del conductor aún debe ser excluido.

El sonido de CD de audio con licencia mejor que sus copias

Si no hay errores de error (irrazonables) de lectura / escritura durante la copia y la unidad óptica del dispositivo en el que se jugará la copia del disco, no hay problemas con su lectura, entonces dicha declaración es erróneamente y refutada fácilmente.

El modo de codificación estéreo da mejor calidad que el estéreo conjunto

Este error se refiere principalmente a LAME MP3, ya que todos los codificadores modernos (AAC, Vorbis, Musepack) utilizan solo Modo estéreo conjunto (y esto ya dice algo)

El espectro más amplio, mejor será el registro (sobre espectrogramas, el rango de AUCDTTECT y la frecuencia)

En nuestro tiempo en los foros, desafortunadamente, la medición de la calidad de la pista "línea por espectrograma" es muy común. Obviamente, debido a la simplicidad de este método. Pero, como lo demuestra la práctica, en realidad, todo es mucho más complicado.

Y el punto aquí es qué. El espectrograma demuestra visualmente la distribución de la potencia de la señal de frecuencia, pero no puede dar una vista completa del sonido de grabación, la presencia de distorsión y artefactos de compresión. Es decir, de hecho, todo lo que puede determinarse por el espectrograma es el rango de frecuencia (y en parte, la densidad del espectro en la región RF). Es decir, en el mejor de los casos, al analizar el espectrograma que puede revelar el aparte. Comparando los mismos espectrogramas de pistas obtenidas al codificar por varios codificadores, con el original, el absurdo completo. Sí, puede identificar las diferencias en el espectro, pero para determinar si (y en qué medida) serán percibidos por el oído humano, casi imposible. No debemos olvidar que la tarea de la codificación de pérdidas es garantizar que el resultado indistinguible oreja humana Desde el original (de ninguna manera con el ojo).

Lo mismo se aplica a la evaluación de la calidad de la codificación al analizar las pistas en el AUCDTECT, el Administrador de tareas AUCDTTECT, el analizador TAU, FOOCDTECT es solo un shell para un solo programa de consola de AUCDTECT). El algoritmo AUCDTECT también analiza realmente el rango de frecuencia y solo le permite determinar (con una parte determinada de la probabilidad), si se aplicó la compresión MPEG en cualquiera de las etapas de codificación. El algoritmo está afilado por MP3, por lo tanto, es fácil "engañar" utilizando los códecs Vorbis, AAC y Musepack, de modo que incluso si el programa escribe "100% CDDA", esto no significa que el audio codificado esté 100% correspondiente a la fuente.

Y regresando directamente a los espectros. También es popular el deseo de algunos "entusiastas" por cualquier cosa para deshabilitar el filtro de PAESS (LC) en el codificador cojo. Aquí, en la cara, malinterpretando los principios de codificación y psicoacústica. Primero, el codificador reduce las frecuencias altas con un solo objetivo: para guardar datos y usarlas para codificar el rango de frecuencia más audible. El rango de frecuencia extendido puede afectar fatalmente la calidad general del sonido y conducir a artefactos de codificación audible. Además, la desconexión del corte en 20 kHz es generalmente completamente innecesaria, ya que la frecuencia por encima de la persona simplemente no escucha.

Hay un cierto ajuste preestablecido del ecualizador "mágico" capaz de mejorar significativamente el sonido.

Esto no es completamente así, en primer lugar, porque cada configuración individual (auriculares, acústica, tarjeta de sonido) tiene sus propios parámetros (en particular, su respuesta de frecuencia de amplitud). Y, por lo tanto, cada configuración debe ser su enfoque único. Simplemente ponga, existe un preajuste de tal igualizador, pero difiere para diferentes configuraciones. Su esencia es ajustar la respuesta de la frecuencia, a saber, en la "alineación" de fallas y estallidos no deseados.

También entre las personas están lejos de trabajar directamente con el sonido, la configuración de un ecualizador gráfico "Marca de verificación" es muy popular, lo que realmente representa el aumento en el nivel del LF y los componentes de RF, pero al mismo tiempo conduce a la Mufla de voces y herramientas, cuyo espectro de sonido se encuentra en el área de frecuencia media.

Antes de convertir la música a otro formato, debería "exprimir" en WAV

Inmediatamente, observo que bajo WAV implica datos PCM (modulación de código de pulso) en el contenedor de onda (archivo con la extensión * .wav). Estos datos no son más que una secuencia de bits (ceros y unidades) por grupos de 16, 24 o 32 (dependiendo de la broca), cada uno de los cuales es un código de amplitud binario de las muestras correspondientes (por ejemplo, para 16 bits en Representación decimal Estos son valores de -32768 a +32768).

Sin embargo, si usa un convertidor o un codificador de consola simplemente avanzado, se produce una conversión intermedia en PCM sobre la marcha, a veces incluso sin grabar en un archivo WAV temporal. Eso es lo que entra en las personas en error: parece que los formatos se convierten directamente a uno a otro, pero de hecho, en dicho programa, hay un decodificador de un formato de entrada que realiza una conversión intermedia a PCM.

Por lo tanto, la transformación manual en WAV no le dará absolutamente nada más que el exceso de tiempo.