FMUSER ¡Transmite video y audio sin cables más fácilmente!

[email protected] WhatsApp + 8618078869184
Idioma

    Conocimientos básicos de audio y principios de codificación.

     

     1. Conceptos básicos

     

    1) Tasa de bits: indica cuántos bits por segundo deben representarse los datos de audio codificados (comprimidos), y la unidad suele ser kbps.

     

    2) Sonoridad e intensidad: Atributos subjetivos de un sonido. La sonoridad indica qué tan fuerte suena un sonido. La sonoridad varía principalmente con la intensidad del sonido, pero también se ve afectada por la frecuencia. En términos generales, los sonidos puros de frecuencia media son mejores que los sonidos puros de baja y alta frecuencia.

     

    3) Muestreo y frecuencia de muestreo: el muestreo consiste en transformar una señal de tiempo continuo en una señal digital discreta. La frecuencia de muestreo se refiere a la cantidad de muestras que se recolectan por segundo.

     

    Ley de muestreo de Nyquist: cuando la frecuencia de muestreo es mayor o igual a 2 veces el componente de frecuencia más alto de la señal continua, la señal muestreada se puede utilizar para reconstruir perfectamente la señal continua original.

     

    2. formatos de audio comunes

     

    1) El formato WAV es un formato de archivo de sonido desarrollado por Microsoft, también llamado archivo de sonido de onda. Es el formato de audio digital más antiguo, ampliamente compatible con la plataforma Windows y sus aplicaciones, y tiene una tasa de compresión baja.

     

    2) MIDI es la abreviatura de Musical Instrument Digital Interface, también conocida como Musical Instrument Digital Interface, que es un estándar internacional unificado para música digital / instrumentos musicales electrónicos sintéticos. Define la forma en que los programas de música de computadora, sintetizadores digitales y otros dispositivos electrónicos intercambian señales de música, y especifica el protocolo de transmisión de datos entre cables y hardware y dispositivos que conectan instrumentos musicales electrónicos de diferentes fabricantes a computadoras, y puede simular el sonido de múltiples instrumentos musicales. instrumentos. Un archivo MIDI es un archivo en formato MIDI y algunos comandos se almacenan en el archivo MIDI. Envíe estas instrucciones a la tarjeta de sonido y la tarjeta de sonido sintetizará el sonido de acuerdo con las instrucciones.

     

    3) El nombre completo de MP3 es MPEG-1 Audio Layer 3, que se fusionó con la especificación MPEG en 1992. MP3 puede comprimir archivos de audio digital con alta calidad de sonido y baja frecuencia de muestreo. La aplicación más común.

     

    4) MP3Pro fue desarrollado por Swedish Coding Technology Company, que contiene dos tecnologías principales: una es la tecnología de decodificación única de Coding Technology Company y la otra es la integración del titular de la patente MP3 French Thomson Multimedia Company y la alemana Fraunhofer Una tecnología de decodificación investigada conjuntamente por la Asociación de Circuitos. MP3Pro puede mejorar la calidad del sonido de la música MP3 original sin cambiar básicamente el tamaño del archivo. Puede mantener la calidad del sonido antes de la compresión en la mayor medida posible mientras comprime archivos de audio a una tasa de bits más baja.

     

    5) MP3Pro fue desarrollado por Swedish Coding Technology Company, que contiene dos tecnologías principales: una es la tecnología de decodificación única de Coding Technology Company y la otra es la integración del titular de la patente MP3 French Thomson Multimedia Company y la alemana Fraunhofer Una tecnología de decodificación investigada conjuntamente por la Asociación de Circuitos. MP3Pro puede mejorar la calidad del sonido de la música MP3 original sin cambiar básicamente el tamaño del archivo. Puede mantener la calidad del sonido antes de la compresión en la mayor medida posible mientras comprime archivos de audio a una tasa de bits más baja.

     

    6) WMA (Windows Media Audio) es la obra maestra de Microsoft en el campo del audio y video de Internet. El formato WMA logra una mayor tasa de compresión al reducir el tráfico de datos pero manteniendo la calidad del sonido. La tasa de compresión generalmente puede alcanzar 1:18. Además, WMA también puede proteger los derechos de autor a través de DRM (Gestión de derechos digitales).

     

    7) RealAudio es un formato de archivo lanzado por Real Networks. La característica más importante es que puede transmitir información de audio en tiempo real, especialmente cuando la velocidad de la red es lenta, aún puede transmitir datos sin problemas, por lo que RealAudio es principalmente adecuado para jugar en red en línea. Los formatos de archivo actuales de RealAudio incluyen principalmente RA (RealAudio), RM (RealMedia, RealAudio G2), RMX (RealAudio Secured), etc. La característica común de estos archivos es que la calidad del sonido cambia con la diferencia en el ancho de banda de la red. Bajo la premisa de que la mayoría de las personas escuchan un sonido suave, los oyentes con un ancho de banda más amplio pueden obtener una mejor calidad de sonido.

     

    8) Audible tiene cuatro formatos diferentes: Audible1, 2, 3, 4. El sitio web Audible.com vende principalmente libros de audio en Internet y brinda protección para los productos y archivos que venden a través de uno de los cuatro formatos de audio dedicados de Audible.com. . Cada formato considera principalmente la fuente de audio y el dispositivo de escucha utilizado. Los formatos 1, 2 y 3 usan diferentes niveles de compresión de voz, mientras que el formato 4 usa una frecuencia de muestreo más baja y el mismo método de decodificación que MP3. La voz resultante es más clara y se puede descargar de manera más eficiente desde Internet. Audible utiliza su propia herramienta de reproducción de escritorio, que es Audible Manager. Con este reproductor, puede reproducir archivos de formato Audible almacenados en una PC o transferidos a un reproductor portátil.

     

    9) AAC es en realidad una abreviatura de Advanced Audio Coding. AAC es un formato de audio desarrollado conjuntamente por Fraunhofer IIS-A, Dolby y AT&T. Es parte de la especificación MPEG-2. El algoritmo utilizado por AAC es diferente al de MP3. AAC combina otras funciones para mejorar la eficiencia de la codificación. El algoritmo de audio de AAC supera con creces algunos algoritmos de compresión anteriores (como MP3, etc.) en capacidades de compresión. También admite hasta 48 pistas de audio, 15 pistas de audio de baja frecuencia, más frecuencias de muestreo y velocidades de bits, compatibilidad con varios idiomas y una mayor eficiencia de decodificación. En resumen, AAC puede proporcionar una mejor calidad de sonido bajo la premisa de que es un 30% más pequeño que los archivos MP3.

     

    10) Ogg Vorbis es un nuevo formato de compresión de audio, similar a los formatos de música existentes como MP3. Pero una diferencia es que es completamente gratuito, abierto y sin restricciones de patente. Vorbis es el nombre de este mecanismo de compresión de audio, y Ogg es el nombre de un proyecto que pretende diseñar un sistema multimedia completamente abierto. VORBIS también es una compresión con pérdida, pero utiliza modelos acústicos más avanzados para reducir la pérdida. Por lo tanto, OGG codificado con la misma tasa de bits suena mejor que MP3.

     

    11) APE es un formato de audio comprimido sin pérdidas, bajo la premisa de que la calidad del sonido no se reduce, el tamaño se comprime a la mitad del formato tradicional de archivo WAV sin pérdidas.

     

    12) FLAC es la abreviatura de Free Lossless Audio Codec, un conjunto de códigos de compresión sin pérdida de audio gratuitos conocidos, que se caracteriza por la compresión sin pérdida.

     

    3. el principio básico de la codificación de audio

     

    La codificación de voz está dedicada a reducir el ancho de banda del canal requerido para la transmisión mientras se mantiene la alta calidad de la voz de entrada.

     

    El objetivo de la codificación de voz es diseñar un codificador de baja complejidad para lograr una transmisión de datos de alta calidad a la tasa de bits más baja posible.

     

    1) Curva de umbral de silencio: el umbral en el que el oído humano puede escuchar el sonido en varias frecuencias solo en un entorno silencioso.

    2) Banda de frecuencia crítica

    Debido a que el oído humano tiene diferentes resoluciones para diferentes frecuencias, MPEG1 / Audio divide el rango de frecuencia perceptible dentro de 22 kHz en 23 ~ 26 bandas de frecuencia críticas de acuerdo con diferentes capas de codificación y diferentes frecuencias de muestreo. La siguiente figura enumera la frecuencia central y el ancho de banda de la banda de frecuencia crítica ideal. Como se puede ver en la figura, el oído humano tiene una mejor resolución de baja frecuencia.

    3) Efecto de enmascaramiento en el dominio de la frecuencia: una señal con una amplitud mayor enmascarará una señal con una frecuencia similar y una amplitud menor, como se muestra en la siguiente figura:

     

    4) Efecto de enmascaramiento en el dominio del tiempo: en un corto período de tiempo, si aparecen dos sonidos, el sonido con un SPL (nivel de presión sonora) mayor enmascara el sonido con un SPL más pequeño. El efecto de enmascaramiento del dominio del tiempo se divide en enmascaramiento hacia adelante (pre-enmascaramiento) y enmascaramiento hacia atrás (post-enmascaramiento). El tiempo de post-enmascaramiento será más largo, aproximadamente 10 veces mayor que el de pre-enmascaramiento.

    El efecto de enmascaramiento en el dominio del tiempo ayuda a eliminar el eco previo.

     

    4. los medios básicos de codificación

     

    1) Cuantizador y cuantificador

     

    Cuantización y cuantificador: la cuantificación convierte una señal continua en tiempo discreto en una señal discreta en tiempo discreto. Los cuantificadores comunes son: cuantificador uniforme, cuantificador logarítmico y cuantificador no uniforme. El objetivo perseguido por el proceso de cuantificación es minimizar el error de cuantificación y minimizar la complejidad del cuantificador (los dos son en sí mismos una contradicción).

     

    (A) Cuantizador uniforme: el más simple, el peor rendimiento, solo apto para voz telefónica.

     

    (B) Cuantizador logarítmico: Es más complicado que el cuantificador uniforme y fácil de implementar, y su rendimiento es mejor que el cuantificador uniforme.

     

    (C) Cuantizador no uniforme: según la distribución de la señal, diseñe el cuantificador. La cuantificación detallada se realiza cuando la señal es densa y la cuantificación aproximada se realiza cuando la señal es escasa.

     

    2) Codificador de voz

     

    Hay tres tipos de codificadores de voz: (a) codificador de forma de onda; (b) codificador de voz; (c) Codificador híbrido.

     

    El codificador de forma de onda tiene como objetivo construir una forma de onda analógica que incluya la hoja de ruido de fondo. Actuando sobre todas las señales de entrada, producirá muestras de alta calidad y consumirá una alta tasa de bits. El vocoder no regenerará la forma de onda original. Este conjunto de codificadores extraerá un conjunto de parámetros, que se envían al extremo receptor para derivar el modelo de generación de voz. La calidad de voz del codificador de voz no es lo suficientemente buena. Codificador híbrido, que incorpora las ventajas del codificador de forma de onda y la sirena.

     

    2.1 codificador de forma de onda

     

    El diseño del codificador de forma de onda suele ser independiente de la señal. Por lo tanto, es adecuado para la codificación de varias señales y no se limita a la voz.

     

    1) Codificación en el dominio del tiempo

     

    a) PCM: modulación de código de impulsos, es el método de codificación más simple. Es solo la discretización y cuantificación de la señal, y a menudo se usa la logaritmización.

     

    b) DPCM: modulación de código de pulso diferencial, que solo codifica la diferencia entre muestras. La anterior o más muestras se utilizan para predecir el valor actual de la muestra. Cuantas más muestras se utilicen para hacer predicciones, más preciso será el valor predicho. La diferencia entre el valor verdadero y el valor predicho se denomina residual, que es el objeto de la codificación.

                       

     

    c) MICDA: modulación de código de pulso diferencial adaptativo, código de pulso diferencial adaptativo. Es decir, sobre la base de DPCM, el cuantificador y el predictor se ajustan adecuadamente de acuerdo con los cambios de la señal, de modo que el valor predicho está más cerca de la señal real, el residual es menor y la eficiencia de compresión es mayor.

     

    (2) Codificación en el dominio de la frecuencia

     

    La codificación en el dominio de la frecuencia consiste en descomponer una señal en una serie de elementos de frecuencia diferentes y realizar una codificación independiente.

     

    a) Codificación de subbanda: la codificación de subbanda es la técnica de codificación en el dominio de la frecuencia más simple. Es una tecnología que transforma la señal original del dominio del tiempo al dominio de la frecuencia, luego la divide en varias subbandas y realiza la codificación digital en ellas respectivamente. Utiliza un grupo de filtro de paso de banda (BPF) para dividir la señal original en varias subbandas (por ejemplo, m) (denominadas subbandas). Pase cada subbanda a través de las características de modulación equivalentes a la modulación de amplitud de banda lateral única, mueva cada subbanda a una frecuencia cercana a cero, pase respectivamente a través de BPF (un total de m) y luego transfiera cada subbanda a una velocidad prescrita ( Tasa de Nyquist) Se muestrea la señal de salida de la subbanda, y el valor muestreado generalmente se codifica digitalmente y se establecen m codificadores digitales. Envíe cada señal codificada digital al multiplexor y finalmente emita el flujo de datos codificados de subbanda.

     

    Para diferentes subbandas, se pueden usar diferentes métodos de cuantificación y se pueden asignar diferentes números de bits a las subbandas de acuerdo con el modelo de percepción del oído humano.

     

    b) codificación de transformada: codificación DCT.

     

    5. Codificador de voz

     

    Vocoder de canal: utiliza la insensibilidad del oído humano a la fase.

     

    codificador de voz homomórfico: puede procesar eficazmente señales sintéticas.

     

    Vocoder de formante: la mayor parte de la información de la señal de voz se encuentra en la posición y el ancho de banda del formante.

     

    codificador de voz predictivo lineal: el codificador de voz más utilizado.

     

    6. Codificador híbrido

     

    El codificador de forma de onda intenta preservar la forma de onda de la señal codificada y puede proporcionar voz de alta calidad a una tasa de bits media (32 kbps), pero no se puede aplicar en ocasiones con una tasa de bits baja. El codificador de voz intenta generar una señal que es auditivamente similar a la señal codificada y puede proporcionar un habla inteligible a una tasa de bits baja, pero el habla resultante suena poco natural. El codificador híbrido combina las ventajas de ambos.

     

    RELP: Sobre la base de la predicción lineal, se codifica el residual. El mecanismo es: transmitir solo una pequeña parte de los residuos y reconstruir todos los residuos en el extremo receptor (copiar los residuos de la banda base).

     

    MPC: codificación multipulso, que elimina la correlación de los residuos y se utiliza para compensar la clasificación simple de voces del codificador de voz en sonoras y sordas sin los defectos de los estados intermedios.

     

    CELP: predicción lineal excitada por libro de códigos, que utiliza la predicción del tracto vocal y la cascada del predictor de tono para aproximarse mejor a la señal original.

     

    MBE: excitación multibanda, la finalidad es evitar una gran cantidad de cálculos CELP, para obtener una calidad superior al vocoder.

     

     

     

     

    Una lista de todas pregunta

    Apodo

    Correo electrónico

    Preguntas

    Nuestro otro producto:

    Paquete de equipo de estación de radio FM profesional

     



     

    Solución de IPTV para hoteles

     


      Ingrese el correo electrónico para recibir una sorpresa

      fmuser.org

      es.fmuser.org
      it.fmuser.org
      fr.fmuser.org
      de.fmuser.org
      af.fmuser.org -> Afrikáans
      sq.fmuser.org -> albanés
      ar.fmuser.org -> árabe
      hy.fmuser.org -> Armenio
      az.fmuser.org -> azerbaiyano
      eu.fmuser.org -> Vasco
      be.fmuser.org -> bielorruso
      bg.fmuser.org -> Bulgaria
      ca.fmuser.org -> catalán
      zh-CN.fmuser.org -> chino (simplificado)
      zh-TW.fmuser.org -> Chino (tradicional)
      hr.fmuser.org -> croata
      cs.fmuser.org -> checo
      da.fmuser.org -> danés
      nl.fmuser.org -> Holandés
      et.fmuser.org -> estonio
      tl.fmuser.org -> filipino
      fi.fmuser.org -> finlandés
      fr.fmuser.org -> Francés
      gl.fmuser.org -> gallego
      ka.fmuser.org -> georgiano
      de.fmuser.org -> alemán
      el.fmuser.org -> Griego
      ht.fmuser.org -> criollo haitiano
      iw.fmuser.org -> hebreo
      hi.fmuser.org -> Hindi
      hu.fmuser.org -> Hungarian
      is.fmuser.org -> islandés
      id.fmuser.org -> indonesio
      ga.fmuser.org -> irlandés
      it.fmuser.org -> Italiano
      ja.fmuser.org -> japonés
      ko.fmuser.org -> coreano
      lv.fmuser.org -> letón
      lt.fmuser.org -> Lituania
      mk.fmuser.org -> macedonio
      ms.fmuser.org -> malayo
      mt.fmuser.org -> maltés
      no.fmuser.org -> Noruega
      fa.fmuser.org -> persa
      pl.fmuser.org -> polaco
      pt.fmuser.org -> portugués
      ro.fmuser.org -> Rumano
      ru.fmuser.org -> ruso
      sr.fmuser.org -> serbio
      sk.fmuser.org -> eslovaco
      sl.fmuser.org -> Eslovenia
      es.fmuser.org -> español
      sw.fmuser.org -> Swahili
      sv.fmuser.org -> sueco
      th.fmuser.org -> Tailandés
      tr.fmuser.org -> turco
      uk.fmuser.org -> ucraniano
      ur.fmuser.org -> Urdu
      vi.fmuser.org -> Vietnamita
      cy.fmuser.org -> galés
      yi.fmuser.org -> Yiddish

       
  •  

    FMUSER ¡Transmite video y audio sin cables más fácilmente!

  • Contacto

    Dirección:
    Habitación No.305 Edificio HuiLan No.273 Huanpu Road Guangzhou China 510620

    E-mail:
    [email protected]

    Teléfono / WhatApps:
    +8618078869184

  • Categorias

  • Boletin Informativo

    PRIMER O NOMBRE COMPLETO

    E-mail

  • solución paypal  Western UnionBanco de China
    E-mail:[email protected]   WhatsApp: +8618078869184 Skype: sky198710021 Chatear conmigo
    Los derechos de autor 2006 2020-accionada por el www.fmuser.org

    Contáctenos