FMUSER ¡Transmite video y audio sin cables más fácilmente!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikáans
sq.fmuser.org -> albanés
ar.fmuser.org -> árabe
hy.fmuser.org -> Armenio
az.fmuser.org -> azerbaiyano
eu.fmuser.org -> Vasco
be.fmuser.org -> bielorruso
bg.fmuser.org -> Bulgaria
ca.fmuser.org -> catalán
zh-CN.fmuser.org -> chino (simplificado)
zh-TW.fmuser.org -> Chino (tradicional)
hr.fmuser.org -> croata
cs.fmuser.org -> checo
da.fmuser.org -> danés
nl.fmuser.org -> Holandés
et.fmuser.org -> estonio
tl.fmuser.org -> filipino
fi.fmuser.org -> finlandés
fr.fmuser.org -> Francés
gl.fmuser.org -> gallego
ka.fmuser.org -> georgiano
de.fmuser.org -> alemán
el.fmuser.org -> Griego
ht.fmuser.org -> criollo haitiano
iw.fmuser.org -> hebreo
hi.fmuser.org -> Hindi
hu.fmuser.org -> Hungarian
is.fmuser.org -> islandés
id.fmuser.org -> indonesio
ga.fmuser.org -> irlandés
it.fmuser.org -> Italiano
ja.fmuser.org -> japonés
ko.fmuser.org -> coreano
lv.fmuser.org -> letón
lt.fmuser.org -> Lituania
mk.fmuser.org -> macedonio
ms.fmuser.org -> malayo
mt.fmuser.org -> maltés
no.fmuser.org -> Noruega
fa.fmuser.org -> persa
pl.fmuser.org -> polaco
pt.fmuser.org -> portugués
ro.fmuser.org -> Rumano
ru.fmuser.org -> ruso
sr.fmuser.org -> serbio
sk.fmuser.org -> eslovaco
sl.fmuser.org -> Eslovenia
es.fmuser.org -> español
sw.fmuser.org -> Swahili
sv.fmuser.org -> sueco
th.fmuser.org -> Tailandés
tr.fmuser.org -> turco
uk.fmuser.org -> ucraniano
ur.fmuser.org -> Urdu
vi.fmuser.org -> Vietnamita
cy.fmuser.org -> galés
yi.fmuser.org -> Yiddish
1. general
La tecnología analógica se utilizó en el campo del audio y el video en una etapa temprana y se ha convertido en tecnología digital. Las principales ventajas de la digitalización son: alta confiabilidad, puede eliminar la pérdida de transmisión y almacenamiento y facilitar el procesamiento por computadora y la transmisión por red. Después de la digitalización, el procesamiento de audio y video ha entrado en el campo de la tecnología informática. El procesamiento de audio y video es esencialmente el procesamiento de datos informáticos.
Los datos de video originales generados por la adquisición de información de imágenes son muy grandes. Para algunas aplicaciones que se reproducen directamente de forma local después de la adquisición, la tecnología de compresión no es necesaria. Pero en realidad, más aplicaciones involucran transmisión y almacenamiento de video. La red de transmisión y el equipo de almacenamiento no pueden tolerar la gran cantidad de datos de los datos de video originales. Los datos de video originales deben codificarse y comprimirse antes de la transmisión y el almacenamiento.
2. principio de compresión de video
2.1 entropía y redundancia
Hay dos tipos de componentes de señal en todos los materiales reales del programa: anormales, imprevistos y predecibles. El componente anormal se llama entropía, que es la información real en la señal. El resto se llama redundancia porque no es información requerida. La redundancia puede ser espacial, por ejemplo, en grandes áreas de una imagen, los píxeles adyacentes tienen casi el mismo valor. La redundancia también puede ser temporal, como una parte similar entre imágenes continuas. En todos los codificadores del sistema de compresión, la entropía se separa de la redundancia, solo se codifica y transmite la entropía, y la redundancia se calcula a partir de las señales enviadas por el codificador en el decodificador.
2.2 codificación intracuadro
La codificación intracuadro es una codificación de dominio espacial, que utiliza redundancia espacial para comprimir imágenes. Procesa una imagen independiente y no abarca varias imágenes. La codificación del dominio espacial depende de la similitud entre los píxeles adyacentes en una imagen y la frecuencia espacial principal del área del patrón.
El estándar JPEG se usa para imágenes fijas (es decir, imágenes), solo se usa compresión de dominio espacial y solo se usa codificación intracuadro.
2.3 codificación entre tramas
La codificación entre cuadros es una codificación en el dominio del tiempo, que utiliza la redundancia temporal entre un conjunto de imágenes continuas para comprimir imágenes. Si el decodificador puede utilizar una imagen de cuadro, el decodificador puede obtener la siguiente imagen de cuadro sólo utilizando la diferencia entre los dos cuadros. Por ejemplo, la similitud de las imágenes de marco plano en movimiento es grande y la diferencia es pequeña, mientras que las imágenes con ejercicio intenso son similares y diferentes. Cuando se obtiene un cuadro de información de imagen completa, el valor de diferencia entre la imagen y el último cuadro se puede usar para calcular la imagen del último cuadro, de modo que la cantidad de datos se pueda comprimir. La codificación en el dominio del tiempo se basa en la similitud entre imágenes consecutivas, y la imagen actual se predice utilizando la información de la imagen recibida tanto como sea posible.
El estándar MPEG se usa para imágenes en movimiento (es decir, video), que usa codificación en el dominio del espacio y codificación en el dominio del tiempo, por lo que se usa en combinación con la codificación entre cuadros y la codificación entre cuadros.
2.4 vector de movimiento
Un conjunto de imágenes continuas registra el movimiento del objetivo. El vector de movimiento se utiliza para medir el grado de movimiento del objetivo entre dos fotogramas. El vector de movimiento se compone de desplazamiento horizontal y desplazamiento vertical.
2.5 compensación de movimiento
El movimiento del objetivo reduce la similitud entre imágenes y aumenta la cantidad de diferencia de datos. La compensación de movimiento reduce la cantidad de diferencia de datos entre imágenes mediante la ejecución de vectores.
La siguiente figura muestra el diagrama esquemático de compensación de movimiento. Cuando un objetivo se mueve, su posición cambia, pero el color de la forma, etc., permanece sin cambios. El codificador puede reducir la diferencia de imagen utilizando el vector de movimiento, y el decodificador puede mover el objetivo a la posición correcta de acuerdo con el vector de movimiento en la diferencia de imagen. Si la imagen es ideal, no hay ningún cambio en ningún atributo excepto en la posición de movimiento, la diferencia entre las dos imágenes solo contiene la cantidad de datos del vector de movimiento. Obviamente, la compensación de movimiento puede reducir significativamente la cantidad de datos de diferencia de imagen.
2.6 predicción bidireccional
En las tres imágenes consecutivas, el bloque de destino se mueve verticalmente y el bloque de fondo no se mueve. Consideramos cómo obtener la imagen del cuadro actual (imagen n):
En la pantalla n, el objetivo se mueve hacia arriba para revelar el bloque de fondo.
En la pantalla n-1, debido a que el bloque de fondo está bloqueado por el bloque de destino, no hay información relacionada con el bloque de fondo.
En la pantalla n + 1, los datos del bloque de fondo están completamente incluidos, por lo que la pantalla n puede obtener el bloque de fondo de la pantalla n-1.
¿Cómo puedo obtener la pantalla n? El decodificador puede decodificar la pantalla n-1 y la imagen n + 1 primero. Los datos del bloque objetivo en la imagen n-1 se pueden obtener combinando los datos del bloque objetivo en la imagen n-1 con el vector de movimiento. Los datos del bloque de fondo en la imagen n se pueden obtener mediante los datos del bloque de fondo en la pantalla n + 1. La secuencia de decodificación de las tres imágenes es n-1, n + 1, n. La secuencia de visualización de las tres imágenes es n-1, N, n + 1. La imagen n se obtiene mediante el cálculo (predicho) de la primera cara de dibujo n-1 y la última superficie de dibujo n + 1, por lo que este método se denomina predicción bidireccional (o predicción directa, referencia bidireccional).
2.7 Marco I / marco IDR / marco P / marco B
Marco I: el fotograma I (imagen intracodificada, a menudo denominada fotograma clave) contiene una información de imagen completa, que pertenece a la imagen de codificación interna, sin vector de movimiento, y no necesita hacer referencia a otras imágenes de fotograma durante la decodificación. Por lo tanto, el cambio de canal se puede realizar en una imagen de cuadro I sin pérdida o decodificación de la imagen. I frame image se utiliza para evitar la acumulación y difusión de errores. En GOP cerrado, el primer fotograma de cada GOP debe ser I fotograma, y los datos del GOP actual no se referirán a los datos del GOP antes y después.
Marco IDR: el marco IDR (imagen de actualización de decodificación instantánea) es un marco I especial. Cuando el decodificador decodifica a la trama IDR, se borrará DPB (búfer de imagen decodificada), todos los datos decodificados se enviarán o descartarán, y luego se iniciará una nueva secuencia de decodificación. La imagen después del fotograma IDR no se refiere a la imagen antes del fotograma IDR, por lo que el fotograma IDR puede evitar la propagación de errores en el flujo de video, y el fotograma IDR también es un punto de acceso seguro para el decodificador y el reproductor.
Marco P: La trama P (imagen codificada predicha) es una trama de codificación entre tramas, que se predice y codifica utilizando la trama I o la trama P. anterior.
Marco B: La imagen predicha b-direccional (cuadro de imagen predicho bidireccional) es un cuadro de codificación entre cuadros, y la codificación de predicción bidireccional se lleva a cabo utilizando el cuadro I o el cuadro P antes y / o después. El marco B no se puede utilizar como marco de referencia.
El cuadro B tiene una tasa de compresión más alta, pero necesita más tiempo de búfer y una mayor ocupación de la CPU. Por lo tanto, el marco B es adecuado para almacenamiento local y video a pedido, pero no para sistemas de transmisión en vivo con altos requisitos de tiempo real.
2.8 GOP
GOP (grupo de imágenes) es un grupo de imágenes continuas, que consta de un fotograma I y varios fotogramas b / p, que es la unidad básica de acceso al códec. Dos parámetros my N comúnmente utilizados en la estructura GOP especifican la distancia entre dos marcos de anclaje (marco I o marco P) en GOP, y N especifica el tamaño de un GOP. Por ejemplo, m = 3, n = 15, la estructura de GOP es ibbpbbpbbpbbpbb
Todo: ¿el intervalo de cada dos marcos de anclaje es el mismo en GOP? Especulación: no necesariamente lo mismo. De hecho, se analizan muchos archivos de video y las reglas no son consistentes. Esto no está del todo claro y es necesario acumularlo, analizarlo y confirmarlo más a fondo.
Hay dos tipos de GOP: GOP cerrado y GOP abierto:
GOP cerrado: GOP cerrado solo necesita hacer referencia a las imágenes en este GOP, y no necesita referirse a los datos del GOP antes y después. Este modo determina que el orden de visualización del GOP cerrado siempre comienza con el cuadro I y termina con el cuadro P
Todo: ¿GOP cerrado está obligado a terminar con el marco P? Especulación: esta definición puede no ser necesaria. Se ve que algunos archivos de video GOP terminan en el cuadro B.
Abrir GOP: la trama B en GOP abierto puede decodificarse utilizando algunas tramas de su GOP anterior o del último GOP. Open GOP solo aparecerá cuando la transmisión contenga cuadros B.
Todo: ¿Open GOP estipula que comienza con el cuadro B y termina con el cuadro P? Especulación: esta definición puede no ser necesaria. ¿Empezar con el cuadro B? Los datos en línea son diferentes. ¿Terminar con el marco P? Se ve que algunos archivos de video GOP terminan en el cuadro B.
En GOP abierto, las funciones de la trama I común y la trama IDR son diferentes, por lo que es necesario distinguir dos tipos de tramas claramente. En GOP cerrado, no hay diferencia entre la función de la trama I ordinaria y la trama IDR, por lo que no se puede distinguir.
2.9 DTS y PTS
EDE (decodificación de marca de tiempo) representa el tiempo de decodificación de la trama comprimida.
PT (sello de tiempo de presentación) indica el tiempo de visualización del fotograma original después de decodificar el fotograma comprimido.
DTS y PTS son iguales en audio. Debido a que el cuadro B necesita una predicción bidireccional en el video, el cuadro B depende del cuadro anterior y posterior, por lo que la secuencia de decodificación de video y la secuencia de visualización del cuadro B son diferentes, es decir, DTS y PTS son diferentes. Por supuesto, el video sin cuadros B tiene el mismo DTS y PTS. La siguiente figura toma un diagrama GOP abierto como ejemplo para ilustrar la secuencia de decodificación y la secuencia de visualización del flujo de video.
La secuencia de adquisición se refiere a la secuencia del cuadro de imagen adquirido por la señal original recopilada por el sensor de imagen.
La secuencia de codificación se refiere a la secuencia de cuadros de imagen después de la codificación del codificador. Los cuadros de imagen almacenados en el archivo de video local almacenado en el disco están en el mismo orden que el orden de codificación.
La secuencia de transmisión se refiere a la secuencia de cuadros de imagen en el proceso de transmisión de flujo codificado en la red.
La secuencia de decodificación se refiere al orden en el que el decodificador decodifica el cuadro de la imagen.
El orden de visualización se refiere al orden en el que se muestran los fotogramas de la imagen en la pantalla.
El orden de adquisición es el mismo que el de visualización. La secuencia de codificación, la secuencia de transmisión y la secuencia de decodificación son las mismas.
Tomando el cuadro "b [1]" como ejemplo, se muestra que la decodificación del cuadro "b [1]" requiere una referencia al cuadro "i [0]" y al cuadro "p [3]", por lo que "p [3] "El marco debe decodificarse primero que" b [1] ". Esto conduce a la inconsistencia entre el orden de decodificación y el orden de visualización, y el marco mostrado debe resolverse primero.
|
Ingrese el correo electrónico para recibir una sorpresa
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikáans
sq.fmuser.org -> albanés
ar.fmuser.org -> árabe
hy.fmuser.org -> Armenio
az.fmuser.org -> azerbaiyano
eu.fmuser.org -> Vasco
be.fmuser.org -> bielorruso
bg.fmuser.org -> Bulgaria
ca.fmuser.org -> catalán
zh-CN.fmuser.org -> chino (simplificado)
zh-TW.fmuser.org -> Chino (tradicional)
hr.fmuser.org -> croata
cs.fmuser.org -> checo
da.fmuser.org -> danés
nl.fmuser.org -> Holandés
et.fmuser.org -> estonio
tl.fmuser.org -> filipino
fi.fmuser.org -> finlandés
fr.fmuser.org -> Francés
gl.fmuser.org -> gallego
ka.fmuser.org -> georgiano
de.fmuser.org -> alemán
el.fmuser.org -> Griego
ht.fmuser.org -> criollo haitiano
iw.fmuser.org -> hebreo
hi.fmuser.org -> Hindi
hu.fmuser.org -> Hungarian
is.fmuser.org -> islandés
id.fmuser.org -> indonesio
ga.fmuser.org -> irlandés
it.fmuser.org -> Italiano
ja.fmuser.org -> japonés
ko.fmuser.org -> coreano
lv.fmuser.org -> letón
lt.fmuser.org -> Lituania
mk.fmuser.org -> macedonio
ms.fmuser.org -> malayo
mt.fmuser.org -> maltés
no.fmuser.org -> Noruega
fa.fmuser.org -> persa
pl.fmuser.org -> polaco
pt.fmuser.org -> portugués
ro.fmuser.org -> Rumano
ru.fmuser.org -> ruso
sr.fmuser.org -> serbio
sk.fmuser.org -> eslovaco
sl.fmuser.org -> Eslovenia
es.fmuser.org -> español
sw.fmuser.org -> Swahili
sv.fmuser.org -> sueco
th.fmuser.org -> Tailandés
tr.fmuser.org -> turco
uk.fmuser.org -> ucraniano
ur.fmuser.org -> Urdu
vi.fmuser.org -> Vietnamita
cy.fmuser.org -> galés
yi.fmuser.org -> Yiddish
FMUSER ¡Transmite video y audio sin cables más fácilmente!
Contacto
Dirección:
Habitación No.305 Edificio HuiLan No.273 Huanpu Road Guangzhou China 510620
Categorías
Newsletter