FMUSER ¡Transmite video y audio sin cables más fácilmente!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikáans
sq.fmuser.org -> albanés
ar.fmuser.org -> árabe
hy.fmuser.org -> Armenio
az.fmuser.org -> azerbaiyano
eu.fmuser.org -> Vasco
be.fmuser.org -> bielorruso
bg.fmuser.org -> Bulgaria
ca.fmuser.org -> catalán
zh-CN.fmuser.org -> chino (simplificado)
zh-TW.fmuser.org -> Chino (tradicional)
hr.fmuser.org -> croata
cs.fmuser.org -> checo
da.fmuser.org -> danés
nl.fmuser.org -> Holandés
et.fmuser.org -> estonio
tl.fmuser.org -> filipino
fi.fmuser.org -> finlandés
fr.fmuser.org -> Francés
gl.fmuser.org -> gallego
ka.fmuser.org -> georgiano
de.fmuser.org -> alemán
el.fmuser.org -> Griego
ht.fmuser.org -> criollo haitiano
iw.fmuser.org -> hebreo
hi.fmuser.org -> Hindi
hu.fmuser.org -> Hungarian
is.fmuser.org -> islandés
id.fmuser.org -> indonesio
ga.fmuser.org -> irlandés
it.fmuser.org -> Italiano
ja.fmuser.org -> japonés
ko.fmuser.org -> coreano
lv.fmuser.org -> letón
lt.fmuser.org -> Lituania
mk.fmuser.org -> macedonio
ms.fmuser.org -> malayo
mt.fmuser.org -> maltés
no.fmuser.org -> Noruega
fa.fmuser.org -> persa
pl.fmuser.org -> polaco
pt.fmuser.org -> portugués
ro.fmuser.org -> Rumano
ru.fmuser.org -> ruso
sr.fmuser.org -> serbio
sk.fmuser.org -> eslovaco
sl.fmuser.org -> Eslovenia
es.fmuser.org -> español
sw.fmuser.org -> Swahili
sv.fmuser.org -> sueco
th.fmuser.org -> Tailandés
tr.fmuser.org -> turco
uk.fmuser.org -> ucraniano
ur.fmuser.org -> Urdu
vi.fmuser.org -> Vietnamita
cy.fmuser.org -> galés
yi.fmuser.org -> Yiddish
1, principio de transmisión de video
El video es utilizar el principio de retención de la visión del ojo humano, mediante la reproducción de una serie de imágenes, hacer que el ojo humano se sienta en movimiento. El video solo se transmite y la cantidad de video es muy grande, lo cual es inaceptable para la red y el almacenamiento existentes. Para que el video sea fácil de transmitir y almacenar, las personas encuentran que el video tiene mucha información repetida. Si la información duplicada se elimina del extremo de transmisión y se recupera en el extremo receptor, el archivo de datos de video se reduce considerablemente, por lo que el estándar de compresión de video H.264 está disponible.
Los datos de la imagen original en el video se comprimirán en formato de codificación H.264 y los datos de muestreo de audio se comprimirán en formato de codificación AAC. Después de codificar y comprimir, el contenido de video es realmente propicio para el almacenamiento y la transmisión. Sin embargo, al ver la reproducción, el proceso de decodificación también es necesario en consecuencia. Por lo tanto, es obvio que tanto el codificador como el descodificador pueden entender una especie de convención entre la codificación y la descodificación. En términos de codificación y decodificación de imágenes de video, este Convenio es simple:
El codificador codifica varias imágenes y produce un GOP (grupo de imágenes) en un segmento. Al reproducir, el decodificador lee una sección de GOP para decodificar, luego lee la imagen y luego renderiza la pantalla. GOP (grupo de imágenes) es una serie de imágenes continuas, que consta de un cuadro I y varios cuadros B / P. Es la unidad básica de acceso al codificador y descodificador de imágenes de vídeo. Su secuencia de disposición se repetirá hasta el final de la imagen. La trama I es una trama de codificación interna (también conocida como trama clave), la trama P es una trama de predicción directa (trama de referencia directa) y la trama B es una trama de interpolación bidireccional (trama de referencia bidireccional). En resumen, el cuadro I es una imagen completa, mientras que el registro P y B cambia en relación con el cuadro I. Sin cuadros I, los cuadros P y B no se pueden decodificar.
En el estándar de compresión H.264, el cuadro I, el cuadro P y el cuadro B se utilizan para representar la imagen de vídeo transmitida.
Volver a la cima
2 、 Cuadro I, P, cuadro B, GOP
Marco I
Cuadro I: es decir, imagen intracodificada. El fotograma I representa el fotograma clave y puede comprender que la imagen de este fotograma se conserva por completo; la decodificación solo necesita los datos del cuadro para completarse (porque contiene la imagen completa). También conocido como imagen interna, el cuadro I suele ser el primer cuadro de cada GOP (una tecnología de compresión de video utilizada por MPEG). Después de una compresión moderada, se puede utilizar como un punto de referencia de acceso aleatorio y se puede considerar como una imagen. En la codificación MPEG, algunas secuencias de cuadros de vídeo se comprimen en cuadros I; algunos están comprimidos en cuadros P; y algunos están comprimidos en cuadros B. El método de fotograma I es un método de compresión en fotograma, también conocido como método de compresión "fotograma clave". El método I frame es una tecnología de compresión basada en DCT (transformada de coseno discreta), que es similar al algoritmo de compresión JPEG. La relación de compresión de 1/6 se puede lograr utilizando la compresión I frame sin un rastro de compresión obvio.
[Encuadro características]
1. Es un cuadro de codificación de compresión de fotograma completo. Codifica y transmite toda la información de la imagen del fotograma mediante compresión JPEG;
2. la imagen completa sólo se puede reconstruir utilizando los datos del cuadro I durante la decodificación;
3. el cuadro I describe el fondo de la imagen y los detalles del cuerpo en movimiento;
4. El marco I no se genera haciendo referencia a otras imágenes;
5. El marco I es el marco de referencia del marco P y el marco B (su calidad afecta directamente la calidad de cada marco en el mismo grupo);
6. La trama I es la trama básica (la primera trama) del grupo de tramas GOP, y solo una trama I está en un grupo;
7. El vector de movimiento no es necesario para el cuadro I;
8. la información del marco I es relativamente grande.
[Marco el proceso de codificación]
(1) La predicción intra se lleva a cabo para determinar el modo de predicción intra.
(2) El valor de píxel resta el valor predicho para obtener el residual.
(3) El residual se transforma y cuantifica.
(4) Codificación de longitud variable y codificación aritmética.
(5) La imagen se reconstruye y filtra, y la imagen se utiliza como marco de referencia de otros marcos.
Por ejemplo, en el sistema de videoconferencia, la imagen enviada por el terminal a la MCU (o la MCU a la terminal) no envía una imagen completa al extremo remoto a la vez, sino solo la parte que cambia después de enviar la imagen en función de la anterior. imagen. Si la condición de la red no es buena, el terminal recibirá el extremo remoto o enviará a la imagen remota con pérdida de paquetes y la imagen se bloqueará. En este caso, si no hay un mecanismo de marco para enviar una nueva imagen completa al local (o reenviar local una nueva imagen completa al remoto), se mostrará la pantalla de flores de la imagen de salida del terminal El fenómeno de Caton será cada vez más grave, lo que hará que la reunión no se lleve a cabo con normalidad.
En el proceso de reproducción de la pantalla de video, si se pierde el fotograma, el fotograma P detrás también aparecerá tan pronto como no se pueda resolver, y aparecerá el fenómeno de la pantalla negra; si se pierde el cuadro P, la pantalla de video mostrará el fenómeno de la pantalla de flores y el mosaico.
En el sistema de videoconferencia, el marco I solo se producirá dentro del límite de ancho de banda de la reunión, y no excederá el ancho de banda de la reunión y entrará en vigor. El mecanismo de marco I no solo existe en MCU, sino también en el servidor de pared de TV y el servidor de video. Se trata de solucionar el problema de la pérdida de paquetes en el caso de malas condiciones de la red, como imagen de pantalla y botón, lo que afectará al progreso normal de la reunión.
Marco P
Cuadro P: es decir, imagen codificada predictiva. El cuadro P representa la diferencia entre este cuadro y el cuadro clave anterior (o cuadro P). Al decodificar, la diferencia definida en este cuadro debe superponerse a la imagen almacenada en caché anterior para generar la imagen final. (es decir, fotograma de diferencia, el fotograma P no tiene datos de imagen completos, solo datos diferentes del fotograma anterior)
[predicción y reconstrucción del marco P]
El cuadro P es un cuadro de referencia I, en el que el valor de predicción y el vector de movimiento de "un punto" del cuadro P se encuentran en el cuadro I, y la diferencia de predicción y el vector de movimiento se transmiten juntos. El valor predicho de "punto" del cuadro P se encuentra a partir del cuadro I de acuerdo con el vector de movimiento en el receptor y la diferencia se suma para obtener el valor de muestra del "punto" del cuadro P, de modo que el cuadro P completo pueda ser adquirido.
[Características del marco P]
1. El cuadro P es el cuadro de codificación con 1-2 cuadros detrás del cuadro I;
2. El cuadro P adopta el método de compensación de movimiento para transmitir la diferencia y el vector de movimiento (error de predicción) entre el cuadro P y el cuadro I;
3. el valor de predicción y el error de predicción en la trama I deben sumarse en la decodificación antes de poder reconstruir la imagen completa de la trama P;
4. La trama P pertenece a la codificación entre tramas de predicción directa. Solo se refiere al marco I o marco P más cercano al frente;
5. El marco P puede ser el marco de referencia del marco P después de él, o puede ser el marco de referencia del marco B antes y después de él;
6. debido a que el marco P es un marco de referencia, puede provocar la propagación del error de decodificación;
7. Debido a la diferencia de transmisión, la compresión de la trama P es relativamente alta.
Cuadro B
Cuadro B: es decir, imagen predicha bidireccionalmente. El fotograma B es un fotograma de diferencia bidireccional, es decir, la diferencia entre el fotograma y los fotogramas delantero y trasero se registra en el fotograma B. En otras palabras, para decodificar el cuadro B, no solo se necesita la imagen de la caché anterior, sino también la imagen decodificada. La imagen final se obtiene mediante la superposición de las imágenes frontal y posterior y los datos del encuadre. La tasa de compresión de cuadros B es alta, pero la CPU estará más cansada al decodificar.
[predicción y reconstrucción del marco B]
El marco B se basa en el marco I o P frontal y el marco P en la parte posterior como marco de referencia. Se encuentran el valor de predicción y dos vectores de movimiento de "un punto" del cuadro B, y la diferencia de predicción y el vector de movimiento se toman para transmitir. El receptor "averigua (calcula)" el valor predicho en dos cuadros de referencia según el vector de movimiento y suma con diferencia, y obtiene el valor muestral de "cierto punto" del cuadro B, obteniendo así el cuadro B completo. Codificación de predicción bidireccional entre fotogramas mediante predicción de movimiento
[Características del marco B]
1. El fotograma B está predicho por el fotograma I o P frontal y el fotograma P posterior;
2. La trama B transmite el error de predicción y el vector de movimiento entre ella y la trama I o trama P y la trama P en la parte posterior;
3. La trama B es una trama de codificación de predicción bidireccional;
4. La relación de compresión del fotograma B es la más alta, porque solo refleja el cambio del cuerpo principal del movimiento entre los fotogramas de referencia C, y la predicción es más precisa;
5. El marco B no es un marco de referencia y no provocará la propagación del error de decodificación.
[por qué se necesita el marco B]
Por lo anterior, sabemos que el algoritmo de decodificación de I y P es relativamente simple y la ocupación de recursos es relativamente pequeña. Solo necesito completarlo yo mismo. P. solo necesita el decodificador para almacenar en caché la imagen anterior. Cuando se encuentra con P, es mejor utilizar la imagen almacenada en caché anteriormente. Si el flujo de video solo tiene I y P, el decodificador puede leer y decodificar mientras lee y avance lineal. Es muy cómodo para nosotros seguir adelante. No me gusta. Entonces, ¿por qué quieres presentar el marco B?
Muchas películas de la red adoptan el fotograma B, porque la diferencia entre los fotogramas delanteros y traseros grabados por el fotograma B puede ahorrar más espacio que el fotograma P. Sin embargo, el archivo es pequeño y el decodificador tiene problemas. En la decodificación, no solo se usa la imagen almacenada en caché antes, sino también la siguiente imagen I o P (es decir, prelectura y decodificación). Además, el cuadro B no se puede perder simplemente, ya que el cuadro B en realidad contiene información de la imagen, si simplemente se pierde y se repite con la imagen anterior, provocará la tarjeta de imagen (de hecho, se perderá). Para ahorrar espacio, las películas en la red suelen utilizar bastantes fotogramas B. Cuantos más fotogramas B se utilicen, más problemas tendrán los jugadores que no admitan el fotograma B y más se atascará la imagen.
GOP (secuencia) e IDR
En h264, la imagen está organizada en secuencia y una secuencia es un flujo de datos después de la codificación de imágenes.
La primera imagen de una secuencia se llama imagen IDR (actualice la imagen inmediatamente) y la imagen IDR es una imagen de cuadro I. H. 264 introduce la imagen IDR para resincronizar la decodificación. Cuando el decodificador decodifica la imagen IDR, vaciará inmediatamente la cola de tramas de referencia, emitirá o descartará todos los datos decodificados, buscará el conjunto de parámetros y comenzará una nueva secuencia. De esta manera, si hay un error importante en la secuencia anterior, puede tener la oportunidad de resincronizar aquí. Las imágenes posteriores a las imágenes IDR nunca se decodificarán utilizando datos de imágenes IDR anteriores.
Una secuencia es una serie de flujos de datos generados después de la codificación de imágenes con poca diferencia de contenido. Cuando el movimiento cambia menos, una secuencia puede ser muy larga, porque menos cambios de movimiento representan que el cambio de contenido de la imagen es muy pequeño, por lo que puede hacer un fotograma I, y luego siempre el fotograma P y el fotograma B. Cuando el movimiento cambia mucho, una secuencia puede ser más corta, por ejemplo, contiene un fotograma I y 3 o 4 fotogramas P.
En la secuencia de codificación de video, GOP es un grupo de imágenes, que se refiere a la distancia entre dos cuadros I, y la referencia se refiere a la distancia entre dos cuadros P. Se forma un grupo de imágenes entre los dos fotogramas I, a saber, GOP (grupo de imágenes).
|
Ingrese el correo electrónico para recibir una sorpresa
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikáans
sq.fmuser.org -> albanés
ar.fmuser.org -> árabe
hy.fmuser.org -> Armenio
az.fmuser.org -> azerbaiyano
eu.fmuser.org -> Vasco
be.fmuser.org -> bielorruso
bg.fmuser.org -> Bulgaria
ca.fmuser.org -> catalán
zh-CN.fmuser.org -> chino (simplificado)
zh-TW.fmuser.org -> Chino (tradicional)
hr.fmuser.org -> croata
cs.fmuser.org -> checo
da.fmuser.org -> danés
nl.fmuser.org -> Holandés
et.fmuser.org -> estonio
tl.fmuser.org -> filipino
fi.fmuser.org -> finlandés
fr.fmuser.org -> Francés
gl.fmuser.org -> gallego
ka.fmuser.org -> georgiano
de.fmuser.org -> alemán
el.fmuser.org -> Griego
ht.fmuser.org -> criollo haitiano
iw.fmuser.org -> hebreo
hi.fmuser.org -> Hindi
hu.fmuser.org -> Hungarian
is.fmuser.org -> islandés
id.fmuser.org -> indonesio
ga.fmuser.org -> irlandés
it.fmuser.org -> Italiano
ja.fmuser.org -> japonés
ko.fmuser.org -> coreano
lv.fmuser.org -> letón
lt.fmuser.org -> Lituania
mk.fmuser.org -> macedonio
ms.fmuser.org -> malayo
mt.fmuser.org -> maltés
no.fmuser.org -> Noruega
fa.fmuser.org -> persa
pl.fmuser.org -> polaco
pt.fmuser.org -> portugués
ro.fmuser.org -> Rumano
ru.fmuser.org -> ruso
sr.fmuser.org -> serbio
sk.fmuser.org -> eslovaco
sl.fmuser.org -> Eslovenia
es.fmuser.org -> español
sw.fmuser.org -> Swahili
sv.fmuser.org -> sueco
th.fmuser.org -> Tailandés
tr.fmuser.org -> turco
uk.fmuser.org -> ucraniano
ur.fmuser.org -> Urdu
vi.fmuser.org -> Vietnamita
cy.fmuser.org -> galés
yi.fmuser.org -> Yiddish
FMUSER ¡Transmite video y audio sin cables más fácilmente!
Contacto
Dirección:
Habitación No.305 Edificio HuiLan No.273 Huanpu Road Guangzhou China 510620
Categorías
Newsletter