1 realizado por: joaquín guillén marín dirigido por: eduardo casilari pérez dpto. tecnología...
TRANSCRIPT
1
Realizado por: Joaquín Guillén Marín
Dirigido por: Eduardo Casilari Pérez
Dpto. Tecnología Electrónica - Universidad de Málaga
Málaga 21 de Noviembre de 2003
Caracterización de serviciosde audio en Internet
2
1. Introducción
2. Muestras de tráfico de voz en Internet y
estudios realizados
3. Análisis de las muestras
4. Conclusiones y líneas futuras
Índice
3
1. Introducción
2. Muestras de tráfico de voz en Internet y
estudios realizados
3. Análisis de las muestras
4. Conclusiones y líneas futuras
Índice
4
VoIP
• Transmisión de voz en paquetes de datos que utiliza protocolo IP
• Estándar más que simple tecnología
• A pesar de la calidad se encuentra en alza. Causas del desarrollo:
• Necesidad de integración
• Presencia universal de IP
• Motivaciones económicas
• Evolución de la tecnología
5
VoIP (2)
• Problemática de la transmisión de voz en redes de datos:
• Diferencias del tráfico de voz:
• Tratamiento en tiempo real
• Síncrono
• Perfectamente definible (CBR y simétrico)
• Diferencias de las redes de datos:
• No orientada a conexión
• Enrutamiento basado en datagrama
• Servicio no fiable (best effort))
6
VoIP (3)
• Protocolos y estándares:
• H.323:
• Creado por ITU (1996)Estándar “paraguas”
• Cubre los requerimientos técnicos para servicios de comunicación de audio, vídeo y datos en redes LAN que no proporcionan una QoS garantizada
• 4 tipos de elementos funcionales:
• Terminales
• Gateways
• Gatekeepers o “equipo selector”
• MCU (Multipoint Control Unit)
7
VoIP (5)
• Protocolos y estándares:
• SIP:
• Protocolo para establecimiento de conexiones VoIP (RFC 2543) creado por grupo MMUSIC de IETF (1999)
• Depende del protocolo SDP
• Mensajes codificados utilizando sintaxis HTTP y direcciones identificadas mediante URI: user@host
• Arquitectura basada en un modelo cliente-servidor:
• Agentes de usuario
• Servidores de red
8
VoIP (7)
• Protocolos y estándares:
• Otros protocolos y estándares necesarios:
• MGCP, RTP, RTCP, RTSP, RSVP, SDP y SAP
• Parámetros fundamentales y valores óptimos:
• Pérdida de paquetes (1-5%)
• Retardo (100-150 mseg)
• Jitter (20-60 mseg)
9
Modelo del tráfico de voz
• Digitalizada y encapsulada en paquetes IP
• 65% de una comunicación son silencios Supresión de silencios (VAD). Problemas:
• Clipping o recorte. Solución: Hangover
• Sensación de corte de línea. Solución: Comfort Noise Generator
10
Modelo del tráfico de voz (2)
• Escalas de modelado:
11
Modelo del tráfico de voz (3)
• Nivel de llamada:
• Modelo de Poisson M/M/m/m
• Percepción humana del tiempo logaritmo-normal
• Número de servidores limitado pérdidas:
servidoresdenúmerom
tráficodeIntensidadmB
i
mPm
i
i
m
m
),,(
!
!
0
12
Modelo del tráfico de voz (4)
• Nivel de ráfaga:
• Modelo de actividad de un hablante MMDP
• Agregación de fuentes N fuentes on-off independientes
• Modelo de interacción de hablantes
• Modelos de multiconferencia
13
1. Introducción
2. Muestras de tráfico de voz en Internet y
estudios realizados
3. Análisis de las muestras
4. Conclusiones y líneas futuras
Índice
14
Muestras de tráfico de voz
• Parte importante del proyecto:
• Buscar, recopilar y comprender las muestras
• Estudiar los resultados obtenidos
• Página web con descripción de las muestras y enlaces a las mismas:
• http://pc21te.dte.uma.es/audio/muestras.html
15
Muestras de tráfico de voz (2)
• Muestras generadas por G.729B y NeVoT de la Universidad de Columbia
• Distribución períodos on-off y efectos de la agregación de fuentes
• Modelo tradicional inadecuado. A menor número de fuentes agregadas mayores diferencias
• Muestras generadas por NeVoT de Sprint Labs
• Algoritmos de ajuste del retardo de reproducción
16
Muestras de tráfico de voz (3)
• Muestras de audio de diversos servicios multimedia de la Universidad de California
• Distribución períodos on-off de distintos servicios
• Distribución elegida para modelar los períodos on-off: Weibull, independientemente del servicio
• Muestras de VoIP del proyecto COST-263
• Medida de la calidad
• Calidad aceptable
17
1. Introducción
2. Muestras de tráfico de voz en Internet y
estudios realizados
3. Análisis de las muestras
4. Conclusiones y líneas futuras
Índice
18
Pasos seguidos para el modelado
• Obtención de las muestras: tiempo entre paquetes, números de secuencia
• Análisis: división en períodos on-off, secuencia de pérdidas, valores de jitter
• Modelado: Comparación de estadísticos, comparación visual, test de estadísticos (test 2 y de Kolmogorov-Smirnov), análisis del comportamiento en cola
19
Modelado de los períodos on-off
• Decisión on-off umbral óptimo
• Independiente de paquetización
• Cálculo del nº de períodos detectados
• Umbral 100 mseg fonema
jk
ikkon tT
0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2 0
500
1000
1500
2000
2500
3000
Núm
ero
de p
erí
odos on
dete
ctados
Umbral (seg)
Número de períodos on detectados en función del umbral utilizado
20
Modelado de los períodos on-off (2)
• Estadísticos de la duración on-off dependen del tipo de servicio de voz analizado:
• Conversación: períodos cortos y poca desviación
• Conferencia: períodos on largos y alta desviación
• Teleenseñanza: períodos off largos y desviación elevada
• Multiconferencia: variabilidad muy alta
• Conversación y multiconferencia: correlación
• Períodos on más correlados
21
Modelado de los períodos on-off (3)
• Distribución de los períodos:
• Conversación telefónica: se elige Gamma. Pero log-normal buena para la “cola”
0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 0.2 0.4 0.6 0.8
1 1.2 1.4 1.6 1.8
2 Representación por cuantiles
Cuantiles de la señal original
Cua
ntile
s de
l mod
elo
Señal real Normal (mux=0.32639,six=0.42156) Gamma (a=1.8367,b=0.59947) Weibull (a=0.28338,b=0.78227) Log-normal (muy=-1.6103,siy=0.99065) Pareto (a=2.5864,b=0.51778) Exponencial (mu=0.32639)
1 2 3 4 5 6 7
1 2 3 4 5 6 7 Representación por cuantiles
Cuantiles de la señal original
Cua
ntile
s de
l mod
elo
Señal real Normal (mux=0.44174,six=1.3203) Gamma (a=0.25342,b=0.11195) Weibull (a=0.45593,b=1.0866) Log-normal (muy=-1.965,siy=1.5152) Pareto (a=1.1796,b=0.079333) Exponencial (mu=0.44174)
Períodos on Períodos off
22
Modelado de los períodos on-off (4)
• Distribución de los períodos:
• Conferencia: se elige log-normal, aunque Gamma también es una buena candidata
50 100 150 200 250 300
50
100
150
200
250
300 Representación por cuantiles
Cuantiles de la señal original
Cua
ntile
s de
l mod
elo
Señal real Normal (mux=20.6369,six=73.6325) Gamma (a=0.0038063,b=0.07855) Weibull (a=22.6051,b=1.3856) Log-normal (muy=1.7173,siy=1.6185) Pareto (a=1.1162,b=2.3986) Exponencial (mu=20.6369)
5 10 15 20 25 30 35 40 5
10 15 20 25 30 35 40
Representación por cuantiles
Cuantiles de la señal original
Cua
ntile
s de
l mod
elo
Señal real Normal (mux=3.2808,six=13.7955) Gamma (a=0.017239,b=0.056556) Weibull (a=3.6469,b=1.5465) Log-normal (muy=-0.27569,siy=1.711) Pareto (a=1.215,b=0.70521) Exponencial (mu=3.2808)
Períodos on Períodos off
23
Modelado de los períodos on-off (5)
• Distribución de los períodos:
• Receptores de clase de teleenseñanza: se elige Gamma, pero también posible incluso normal
5 10 15 20 25
5
10
15
20
25 Representación por cuantiles
Cuantiles de la señal original
Cua
ntile
s de
l mod
elo
Señal real Normal (mux=6.3089,six=6.981) Gamma (a=0.12945,b=0.81672) Weibull (a=6.0145,b=0.90512) Log-normal (muy=1.4422,siy=0.89414) Pareto (a=5.042,b=25.5006) Exponencial (mu=6.3089)
200 400 600 800 1000 1200 1400 1600
200 400 600 800
1000 1200 1400 1600
Representación por cuantiles
Cuantiles de la señal original
Cua
ntile
s de
l mod
elo
Señal real Normal (mux=375.135,six=507.4622) Gamma (a=0.0014567,b=0.54647) Weibull (a=315.0902,b=0.75006) Log-normal (muy=5.4072,siy=1.0199) Pareto (a=6.7423,b=2154.1389) Exponencial (mu=375.135)
Períodos on Períodos off
24
Modelado de los períodos on-off (6)
• Distribución de los períodos:
• Participantes en sesión de multiconferencia: ajuste visual Gamma, pero se elige Weibull
50 100 150 200 250 300 350 400 450 50
100 150 200 250 300 350 400 450
Representación por cuantiles
Cuantiles de la señal original
Cua
ntile
s de
l mod
elo
Señal real Normal (mux=26.5031,six=71.7962) Gamma (a=0.0051416,b=0.13627) Weibull (a=10.0911,b=0.43876) Log-normal (muy=2.2168,siy=1.4563) Pareto (a=1.1162,b=3.0797) Exponencial (mu=26.5031)
20 40 60 80 100 120 140 160 180 200 20 40 60 80
100 120 140 160 180 200
Representación por cuantiles
Cuantiles de la señal original
Cua
ntile
s de
l mod
elo
Señal real Normal (mux=18.9673,six=36.0001) Gamma (a=0.014635,b=0.27759) Weibull (a=11.5966,b=0.56485) Log-normal (muy=2.1794,siy=1.2355) Pareto (a=1.7111,b=13.4868) Exponencial (mu=18.9673)
Períodos on Períodos off
25
Modelado de los períodos on-off (7)
• Comportamiento en cola:
45 50 55 6010
-5
10-4
10-3
10-2
10-1
100
101
102
Comparación del porcentaje de pérdidas
Porcentaje de ocupación de la cola (%)
Por
cent
aje
de p
érdi
das
en c
ola
(%)
Serie original; N=5 Serie original; N=50 Serie original; N=100 Distribución gamma; N=5 Distribución gamma; N=50 Distribución gamma; N=100 Distribución weibull; N=5 Distribución weibull; N=50 Distribución weibull; N=100
86 88 90 92 94 96 98 10010
-4
10-3
10-2
10-1
100
101
102
Comparación del porcentaje de pérdidas
Porcentaje de ocupación de la cola (%)
Por
cent
aje
de p
érdi
das
en c
ola
(%)
Serie original; N=5 Serie original; N=50 Serie original; N=100 Distribución log-normal; N=5 Distribución log-normal; N=50 Distribución log-normal; N=100Distribución gamma; N=5 Distribución gamma; N=50 Distribución gamma; N=100
Conversación telefónica Conferencia
26
Modelado de los períodos on-off (8)
• Comportamiento en cola:
25 30 35 4010
-2
10-1
100
101
102
Comparación del porcentaje de pérdidas
Porcentaje de ocupación de la cola (%)
Por
cent
aje
de p
érdi
das
en c
ola
(%)
Serie original; N=700 Serie original; N=720 Serie original; N=800 Distribución gamma; N=700 Distribución gamma; N=720 Distribución gamma; N=800 Distribución weibull; N=700Distribución weibull; N=720Distribución weibull; N=800
58 60 62 64 66 68 7010
-1
100
101
Comparación del porcentaje de pérdidas
Porcentaje de ocupación de la cola (%)
Por
cent
aje
de p
érdi
das
en c
ola
(%)
Serie original; N=5 Serie original; N=50 Serie original; N=100 Distribución weibull; N=5 Distribución weibull; N=50 Distribución weibull; N=100Distribución gamma; N=5 Distribución gamma; N=50 Distribución gamma; N=100
Receptores de clase de teleenseñanza
Participantes en sesión de multiconferencia
27
Modelado de los períodos on-off (9)
• Comportamiento en cola:
• Validación del modelo elegido mediante ajuste visual y test estadísticos
• El modelo imita mejor para colas pequeñas con un alto grado de ocupación
• Dificultad de modelado
28
Pérdidas
• Calidad aceptable:
• Media=0.938% (<1%, porcentaje óptimo)
• Desviación=3.895%
• Más del 90% de las conversaciones no superan el porcentaje óptimo dificultad de modelado
• Depende de distintos factores
29
Pérdidas (2)
• Aumenta coincidiendo con las horas y días de la semana laborables
• Ni la paquetización utilizada ni la supresión de silencio provocan efectos significativos
• El factor más influyente es el par origen-destino de la comunicación Asimetría de la red
30
Pérdidas (3)
• Tiempo entre pérdidas:
• Gran variabilidad
• Efecto de la red: valores mínimos muy pequeños
• Existe correlación a largo plazo pérdidas a intervalos de tiempo parecidos
10 0 10 1 10 2 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
1 Autocorrelación normalizada del tiempo entre pérdidas
Retraso (número de muestra)
Coe
ficie
ntes
de
la a
utoc
orre
laci
ón
31
Pérdidas (4)
Períodos off
• Tiempo entre pérdidas:
• Tras el análisis se elige la distribución log-normal (comportamiento subexponencial)
50 100 150 200 250 300 350 400 450 50
100 150 200 250 300 350 400 450
Representación por cuantiles
Cuantiles de la señal original
Cua
ntile
s de
l mod
elo
Señal real Normal (mux=26.5031,six=71.7962) Gamma (a=0.0051416,b=0.13627) Weibull (a=10.0911,b=0.43876) Log-normal (muy=2.2168,siy=1.4563) Pareto (a=1.1162,b=3.0797) Exponencial (mu=26.5031)
20 40 60 80 100 120 140 160 180 200 20 40 60 80
100 120 140 160 180 200
Representación por cuantiles
Cuantiles de la señal original
Cua
ntile
s de
l mod
elo
Señal real Normal (mux=18.9673,six=36.0001) Gamma (a=0.014635,b=0.27759) Weibull (a=11.5966,b=0.56485) Log-normal (muy=2.1794,siy=1.2355) Pareto (a=1.7111,b=13.4868) Exponencial (mu=18.9673)
Períodos on
2 4 6 8 10 12
2
4
6
8
10
12 Representación por cuantiles
Cuantiles de la señal original
Cua
ntile
s de
l mod
elo
Señal real Normal (mux=0.68133,six=3.4983) Gamma (a=0.055673,b=0.037932) Weibull (a=0.76318,b=1.6861) Log-normal (muy=-2.0383,siy=1.8191) Pareto (a=2.2828,b=0.87401) Exponencial (mu=0.68133)
0 20 40 60 80 100 120 140 10 -20
10 -15
10 -10
10 -5
10 0
Tiempo entre pérdidas (seg)
Pro
babi
lidad
Función de densidad de probabilidad
real normal gamma weibull log-normal pareto exponencial
32
Pérdidas (5)
• Tamaño en número de paquetes de las ráfagas de pérdidas:
• Importante caracterizarla debido a que las pérdidas en internet se suceden a ráfagas y los algoritmos de codificación las compensan mal
• Más de la mitad de las pérdidas son simples (mediana=1)
• Aunque existen ráfagas (máxima=2240)
• Fuertemente correlado
33
Pérdidas (6)
• Tamaño en número de paquetes de las ráfagas de pérdidas:
• Distribución binomial negativa elegida
0 5 10 15 20 25 300
5
10
15
20
25
30Representación por cuantiles
Cuantiles de la señal original
Cu
an
tile
s d
el
mo
de
lo
Señal real Geometrica (p=0.31612) Poisson (beta=2.1633) Binomial (n=2240,p=0.00096576) Binomial negativa (p=0.01494,r=0.03281)
100
101
102
103
104
10-20
10-15
10-10
10-5
100
Número de pérdidas consecutivas
Pro
ba
bili
da
d
Función de densidad de probabilidad
Señal real Geometrica Poisson Binomial Binomial negativa
34
Jitter
• Desviación media, suavizada en valor absoluto, de la variación del tiempo entre paquetes entre tx y rx (RFC1889)
• Paquetes con jitter excesivo deberán ser descartados Pérdidas
• También en este caso la calidad es aceptable:
• Media=3.731 mseg (<20 mseg, valor óptimo)
• Desviación fortísima
)()()()( ijijiijj ttrrtrtrJ
35
Jitter (2)
• Efectos similares a los de las pérdidas
• Aumenta coincidiendo con las horas y días de la semana laborables
• El jitter se incrementa al aumentar la paquetización utilizada, pero la supresión de silencio no provoca efectos significativos
• De nuevo el par origen-destino es el factor más influyente (asimetría de la red)
36
Jitter (3)
• Aunque existen diferencias cuantitativas, los resultados cualitativos son similares para ambas paquetizaciones
• Parece existir cierta dependencia a largo plazo
0 10 20 30 40 50 60 70 80 90 100 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
1 Autocorrelación del jitter
Retraso (número de muestra)
Coe
ficie
ntes
de
la a
utoc
orre
laci
ón
0 10 20 30 40 50 60 70 80 90 100 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
1 Autocorrelación del jitter
Retraso (número de muestra)
Coe
ficie
ntes
de
la a
utoc
orre
laci
ón
Paquetización=20 mseg Paquetización=80 mseg
37
Jitter (4)
• El jitter se distribuye de forma subexponencial con cierta tendencia hiperbólica
• Aparecen picos alrededor de la paquetización utilizada
• Son debidos al efecto de la red (los paquetes llegan al destino juntos)
10 -3 10 -2 10 -1 10 0 10 0 10 1 10 2 10 3 10 4 10 5 10 6 10 7 Número de ocurrencias de cada valor de jitter
Jitter (seg)
Núm
ero
de o
curr
enci
as
10 -3 10 -2 10 -1 10 0 10 0 10 1 10 2 10 3
10 4 10 5
10 6 Número de ocurrencias de cada valor de jitter
Jitter (seg)
Núm
ero
de o
curr
enci
as
Paquetización=20 mseg Paquetización=80 mseg
38
Jitter (5)
• Distribución elegida para modelar el jitter: log-normal y Pareto (sobre todo para la cola), independientemente de la paquetización
0.005 0.01 0.015 0.02 0.025 0.03 0.035 0.04 0.045 0.05 0.055 0.005
0.01 0.015
0.02 0.025
0.03 0.035
0.04 0.045
0.05 0.055
Representación por cuantiles
Cuantiles de la señal original
Cua
ntile
s de
l mod
elo
Señal real Normal (mux=0.0020893,six=0.0045184) Gamma (a=102.3354,b=0.21381) Weibull (a=0.001091,b=0.51217) Log-normal (muy=-7.0392,siy=1.3177) Pareto (a=2.1182,b=0.0023363) Exponencial (mu=0.0020893)
0 0.5 1 1.5 10 -20
10 -15
10 -10
10 -5
10 0
Jitter (seg)
Pro
babi
lidad
Función de densidad de probabilidad
real normal gamma weibull log-normal pareto exponencial
Paquetización=20 mseg
0.01 0.02 0.03 0.04 0.05 0.06 0.07
0.01 0.02 0.03 0.04 0.05 0.06 0.07
Representación por cuantiles
Cuantiles de la señal original
Cua
ntile
s de
l mod
elo
Señal real Normal (mux=0.0032083,six=0.0060593) Gamma (a=87.3847,b=0.28036) Weibull (a=0.0019726,b=0.56702) Log-normal (muy=-6.5014,siy=1.2324) Pareto (a=2.0267,b=0.0032941) Exponencial (mu=0.0032083)
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 10 -20
10 -15
10 -10
10 -5
10 0
Jitter (seg)
Pro
babi
lidad
Función de densidad de probabilidad
real normal gamma weibull log-normal pareto exponencial
Paquetización=80 mseg
39
1. Introducción
2. Muestras de tráfico de voz en Internet y
estudios realizados
3. Análisis de las muestras
4. Conclusiones y líneas futuras
Índice
40
Conclusiones
• Duración de los períodos on-off:
• Distribución subexponencial:
• Conversación telefónica Gamma
• Conferencia en aula Log-normal
• Receptores clase de teleenseñanza Gamma
• Participantes en sesiones multimedia Weibull
• Comportamiento en cola:
• Resultados similares en cuanto a la distribución elegida
• Mayor parecido entre serie real y modelo para colas de tamaño pequeño y grado de ocupación elevado
41
Conclusiones (2)
• Pérdidas
• Dependencia de hora, día y origen-destino, pero no de la paquetización y supresión de silencio
• Tiempo entre pérdidas:
• Correlado
• Distribuido de forma subexponencial Log-normal
• Pérdidas consecutivas:
• Pérdidas simples
• Distribución Binomial negativa
42
Conclusiones (3)
• Jitter
• Dependencia de hora, día y origen-destino, pero no de la paquetización y supresión de silencio
• Existencia de cierta correlación
• Distribuido de forma subexponencial Log-normal, independientemente de la paquetización
• Valor típico en torno a la paquetización utilizada debido a la deformación que produce la red
43
Líneas futuras
• Captura propia: mayor duración, mayor número de características
• Ampliar el número de servicios analizados Ejemplo: streaming
• Mayor número de nodos, ámbito más global
• Nodos comerciales
• Dependencia del codec en cuanto al porcentaje de pérdidas y jitter
44
Realizado por: Joaquín Guillén Marín
Dirigido por: Eduardo Casilari Pérez
Dpto. Tecnología Electrónica - Universidad de Málaga
Málaga 21 de Noviembre de 2003
Caracterización de serviciosde audio en Internet