teor a de series temporales · evolución futura, siempre bajo el supuesto de que las condiciones...

47
Introducción p11 TEORÍA DE SERIES TEMPORALES 1 INTRODUCCIÓN Una serie temporal es un conjunto de observaciones ordenadas en el tiempo o, también, la evolución de un fenómeno o variable a lo largo de él. Esta variable puede ser económica (ventas de una empresa, consumo de cierto producto, evolución de los tipos de interés,...), física (evolución del caudal de un río, de la temperatura de una región, etc.) o social (número de habitantes de un país, número de alumnos matriculados en ciertos estudios, votos a un partido,...). El objetivo del análisis de una serie temporal, de la que se dispone de datos en períodos regulares de tiempo, es el conocimiento de su patrón de comportamiento para prever la evolución futura, siempre bajo el supuesto de que las condiciones no cambiarán respecto a las actuales y pasadas. Si al conocer la evolución de la serie en el pasado se pudiese predecir su comportamiento futuro sin ningún tipo de error, estaríamos frente a un fenómeno determinista cuyo estudio no tendría ningún interés especial. Esto correspondería a una situación como la de la figura 1.1, que muestra la intensidad de corriente, I, que circula a través de una resistencia, R, sometida a un voltaje sinusoidal, V(t) = a cos (vt + θ); por tanto I(t) = a cos (vt + θ)/R. -1,5 -1 -0,5 0 0,5 1 1,5 0 20 40 60 80 t I(t) Fig. 1.1.- Observaciones de la serie I(t) = cos (0,5t + π/2) En general, las series de interés llevan asociados fenómenos aleatorios, de forma que el estudio de su comportamiento pasado sólo permite acercarse a la estructura o modelo probabilístico para la predicción del futuro. Estos modelos se denominan también procesos estocásticos. Así, un proceso estocástico es una sucesión de variables aleatorias {Y t }, con t = 1, 2, ..., n, que evolucionan con el tiempo ( representado éste por el subíndice t). Cuando se dispone de n datos de un proceso estocástico, se está frente a n muestras, de tamaño unidad, extraídas de la población (variable aleatoria), correspondientes al tiempo en que se realizó la medición, y esto es lo que constituye la serie temporal o cronológica. Como ejemplo puede servir la evolución a lo largo de un año del índice IBEX35, que recoge los 35 valores de mayor cotización de la bolsa española, representada en la figura 1.2. © Los autores, 2001; © Edicions UPC, 2001.

Upload: dothu

Post on 27-Oct-2018

218 views

Category:

Documents


0 download

TRANSCRIPT

Introducción p11

TEORÍA DE SERIES TEMPORALES

1 INTRODUCCIÓN

Una serie temporal es un conjunto de observaciones ordenadas en el tiempo o, también, laevolución de un fenómeno o variable a lo largo de él. Esta variable puede ser económica(ventas de una empresa, consumo de cierto producto, evolución de los tipos de interés,...),física (evolución del caudal de un río, de la temperatura de una región, etc.) o social (númerode habitantes de un país, número de alumnos matriculados en ciertos estudios, votos a unpartido,...).

El objetivo del análisis de una serie temporal, de la que se dispone de datos en períodosregulares de tiempo, es el conocimiento de su patrón de comportamiento para prever laevolución futura, siempre bajo el supuesto de que las condiciones no cambiarán respecto alas actuales y pasadas.

Si al conocer la evolución de la serie en el pasado se pudiese predecir su comportamientofuturo sin ningún tipo de error, estaríamos frente a un fenómeno determinista cuyo estudiono tendría ningún interés especial. Esto correspondería a una situación como la de la figura1.1, que muestra la intensidad de corriente, I, que circula a través de una resistencia, R,sometida a un voltaje sinusoidal, V(t) = a cos (vt + θ); por tanto I(t) = a cos (vt + θ)/R.

-1,5

-1

-0,5

0

0,5

1

1,5

0 20 40 60 80 t

I(t)

Fig. 1.1.- Observaciones de la serie I(t) = cos (0,5t + π/2)

En general, las series de interés llevan asociados fenómenos aleatorios, de forma que elestudio de su comportamiento pasado sólo permite acercarse a la estructura o modeloprobabilístico para la predicción del futuro. Estos modelos se denominan también procesosestocásticos. Así, un proceso estocástico es una sucesión de variables aleatorias {Yt}, cont = 1, 2, ..., n, que evolucionan con el tiempo ( representado éste por el subíndice t).

Cuando se dispone de n datos de un proceso estocástico, se está frente a n muestras, detamaño unidad, extraídas de la población (variable aleatoria), correspondientes al tiempo enque se realizó la medición, y esto es lo que constituye la serie temporal o cronológica.

Como ejemplo puede servir la evolución a lo largo de un año del índice IBEX35, que recogelos 35 valores de mayor cotización de la bolsa española, representada en la figura 1.2.

© Los autores, 2001; © Edicions UPC, 2001.

p12 Series temporales

Lógicamente, el valor del IBEX35 dependerá del valor alcanzado en los días previos,además de recoger la influencia de un conjunto de factores sociales, políticos, económicos,etc., que son continuamente cambiantes en el tiempo y cuya conjunción, en un determinadoinstante, configuraría una hipotética distribución de probabilidad del citado índice económico.

En casos como éste, es evidente que puede obtenerse un modelo que explique elcomportamiento de la serie en el período estudiado, pero puede ser muy arriesgada lautilización de este modelo para hacer previsiones a medio o largo plazo. Así, en todas lasseries cronológicas, es necesaria una gran cautela en la previsión a causa de la muyprobable inestabilidad del modelo en un futuro más o menos alejado del último instante delque se conocen datos.

3

3,5

4

4,5

5

enero diciembre

IBEX35

Fig. 1.2.- Evolución del índice IBEX35

Otro ejemplo puede ser el constituido por la sucesión de variables aleatorias {Y1, ...,Yt,...},tales que t t 1 tY 0,80Y −= + ε , con Y0 = 0 y los tε distribuidos N(0; 1), independientes para todo

t = 1, 2,...

Esta serie puede expresarse también como t

t it i

i 1

Y 0,8 −

=

= ε∑ y la distribución de

probabilidad de cualquier Yt corresponde a una ley Normal, con esperanza matemáticat t

t it

i 1

1 0,8E(Y ) 0,8

0,2−

=

−= =∑ y variancia t t

2(t i)t

i 1

1 0,64V(Y ) 0,8

0,36−

=

−= =∑ .

La figura 1.3 muestra la ley de probabilidad de la variable Y en los instantes t = 1, t = 4 y t =20, junto con la serie cronológica compuesta por las 25 primeras observaciones de lamisma.

La particular forma de la información disponible de una serie cronológica, n muestras detamaño unidad procedentes de otras tantas poblaciones de distribución y característicasdesconocidas, hacen que las técnicas de inferencia estadística, usualmente aplicadas enmuestras de tamaño superior a la unidad, no sean válidas para estos casos.

© Los autores, 2001; © Edicions UPC, 2001.

Introducción p13

En los capítulos siguientes se pretende presentar, de forma simple, distintos criteriosmetodológicos que permitan el estudio de estos fenómenos, y en particular la previsión desu evolución futura, para aplicarlos a campos técnicos y económicos, como por ejemploprevisión de las ventas de una empresa, de los usuarios de un medio de transporte, de lacaracterística de interés de un proceso continuo, etc.

Yt

-10

-5

0

5

10

15

20

0 5 10 15 20 25

Fig. 1.3.- Distribución de Yt y 25 observaciones de la serie

Todas las formas de estudio de una serie cronológica, tal como se irá viendo, no conllevancálculos complicados, pero sí reiterativos, con gran volumen de datos manipulados y conabundancia de gráficos; es por ello que para su estudio se hace muy necesario el disponerde un programa informático que permita su correcta aplicación y la obtención de cuantosgráficos sean necesarios.

© Los autores, 2001; © Edicions UPC, 2001.

p14 Series temporales

2. ANÁLISIS DE UNA SERIE TEMPORAL

Antes de abordar cualquier estudio analítico de una serie temporal, se impone unarepresentación gráfica de la misma y la observación detenida de su aspecto evolutivo.

Para estudiar el comportamiento de cualquier serie temporal, y predecir los valores quepuede tomar en un futuro, puede hablarse de distintas metodologías, que denominaremosmodelización por componentes y enfoque Box-Jenkins.

2.1 Modelizacion por componentes

Este método consiste en identificar, en la serie Yt, cuatro componentes teóricas, que notienen por qué existir todas, y que son:

Tendencia: Tt.

Estacionalidad: Et.

Ciclos: Ct.

Residuos: Rt.

Cada una de estas componentes es una función del tiempo y el análisis consistirá en laseparación y obtención de cada una de ellas, así como en determinar de qué forma seconjugan para dar lugar a la serie original. Estas componentes se pueden observar en lafigura 2.1, en donde se ha considerado que actúan de forma aditiva para dar lugar a la seriecronológica.

La tendencia es la componente general a largo plazo y se suele expresar como una función

del tiempo de tipo polinómico o logarítmico, por ejemplo Tt = α0 + α1 t+ α2 t2 + …

Las variaciones estacionales son oscilaciones que se producen, y repiten, en períodos detiempo cortos. Pueden estar asociadas a factores dinámicos, por ejemplo la ocupaciónhotelera, la venta de prendas de vestir, de juguetes, etc., cuya evolución está claramenteligada a la estacionalidad climática, vacacional, publicitaria, etc.

Las variaciones cíclicas se producen a largo plazo y suelen ir ligadas a etapas deprosperidad o recesión económica. Suelen ser tanto más difíciles de identificar cuanto máslargo sea su período, debido, fundamentalmente, a que el tiempo de recogida deinformación no aporta suficientes datos, por lo que a veces quedarán confundidas con lasotras componentes.

© Los autores, 2001; © Edicions UPC, 2001.

Análisis de una serie temporal p15

TENDENCIA

ESTACIONALIDAD

CICLOS

RESIDUOS

100

125

150

175

200

-40

-20

0

20

40

-60

-30

0

30

60

-5

-3

0

3

5

0

100

200

300

SERIE

CRONOLÓGICA

Fig. 2.1.- Componentes de una serie cronológica

La componente residual es la que recoge la aportación aleatoria de cualquier fenómenosujeto al azar.

© Los autores, 2001; © Edicions UPC, 2001.

p16 Series temporales

Para evaluar las distintas componentes se utilizan técnicas estadísticas tales como modelolineal, medias móviles, diferencias finitas, etc.

Admitiendo que el componente aleatorio (residuo) es aditivo, una vez identificadas las otrascomponentes surge un nuevo problema que es el cómo conjuntar tendencia, estacionalidady ciclos para dar lugar a la serie definitiva.

Así se proponen, entre otros, modelos genéricamente denominados aditivos ymultiplicativos.

Modelo aditivo: Y = T + E + C + R

Modelo multiplicativo: Y = T x E x C + R

Para una primera identificación visual del caso, se puede considerar que si el patrónestacional se mantiene con amplitud constante se tratará de modelo aditivo (figuras 2.1 y2.2). Cuando dicho patrón se vaya amplificando con el tiempo, será multiplicativo (figura2.3).

50

100

150

200

250

t

Y

Fig. 2.2.- Serie aditiva

0

100

200

300

400

t

Y

Fig. 2.3.- Serie multiplicativa

© Los autores, 2001; © Edicions UPC, 2001.

Análisis de una serie temporal p17

Un modelo aditivo se puede interpretar como aquel en que la estacionalidad actúamodificando la ordenada en el origen de la tendencia.

Supongamos que no hay ciclos, que la tendencia es de tipo lineal, Tt = α0 + α1 t, y que laestacionalidad es de período p = 4, es decir, cada 4 unidades de tiempo se repite el patrón(tal como ocurre en la figura 2.2). Representando sus valores por E1, E2, E3 y E4,respectivamente, el modelo aditivo se puede escribir como

Y1 = α0 + α1 × 1 + E1 + R1 = γ1 + α1 × 1 + R1

Y2 = α0 + α1 × 2 + E2 + R2 = γ2 + α1 × 2 + R2

Y3 = α0 + α1 × 3 + E3 + R3 = γ3 + α1 × 3 + R3

Y4 = α0 + α1 × 4 + E4 + R4 = γ4 + α1 × 4 + R4

Y5 = α0 + α1 × 5 + E1 + R5 = γ1 + α1 × 5 + R5

… …. ….

Yt = α0 + α1 × t + Es + Rt = γs + α1 × t + Rt con t = p$ + s; s = 1, …, p

Así pues, cada estación (s) componente del período conforma una recta con ordenada en elorigen distinta para cada caso y pendiente común a todos; es decir, según muestra la figura2.4, el modelo es un conjunto de rectas paralelas, cada una de ellas asociada a unaestación.

En el modelo multiplicativo, el componente estacional actúa sobre la ordenada en el origen ysobre la pendiente.

50

100

150

200

250

t

Y

Fig. 2.4.- Interpretación de una serie con modelo aditivo

Prescindiendo de los ciclos, supuesta una tendencia lineal tipo Tt = α0 + α1t y unaestacionalidad de período p, para cualquier t = p$ + s, con s = 1, …, p, resulta

© Los autores, 2001; © Edicions UPC, 2001.

p18 Series temporales

Yt = Tt × Es + Rt = (α0 + α1t) Es + Rt,

es decir Yt = (α0 Es ) + ( α1Es ) t + Rt

o sea Yt = γ0s + γ1s t + Rt

De esta forma, cada una de las p estaciones del período configura una recta distinta, tantoen lo que se refiere a la ordenada en el origen (γ0s) como a la pendiente (γ1s).

El conjunto de las p rectas constituye el modelo de comportamiento de la serie (figura 2.5).

Es evidente que esta división, en modelo estrictamente aditivo o estrictamente multiplicativo,es bastante restrictiva, ya que puede darse el caso de que en algunas estaciones cambiesólo la pendiente, o sólo la ordenada en el origen. Esto constituiría un modelo mixto muchomás general que los propuestos hasta ahora, los cuales pasarían a ser meros casosparticulares de éste. En la figura 2.6 se presenta una situación de este tipo.

0

100

200

300

400

500

t

Y

Fig. 2.5.- Interpretación de una serie con modelo multiplicativo

0

50

100

150

200

t

Y

Fig. 2.6.- Modelo general

© Los autores, 2001; © Edicions UPC, 2001.

Análisis de una serie temporal p19

2.2 Enfoque Box - Jenkins

La forma de encarar el análisis de las series temporales a través de la metodología de Box-Jenkins es dirigir el esfuerzo a determinar cuál es el modelo probabilístico que rige elcomportamiento del fenómeno a lo largo del tiempo. Es decir, partiendo de la premisa deque no siempre va a ser posible identificar los componentes de la serie, se trata de estudiarel componente aleatorio puro, reflejado en los residuos.

La metodología estadística utilizada en el estudio de una serie temporal por este sistema, sebasa en los siguientes pasos:

Identificación del modelo.

Estimación de los parámetros.

Validación de los supuestos admitidos en el análisis, también llamado diagnosis delmodelo.

Para poder abordar esta metodología es imprescindible, en primer lugar, estudiar unconjunto de modelos de comportamiento que cubran el mayor espectro posible de losprocesos estocásticos objeto de nuestro interés. Entre ellos se pueden destacar losprocesos de ruido blanco, medias móviles (MA), autorregresivos (AR), integrados (I) y susconjunciones (ARMA y ARIMA). A partir de aquí se podrá identificar la serie de datos conalguno de los modelos estudiados, estimar sus parámetros y validar la admisibilidad delmodelo adoptado.

En general, se suele asumir que el componente aleatorio, el cual se representa por Z, sigueuna distribución Normal de media cero y variancia σ2. Un proceso estocástico en que todossus componentes son independientes y están constituidos sólo por componente aleatorio sedenomina proceso de ruido blanco, es decir, Yt = Zt con Zt ∼ NINDEP(0; σ2) ∀t.

Un proceso se denomina de media móvil de orden q, y se representa por MA(q), si suestructura es del tipo Yt = Zt + αt-1 Zt-1 + … + αt-q Zt-q. En la figura 2.7 se muestra un MA(4).

-4

-3

-2

-1

0

1

2

3

4

t

Y

Fig. 2.7.- Proceso de media móvil MA(4)

© Los autores, 2001; © Edicions UPC, 2001.

p20 Series temporales

Un proceso es autorregresivo de orden p, y se representa por AR(p), cuando cadacomponente es función de los anteriores más el término aleatorio; su estructura correspondea

Yt = Zt + βt-1 Yt-1 + … + βt-p Yt-p

En la figura 2.8 se muestra un AR(2).

Cuando a las estructuras de autorregresión y media móvil se une una dependencia con eltiempo se llega a un ARIMA(p, r, q), donde p es el orden del AR, q el del MA y r el delproceso integrado, o, lo que es lo mismo, el grado del polinomio que representa la funcióndel tiempo. En la figura 2.9 se presenta un proceso ARIMA(2,1,3).

-4

-3

-2

-1

0

1

2

3

4

t

Y

Fig. 2.8.- Proceso autorregresivo AR(2)

0

10

20

30

40

50

60

70

80

90

t

Y

Fig. 2.9.- Proceso ARIMA(2, 1, 3)

© Los autores, 2001; © Edicions UPC, 2001.

Descomposición de una serie temporal p21

3 DESCOMPOSICIÓN DE UNA SERIE TEMPORAL

Este método, también denominado sistema clásico, descompone la serie en tendencia,estacionalidad, ciclos y residuos Una vez decidida la conjunción entre ellos, aditiva omultiplicativa, se obtiene el modelo con el que hacer previsiones.

La tendencia es la componente más importante de la serie, al definir lo que se podríainterpretar como comportamiento a largo plazo. Cada observación va ligada a un valor deltiempo, lo que permite plantear un modelo del tipo

Y (t)= φ + ε

donde la función φ(t) puede ser:

lineal: φ(t) = α0 + α1t

polinómica: φ(t) = α0 + α1t + α2 t2 + ...

exponencial: φ(t) = α0 t α1

Si la serie no presenta estacionalidad, el método de estimación mínimo-cuadrática y todaslas pruebas de hipótesis relativas a la explicación del modelo y a la significación de loscoeficientes estimados, propios del modelo lineal ordinario, permiten estimar loscoeficientes del modelo de tendencia sobre los datos directos.

Caso de existir componente estacional, para que ésta no enmascare la tendencia, esnecesario estabilizar previamente la serie.

Para desarrollar la metodología de la descomposición clásica sobre un ejemplo, se disponede los datos relativos a las ventas de material deportivo en una gran superficie comercial,recogidos en la tabla 3.I y representados en la figura 3.1. En esta tabla el tiempo (t) se hamedido tomando como referencia el inicio del período de recogida de datos, y, en este caso,su unidad es el trimestre.

La observación de la figura 3.1, permite pensar en una tendencia lineal creciente y unaestacionalidad clara, cuyo patrón se repite anualmente, es decir, cada 4 valores del tiempo(trimestres). Esto se puede interpretar como una tendencia sostenida de un aumento de lasventas en esta superficie comercial, unida a un comportamiento distinto para cada uno delos cuatro trimestres; debido, posiblemente, a que el precio del material deportivo es muydistinto según sea el adecuado para una estación concreta (material de esquí frente aentretenimiento de playa, por ejemplo). Por otra parte, el patrón estacional se mantiene conuna amplitud aproximadamente constante, lo que conduce a la utilización de un modeloaditivo.

© Los autores, 2001; © Edicions UPC, 2001.

p22 Series temporales

Año Trimestre Ventas (Y) t1990 1

234

40,2254,8963,51111,35

1234

1991 1234

46,9551,6261,47108,58

5678

1992 1234

41,3865,3064,25113,82

9101112

1993 1234

53,3459,3766,15121,5

13141516

1994 1234

67,3856,0975,11124,39

17181920

1995 1234

55,9061,2575,44126,50

21222324

Tabla 3.I.- Ventas de material deportivo

40

70

100

130

0 4 8 12 16 20 24 t

Y

Fig. 3.1.- Evolución cronológica de las ventas de material deportivo

En este ejemplo se ha identificado un patrón estacional compuesto por los cuatro trimestresy que se repite de año en año, además de una tendencia aparentemente lineal. Si sedecidiese ajustar el modelo de tendencia directamente sobre los datos, se obtendrían losresultados de la tabla 3.II.

© Los autores, 2001; © Edicions UPC, 2001.

Descomposición de una serie temporal p23

nu S. C. C. M. F p-valRegresión 1 1901,300 1901,300 2,677 0,116Residuos 22 15623,686 710,168Total 23 17524,985

Coef. Error típico t p-valOrd. Origen 57,501 11,229 5,121 0,000t 1,286 0,786 1,636 0,116

R^2 = 0,10849

Tabla 3.II.- Modelo de tendencia ajustado sobre todos los datos: Y = α0 + α1

t + ε

El modelo presenta un coeficiente de determinación (R^2) tan sólo del 10,8% y no resultaestadísticamente significativo, ya que el nivel de significación (p-val), tanto del ajuste comode la pendiente de la recta de tendencia, son claramente superiores a un riesgo de primeraespecie del 5%. Así, se demuestra que este procedimiento no es válido ya que incluye en elresiduo todo el componente estacional, lo cual produce una inflación de la suma decuadrados residual que desvirtúa el modelo y cualquier prueba de significación de laregresión y de sus coeficientes.

Para evitar esto es necesario estabilizar la serie liberándola de la estacionalidad; esto sepodría conseguir trabajando con los valores medios anuales, que son los de la tabla 3.III. Enla tabla 3.IV se detallan los resultados del cálculo del modelo de tendencia, considerado tiporectilíneo.

Y a t (años) Y a t (años)

67,4925

67,1550

71,1875

1

2

3

75,0900

80,7425

79,7725

4

5

6

Tabla 3.III.- Medias anuales de ventas de material deportivo

nu S.C. C.M. F p-valRegresión 1 160,711 160,711 42,073 0,003Residuos 4 15,279 3,820Total 5 175,991

Coef. Error típico t p-valOrd. Origen 62,967 1,819 34,607 0,000t(años) 3,030 0,467 6,486 0,003

R^2 = 0,91318

Tabla 3.IV.- Modelo lineal para las medias anuales

© Los autores, 2001; © Edicions UPC, 2001.

p24 Series temporales

Ahora ya se ha obtenido un modelo de tendencia altamente significativo y con un buenajuste (R^2 = 91,3%). En la figura 3.2 se han representado las medias anuales junto a laestimación del modelo de tendencia; se observa la estabilización conseguida en los valoresde las medias anuales, ya que mientras los datos directos oscilaban entre 40 y 130, lasmedias anuales van desde 67 hasta 81.

Hay que destacar que con esta estabilización se ha conseguido un modelo de tendenciasignificativo; sin embargo, ¿es aceptable este procedimiento? La respuesta sería no, ya queeste sistema tiene el inconveniente de la gran pérdida de información, pues de los 24 datosiniciales, se ha acabado estimando el modelo con sólo 6 puntos. Este inconveniente quedapaliado desestacionalizando la serie con las medias móviles.

65

70

75

80

85

0 1 2 3 4 5 6 7

t(años)

Ya

Fig. 3.2.- Evolución y tendencia de la media anual

3.1 Medias móviles: tendencia

Con este método se consiguen suavizar tanto las oscilaciones periódicas de una serie comolas aleatorias. Su aplicación requiere decidir, previamente, el período en que se repite ciertopatrón de comportamiento, que pueda atribuirse a variaciones estacionales; la observaciónde la evolución gráfica de la serie puede ayudar a tomar la decisión.

Una vez fijado el período p, se calculan las medias de los valores de la serie tomados de pen p, sucesivamente desde el inicio. Asociando cada una de estas medias al valor deltiempo del punto central del período estudiado, se obtiene una nueva serie de valoresmucho más estables, debido, por una parte, a la reducción de la variabilidad ocasionada alpromediar y, por otra, a que, si el período escogido es el correcto, al pasar de una mediamóvil a la siguiente, el nuevo dato incorporado es del mismo comportamiento que el datosaliente.

Si p es impar la asociación es directa :

p + 1t =

2⇔

p

i1 2 pi 1

(p 1) / 2

YY Y Y

Yp p

=+

+ + += =∑

A

© Los autores, 2001; © Edicions UPC, 2001.

Descomposición de una serie temporal p25

p + 3t =

2 ⇔

p 1

i2 3 p 1i 2

(p 3) / 2

YY Y Y

Yp p

+

+=+

+ + += =∑

A

•••

Si p es par, el centro del grupo de cada p valores promediados corresponde a un valor noobservado del tiempo; para subsanarlo, la nueva serie queda constituida por los promediosde las medias móviles tomadas dos a dos. Es decir:

p + 2t =

2⇔ (p 1) / 2 (p 3) / 2

(p 2) / 2

Y YY

2+ +

++

=

p + 4t =

2 ⇔ (p 3) / 2 (p 5) / 2

(p 4) / 2

Y YY

2+ +

++

=

• • •

La representación gráfica de las medias móviles, o la regresión de dichos valores frente altiempo, permiten evaluar la tendencia de la serie liberada de la componente estacional.

Uno de los inconvenientes de este sistema es la pérdida de valores en los dos extremos dela serie, tanto mayor cuanto mayor es p. En ocasiones, se propone como alternativa a esteproblema la sustitución de los valores extremos de las medias móviles por los resultantes deuna extrapolación lineal de los observados; sin embargo, si el número de datos disponibleses grande, la pérdida de información es negligible.

En el caso del ejemplo de las ventas de material deportivo, ya se ha comentado que laestacionalidad se manifiesta de forma anual, es decir, cada cuatro trimestres; ello conduceal cálculo de las medias móviles tomando p = 4.

En la tabla 3.V se detalla el cálculo de los primeros valores de la nueva serie, y la tabla 3.VIresume la totalidad de los mismos.

t Y Y t

12345…

40,22 54,89 63,51

111,35 46,95

67,4925 69,1750

68,3337 345…

Tabla 3.V.- Detalle del cálculo de las medias móviles con p = 4

© Los autores, 2001; © Edicions UPC, 2001.

p26 Series temporales

t Y t Y t Y t Y34567

68,333768,766268,102567,501266,4588

89

101112

67,472569,530070,532572,682573,4363

1314151617

72,932574,130076,845078,190078,9000

1819202122

80,381279,307578,517579,203779,5088

Tabla 3.VI.- Medias móviles con p = 4

Los resultados del modelo lineal, 0 1Y t= α + α + ε para el cálculo de la tendencia constan enla tabla 3.VII.

nu S.C. C.M. F p-valRegresión 1 393,692 393,692 162,810 0,000Residuos 17 41,108 2,418Total 18 434,800

Coef. Error típico t p-valOrd. Origen 63,0065 0,9188 68,5739 0,0000t 0,8311 0,0651 12,7597 0,0000

R^2 = 0,905

Tabla 3.VII.- Modelo de tendencia sobre las medias móviles

Trabajando sobre 19 puntos, los 19 valores de las medias móviles, se ha obtenido un buenajuste, con un coeficiente de determinación del 90,5 %. En consecuencia, el modelo detendencia resultante es

T = 63,0065 + 0,8311 t

Evidentemente, la interpretación de la ecuación de la tendencia permite afirmar que lasventas se incrementan 0,8311 unidades cada trimestre (ya que el tiempo se ha medido entrimestres). En la figura 3.3 puede observarse el suavizado conseguido con las mediasmóviles junto con el modelo de tendencia estimado a partir de los citados valores.

40

70

100

130

0 4 8 12 16 20 24 t

Fig. 3.3.- Evolución ( • ), medias móviles ( 1 ) y tendencia ( ), para p = 4

© Los autores, 2001; © Edicions UPC, 2001.

Descomposición de una serie temporal p27

3.2 Estacionalidad

La componente estacional, que provoca una oscilación sistemática de período corto,generalmente no superior al año, puede enmascarar la evolución a largo plazo, tendencia, sino se aísla convenientemente.

Se entiende como componente estacional, en modelos aditivos, la diferencia entre el valorde la estación y la media de todas las estaciones componentes del período.

El análisis de la estacionalidad queda ligado al método que se decida emplear paramodelizar la tendencia; así, en este punto estudiaremos la situación para el caso de trabajarcon medias móviles.

Para calcular los valores de los índices estacionales hay que seguir la siguiente sistemática:

n Calcular las medias móviles, tY , sobre los datos, tY , de la serie original, tomando elperíodo de agrupación, p, que se considere oportuno.

n Proponer un modelo de agrupación de las componentes, aditivo o multiplicativo.

n Separar la parte explicada por la tendencia. Supuesto el modelo aditivo, esto equivale acalcular tW = tY − tY ; si fuese multiplicativo, en lugar de diferencias serían cocientes, es

decir, tW = tY / tY . Hay que destacar que en tW están incluidas las componentesasociadas a la estacionalidad, los ciclos y los residuos.

n Asumiendo que los residuos son variables aleatorias de media nula y que lacomponente cíclica, caso de existir, es de período suficientemente largo como para noser recogida por los datos, se procede a evaluar la estacionalidad asociada a cadacomponente del período, a cada trimestre en el caso del ejemplo. Para ello se calculan

los promedios de los tW de la misma estaciónt

t s p*s

s

W

En

= +=∑

& s = 1, …, p

donde s representa el índice estacional y ns el número de valores asociados a esteíndice que se promedian.Ya que los índices estacionales miden discrepancias respecto a la media, ésta senecesita como valor de referencia; por tanto es necesario calcular la media general:

p*s

s = 1

E E =

p

n Calcular los índices estacionales en modelo aditivoLos índices estacionales son las diferencias entre los promedios de las tW de cadaestación y la media general que se acaba de definir, es decir

*s sE E E= −

© L o s a u t o r e s , 2 0 0 1 ; © E d i c i o n s U P C , 2 0 0 1 .

p28 Series temporales

Es obvio destacar que la suma de estos índices es cero: p

ss 1

E 0=

=∑ .

n Calcular los índices estacionales en modelo multiplicativo.En este caso, los índices estacionales son el cociente entre los promedios de las tW decada estación y la media general, es decir

*s

sE

EE

=

Ahora, la suma de estos índices es igual al período, p

ss 1

E p=

=∑ . En modelo

multiplicativo, no es extraño que los índices estacionales se representen en %.

En la tabla 3.VIII se detallan los cálculos del caso de modelo aditivo de las ventas dematerial deportivo. Por ejemplo, para el tercer trimestre (s = 3), el promedio de las Wt, cuyosvalores del tiempo correspondiesen al tercer trimestre, por ser múltiplos de 4 más 3 (t = 3, 7,11, 15, 19), sería:

*3

-4,8237 - 4,9888 - 8,4325 - 10,6950 - 4,1975 = = - 6,6275E

5

t tY tY tW Estación: s123456789

101112131415161718192021222324

40,2254,8963,51

111,3546,9551,6261,47

108,5841,3865,3064,25

113,8253,3459,3766,15121,567,3856,0975,11

124,3955,9061,2575,44126,5

------

68,333768,766268,102567,501266,458867,472569,530070,532572,682573,436372,932574,130076,845078,190078,900080,381279,307578,517579,203779,5088

------

------

-4,823742,5838

-21,1525-15,8812-4,988841,1075

-28,1500-5,2325-8,432540,3837

-19,5925-14,7600-10,695043,3100

-11,5200-24,2912-4,197545,8725

-23,3037-18,2588

------

123412341234123412341234

Tabla 3.VIII.- Evaluación de la estacionalidad por medias móviles.

© Los autores, 2001; © Edicions UPC, 2001.

Descomposición de una serie temporal p29

Análogamente, para cada trimestre, se obtiene:

* * * *1 2 3 4E 20,7438 E 15,68477 E 6,6275 E 42,6515= − = − = − =

La media general es:

4*s

s 1

E

E 0,1011254

== = −∑

y los índices estacionales, resultan

E1 = –20,6426 E2 = –15,5836 E3 = –6,5264 E4 = 42,7526

Los valores de los índices estacionales recién obtenidos se interpretan de la siguiente forma:respecto a la media, el primer trimestre tiene una venta inferior en 20,6426 unidades; elsegundo está 15,5836 unidades por debajo de la media; el tercero 6,5264; mientras que elcuarto supera a la media en 42,7526 unidades de venta.

Con el modelo de tendencia de la tabla 3.VII y la estacionalidad, se ha obtenido ladescomposición de la serie original, mostrada en la figura 3.4.

Evidentemente, los residuos se calculan como : R = Y - T - E. La buena modelizaciónconseguida queda confirmada por los residuos, ya que en su mayoría están en el intervalo±5 y sólo en 3 puntos se llega a valores de 10 u 11 unidades.

Tal como se ha ido repitiendo, el objetivo de la modelización de la serie es poder realizarprevisiones para los próximos valores del tiempo. En la tabla 3.IX se presentan lasprevisiones para los 2 años inmediatos siguientes. Atendiendo a que el período estacionales igual a 4, para realizar la previsión hay que identificar el tiempo como un múltiplo de 4más s (s = 1, 2, 3, 4), para añadir a la tendencia el valor correcto de la estacionalidad. Así,la previsión se calcula como:

tY# = 63,0065 + 0,8311 t + Es con t = 4$ + s

La figura 3.5 muestra la evolución de las previsiones y su buena concordancia con laevolución histórica de los datos recogidos en el estudio.

© Los autores, 2001; © Edicions UPC, 2001.

p30 Series temporales

40

70

100

130

Y

64

69

74

79

84

T

-30

-10

10

30

50

E

-11

0

11

t

R

40

70

100

130

T+E

Fig. 3.4.- Descomposición de la serie de ventas de material deportivo por medias móviles

© Los autores, 2001; © Edicions UPC, 2001.

Descomposición de una serie temporal p31

Año t Estación: s Tendencia:T = 63,0065+0,8311 t

Estacionalidad: E Previsión: Y#

1996 25

26

2728

1

2

3

4

83,7840

84,6151

85,4462

86,2773

–20,6426

–15,5836

–6,5264

42,7526

63,1414

69,0315

78,9198

129,0299

1997 29

30

31

32

1

2

3

4

87,1084

87,9395

88,7706

89,6017

–20,6426

–15,5836

–6,5264

42,7526

66,4658

72,3559

82,2442

132,3543

Tabla 3. IX.- Previsiones para 1996 y 1997, según el modelo de descomposición clásica

40

90

140

0 4 8 12 16 20 24 28 32 t

Y

Fig. 3.5.- Evolución histórica ( • ), modelo ( –– ) y previsiones ( p )

3.3 Caso temperaturas

La tabla 3.X presenta las temperaturas medias mensuales registradas en una ciudad delhemisferio sur, en el período de tiempo que abarca desde enero de 1986 a diciembre de1995. Interesa estudiar el modelo de comportamiento y realizar una previsión de lastemperaturas de la década siguiente.

© Los autores, 2001; © Edicions UPC, 2001.

p32 Series temporales

Año

Mes 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995

IIIIIIIVVVIVIIVIIIIXXXIXII

26,827,227,126,325,423,923,823,625,325,826,426,9

27,127,527,426,424,824,323,423,424,625,425,826,7

26,926,325,725,724,824,023,423,524,825,626,226,5

26,826,926,726,126,224,723,923,724,725,826,126,5

26,327,126,225,725,524,924,224,625,525,926,426,9

27,127,127,426,825,424,823,623,925,025,926,326,6

26,827,127,426,425,524,724,324,424,826,226,327,0

27,127,526,228,227,125,425,624,524,726,026,526,8

26,326,726,625,825,225,123,323,825,225,526,426,7

27,027,427,026,325,924,624,124,325,226,326,426,7

Tabla 3.X.- Registro de las temperaturas mensuales

La evolución cronológica de los datos se muestra en la figura 3.6, en donde se pone demanifiesto que la tendencia es prácticamente inapreciable, por la aparente horizontalidad deleje virtual de la serie. Por otra parte se observa la existencia de una componente estacionalclara que se repite, lógicamente, cada año y mantiene la amplitud, dando idea de que es unmodelo aditivo. Al ser los datos mensuales, la longitud del período es igual a 12.

El cálculo de las medias móviles, con p = 12, y su representación gráfica (figura 3.7)confirman la estacionalidad, por la estabilización conseguida en la serie, pero ponen enentredicho la ausencia de tendencia.

La observación del gráfico hace recomendable ajustar un modelo de tendencia, que se haráposteriormente y que ya se ha representado en esta figura.

22

24

26

28

30

0 24 48 72 96 120 t

Y

Fig. 3.6.- Evolución cronológica de las temperaturas

© Los autores, 2001; © Edicions UPC, 2001.

Descomposición de una serie temporal p33

22

24

26

28

30

0 24 48 72 96 120 t

Y

Fig. 3.7.- Temperaturas mensuales ( • ), medias móviles ( ♦ ) y línea de tendencia ajustada ( −−−− )

Para evaluar la estacionalidad es necesario calcular los índices estacionales, tal como se hadetallado en el apartado 3.2. Los resultados obtenidos se encuentran en la tabla 3.XI, y sepresentan gráficamente en la figura 3.8.

Mes (s) Índice Es Mes (s) Índice Es

I 1

II 2

III 3

IV 4

V 5

VI 6

1,07496

1,31478

0,97867

0,62126

−0,15883

−1,03569

VII 7

VIII 8

IX 9

X 10

XI 11

XII 12

−1,78846

−1,80143

−0,77967

0,05413

0,52959

0,99070

Tabla 3.XI.- Índices estacionales

La interpretación de los índices es simple: desde octubre (X) a abril (IV), la temperatura estápor encima de la media anual; mientras que de mayo (V) a septiembre (IX) está por debajode la media. No olvidemos que los datos corresponden a una ciudad del hemisferio sur; portanto, de octubre a abril son los meses cálidos, y los demás son los fríos. Es de destacarque la oscilación térmica media, del mes más cálido al más frío, es relativamente pequeña(1,31 + 1,80 = 3,01°C). Esto, unido a los valores medios mensuales, que oscilan entre 23 y29°C permite afirmar que el estudio se está haciendo sobre una ciudad de clima muy suavey casi permanentemente primaveral.

© Los autores, 2001; © Edicions UPC, 2001.

p34 Series temporales

-2

-1

0

1

2

0 4 8 12 s

T

Fig. 3.8.- Componente estacional: índices

La tendencia, aunque débil, existe y es de tipo lineal. Su evaluación se efectuará medianteel modelo lineal aplicado a las medias móviles (tabla 3.XII).

nu S.C. C.M. F p-valRegresión 1 2,186 2,186 44,512 0,000Residuos 106 5,205 0,049Total 107 7,391

Coeficientes Error típico t p-valOrd. Origen 25,4733 0,0459 554,4281 0,0000t 0,00456 0,0007 6,6717 0,0000

R^2 = 0,295735

Tabla 3.XII.- Modelo lineal para la tendencia: tY = α0 + α1

t + ε

A pesar del valor del coeficiente de determinación del ajuste, (29,57 %), la explicación delmodelo es significativa. Así, se puede deducir que parece existir una tendencia muy ligera aun incremento de la temperatura, que se ha estimado en un aumento de 0,00456 gradosmensuales en promedio.

La evolución del modelo, junto con los datos reales, se presentan en la figura 3.9. Para suobtención, hay que tener en cuenta que, conocidos los índices estacionales y el modelo detendencia, la suma mes a mes de los dichos valores darán lugar al modelo propuesto, esdecir:

tY# = 25,4733 + 0,00456 t + sE con t = 12$ + s s = 1, …, 12

© Los autores, 2001; © Edicions UPC, 2001.

Descomposición de una serie temporal p35

22

24

26

28

30

0 24 48 72 96 120 t

Y

Fig. 3.9.- Datos ( • ) y modelo ajustado ( − )

Solamente hay que destacar la buena concordancia entre ambos, a pesar de que hayalgunos puntos que parecen presentar mayores discrepancias.

Esto ocurre, principalmente, desde abril hasta julio de 1993 que como, puede observarse, yaen los datos iniciales presentaron unas temperaturas medias bastante superiores a las delos demás años (es decir hizo un otoño especialmente cálido).

En la figura 3.10, se muestran los residuos resultantes de la descomposición de esta serie,obtenidos como t t tR Y Y= − # . Hay que destacar la buena modelización conseguida, puesen la mayoría de las 120 observaciones, el error es inferior a un grado, excepto en losmeses ya comentados.

-2

-1

0

1

2

0 24 48 72 96 120 t

R

Fig. 3.10.- Residuos del modelo

© Los autores, 2001; © Edicions UPC, 2001.

p36 Series temporales

A partir de la descomposición, y suponiendo que no cambiase el comportamientometeorológico de la zona, la previsión de la temperatura para los 10 años siguientes sería lade la tabla 3.XIII, que se muestra en la figura 3.11 junto a los datos disponibles. Aquí seobserva que, de mantenerse la tendencia, la temperatura media mensual, poco a poco, seva incrementando.

Comparando los datos reales con las previsiones, se ve en estas últimas la ausencia delcomponente aleatorio. Se está haciendo una previsión de temperaturas medias, pero el azarmeteorológico se unirá a la previsión alterándola en aquellos períodos de tiempo en los quelas temperaturas sean distintas a las de la tónica general: inviernos muy fríos o muy suaves,veranos más extremos, etc.

Año

Mes 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005

IIIIIIIVVVIVIIVIIIIXXXIXII

27,127,327,026,725,925,024,324,325,326,126,627,1

27,227,427,126,725,925,024,324,325,326,226,727,1

27,227,527,126,826,025,124,424,425,426,226,727,2

27,327,527,226,826,125,124,424,425,526,326,827,2

27,327,627,226,926,125,224,524,525,526,326,827,3

27,427,627,326,926,225,224,524,525,626,426,927,3

27,427,727,327,026,225,324,624,625,626,526,927,4

27,527,727,427,026,325,324,724,625,726,527,027,5

27,527,827,527,126,325,424,724,725,726,627,027,5

27,627,827,527,226,425,524,824,825,826,627,127,6

Tabla 3.XIII.- Temperatura prevista para los 10 años siguientes a la recogida de datos

22

24

26

28

30

0 48 96 144 192 240 t

Fig. 3.11.- Datos desde 1986 a 1995 ( • ) y previsiones desde 1996 a 2005 ( 1 )

© Los autores, 2001; © Edicions UPC, 2001.

Descomposición de una serie temporal p37

3.4 Caso usuarios transporte público

En la tabla 3.XIV se recogen los datos relativos al número de usuarios de un determinadotransporte público en el período que abarca desde 1984 hasta 1995, y la figura 3.2 muestrasu evolución cronológica.

Año

Mes 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995

IIIIIIIVVVIVIIVIIIIXXXIXII

908810910310312213413211510191112

111115129121112125164158133127110120

127107141135133154175174158139112140

142139145162144176192190160151134140

146155182165165191195205182165138155

164151180164184206198235197163148163

175161179195189208227249224193170166

176194197211191235248273202189167168

208189232226222245252242229202192198

199190228220222233303253253223191185

207198251231234251316285250232190201

219206229223231266290294258214206199

Tabla 3. XIV.- Usuarios de un transporte público.

80

160

240

320

0 24 48 72 96 120 144 t

Y

Fig. 3.12.- Evolución cronológica del número de usuarios.

La observación de la figura 3.12 permite realizar las siguientes consideraciones:

Se detecta una clara tendencia creciente en el tiempo.

Hay una estacionalidad manifiesta que se repite anualmente. Ya que los datos sonmensuales, su período será igual a 12.

© Los autores, 2001; © Edicions UPC, 2001.

p38 Series temporales

El patrón de estacionalidad tiene una forma constante pero presenta una amplificacióncontinua en el tiempo. Esta situación es la que indica que el modelo subyacente esmultiplicativo.

Para obtener la descomposición de la serie cronológica, es necesario estabilizarlapreviamente, mediante medias móviles de p = 12; y después modelizar la tendencia ycalcular los índices estacionales.

La evolución de las medias móviles se muestra en la figura 3.13, y se aprecia un crecimientoque no es proporcional al tiempo, sino que parece sufrir un amortiguamiento al final de laserie; es decir, probablemente se tratará de un modelo parabólico.

80

160

240

320

0 24 48 72 96 120 144 t

Fig. 3.13.- Tendencia a través de las medias móviles (p =12)

La estimación mínimo-cuadrática conduce al modelo de tendencia, sobre las mediasmóviles, cuya estimación se muestra en la tabla 3.XV. En ella se observa, además de unmuy buen ajuste reflejado por una R2 del 99,74%, que el término cuadrático es altamentesignificativo. El signo negativo de este término da idea de una especie de freno en elcrecimiento sostenido del número de usuarios, representado por el coeficiente positivo deltiempo.

nu S.C. C.M. F p-valRegresión 2 194340,33 97170,17 25069,58 7,937E-168Residuos 129 500,01 3,88Total 131 194840,34

Coeficientes Error típico t p-valOrd. Origen 100,4749 0,6227 161,3636 1,08E-150t 1,4326 0,0197 72,8823 1,08E-106t^2 -0,00297 0,0001 -22,5088 1,66E-46

R^2 = 0,9974

Tabla 3.XV.- Estimación del modelo de tendencia: Y = α0 + α1

t + α2 t2 + ε

© Los autores, 2001; © Edicions UPC, 2001.

Descomposición de una serie temporal p39

Así pues, el modelo de tendencia puede escribirse como:

T = 100,4749 + 1,4326 t – 0,00297 t2

En modelos multiplicativos, como el del actual ejemplo, la componente estacional representala relación entre cada estación y la media general. Recordemos que, en estos casos, elcálculo de la estacionalidad se realiza de acuerdo con los siguientes pasos:

a) Calcular las medias móviles tY , a partir de los datos, Yt, de la serie.

b) Separar la tendencia, es decir, calcular tt

t

YW

Y= .

c) Asumiendo que los ciclos, caso de existir, son de período suficientemente largo comopara no ser recogidos por los datos, calcular los promedios de las Wt de cada estación y lamedia general. s es el indicador de la estación (mes, en el ejemplo), y ns el número devalores de W que se promedian en la citada estación

tt s p*

ss

W

En

= +=∑

$

s = 1, ..., p y

p*s

s 1

E

Ep

==∑

d) Finalmente, los valores de las componentes estacionales, generalmente expresados en %en modelos multiplicativos, se obtienen como:

*s

sE

E 100E

= ×

En la tabla 3.XVI se muestran los valores de las componentes estacionales del presenteejemplo, y se representan gráficamente en la figura 3.14.

Mes Es Mes Es Mes Es

I

II

III

IV

92,38

88,41

101,72

99,21

V

VI

VII

VIII

97,04

109,53

121,91

121,31

IX

X

XI

XII

105,50

94,11

81,54

87,33

Tabla 3.XVI.- Componente estacional.

© Los autores, 2001; © Edicions UPC, 2001.

p40 Series temporales

80

90

100

110

120

130

0 4 8 12 t

E

Fig. 3.14.-Índices estacionales

La interpretación de los índices podría ser en el sentido de que, por ejemplo, los usuarios delos meses de julio y agosto son del orden de un 121% superior a la media, mientras que ennoviembre se está en un 81% de la media. Ello podría aconsejar una promoción en losmeses de noviembre, diciembre, enero y febrero, con el fin de conseguir una mayorocupación de las plazas disponibles.

La figura 3.15 muestra la concordancia entre los datos y su modelización, a partir de latendencia y estacionalidad calculadas, de acuerdo con el modelo multiplicativo:

( )2 st

EY 100,4749 1,4326 t 0,00297 t

100= + −# s = 1, ..., 12 t = s + 12$

80

160

240

320

0 24 48 72 96 120 144 t

Fig. 3.15.- Serie cronológica experimental ( • ) y ajustada ( !!!!).

Observando la figura 3.15 se puede destacar que hay unos desajustes más acusados enciertos meses de julio o agosto, en concreto, los de los años 1989, 90, 91, 93 y 94, por loque es posible afirmar que en los casos citados ha habido un comportamientosustancialmente distinto del esperado en los mismos meses de otros años; en principio,sería discutible afirmar la presencia de un cambio en los hábitos de utilización de estetransporte, ya que ni el año 1993 ni el 1995, pertenecientes al período en cuestión,presentan semejantes discrepancias.

© Los autores, 2001; © Edicions UPC, 2001.

Descomposición de una serie temporal p41

A pesar de todo, en este caso, sería prudente tomar con ciertas precauciones lasprevisiones para años venideros, mientras no se confirme la consolidación en el futuro de uncambio o de una permanencia de comportamiento. También podría ser interesante intentaraveriguar qué ocurrió en estos meses (quizás una campaña publicitaria, quizás unadisminución de alternativas de la competencia,...).

La figura 3.16 muestra la evolución de los residuos entre los datos experimentales y elmodelo ajustado, Rt = Yt − tY# . Se observa que, en la mayoría de los casos, oscilan entre ±16,aunque en algún caso la discrepancia se aproxima a 30 unidades.

Asumiendo que se mantiene el mismo modelo, la previsión de usuarios hasta el año 2000 sepresenta en la figura 3.17. Hay que tener en cuenta, para realizar correctamente loscálculos, que el último valor de t para el que se dispone de datos, diciembre de 1995, es144; por tanto, para las predicciones, que abarcan el período de los próximos 60 meses, losvalores de t irán desde 145 hasta 204.

-32

-16

0

16

32

0 24 48 72 96 120 144 t

R

Fig. 3.16.- Residuos del modelo ajustado

En el gráfico de la previsión se puede observar la reducción de la velocidad de crecimientoinicial de la serie que se ha comentado en la modelización de la tendencia.

80

130

180

230

280

330

0 24 48 72 96 120 144 168 192 t

PrevisionesDatos

Fig. 3.17.- Serie observada y previsiones hasta el año 2000

© Los autores, 2001; © Edicions UPC, 2001.

p42 Series temporales

4 MODELIZACIÓN CON VARIABLES CATEGÓRICAS

Tal como se ha comentado en el capítulo anterior, si hubiera estacionalidad, estimar el modelode tendencia sobre los datos directos, por procedimientos usuales de ajuste mínimo-cuadrático, sería improcedente. Ello es debido a que se produciría una inflación de losresiduos no atribuible a la aleatoriedad sino a la variabilidad ocasionada por el componenteestacional. Para evitarlo, se pueden modelizar conjuntamente la tendencia y la estacionalidadcon variables categóricas asociadas a cada estación, o bien desestacionalizar previamente laserie y entonces ajustar el modelo de tendencia, como ya se ha expuesto.

La modelización conjunta, con variables categóricas, de la tendencia y la estacionalidadpresenta como principal ventaja la generalidad del método. Por este procedimiento no esnecesario, a priori, asumir un modelo aditivo o multiplicativo, sino que se plantea un modelogeneral que incluye todas las posibilidades.

Sea p el período estacional, es decir, el número de unidades de tiempo que conforman elpatrón de comportamiento que se repite sistemáticamente. Cada uno de los valores deltiempo contenidos en p corresponde a una estación, la cual se designará por el subíndice s,de forma que s = 1, 2, ..., p.

Cada estación debe estar ligada biunívocamente a una variable categórica. Dicha variablees un indicador que toma el valor 1 en la estación a la que está asociada y 0 en todas lasdemás, excepto para la primera estación, en que todas toman el valor 0. Ésta es la razónpor la cual con p-1 variables categóricas es suficiente para estudiar una serie de período p.Las variables categóricas, Q, quedan, pues, definidas como

j

j

Q 0 j scon s 1 , 2 , , p y j 2 , , p

Q 1 j s

= ≠ = == = @ @

Con estas variables se plantea un modelo tipop p

Y = ( t ) + Q t + Qjj j jj 2j = 2

φ + γ εβ ∑∑=

donde φ(t) es una función polinómica del tiempo, o sea, k

i0 i

i 1

(t) + t =

φ = α α∑ , que viene a

recoger la tendencia o evolución general, a largo plazo, de los datos con el tiempo. Los

términos del grupo p

j jj 2

Q=

β∑ indican los cambios que las distintas estaciones, componentes

del período estacional, introducen en la ordenada en el origen del modelo, parte aditiva

según el sistema clásico. Mientras que los del grupo p

j jj 2

Q t=

γ∑ representan la influencia de la

estacionalidad sobre la función del tiempo, lo que en el método clásico se interpreta comoparte multiplicativa.

El estudio de la significación de cada uno de los coeficientes α, β y γ, y la consiguienteeliminación de los no significativos conducirá el modelo que definitivamente explica elcomportamiento de la serie.

© Los autores, 2001; © Edicions UPC, 2001.

Modelización con variables categóricas p43

Para desarrollar la metodología de las variables categóricas sobre un ejemplo, se van a utilizarlos datos relativos a las ventas de material deportivo estudiados por el método clásico, con elfin de poder comparar posteriormente los resultados obtenidos. En la tabla 4.I se vuelven areproducir los datos de la serie cronológica, junto a los valores de las variables categóricas. Larepresentación gráfica de los mismos ya se presentó en la figura 3.1, cuya observacióncondujo a pensar en una tendencia lineal creciente y una estacionalidad de período p = 4.

A fin de no confundir los dos efectos, procede la creación de variables categóricas queidentifiquen cada una de las cuatro estaciones, que en este ejemplo constituyen el períodode repetición del patrón estacional. Por otra parte, suponiendo que hubiese ciclos, elintervalo de tiempo de recogida de datos es totalmente insuficiente para tomarlos, por lo quesu posible existencia quedará enmascarada en los residuos.

En la tabla 4.I están las variables categóricas Q2, Q3 y Q4, cuya conjunción representa deforma unívoca cada trimestre. Se insiste en que no es necesaria una Q1, puesto que elprimer trimestre es el que toma como referencia Q2 = Q3 = Q4 = 0, y son los demás que, através del indicador, aportarán la parte del efecto estacional correspondiente.

En este caso, al ser la tendencia rectilínea, se plantea el modelo

0 1 2 2 3 3 4 4 2 2 3 3 4 4Y t Q Q Q Q t Q t Q t= + + + + + + + +α α β β β γ γ γ ε

La estimación de sus parámetros conduce a los resultados expuestos en la tabla 4.II.

Año Trimestre (s) Ventas (Y) Q2 Q3 Q4 t

1990 1234

40,2254,8963,51111,35

0100

0010

0001

1234

1991 1234

46,9551,6261,47108,58

0100

0010

0001

5678

1992 1234

41,3865,3064,25113,82

0100

0010

0001

9101112

1993 1234

53,3459,3766,15121,5

0100

0010

0001

13141516

1994 1234

67,3856,0975,11124,39

0100

0010

0001

17181920

1995 1234

55,9061,2575,44126,50

0100

0010

0001

21222324

Tabla 4.I.- Ventas de material deportivo

© Los autores, 2001; © Edicions UPC, 2001.

p44 Series temporales

Los resultados del modelo lineal general evidencian que todos los términos del tipo Qjt noson estadísticamente significativos, (p-val < 0,05), por tanto procede recalcular el modeloprescindiendo de ellos.

Cabe destacar que este hecho manifiesta que la estacionalidad no modifica la pendiente dela recta del tiempo, es decir, el incremento de las ventas es el mismo para cada trimestre.Esto simplifica el caso al corresponder a un modelo aditivo puro, que puede ser,alternativamente, estudiado por la metodología de la descomposición clásica, tal como se hahecho en el capítulo 3. Si alguno de esos términos hubiese resultado significativo, el sistemaclásico proporcionaría un modelo bastante precario.

nu S.C. C.M. F p-valRegresión 7 17166,997 2452,428 109,609 0,000Residuos 16 357,988 22,374Total 23 17524,985

Coeficientes Error típico t p-valOrd. Origen 38,9463 3,660 10,640 0,000Q2 15,7735 5,351 2,948 0,009Q3 19,1936 5,535 3,468 0,003Q4 65,6577 5,726 11,466 0,000t 1,0832 0,283 3,832 0,001t*Q2 -0,8026 0,400 -2,008 0,062t*Q3 -0,3513 0,400 -0,879 0,393t*Q4 -0,1485 0,400 -0,371 0,715

R^2 = 0,9796

Tabla 4.II.- Resultados del modelo lineal general

La tabla 4.III contiene los resultados del ajuste del modelo definitivo, es decir, de

0 1 2 2 3 3 4 4Y t Q Q Q= + + + + +α α β β β ε

nu S.C. C.M. F p-valRegresión 4 17064,626 4266,157 176,073 0,000Residuos 19 460,359 24,229Total 23 17524,985

Coeficientes Error típico t p-valOrd. Origen 42,5280 2,580 16,484 0,000Q2 6,4674 2,846 2,273 0,035Q3 15,2781 2,857 5,347 0,000Q4 64,5555 2,876 22,447 0,000t 0,7576 0,147 5,151 0,000

R^2 = 0,97373

Tabla 4.III.- Resultados del modelo definitivo

© Los autores, 2001; © Edicions UPC, 2001.

Modelización con variables categóricas p45

Los gráficos de residuos y probabilístico Normal se presentan en la figura 4.1, y nopresentan ninguna peculiaridad especial.

En consecuencia queda validado el modelo obtenido.

Res

4 7

0

Y

Res

0 4 8

0

t%P

0

9

Res

Fig. 4.1.- Gráficos de los residuos del modelo

Como resumen de todo lo anterior, el modelo que explica el comportamiento de la serie, yque va a ser utilizado para hacer previsiones de las ventas futuras, ha resultado ser

t 2 3 4Y 42,5280 0,7576t 6,4674Q 15,2781Q 64,5555Q= + + + +#

La interpretación de los coeficientes del modelo permite identificar tendencia yestacionalidad.

En cuanto a la primera, se detecta un incremento de las ventas de 0,7576 unidades cadaunidad de tiempo (trimestre); incremento que se mantiene constante sea cual sea laestación.

En consecuencia, la estacionalidad sólo afecta a la ordenada en el origen de cada una delas cuatro estaciones (trimestres) que componen el período.

Tomando como referencia el primer trimestre, en el que Q2 = Q3 = Q4 = 0, se observa que enél las ventas dependen del tiempo, según la ecuación

tY# = 42,5280 + 0,7576 t con t = 1 + 4$

© Los autores, 2001; © Edicions UPC, 2001.

p46 Series temporales

Para un tiempo correspondiente a un segundo trimestre, las variables categóricas toman losvalores Q2 = 1 y Q3 = Q4 = 0 y el modelo es

tY# = 42,5280 + 0,7576 t + 6,4674 = 48,9954 + 0,7576 t con t = 2 + 4$

Para un tiempo de tercer trimestre, las variables categóricas toman los valores Q3 = 1 y Q2 =Q4 = 0 y el modelo es

tY# = 42,5280 + 0,7576 t + 15,2781 = 57,8061 + 0,7576 t con t = 3 + 4$

Y, en el caso del cuarto trimestre, las variables categóricas toman los valores Q4 = 1 yQ2 = Q3 = 0; el modelo es

tY# = 42,5280 + 0,7576 t + 64,5555 = 107,0835 + 0,7576 t con t = 4 + 4$

Así, para cada trimestre (estación del período), se obtiene un modelo del mismo tipo,rectilíneo con igual pendiente, en este caso, pero con distinta ordenada en el origen.

Esto se puede interpretar como que, tomando siempre como referencia el primer trimestre,en el segundo el volumen de ventas añade a la función del tiempo 6,4674 unidades, en eltercero el incremento es de 15,2782 y en el cuarto de 64,5555 unidades. Estos valores son,evidentemente, los coeficientes de las variables categóricas.

En consecuencia los coeficientes de las variables categóricas representan la cantidad enque una estación, sistemáticamente, supera (o no alcanza, según sea el signo) el valor de laprimera estación del período. Es decir, estos coeficientes son una forma de medir elcomponente estacional.

Para evaluar la bondad del modelo, en la figura 4.2 se muestra la comparación de losvalores medidos con los estimados a partir del modelo ajustado; se observa la buenaconcordancia entre ambos.

La modelización tiene como objetivo principal el poder hacer previsiones para un futuropróximo. En este caso se procede a calcular las previsiones para los próximos 2 años, abase de sustituir los valores del tiempo y de las variables categóricas en el modelo obtenido.Los resultados se muestran en la tabla 4.IV y en la figura 4.3.

40

70

100

130

0 4 8 12 16 20 24 t

Y

Fig. 4.2.- Datos reales ( • ) y modelo ajustado ( )

© Los autores, 2001; © Edicions UPC, 2001.

Modelización con variables categóricas p47

Aquí se detecta la coherencia de la previsión con los datos históricos, siempre que nocambie el modelo de comportamiento de la serie en el período previsto. Esto podría ocurrir,por ejemplo, si hubiese una recesión económica, la apertura de otro comercio de similarescaracterísticas en las inmediaciones, un cambio de hábitos en la población, una campañapropagandística con éxito de la competencia, etc.

t 2 3 4Y 42,5280 0,7576t 6,4674Q 15,2781Q 64,5555Q= + + + +#

Año t Q2 Q3 Q4 tY#

1996 25

26

27

28

0

1

0

0

0

0

1

0

0

0

0

1

61,4680

68,6930

78,2613

128,2963

1997 29

30

31

32

0

1

0

0

0

0

1

0

0

0

0

1

64,4984

71,7234

81,2917

131,3267

Tabla 4.IV.- Previsiones para 1996 y 1997

Y

40

90

140

0 4 8 12 16 20 24 28 32 t 1990 1995 1996 1997 ← datos →← previsiones →

Fig. 4.3.- Datos, modelo y previsiones para los dos años siguientes

© Los autores, 2001; © Edicions UPC, 2001.

p48 Series temporales

4.1 Comparación del método de descomposición con el de variables categóricas

Se han expuesto dos métodos para la descomposición de la serie y ambos se han aplicadoa un caso de modelo aditivo puro, es decir, en el que la estacionalidad no afecta a lapendiente de la recta de tendencia. El de variables categóricas es más simple en cuanto amanipulación y cálculos, aunque, si el período tiene muchas componentes, adquiere mayoraparatosidad por el número de variables categóricas que se manejan. El clásico, queidentifica los componentes del modelo por medio del uso de medias móviles, conduce aresultados similares, en un caso en que se insiste que es aditivo puro; en casos másgenerales la descomposición clásica no sería capaz de conseguir un buen modelo.

La comparación de ambos, sobre el ejemplo desarrollado, se presenta en las figuras 4.4 y4.5. La primera compara los resultados de los dos modelos dentro del período de recogidade información; la segunda confronta los valores de los residuos obtenidos mediante los dossistemas. Ambos gráficos confirman la gran concordancia de los resultados.

En las tablas 3.IX y 4.IV se han presentado las previsiones de ventas del material deportivopara los ocho trimestres siguientes a la recogida de información, es decir, para los años1996 y 1997, siempre bajo el supuesto que el comportamiento de la serie no va a cambiaren este período de tiempo. La figura 4.6 da idea de la casi coincidencia de las previsionespara las dos formas de análisis estudiadas.

40

70

100

130

0 4 8 12 16 20 24 t

Val

ores

mod

eliz

ados

Fig. 4.4.- Modelo según la descomposición clásica ( • ) y las variables categóricas ( » )

© Los autores, 2001; © Edicions UPC, 2001.

Modelización con variables categóricas p49

-10

-5

0

5

10

15

-10 -5 0 5 10 15R(descomp. clásica)

R(c

ateg

óric

as)

Fig. 4.5.- Residuos de la descomposición frente a los del modelo en variables categóricas

Ya que el objetivo del sistema clásico es descomponer la serie como un modelo aditivo, omultiplicativo si fuese el caso, de tendencia, estacionalidad, ciclos y residuos, es necesarioidentificar cada componente.

40

65

90

115

140

24 28 32t

Pre

visi

on

es

Fig. 4.6.- Previsiones para los dos años siguientes según la descomposición clásica ( • )y las variables categóricas ( » )

Refiriéndonos sólo a tendencia y estacionalidad, y considerando el modelo puramenteaditivo, como es el caso de los datos de las ventas de material deportivo, se tratará de pasardel modelo en variables categóricas

q pi

t 0 i jji = 1 j = 2

= + + QtY ∑ ∑ βα α

© L o s a u t o r e s , 2 0 0 1 ; © E d i c i o n s U P C , 2 0 0 1 .

p50 Series temporales

a otro con sus componentes aisladas. Considerando el modelo aditivo, y suponiendo que losciclos, caso de existir, no sean identificables con los datos disponibles, tendremos

Yt =Tt + Et

En este caso, después de estabilizar la serie, se habrá modelizado la tendencia como

qi

t 0 ii 1

T = a t=

+ ∑α

Debido a que es posible tener dos contadores del tiempo, uno asociado al momento de tomade datos y otro que identifica la estación a la que pertenece el dato, cualquier instante tpuede escribirse como t = s + k p = s + p$ , con k = 0, 1, 2, y s = 1, 2,..., p, es decir, tes un múltiplo del período, p, más el indicador de la estación, s. Así, resulta

qi

t t t 0 i si 1

Y = T E a t E=

+ = + +∑α

donde p

ss = 1

= 0E∑ ya que se ha definido cada componente estacional como la diferencia

respecto a la media del período.

Se asume que, en caso de modelo aditivo puro, los coeficientes asociados a las potenciasdel tiempo deben ser los mismos, sea cual sea el procedimiento empleado para su estudio;en consecuencia, las posibles discrepancias entre los valores estimados por ambosmétodos serán muy pequeñas.

Desarrollando las ecuaciones del modelo clásico y del de variables categóricas para s = 1,. .. , p, igualándolas para cada s se obtiene

q qi i

t 1 p 0 i 0 i 1i 1 i 1

q qi i

t 2 p 0 i 2 0 i 2i 1 i 1

q qi i

t p p 0 i p 0 i pi 1 i 1

Y t a t E

Y t a t E

Y t a t E

= += =

= += =

= += =

= + = + +

= + + = + +

= + + = + +

∑ ∑

∑ ∑

∑ ∑

$

$

$

A

α α α

α α β α

α α β α

y sumando miembro a miembro, resultap

jpj = 2

0 0 0 0jj = 2

p + = p a a = + p

⇒∑

∑β

α αβ

de donde se deduce la expresión que da directamente la tendencia global, T, en función delos parámetros estimados en el modelo de variables categóricas:

© Los autores, 2001; © Edicions UPC, 2001.

Modelización con variables categóricas p51

p

j qj = 2 i

t 0 ii 1

T + + tp =

=∑

∑β

α α

Para cualquier estación, s, componente del período p, el modelo en variables categóricaspuede escribirse como

qi

t 0 i si 1

Y + t=

= +∑α α β s = 1, …, p t = s + p$

Al ser la estacionalidad s t s p t s pE Y T= + = += −$ $ , restando las dos últimas expresiones de Yt y

Tt resultap

jj 2

s s

E = p=−∑β

β

Para el caso del ejemplo del material deportivo, p = 4, con variables categóricas se obtuvo elmodelo

t 2 3 4Y 42,5280 0,7576t 6,4674Q 15,2781Q 64,5555Q= + + + +#

del cual resulta

4

jj = 2

= 21,575254

∑ β. A partir de este modelo la ecuación pura de la tendencia,

o esqueleto de la serie, esp

j qj = 2 i

t 0 ii 1

T + + tp =

=∑

∑β

α α = 42,5280 + 21,57525 + 0,7576 t = 64,10325 + 0,7576 t

Cuando, a partir de la estabilización por medias móviles, se estimó el modelo de tendencia(sistema clásico), el resultado fue

Tt = 63,0065 + 0,8311 t

Es evidente que ambos resultados, procedentes de técnicas de modelización distintas, sonmuy parecidos; su similitud ya ha quedado puesta de manifiesto en las comparacionesgráficas de modelos , residuos y previsiones de las figuras 4.4, 4.5 y 4.6.

En cuanto a los valores de la estacionalidad, referidos a la media general, es decir, segúnlos define el modelo clásico, se obtiene

E1 = 0 – 21,57525 = –21,57525

E2 = 6,46475 – 21,57525 = –15,10785

E3 = 15,2781 – 21,57525 = – 6,29715

E4 = 64,5555 – 21,57525 = 42,98025

© Los autores, 2001; © Edicions UPC, 2001.

p52 Series temporales

Se comprueba que4

ss = 1

= 0E∑ .

Estos valores, como era de esperar, son muy similares a los obtenidos por ladescomposición clásica (capítulo 3), que resultaron ser −20,6426; −15,5836; −6,5264 y42,7526, respectivamente.

Como resumen, se puede reiterar la gran similitud de valores de los coeficientes del modelode tendencia y de los índices estacionales obtenidos por los dos métodos desarrollados.

Esta concordancia es buena para un caso como el que se acaba de estudiar, que se podríaetiquetar como modelo aditivo puro. Si se hubiera dado la circunstancia de una serie dondela estacionalidad hubiese afectado a la tendencia de distinta forma en cada componente delperíodo, es decir, variando ya la pendiente, ya la ordenada en el origen, la descomposiciónclásica no hubiese conseguido modelizarla correctamente.

Es por todo ello que se puede afirmar que la modelización global con variables categóricases un procedimiento mucho más general para el estudio del comportamiento de una serietemporal y la realización de previsiones.

4.2 Caso usuarios de un teléfono

En la tabla 4.5 se exponen unos datos cronológicos correspondientes al número de usuariosde un teléfono de atención al cliente de lunes a viernes, recogidos durante las 12 primerassemanas de puesta en marcha del servicio.

t Y t Y t Y t Y1 99,30 16 117,66 31 127,52 46 149,66

2 65,27 17 52,67 32 30,42 47 34,13

3 48,27 18 63,96 33 92,71 48 118,31

4 20,58 19 40,85 34 60,22 49 64,06

5 75,17 20 76,12 35 88,61 50 106,09

6 104,76 21 116,48 36 136,60 51 150,28

7 58,96 22 52,86 37 32,16 52 25,74

8 67,18 23 79,80 38 104,76 53 114,62

9 28,44 24 44,25 39 60,62 54 74,64

10 83,71 25 88,39 40 93,53 55 106,34

11 121,13 26 125,34 41 142,92 56 149,02

12 51,52 27 46,45 42 33,34 57 29,0613 64,30 28 80,05 43 103,53 58 121,42

14 25,60 29 50,67 44 68,86 59 76,33

15 76,50 30 94,03 45 92,50 60 114,29

Tabla 4.V.- Usuarios del teléfono de atención al cliente

© Los autores, 2001; © Edicions UPC, 2001.

Modelización con variables categóricas p53

En la figura 4.7 se muestra la evolución de la demanda de utilización de este servicio, y seobserva que la simplicidad del método clásico de considerar la serie aditiva o multiplicativa,no está nada clara pues el patrón estacional ni se mantiene constante ni se amplificasistemáticamente.

Es natural que, de haber estacionalidad, ésta sea de período 5, correspondiente a posiblesdiferencias de utilización de dicho servicio en los distintos días de la semana. La observacióndel gráfico confirma esta estacionalidad. En cuanto a la tendencia, tampoco se ve muy claro sila hay; si se observan los datos del primer día de cada semana (lunes) parece que haya uncrecimiento sostenido de la demanda, mientras que viendo el comportamiento de los martes(tabla 4.V) la tendencia es a una disminución. Si sólo se dispusiese del método clásico dedescomposición de la serie sería difícil analizar esta situación, ya que la tendencia general, allídefinida como esqueleto de la serie, parece mantenerse más o menos constante.

0

40

80

120

160

0 20 40 60 t

Y

Fig. 4.7.- Evolución cronológica de la demanda

Aplicando la sistemática de análisis de variables categóricas, corresponde definir 4variables, Q2, Q3, Q4 y Q5, que identificarán cada uno de los cinco días de la semana. En latabla 4.VI, se muestra un fragmento de los valores de dichas variables asociados a los datosdisponibles.

t Y Q2 Q3 Q4 Q5

1 99,3 0 0 0 0

2 65,27 1 0 0 0

3 48,27 0 1 0 0

4 20,58 0 0 1 0

5 75,17 0 0 0 1

6 104,76 0 0 0 0

7 58,96 1 0 0 0

8 67,18 0 1 0 0

9 28,44 0 0 1 0

10 83,71 0 0 0 1

11 121,13 0 0 0 0

12 51,52 1 0 0 0... ... ... ... ... ...

Tabla 4. VI.- Variables categóricas

© Los autores, 2001; © Edicions UPC, 2001.

p54 Series temporales

El modelo inicial que debe plantearse es del tipo

0 1 2 2 3 3 4 4 5 5 2 2 3 3 4 4 5 5Y t Q Q Q Q Q t Q t Q t Q t= + + + + + + + + + +α α β β β β γ γ γ γ ε

y los resultados de la estimación mínimo-cuadrática de los coeficientes se muestran en latabla 4.VII. De ella se deduce que el término t=Q4 no es significativo (p-val > 0,05) y puedeser eliminado del modelo. Al recalcular el nuevo modelo se obtienen los resultadosmostrados en la tabla 4.VIII.

nu S.C. C.M. F p-valRegresión 9 73631,982 8181,331 355,132 0,000Residuos 50 1151,873 23,037Total 59 74783,855

Coef. Error típico t p-valOrd. Origen 101,580 2,675 37,978 0,000Q2 -38,364 3,832 -10,012 0,000Q3 -53,757 3,882 -13,849 0,000Q4 -83,296 3,933 -21,179 0,000Q5 -31,512 3,985 -7,908 0,000t 0,941 0,080 11,718 0,000t*Q2 -1,636 0,114 -14,408 0,000t*Q3 0,385 0,114 3,387 0,001t*Q4 0,106 0,114 0,935 0,354t*Q5 -0,288 0,114 -2,539 0,014

R^2 = 0,9846

Tabla 4.VII.- Resultados del modelo lineal inicial

nu S.C. C.M. F p-valRegresión 8 73611,831 9201,479 400,398 0,000Residuos 51 1172,023 22,981Total 59 74783,855

Coef. Error típico t p-valOrd. Origen 100,067 2,127 47,038 0,000Q2 -36,851 3,469 -10,622 0,000Q3 -52,244 3,524 -14,824 0,000Q4 -80,110 1,964 -40,780 0,000Q5 -29,999 3,637 -8,247 0,000t 0,994 0,057 17,529 0,000t*Q2 -1,689 0,098 -17,198 0,000t*Q3 0,331 0,098 3,376 0,001t*Q5 -0,341 0,098 -3,476 0,001

R^2 = 0,9843

Tabla 4.VIII.- Resultados del modelo lineal definitivo

© Los autores, 2001; © Edicions UPC, 2001.

Modelización con variables categóricas p55

El modelo que explica el comportamiento de la serie presenta un elevado grado de ajuste(R2 = 98,43%) y, según los coeficientes de la tabla 4.VIII, toma la expresión

tY# = 100,07 − 36,85 Q2 − 52,24 Q3 − 80,11 Q4 − 30 Q5

+ 0,99 t − 1,69 t Q2 + 0,33 t Q3 − 0,34 t Q5

La figura 4.8 presenta el modelo ajustado junto a los datos, y la figura 4.9 los residuos delmodelo. Se observa que la mayoría de los valores están en el intervalo ± 4 unidades, y sóloen algún caso la discrepancias alcanza 10 unidades; ello confirma el buen ajuste.

Y

0

40

80

120

160

200

0 20 40 60 t

Fig. 4.8.- Datos experimentales ( • ) y modelo ajustado ( )

-12

-8

-4

0

4

8

12

0 20 40 60 t

R

Fig. 4.9.- Residuos del modelo: R = Y − Y#

La interpretación del modelo obtenido, se puede hacer determinando la ecuación deprevisión asociada a cada uno de los días de la semana, es decir, a cada componente de laestación. A título de ejemplo, los modelos para el lunes y el viernes son:

© Los autores, 2001; © Edicions UPC, 2001.

p56 Series temporales

Lunes: s = 1 Q2 = Q3 = Q4 = Q5 = 0 Y# = 100,07 + 0,99 t con t = 5$ +1

Viernes: s = 5 Q2 = Q3 = Q4 = 0 Q5 = 1 Y# = 70,07 + 0,65 t con t = 5$ +5

En la figura 4.10, se puede observar cada una de las cinco rectas que componen el modelo,sobre el fondo de los datos experimentales. Cada recta, a la derecha del gráfico, lleva elindicador estacional que le corresponde (lunes: s =1; martes: s = 2…). De la ecuación delmodelo general y del estudio de este gráfico se puede concluir que el lunes y el juevestienen la misma tendencia (las rectas 1 y 4 son paralelas); sin embargo el lunes tiene,sistemáticamente, un mayor número de usuarios que el jueves. Esta discrepancia constantees la diferencia de ordenadas de ambas rectas, o sea el coeficiente de Q4, que en este casoes igual a −80,11. La tendencia común indica un aumento sostenido de usuarios que seevalúa en un incremento de 0,99 usuarios al día (coeficiente de t en las rectas 1 y 4).

0

40

80

120

160

0 20 40 60

Y1

3

5

4

2

t

Fig. 4.10.- Modelos asociados a cada día de la semana

En cuanto a los miércoles y viernes (rectas 3 y 5), se puede decir que tienen uncomportamiento similar. En los primeros días había algo más de usuarios el viernes que elmiércoles; sin embargo, dicho número ha aumentado en ambos, pero con mayor velocidadel miércoles, de forma que actualmente éste ya supera al viernes.

Especial atención merece el martes (recta 2), ya que inicialmente tenía un número deusuarios situado más o menos en el promedio de los otros días, pero ha sufrido undecrecimiento progresivo que actualmente lo sitúa en un valor muy inferior a los demás díasde la semana, los cuales, en mayor o menor grado, han presentado un incremento dedemanda del servicio.

Está claro que, en la práctica, una situación como ésta requeriría de un estudio enprofundidad de las causas que han conducido a esta situación: quizás la persona queatiende la línea no es la misma, o hay mayores dificultades para establecer comunicación yel público deja de llamar los martes,...

La obtención del modelo tiene como principal objetivo el poder hacer previsiones delcomportamiento de la demanda del servicio durante los próximos días, a fin de programar un

© Los autores, 2001; © Edicions UPC, 2001.

Modelización con variables categóricas p57

aumento del número de líneas telefónicas, del número de personas que atienden a losusuarios, plantearse una redistribución en el tiempo, etc.

La tabla 4.IX muestra las previsiones para las dos semanas próximas, junto a los valores deltiempo y de las variables categóricas, necesarios para ser sustituidos en el modelo general.

t Q2 Q3 Q4 Q5 Y prevista

61 0 0 0 0 160,686

62 1 0 0 0 20,129

63 0 1 0 0 131,312

64 0 0 1 0 83,557

65 0 0 0 1 112,478

66 0 0 0 0 165,655

67 1 0 0 0 16,654

68 0 1 0 0 137,938

69 0 0 1 0 88,526

70 0 0 0 1 115,741

Tabla 4.IX.- Previsiones para dos semanas

En la figura 4.11 se pueden observar los valores de las previsiones como extrapolación delmodelo ajustado sobre los datos disponibles, constatándose la gran disminución del númerode usuarios del martes.

0

30

60

90

120

150

180

0 10 20 30 40 50 60 70 t

Y

Fig. 4.11. - Datos ( • ), modelo ( --- ) y previsiones (1)

Dichas previsiones serán válidas siempre que se mantenga el modelo de comportamientoque han puesto de manifiesto los datos disponibles. Es evidente que si se encontrase lacausa de la disminución de llamadas producida en los martes, y se corrigiese, seríanecesario llevar a cabo una nueva recogida de información para elaborar los modeloscorrespondientes y hacer previsiones en la nueva situación.

© Los autores, 2001; © Edicions UPC, 2001.