Estudio de la Humedad Relativa Media Mensual y la Temperatura Media Mensual
1
NOTA DE CÁTEDRA El presente trabajo de investigación Estadístico, realizado por alumnos
que se mencionaron al comienzo del mismo, como parte de los requisitos establecidos por esta Cátedra para la obtención de la PROMOCIÓN DIRECTA, ha sido revisado en sus distintas versiones de carácter borrador mediante entregas parciales.
Por ello, esta presentación final presupone que incluye las posibles correcciones que antes se le efectuaron, sin que ello implique necesariamente, estar externa de errores fundamentales en lo que ha cálculo se refiere.
Como podrá observarse, se siguen los pasos fundamentales de toda investigación científica, en decir que se plantean los problemas, los objetivos y las hipótesis, basados en el conocimiento ordinario y luego con metodología estadística, se llega al conocimiento científico, obviando claro está algunas etapas secundarias del mismo.
Esto, aparte de insertarlo al alumno en el campo de la investigación, permite evaluar la asimilación de conocimientos por parte de los alumnos, objetivo que, debido al Método de Aprendizaje Grupal desarrollado, se ha logrado ampliamente dado que esta Técnica conlleva a un APRENDIZAJE SIGNIFICATIVO, es decir que el alumno APRENDE A HACER, APRENDE A APRENDER Y APRENDE A SER.
Destaco la voluntad de los alumnos que han desarrollado esta metodología, a pesar de que la misma le insume mayor tiempo de dedicación, pero lo han realizado a sabiendas de que el resultado sería valioso para su futuro profesional.
Al final de este trabajo, se consigna la calificación que le ha merecido a la Cátedra.
Finalmente la Cátedra agradece a las Instituciones Públicas y/o Privadas, a Organismos y Empresas, que han facilitado el acceso a la información básica por parte de los alumnos y se pone a disposición de las mismas para ampliar este trabajo en el aspecto que le interese.
Mg. FLORENCIO R. MOLINA ESTADÍSTICO
PROFESOR ORDINARIO ADJUNTO
Estudio de la Humedad Relativa Media Mensual y la Temperatura Media Mensual
2
INTRODUCCIÓN
El presente trabajo de investigación es una continuación del desarrollado por Monsalve, Hernán y Pecile, Lautaro titulado “Estudio de la Variación de la Humedad Relativa Media en la Zona del Valle Inferior del Rio
Chubut1” que se encuentra en la biblioteca Gabriel Puentes de la
Universidad Nacional de la Patagonia San Juan Bosco. Se centrara en el estudio de las variaciones de Humedad Relativa Media
en la zona de Trelew. Los datos para tal estudio fueron recopilados de la página web del Instituto Nacional de Tecnología Agrícola INTA (véase http://www.inta.gov.ar/chubut/info/Meteoro/bol_mens.htm).
Se ha propuesto como población del trabajo de investigación 192 datos medidos en el periodo 1993-2008, correspondiente a la Humedad Relativa Media (medida en %). Así mismo corresponde a la variable Humedad la misma cantidad de datos de Temperatura Media medidos en el mismo periodo, para un estudio puntual dentro del trabajo de investigación.
Se ha desarrollado un estudio metodológico de los mismos, a fin de aplicar tanto la Estadística Descriptiva, la Teoría de Probabilidad, como la Estadística Inferencial.
PROBLEMA DE INVESTIGACION Para el presente trabajo de investigación, se han planteado el siguiente
problema: � ¿Qué relación existirá, si existe alguna, entre la variación de la
Humedad Relativa Media mensual en la cuidad de Trelew medida
durante el periodo 1993-2008, y variación de la Temperatura Media
mensual en el mismo periodo?
OBJETIVOS DE INVESTIGACION A partir de los problemas propuestos, se han planteado los siguientes
objetivos: � Determinar el tipo de variabilidad que presenta la variable de la
Humedad Relativa Media.
� Calcular el Promedio Aritmético de la Humedad Relativa Media.
� Analizar qué Modelo Probabilístico sigue la Humedad Relativa
Media.
1 Código de Monografía: 519. M 722-95
Estudio de la Humedad Relativa Media Mensual y la Temperatura Media Mensual
3
� Analizar qué Modelo vincula las variaciones entre las variables
Humedad Relativa Media y Temperatura Media.
PREGUNTAS DE INVESTIGACION � ¿La distribución de Humedad Relativa Media será homogénea?
� ¿El Promedio Aritmético de la Humedad Relativa Media adoptara el
valor 46%?
� ¿La distribución de Humedad Relativa se corresponderá con una
Distribución Teórica de Probabilidad Normal?
� ¿La relación que vincula los valores de Humedad Relativa Media con
los de Temperatura Media será Lineal?
HIPÓTESIS DE INVESTIGACION A partir de este momento, las hipótesis del trabajo de investigación
serán: � La variable bajo estudio, Humedad Relativa Media, presenta un
comportamiento de tipo homogéneo.
� El Promedio Aritmético de la distribución de Humedad Relativa es
de 46%.
� La distribución de Humedad Relativa es descripta por una
Distribución Teórica de Probabilidad Normal.
� La relación que vincula los valores de Humedad Relativa Media con
los de Temperatura Media se Lineal.
Estudio de la Humedad Relativa Media Mensual y la Temperatura Media Mensual
4
Diseño Muestral
Distribución de
Frecuencias con
Datos Agrupados
Medidas de Posición,
Variabilidad y Sesgo
CAPITULO I
TEORÍA DE LA ESTADÍSTICA
ESTADÍSTICA DESCRIPTIVA
Estudio de la Humedad Relativa Media Mensual y la Temperatura Media Mensual
5
DISEÑO MUESTRAL Para el estudio se cuenta con una población de 192 (N) y una muestra de
75 (n) datos2. Los valores de las mediciones observadas varían entre 16% y 79%.
Para poder comenzar con el estudio, es necesario realizar un muestreo representativo y coherente.
Teniendo en cuenta que se tiene un listado completo de la población y esta presenta un comportamiento homogéneo, se ha optado por realizar un muestreo simple al azar. El mismo consiste en seleccionar una muestra en donde cada elemento tiene una probabilidad de inclusión igual y conocida de n/N.
De esta forma, se ha procedido a aplicar este método a la población con lo que se ha obtenido la muestra que se detalla a continuación:
21 42 45 49 52 55 60 64 67 71 32 42 46 49 52 55 61 64 68 73 39 42 46 49 53 55 62 66 69 79 40 42 47 49 54 57 63 66 69 40 43 47 49 54 57 63 66 69 40 44 47 50 54 60 63 66 70 41 44 48 51 55 60 63 67 71 41 44 49 51 55 60 63 67 71 A partir de este punto, todos los cálculos llevados a cabo con los datos de
la presente muestra serán realizados con el soporte estadístico Statgraphic Plus Versión 5.1.
2 El tamaño de la muestra (n) se justificara más adelante en la
investigación.
Estudio de la Humedad Relativa Media Mensual y la Temperatura Media Mensual
6
DISTRIBUCIÓN DE FRECUENCIAS CON DATOS AGRUPADOS
La agrupación de datos en intervalos de clases ayudara al estudio de la muestra, a fin de determinar la similitud de nuestra distribución de frecuencias con alguna distribución teórica de probabilidad (comportamiento de tipo campanular, jota o jota invertida) lo cual permitirá ensamblar lo empírico con la etapa inferencial del análisis estadístico, aunque esto implique la perdida de información individual.
Una distribución de frecuencias es, según Hays (1988), una representación de la relación entre un conjunto de medidas o clases de medidas mutuamente exclusivas y exhaustiva, y la frecuencia de cada uno da ellas.
Cantidad de Intervalos (k)
Para determinar la cantidad de intervalos en que se dividirá la muestra se utilizara la Formula de Sturges, aplicada al tamaño de muestra seleccionado:
� � 1 � 3.33 � �� � 1 � 3.33 � �75 � 7.244
Dado el resultado de la operación, se adoptara � � �
Amplitud del Intervalo (h)
Una vez determinado el número de intervalos, corresponde determinar la amplitud de cada intervalo de clase, definido como la diferencia entre el límite superior exacto y el límite inferior exacto.
Para ello denominaremos min y max al mínimo y máximo valor de la muestra, respectivamente.
min = 21 max = 79
� ���� � ���
��
79 � 21
7� 8.285
Se adoptara, entonces, h = 8
Estudio de la Humedad Relativa Media Mensual y la Temperatura Media Mensual
7
Límite Inferior (Li)
Ahora es necesario determinar el límite inferior.
�� � ��� ��
2� 21 �
8
2� 17
Con este límite inferior más la amplitud del intervalo k es posible
determinar fácilmente los intervalos siguientes, simplemente sumando k a cada límite del intervalo. De esta manera, si Lij es límite inferior del intervalo j y Lsj es límite superior del intervalo j:
��� � 17 ��� � ��� � � � 17 � 8 � 25 ��� � ��� � 25 ��� � ��� � � � 25 � 8 � 33
Tabla de Distribución de Frecuencias
Estableciendo los valores calculados en el software, se ha obtenido la siguiente tabla de distribución de frecuencias de datos agrupados:
Li Ls xi fi Ri Fa Ra
17 25 21 1 0,0133 1 0,0133 25 33 29 1 0,0133 2 0,0267 33 41 37 6 0,0800 8 0,1067 41 49 45 21 0,2800 29 0,3867 49 57 53 16 0,2133 45 0,6000 57 65 61 13 0,1733 58 0,7733 65 73 69 16 0,2133 74 0,9867 73 81 77 1 0,0133 75 1,0000
Total 75
Representación Gráfica de la distribución Empírica
Volcando los datos obtenidos en la tabla de distribución de frecuencias, se pueden generar una serie de representaciones graficas para el estudio de la distribución empírica.
Estudio de la Humedad Relativa Media Mensual y la Temperatura Media Mensual
8
Histograma de Frecuencia Absoluta
Humedad Relativa Media (%)
Fre
cuen
cia
17 25 33 41 49 57 65 73 810
4
8
12
16
20
24
Histograma de Frecuencia Relativa
Humedad Relativa Media (%)
Fre
cuen
cia
17 25 33 41 49 57 65 73 810
5
10
15
20
25
30
Estudio de la Humedad Relativa Media Mensual y la Temperatura Media Mensual
9
En el eje de abscisas se representan los puntos medios de cada intervalo
y en el de ordenadas la frecuencia de cada intervalo. Uniendo estos puntos mediantes un segmento de recta, se obtendrá el polígono de frecuencias.
Histograma de Frecuencia Acumulada
Humedad Relativa Media (%)
Fre
cuen
cia
17 25 33 41 49 57 65 73 810
20
40
60
80
Histograma de Frecuencia Relativa Acumulada
Humedad Relativa Media (%)
Fre
cuen
cia
17 25 33 41 49 57 65 73 810
20
40
60
80
100
Estudio de la Humedad Relativa Media Mensual y la Temperatura Media Mensual
10
A continuación se presenta la ojiva de frecuencias. La misma permite identificar porcentajes de observaciones de los intervalos de clases.
Frecuencia Absoluta (fi)
Cantidad exacta de elementos observados que se agrupan en el intervalo de clase.
Poligono de Frecuencia
Humedad Relativa Media (%)
Fre
cuen
cias
8 16 24 32 40 48 56 64 72 80 88 960
5
10
15
20
25
30
Distribucion de Frecuencia Acumulada
Humedad Relativa Media (%)
Fre
cuen
cias
17 25 33 41 49 57 65 73 810
20
40
60
80
100
Estudio de la Humedad Relativa Media Mensual y la Temperatura Media Mensual
11
De los 75 meses, 37 han registrado valores de Humedad Relativa Media entre 33% y 41%.
Frecuencia Relativa (Ri)
Es el cociente entre la frecuencia absoluta y el total de observaciones. Un 28% de los meses han tenido valores de Humedad Relativa Media
entre 41% y 49%.
Frecuencia Acumulada (Fa)
Es la suma acumulativa de las frecuencias absolutas. De los 75 meses, 8 han obtenido valores de Humedad Relativa Media
entre 17% y 41%.
Frecuencia Relativa Acumulada (Ra)
Es el cociente de las frecuencias acumuladas y el total de observaciones. Un 38,67% de los meses han registrado valores de Humedad Relativa
Media entre 17% y 49%.
MEDIDAS DE POSICIÓN, VARIABILIDAD Y SESGO
Mediante estas medidas es posible sintetizar al conjunto de datos
previamente recopilados de forma tal que sea posible caracterizar el fenómeno bajo estudio y así lograr el propósito final orientado hacia el análisis inferencial, destacando que va ser inevitable la pérdida de información.
MEDIDAS DE POSICIÓN
Estas medidas caracterizan a la distribución de los datos. Con ellas se analizara la posición de la distribución.
Media Aritmética (��)
Constituye el promedio de la Humedad Relativa Media, en cuyo cálculo intervienen todos los valores de la variable y sus frecuencias. Consecuentemente, se debe tener en cuenta que si existen valores extremos, dicha medida no será representativa del grupo. Asimismo, cabe recordar
Estudio de la Humedad Relativa Media Mensual y la Temperatura Media Mensual
12
que si la distribución presenta intervalos abiertos, esta magnitud no se puede calcular.
�� � ∑ �� � ��� � 403975 � 53,8533
La media aritmética de la Humedad Relativa Media ha sido de 54% Es decir, que le promedio de los valores observados de la Humedad
Relativa Media ha sido de 54%.
Media Geométrica (Xg)
Se utiliza cuando la Media Aritmética (��) no resulta representativa. Sin embargo, si algún valor de la variable es cero, dada su fórmula, no se puede calcular. Contrariamente a la ��, se ve afectada por los valores mínimos.
�� � ��� ��� ∑ �� � ��� ��� � ��� ��� 129,017075 � 52,5049
En general, podemos decir que la Humedad Relativa Media tiende al
53%. En comparación con la �� obtenida, se verifica que estos valores no están muy alejados entre si, por lo tanto podemos tomar la media aritmética como estimador suficiente.
Mediana (Me)
Es el valor de la variable que deja el mismo número de datos antes y después que él, una vez ordenados estos.
En este caso, dado que los valores están agrupados se debe calcular primero el orden (ºMe) que esta ocupa en la distribución, asignando la Fa y el intervalo de clase correspondiente a la misma. Se define como:
°�� � �2 � 752 � 37,5
Siendo que el ºMe se encuentra acumulado en Fa igual a 45, que
corresponde al intervalo 5, entonces:
� � �°�� � !� � 1"#�� � $ � 37,5 � 2916 � 8 � 4,25
�� � &� ' � � 49 ' 4,25 � 53,25
Estudio de la Humedad Relativa Media Mensual y la Temperatura Media Mensual
13
En la investigación el valor de la mediana es de 53%. En este caso, el 50% de la Humedad Relativa Media son menores o
iguales a 53%. Cómo podemos observar entre los valores de la �� y Me no existe
diferencia, confirmado la conclusión de que �� es representativa de la distribución.
Modo (Mo)
Valor para el cual se presentan la máxima frecuencia absoluta. Una vez establecida esta última, queda determinado el intervalo de clase dentro del cual se encontrara el valor del modo. Se define como:
� � ∆�∆� ' ∆�
� $ � 1515 ' 5 � 8 � 6
Siendo ∆�la diferencia entre la máxima frecuencia absoluta y la
inmediata anterior, y ∆� la diferencia entre la máxima frecuencia absoluta y la inmediata posterior.
�� � &� ' � � 41 ' 6 � 45 Es decir que, el valor de Humedad Relativa Media que más se repite es
45%.
Cuartil I (QI)
Es el valor de la variable que deja por debajo de si mismo a la cuarta parte (25%) de las observaciones, una vez ordenados estos. Se calcula:
°)* � �4 � 754 � 18,75
� � �°)* � !� � 1"#�� � $ � 18,75 � 821 � 8 � 4,0952
)* � &� ' � � 41 ' 4,0952 � 45,0952 En el estudio queda determinado que el cuartil I es 45%. Esto indica que el 25% de los valores de los datos de la Humedad
Relativa Media son inferiores o iguales a 45%.
Estudio de la Humedad Relativa Media Mensual y la Temperatura Media Mensual
14
Cuartil III (QIII)
Es el valor de la variable que deja por debajo de si mismo a las tres cuartas parte (75%) de las observaciones, una vez ordenados estos. Se calcula:
°)*** � 3�4 � 3 � 754 � 58,25
� � �°)*** � !� � 1"#�� � $ � 58,25 � 5816 � 8 � 0,125
)*** � &� ' � � 65 ' 0,125 � 65,125 Por lo tanto esto nos indica que el 75% de los datos considerados de la
Humedad son inferiores o iguales a 65%.
Comparación entre Media, Mediana y Modo
Teniendo en cuenta los valores obtenidos para �� � 53,8533, �� �53,25 y �� � 45 se puede decir que la distribución va a presentar una asimetría, ya que estos tres valores no coinciden exactamente.
Así mismo, �� + �� + �� por lo que la asimetría presentada será hacia la derecha.
MEDIDAS DE VARIABILIDAD
Con estas medidas podemos conocer en menor o mayor grado la concentración de los datos alrededor de la Media Aritmética (��) ya que determinaremos la homogeneidad o heterogeneidad de la distribución.
��
��
��
Estudio de la Humedad Relativa Media Mensual y la Temperatura Media Mensual
15
Variancia Corregida (s’2)
Se utiliza esta medida ya que constituye un estimador insesgado (propiedad que se demostrara más adelante)
,-� � ∑ !�� � ��"� � ���
��� � � 1
Cabe mencionar que esta medida siempre es mayor o igual que 0. Para la distribución estudiada el valor obtenido es: ,�� � 124,639 En caso de necesitar el valor de la Variancia sin corregir se aplicará la
siguiente expresión: !� � 1" � ,-� � � � ,� Que luego de despejar los términos queda:
,� � � � 1� � ,-� � 7475 � 124,639 � 122,977
Desvió Corregido (s’)
Si en el cálculo de este coeficiente se obtiene un valor grande, indica que la generalidad de los datos están alejados de la media, en tanto un valor pequeño indica su cercanía a esta última.
,- � .,-� Para la distribución estudiada el valor obtenido es: ,- � 11,1642 Esto nos indica que la variable mantiene una cierta dispersión con
respecto al promedio. Para posteriores cálculos se necesitara del Desvió sin corregir, cuyo
valor se calcula a partir de la siguiente fórmula:
, � .,� � /� � 1� � ,-�
Estudio de la Humedad Relativa Media Mensual y la Temperatura Media Mensual
16
Remplazando los valores se obtiene:
, � /7475 � 124,639 � .122,977 � 11,0894
Coeficiente de Variación (CV)
Brinda una estimación de la homogeneidad o heterogeneidad de un conjunto de datos. Su formula se expresa como:
01 � ,�2 � 100 � 11,164253,8533 � 100 � 20,7307
Según los valores que se puede adoptar, las distribuciones se pueden
clasificar de la siguiente manera:
Homogénea 0% - 25% Cuasi-homogénea 25% - 50% Cuasi-heterogénea 50% - 75% Heterogénea 75% o mas
En este caso, 01 � 20,7307% lo que indica que la distribución es
homogénea.
Pérdida de información
Ronald Fisher, demostró que partiendo de un supuesto de normalidad, la amplitud del intervalo de la distribución agrupada debería ser igual al Desvió dividido dos, para que la perdida de información fuese del 5%, es decir que si $ � , 2⁄ implicaría una pérdida del 5%.
Considerando $�como la amplitud de intervalo, obtenemos
5�67�7� 7� ����68�9�ó� � !$ � 5"$�
En este caso, la perdida de información es igual:
5�67�7� 7� ����68�9�ó� � !5,5821 � 5"8 � 3,4888%
Lo cual es aceptable, ya que esta debajo del 10%.
Estudio de la Humedad Relativa Media Mensual y la Temperatura Media Mensual
17
Porcentajes de Observaciones
Esta comprobado que en las distribuciones Normales, los intervalos definidos por �� ; �, acumulan un 68%, 95%, 99,9% de los valores, con t= 1, 2 y 3 respectivamente.
Área encerrada bajo el intervalo <= ; > en la Distribución Normal
Área encerrada bajo el intervalo <= ; ?> en la Distribución Normal
Área encerrada bajo el intervalo <= ; @> en la Distribución Normal
Con objeto de comparar el comportamiento de una distribución empírica
con un Modelo Teórico, se procede a calcular estos intervalos.
Estudio de la Humedad Relativa Media Mensual y la Temperatura Media Mensual
18
�� � , � 53,8533 � 11,0894 � 42,7639 �� ' , � 53,8533 ' 11,0894 � 64,9427
Acumulan el 77%
�� � 2, � 53,8533 � 2 � 11,0894 � 31,6745 �� ' 2, � 53,8533 ' 2 � 11,0894 � 76,0321
Acumulan el 98%
�� � 3, � 53,8533 � 3 � 11,0894 � 20,5851 �� ' 3, � 53,8533 ' 3 � 11,0894 � 87,1215
Acumulan el 100%
Por lo tanto, podemos ver que la distribución cumple con los porcentajes
de la Normal.
MOMENTOS Y MEDIDAS DE SESGO
Momentos Centrado de Orden S (µs)
Se define como la suma de los desvíos elevados a la S potencia, multiplicados por �� y divido por el total de observaciones.
A� � ∑ !�� � ��"� � ���
��� �
Asimetría (As)
Si �� � �� � ��, la distribución presenta un carácter de simetría. En caso contrario, se define una asimetría con respecto al valor de la distribución bajo estudio (corrimiento horizontal).
B, � A�,�
Siendo A� � �248,9178, la asimetría de la distribución estudiada es B, � �0,717036. De esta forma y por el valor obtenido, se puede concluir
que la distribución presenta una pequeña asimetría negativa.
Estudio de la Humedad Relativa Media Mensual y la Temperatura Media Mensual
19
Curtosis (K)
Ahora se analizara si la distribución exceden o no al valor modal de la distribución campanular simétrica. Sabiendo que la expresión de K es:
C � A,� 3
Y además: � Si C + 0 la distribución es Platicúrtica. � Si C � 0 la distribución es Mesocúrtica. � Si C D 0 la distribución es Leptocúrtica.
En este caso el valor que se ha obtenido es K � �0,375268. Este valor
es negativo, por lo que indica una distribución platicúrtica.
Estudio de la Humedad Relativa Media Mensual y la Temperatura Media Mensual
20
PRIMER INFORME DE AVANCE ��� La media de la distribución de Humedad Relativa Media es de 54%.
Es decir, que las humedades, en promedio, oscilan alrededor de dicho valor.
��� El 50% de las observaciones son menores o iguales al 53%. ��� El 25% de las observaciones son menores o iguales al 45%. ��� El 75% de las observaciones son menores o iguales al 65%. ��� La medida de la Humedad Relativa Media con mayor cantidad de
observaciones es del 45%. ��� El desvió de la variable estudiada es de 11,1642. ��� El coeficiente de variación calculado para la distribución bajo
estudio es de 23,73%, lo que indica que la distribución de las medidas de humedades observadas se presenta una variabilidad homogénea.
��� La distribución bajo estudio muestra una pequeña asimetría negativa, lo que quiere decir que la distribución se encuentra ligeramente orientada hacia la derecha.
��� La distribución muestra una pequeña curtosis negativa, lo que indica que es ligeramente platicurtica.
��� Porcentaje de Observaciones en �� ; , es del 77%, en �� ; 2, es del 98% y �� ; 3, es del 100% por lo que se puede decir que la distribución cumple con los porcentajes de la Distribución Normal.