presentaciÓn de trabajo de aplicaciÓn de la estadÍstica. alumno: manuel fernández gonzález...
TRANSCRIPT
PRESENTACIÓN DE TRABAJO DE APLICACIÓN
DE LA ESTADÍSTICA.
Alumno: Manuel Fernández GonzálezProfesor: Óscar Vergara Marambio
TABLA DE REGISTRO DE DATOS
Año Numero de trabajadores
Número de accidentados
Numero de días perdidos
2000 Al 2003 343 24 184
2004 Al 2007 379 36 315
2008 al 2011 404 59 257
2012 al 2013 215 31 186
Totales 1341 150 942
TABLA DE DATOS A GRANEL DE NÚMERO DE DÍAS PERDIDOS.
0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0
0 0 1 1 1 1 2 3 3 3
3 3 3 3 3 3 3 3 3 3
3 3 3 3 3 3 3 3 3 3
3 3 4 4 4 4 4 5 5 5
5 5 5 5 5 5 5 5 5 5
6 6 6 6 6 6 7 7 7 7
7 8 8 8 8 8 8 8 9 9
9 10 10 10 10 10 10 11 12 12
12 12 12 15 15 15 15 15 15 15
15 15 17 20 25 30 56 60 63 85
DATOS AGRUPADOS INTERVALARMENTE
Intervalo de clase
Marca de clase(Xi)
fi(Frecuencia absoluta)
Fi(Frecuencia acumulada)
hiFrecuencia relativa.
Hi(Frecuencia porcentual acumulada)
4 118 118 78,66 78,66
13 25 143 16,66 95,32
22 2 145 1,33 96,65
31 1 146 0,66 97,31
40 0 146 0,00 97,31
49 0 146 0,00 97,31
58 2 148 1,33 98,64
67 1 149 0,66 99,30
76 0 149 0,00 99,30
85 1 150 0,66 99,96
Totales 150
GRÁFICO DE BARRASPERIODOS VS FRECUENCIAS DE ACCIDENTES
HISTOGRAMA
GRÁFICO DE LÍNEAS
OTRA FORMA DE PRESENTAR LA INFORMACIÓN ES CON UN PICTOGRAMA
•Determinación e interpretación de algunas medidas de centralización:
•La media •La mediana•La moda
DETERMINACIÓN DE LA MEDIA(MEDIDA DE CENTRALIZACIÓN DE LOS DATOS)
Intervalo de clase Marca de clase() (Frecuencia
absoluta)
4 118 472
13 25 325
22 2 44
31 1 31
40 0 0
49 0 0
58 2 116
67 1 67
76 0 0
85 1 85
Totales 150 1140
𝑋=∑ (𝑋 𝑖)( 𝑓 𝑖)
𝑁=1140150
=7,6=8
INTERPRETACIÓN DE ESTE PARÁMETRO ESTADÍSTICO
• La media en este caso significa que en promedio el total de trabajadores de la muestra estadística “pierden” 8 días producto de la accidentabilidad .
DETERMINACIÓN DE LA MEDIANA ( OTRA MEDIDA DE CENTRALIZACIÓN)
Intervalo de clase Marca de clase() (Frecuencia
absoluta)(Frecuencia acumulada)
4 118 118
13 25 143
22 2 145
31 1 146
40 0 146
49 0 146
58 2 148
67 1 149
76 0 149
85 1 150
Totales
=5.08 =5
INTERPRETACIÓN DE LA MEDIANA
• Esta medida de centralización, supone que el 50% inferior de los trabajadores accidentados incluidos en la muestra estadística “pierden” 5 días de trabajo
DETERMINACIÓN DE LA MODA(OTRA MEDIDA DE CENTRALIZACIÓN)
Intervalo de clase Marca de clase()(Frecuencia absoluta)
4 118 (Clase modal)
13 25
22 2
31 1
40 0
49 0
58 2
67 1
76 0
85 1
Totales
= 4,47= 4
INTERPRETACIÓN ESTADÍSTICA DE LA MODA
• Para este caso , significa que el número de días perdidos que más se repite en los 150 trabajadores que incluyen la muestra del total son 4 días.
• Obs: Recordemos que esta es una estimación estadística y es probable que este valor no sea efectivamente el valor mas frecuente en la muestra.
DETERMINACIÓN DE ALGUNAS MEDIDAS DE POSICIÓN:
• Se han elegido 3 medidas de posición para describir estadísticamente es muestra en este estudio:
•Quartil (Tercer cuartil )•Decil ( Primer decil , )• Percentil (Percentil numero 58 , )
DETERMINACIÓN DEL TERCER CUARTIL ( )
Intervalo de clase
Marca de clase() (Frecuencia
absoluta)(Frecuencia acumulada)
4 118 118
13 25 143
22 2 145
31 1 146
40 0 146
49 0 146
58 2 148
67 1 149
76 0 149
85 1 150
Totales
INTERPRETACIÓN DEL TERCER CUARTIL
•Significa que hasta el 75% de los datos de la muestra , en este caso , por debajo del el 75% de los accidentados , pierden hasta 8 días de trabajo.
DETERMINACIÓN DEL PRIMER DECIL ()
Intervalo de clase
Marca de clase() (Frecuencia
absoluta)(Frecuencia acumulada)
4 118 118
13 25 143
22 2 145
31 1 146
40 0 146
49 0 146
58 2 148
67 1 149
76 0 149
85 1 150
Totales
INTERPRETACIÓN DEL CALCULO DEL PRIMER DECIL
Este parámetro estadístico de posición , indica que del total de datos de la muestra , por debajo ( inclusive) del 10% asume este valor
Para este caso , significa que hasta el 10% de los datos ordenados , pierden 1 día de trabajo por efectos de accidentabilidad.
PERCENTIL (PERCENTIL NUMERO 58 , ( )
Intervalo de clase
Marca de clase() (Frecuencia
absoluta)(Frecuencia acumulada)
4 118 118
13 25 143
22 2 145
31 1 146
40 0 146
49 0 146
58 2 148
67 1 149
76 0 149
85 1 150
Totales
DETERMINACIÓN DE ALGUNAS MEDIDAS DE DESVIACIÓN
•La varianza.•La desviación estándar•Coeficiente de variación
DETERMINACIÓN DE LA VARIANZA
Intervalo de clase
Marca de clase()
(Frecuencia absoluta)
4 118 -4 16 1888 13 25 5 25 625 22 2 14 196 392 31 1 23 529 529 40 0 32 1024 0 49 0 41 1681 0 58 2 50 2500 5000 67 1 59 3481 3481 76 0 68 4624 0 85 1 77 5929 5929
Totales 17.452
INTERPRETACIÓN DE LA VARIANZA
• En Teoría de Probabilidad y la Estadística, la varianza es aquella medida de dispersión que ostenta una variable aleatoria respecto a su esperanza. La varianza se relaciona con la desviación típica o desviación estándar. Nos informa qué tan grande o pequeño es algo en relación a lo normal.
• En este caso un valor de 116 , para datos que varían en un rango de 0 días hasta 85 días indica que estos tienen una gran dispersión respecto de la media
DETERMINACIÓN DE LA DESVIACIÓN ESTÁNDAR.(S)
• En este caso: S
INTERPRETACIÓN DE LA DESVIACIÓN ESTÁNDAR
• La desviación estándar en general indica cuanto se desvían los datos de la muestra en relación al valor medio o a la media.
• en este caso para una desviación estándar de 11 , significa que en promedio los datos se desvían 11 días respecto de la media cuyo valor es 8.
DETERMINACIÓN DEL COEFICIENTE DE VARIACIÓN
• Se define el coeficiente de variación de los datos de una muestra como: El mismo coeficiente expresado porcentualmente se expresa como:
En este caso: = 137.5=138
INTERPRETACIÓN DEL COEFICIENTE DE VARIACIÓN.
• En estadística, cuando se desea hacer referencia a la relación entre el tamaño de la media y la variabilidad de la variable, se utiliza el coeficiente de variación.
• es un parámetro estadístico que expresa que tan homogénea es la distribución de los datos de una muestra estadística.
• Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando una mejor interpretación porcentual del grado de variabilidad que la desviación típica o estándar. ( a mayor valor mayor heterogeneidad y a menor valor ., mayor homogeneidad)
• Para la muestra en cuestión se puede decir que la distribución de los datos es bastante heterogénea, pues el valor del coeficiente de variación es muy alto(138 )
APLICACIÓN DE PROBABILIDAD.
• Cálculo de probabilidad de algún evento que involucran los datos estudiados y que son pertinente a la situación .
• Para este caso se determinará la probabilidad relativa , con el propósito de estimar la ocurrencia de un evento , considerando para ello la frecuencia de este en el periodo en el cual se ha recogido la información muestral.
TIPOS DE ACCIDENTES LABORALES.
Periodos en Año De Trabajo De Trayecto De Enfermedades profesionales.
2000 al 2002 18 6 1
2003 al 2005 9 1 0
2006 al 2008 31 3 0
2009 al 2011 40 7 3
2012 al 2013 26 4 1
Totales 124 21 5
Total de la población promediada : entre los años 2000 al 2013 han trabajado 96 personas en la empresa.
RESPONDEREMOS LAS SIGUIENTES INTERROGANTES DESDE LA PERSPECTIVA DE LAS PROBABILIDADES
• 1)¿Cuál es la probabilidad de que un trabajador se accidente laboralmente en un periodo de año similar al de la muestra?
• 2)¿Cuál es la probabilidad de que un trabajador se accidente en el trayecto en el año 2014 • ( siguiente año)?
• 3)¿Cuál es la probabilidad de que un trabajador sufra algún accidente laboral en el año 2014?
¿CUÁL ES LA PROBABILIDAD DE QUE UN TRABAJADOR SE ACCIDENTE LABORALMENTE EN UN PERIODO DE AÑO SIMILAR AL DE LA MUESTRA?
• Respuestas:• Aquí se aplica el concepto o criterio de la
probabilidad relativa , considerando que el espacio muestral corresponde al total de personas que han trabajado en este periodo , o sea 1341 y que de ese total se han accidentado 124 trabajadores , en consecuencia la probabilidad Laplaciana, se calcula por:
• Para este caso: = • Significa que hay un 9,2% de probabilidades de que
un trabajador se accidente en un periodo de tiempo similar al de la muestra estadística estudiada.
¿CUÁL ES LA PROBABILIDAD DE QUE UN TRABAJADOR SE ACCIDENTE EN EL TRAYECTO EN
EL AÑO 2014 (SIGUIENTE AÑO)?
• El procedimiento estimativo es el siguiente: en el periodo 2000 al 2013 se produjeron 21 accidentes de trayecto, lo que da un promedio por año de 1,5 accidentes de trayecto , que corresponderá los eventos probables.
• Por otro lado del total de trabajadores en el periodo 2000 al 2013 , que equivalen a 1341 , se determina un promedio anual de 96 trabajadores., que corresponderá al espacio muestral.
• aplicando la regla de Laplace, con la consiguiente consideración de que es una probabilidad relativa( se refiere a frecuencias de ocurrencias)
• En consecuencia: = • Significa que existe un 1,5% de probabilidades de que el
año 2014 se produzca un accidente de trayecto.
¿CUÁL ES LA PROBABILIDAD DE QUE UN TRABAJADOR SUFRA ALGÚN ACCIDENTE LABORAL EN EL AÑO 2014?
• El procedimiento estimativo es el siguiente: en el periodo 2000 al 2013 se produjeron 150 accidentes (trabajo, trayecto, enfermedad), lo que da un promedio por año 10,7 , que corresponderá los eventos probables para el problema en cuestión.
• Por otro lado del total de trabajadores en el periodo 2000 al 2013 , que equivalen a 1341 , que determina un promedio anual de 96 trabajadores, y que corresponderá al espacio muestral.
• Aplicando la regla de Laplace, con la consiguiente consideración de que es una probabilidad relativa( se refiere a frecuencias de ocurrencias)
• En consecuencia: = • Significa que existe un 11,1% de probabilidades de que el año
2014 se produzca alguno de los tres accidentes considerados.