instrumentos y técnicas de recolección de datos
Post on 24-Jul-2015
193 Views
Preview:
TRANSCRIPT
Instrumentos y Técnicas de Recolección de Datos
Autor: Thais T. Hernández C.
Barquisimeto, Noviembre de 2014
República Bolivariana de VenezuelaUniversidad de Yacambu
Vicerrectorado de Investigación y PostgradoInstituto de Investigación y Postgrado
Departamento de DoctoradosSeminario Avanzado de Diseño de Investigación I
Facilitador: Marioxy Morales
Contenido
• Instrumentos de Recolección de Datos.
• La Entrevista
• La Encuesta
• La Revisión Documental
• La Observación
Contenido• Técnicas de Recolección de Datos.
• Tabulación de datos
• Graficación de resultados
• Estadísticas Descriptivas
• Medidas de Tendencia Central
• Medidas de Posición
• Medidas de Dispersión
• Medidas de Apuntalamiento
• Medidas de Simetría
Técnicas de Recolección de Datos
En la etapa de recolección de datos es importante elaborarun plan detallado de los procedimientos que conduzcan areunir datos con un propósito especifico (Hernández y otros)
Para ello se debe tomar en cuenta, las fuentes a utilizar:primarias o secundarias; los requisitos de un instrumento:confiabilidad, validez (de contenido, constructo y criterio); losrecursos tanto económicos como de talento humano con elque se cuenta para realizar el estudio.
Técnicas de Recolección de Datos
La Entrevista:
Es un instrumento en la cual una personacalificada aplica un conjunto de preguntas a unentrevistado para luego realizar una análisis delas respuestas del participante en la entrevista.
Son instrumentos que consumen tiempo en el análisis delos resultados.
Son instrumentos difíciles de analizar yaque depende de si las respuestas son abiertaso cerradas.
Técnicas de Recolección de Datos
Cualidades de un entrevistador:
Debe lograr un ambiente de camaradería yamistad con el entrevistado
Debe formular las preguntas en un lenguajefácil de comprensión para el entrevistado
No debe realizar preguntas capciosas, demala intención o poco claras. Tampoco deberárealizar preguntas ajenas al tema que se estádesarrollando
Debe ser hábil al momento de escoger a los participantes en laentrevista de forma tal que no se produzca sesgo en la información,datos irrelevantes o falsos datos.
Técnicas de Recolección de DatosLa Encuesta:
Se fundamenta en una serie de preguntaselaboradas de antemano, pero orientadas a losobjetivos preestablecidos en la investigación.
Como primer paso se escoge el nivel demedición de la variable, en este sentido Ariaslo define como “el tipo de escala que permiteasignar un grado o valor a una variable”
Debe ser congruente con el planteamiento del problema ehipótesis y puede estar diseñado con preguntas cerradas oabiertas
Técnicas de Recolección de DatosLa Revisión Documental:
Se fundamenta en un análisis documentalcompuesto por una revisión de la informaciónfísica y digital de la información con quecuenta el ente de estudio.
En la investigación sedeberá utilizar unamatriz de categorías lacual “permite clasificar,agrupar y categorizarinformación contenida endocumentos”
Técnicas de Recolección de DatosLa Observación:
Esta técnica permite interactuarcon el ente de estudio, como bien loafirma Arias “es una técnica queconsiste en visualizar o captarmediante la vista, de formasistemática, cualquier hecho,fenómeno o situación que seproduzca en la naturaleza o en lasociedad, en función de unosobjetivos de investigaciónpreestablecidos”.
Técnicas de Recolección de DatosNo todos las áreas de la vida disponen
de datos publicados. En algunos casosdeberá recolectarse y analizarse. Cuandoesto sucede se denomina “Fuentes
Primarias”
Una forma de recolectar este tipo de datos es mediantelas encuestas. Hay dos posibilidades:
• Encuestas Muestrales (En muestras)
• Encuestas Censales (En poblaciones)
Encuestas Censales:
Se emplea cuando el número de unidades de análisisno es grande (n< 40 aproximadamente)
Censo: Estadística Descriptiva
Si el número de unidades de análisis es grande y senecesita una amplia cobertura de información en áreasmenores, como distritos, Comunidades nativas, y otros.
Características:• Costoso
• Errores de Medición
Técnicas de Recolección de Datos
Se emplea cuando el número de unidades de análisises grande pero no se necesita información a detalle deáreas geográficas menores.
Muestreo: Estadística Inferencial
Características:
• Mayor rapidez y viabilidad
• Mayor exactitud en la obtención
de información
• Reduce los costos
Técnicas de Recolección de Datos
Los problemas que se estudian o se investiganadquiriendo datos empíricos (de la realidad) publicados.
Los datos (estadísticas) que se encuentranrelacionadas en artículos publicados, tesis,revistas y periódicos.
Este tipo de datos se les conocecomo “Fuentes Secundarias”
Análisis básico de la recolección de datos
Todo análisis de recolección de datos son estrategias paratraducir la cantidad de información obtenida en larecolección de datos, a índices que sean interpretables yque representen alguna dimensión del comportamiento delas variables
La estrategia más sencilla esmostrar la información en unformato visual (gráficos) o en unesquema sintetizado (tablas).
TabulaciónLas tablas deben incluir todos los puntajes registrados
Deben respetar las características de la variable
Llevan un título representativo del contenido (sobre latabla, numerado)
Puntaje f p % Fasc %asc
10 – 15 154 0.2962 29.62% 154 29.62%
16 – 21 222 0.4269 42.69% 376 72.31%
22 – 27 124 0.2385 23.85% 500 96.16%
28 – 33 20 0.0384 3.84% 520 100%
TOTAL 520 1 100%
Muestra
Se requiere saber el número de hijos por matrimonioen Lima. Para este propósito, se elige una muestrarepresentativa de 50 matrimonios de ella. Se obtienen lossiguientes datos:
2 , 2 , 4 , 1 , 3 , 5 , 3 , 2 , 1 , 6 , 3 , 4 , 1 , 2 , 0 , 2 , 3 , 1 ,7 , 4 , 2, , 3 , 0 , 5 , 1 , 4 , 3 , 2 , 4 , 1 , 5 , 2 , 1 , 2 , 4 , 0 ,3 , 3, 2 , 6 , 1 , 5 , 4 , 2 , 0 , 3 , 2 , 4 , 3 , 1.
El número total de datos se representa con laletra n. En nuestro ejemplo n = 50.
Frecuencia Absoluta (fi)
La frecuencia absoluta esel número de veces que apareceun valor (x i) en los datosobtenidos.
En nuestro ejemplo, lafrecuencia absoluta indica elnúmero de familias que tienenesa cantidad de hijos:
TABLA
x i f i
0 4
1 9
2 12
3 10
4 8
5 4
6 2
7 1
Frecuencia Absoluta Acumulada (Fi)
La frecuencia absoluta acumulada indica cuantoselementos de la lista de datos son menores o iguales a unvalor dado.
Es la suma de las frecuenciasabsolutas desde la primera fila hasta lafila elegida.
Por ejemplo, sabemos que hay 25matrimonios de la muestra que tienen alo más 2 hijos:
Frecuencia Absoluta Acumulada (Fi)
x i f i F i
0 4 4
1 9 13
2 12 25
3 10 35
4 8 43
5 4 47
6 2 49
7 1 50
TABLA
Frecuencia Relativa (hi)La frecuencia relativa es el cociente entre la
frecuencia absoluta (f i) y el número total dedatos (n).
En nuestro ejemplo n = 50:
TABLA
x i f i F i h i0 4 4 0,08
1 9 13 0,18
2 12 25 0,24
3 10 35 0,20
4 8 43 0,16
5 4 47 0,08
6 2 49 0,04
7 1 50 0,02
Frecuencia Relativa Absoluta (Hi)La frecuencia relativa acumulada es el cociente
entre la frecuencia absoluta acumulada (F i) y elnúmero total de datos (n).
En nuestro ejemplo n = 50:
TABLA
x i f i F i h i H i0 4 4 0,08 0,08
1 9 13 0,18 0,26
2 12 25 0,24 0,50
3 10 35 0,20 0,70
4 8 43 0,16 0,86
5 4 47 0,08 0,94
6 2 49 0,04 0,98
7 1 50 0,02 1,00
Frecuencia Porcentual (fi %)
La frecuencia porcentual es la frecuenciarelativa (hi) expresada en forma porcentual.
En otras palabras, es la frecuencia relativa (hi)multiplicada por 100.
TABLA
x i f i F i h i H i f i %
0 4 4 0,08 0,08 8 %
1 9 13 0,18 0,26 18 %
2 12 25 0,24 0,50 24 %
3 10 35 0,20 0,70 20 %
4 8 43 0,16 0,86 16 %
5 4 47 0,08 0,94 8 %
6 2 49 0,04 0,98 4 %
7 1 50 0,02 1,00 2 %
Frecuencia Porcentual Acumulada (Fi %)
La frecuencia porcentual acumulada es la frecuenciarelativa acumulada (Hi) expresada en forma porcentual.
En otras palabras, es la frecuencia relativa acumulada(Hi) multiplicada por 100.
TABLA
x i f i F i h i H i f i % F i %
0 4 4 0,08 0,08 8 % 8 %
1 9 13 0,18 0,26 18 % 26 %
2 12 25 0,24 0,50 24 % 50 %
3 10 35 0,20 0,70 20 % 70 %
4 8 43 0,16 0,86 16 % 86 %
5 4 47 0,08 0,94 8 % 94 %
6 2 49 0,04 0,98 4 % 98 %
7 1 50 0,02 1,00 2 % 100 %
Organización y Presentación de Datos Unidimensionales
• Frecuencia Absoluta (fi): Es el número de veces que sepresenta un valor o categoría de una variable. Se representapor fi:
f1 + f2 + f3 + . . . + fn = n
Organización y Presentación de Datos Unidimensionales
• Frecuencia Absoluta Acumulada (Fi): Es el número dedatos igual o inferior (“Menor o igual que”) al valorconsiderado de la variedad o la suma de las frecuenciasabsolutas menor o igual que el valor considerado de lavariable. Es decir:
F1 = f1
F2 = f1 + f2
Fn = f1 + f2 + f3 + . . . fn
Organización y Presentación de Datos Unidimensionales
• Frecuencia Relativa (hi): Es igual a la frecuencia absolutasobre el número de observaciones.
h1f1
n=
h2f2
n=
hnfn
n=
:
Organización y Presentación de Datos Unidimensionales
• Frecuencia Relativa Acumulada (Hi): Es el resultado decada frecuencia absoluta acumulada dividida entre elnúmero total de observaciones.
h1f1
n=
h2f1 + f2
n=
hnf1 + f2 + . . . + fn
n=
:
Tablas de Frecuencias
Las frecuencias son, sin embargo, datos absolutos. Noes posible comparar los resultados de dos tablas con un Ntotal de respuestas diferente.
Para hacer esas comparaciones, se utilizan medidasestandarizadas, esto es, transformaciones de los puntajesoriginales a escalas que sean las mismas en todas las tablas(y que permiten la comparación.)
Tablas de Frecuencias
En muchas ocasiones, la cantidad de valores quepuede tomar la variable son demasiados, de manera que seagrupan en intervalos.
Cada intervalo agrupa a una serie de puntajes
Los intervalos son excluyentes entre sí
El número de valores que compone cada intervalo, sedenominada amplitud (i)del intervalo es la misma paratodos los intervalos de una tabla.
Tablas de Frecuencias
En todo intervalo se distinguen límites superiores einferiores, los cuales pueden ser aparentes (lo que saleen la tabla) o reales (lo que se usa para clasificar).
El número de intervalos debe ser manejable para quienrevise la tabla.
Las tablas de frecuencia reflejan el comportamiento deuna sola variable. Usualmente no se usan para lapresentación de resultados ya que revisar variable porvariable sería demasiado extenso.
En esos casos, se hacen tablas de resumen, en las quese indican los datos más importantes de un conjunto devalores.
Tablas de Frecuencias
Puntaje f p % Fasc %asc
10 – 15 154 0.2962 29.62% 154 29.62%
16 – 21 222 0.4269 42.69% 376 72.31%
22 – 27 124 0.2385 23.85% 500 96.16%
28 – 33 20 0.0384 3.84% 520 100%
TOTAL 520 1 100%
Resumen de resultados
Síntoma Porcentaje de Incidencia
Depresión 44.0%
Ansiedad 33.1%
Insomnio 22.3%
Onicofagia 5%
Colon Irritable 12.6%
Tablas de Frecuencias
Otro tipo de tablas útiles son aquellas que combinanlos resultados de dos variables.
Ambas variables deben expresar sus resultados encategorías.
Se dividen en filas y columnas (una variable en las filas yotra en las columnas).
Se dividen en filas y columnas (una variable en las filas yotra en las columnas). Una celda representa lacombinación de valores de las dos variables.
Cada celda se refiere a tres totales: filas, columnas ytotal.
Tablas de Frecuencias
Tabla III. Disposición a ayudar según sexoSexo
Mujer Hombre TOTAL
¿Ayuda?
Sí
26655.5
69.8
36.4
21344.5
60.9
29.1
47965.5
No
11545.6
30.2
15.7
13754.4
39.1
18.7
252
34.5
TOTAL38152.1
35047.9
731100
Tablas de Frecuencias
Graficación
Son complementos de la tabulación
Representan la distribución de la variable
Deben llevar un título representativo (bajo el gráfico ynumerado)
Tipos de GráficosGráfico de Torta
Son ideales para variablesnominales.
Se hace un circulo que representa al100 % de los casos.
Se divide el círculo en sectores:Cada sector representa un valor de lavariable.
El tamaño de cada sector dependedel porcentaje de ocurrencia de cadavalor.
Sólo se grafica un grupo a la vez.
PSICOLOGIA30%
MEDICINA28%
ARQUITECTURA10%
DERECHO4%
INGENIERIA10%
ECONOMIA18%
No permite usar muchas categorías
Histograma
Es una representación gráfica de una variable en forma debarras, donde la superficie de cada barra es proporcional a lafrecuencia de los valores representados.
En el eje vertical serepresentan las frecuencias, yen el eje horizontal los valoresde las variables.
Normalmente se señalan lasmarcas de clases, es decir, lamitad del intervalo en el queestán agrupados los datos.
Tipos de Gráficos
Tipos de Histograma
Diagrama de Barras Simples Vertical:
Se manejan dos ejes. El eje horizontal indica losvalores de la variable y el eje vertical representa el índiceestadístico (valor).
Tipos de Gráficos
Tipos de Histograma
Diagrama de Barras Simples Horizontal:
Se parecen mucho a las gráficas de columnas, con lasalvedad importante de que la función de los ejes seintercambian y el eje horizontal queda destinado a lasfrecuencias y el eje vertical a las clases.
Tipos de Gráficos
Tipos de Histograma
Diagrama de Barras Compuestas oComparativos:
Se usa para representar lainformación de una tabla dedoble entrada o sea a partir dedos variables, las cuales serepresentan así; la altura de labarra representa la frecuenciasimple de las modalidades ocategorías de la variable y estaaltura es proporcional a lafrecuencia simple de cadamodalidad.
Tipos de Gráficos
Tipos de Histograma
Diagrama de Barras Proporcionales:
Se usan cuando lo que sebusca es resaltar larepresentación de los porcentajesde los datos que componen untotal.
-
20.00
40.00
60.00
80.00
100.00
120.00
Sin Nivel
Inicial
Secundaria
Sup. No Univer.
Sup. Univer.
Especial
MUJER
HOMBRE
Tipos de Gráficos
Tipos de Histograma
Otros Diagrama de Barras:
Existe la posibilidad, y si losrecursos lo permiten, derepresentar gráficos compuestosde una manera "tridimensional",es decir, con gráficos que poseanno sólo dos ejes, sino tres; y enlos que los rectángulos sonsustituidos por prismas de baserectangular.
Ocasionalmente el software en el mercado permiteutilizar prismas cuya base son polígonos regulares de másde cuatro lados, pirámides o cilindros).
Tipos de Gráficos
Tipos de Histograma
Polígonos de Frecuencias:
Es un gráfico de líneas que se usa para presentar lasfrecuencias absolutas de los valores de una distribución enel cual la altura del punto asociado a un valor de lasvariables es proporcional a la frecuencia de dicho valor.
Tipos de Gráficos
Tipos de Histograma Gráficos Mixtos:
En estos tipos degráficos se representan doso más series de datos, cadauna con un tipo diferentede gráfico. Son gráficosmás vistosos y se usan pararesaltar las diferenciasentre las series.
Tipos de Gráficos
Polígono de frecuencias para los datos de la tabla I.
Tipos de Gráficos
Tipos de Histograma
Diagrama de Barras Continuas:
Usualmente se utiliza entablas con intervalos.
• Representan variables continuas.
• Se usa el punto medio comoreferencia.
• Permite visualizar la distribuciónde la variable.
Tipos de Gráficos
Gráficos de Líneas:
Resultan interesantes paraestudiar tendencias a lo largodel tiempo.
• No son más que una serie depuntos conectados entre símediante rectas.
• Cada punto puede representardistintas cosas o medicionessegún lo que nos interese encada momento.
Gráfico No. 1. Nro. Depacientes transplantadosrenales en el Complejo “JuanCamejo” durante el período1981-1997
Tipos de Gráficos
Gráficos de Líneas
Tipos de Gráficos
Ojivas:
La ojiva es una gráficaasociada a la distribuciónde frecuencias, es decir,que en ella se permite vercuántas observaciones seencuentran por encima odebajo de ciertos valores,en lugar de solo exhibirlos números asignados acada intervalo.
La ojiva apropiadapara información quepresente frecuenciasmayores que el dato quese está comparandotendrá una pendientenegativa (hacia abajo y ala derecha) y en cambiola que se asigna a valoresmenores, tendrá unapendiente positiva.
Tipos de Gráficos
Tipos de Gráficos
Gráficas de áreas:
Consiste en rellenas elárea que se encuentre debajode las líneas que resultan deuna gráfica de líneas
Tipos de Gráficos
Pictogramas:
Actualmente, y mucho enlos medios masivos decomunicación, se utilizangráficos para ilustrar los datoso los resultados de algunainvestigación.
Regularmente se utilizandibujos para representar dichainformación, y el tamaño o elnúmero de estos dibujosdentro de una gráfica quedadeterminado por la frecuenciacorrespondiente.
Tipos de Gráficos
Tipos de Gráficos
Gráficos de dispersión o dispersogramas:
Son gráficos que se construyensobre dos ejes ortogonales decoordenadas, llamados cartesianos,cada punto corresponde a un par devalores de datos x e y de un mismoelemento suceso.
Diagrama de dispersión (regresiónlogística). Probabilidad de padecercirrosis hepática, según un modelo deregresión logística ajustando por el % deprotrombina y el presentar o nohepatomegalia.
Tipos de Gráficos
Gráficos de dispersión de burbujas:
Son gráficos en los cuales sepresenta la dispersión de lasobservaciones de la misma formaque aquéllas, pero se le añade laposibilidad de visualizar otravariable representada en el tamañodel punto, pues éstos se conviertenen círculos (burbujas) con radiosproporcionales a las magnitudesque representan.
Tipos de Gráficos
Cartogramas:
Estos tipos de gráficos seutilizan para mostrar datossobre una base geográfica. Ladensidad de datos se puedemarcar por círculos,sombreado, rayado o color.
Tipos de Gráficos
Otros Gráficos:
Tipos de Gráficos
Otros Gráficos:
Tipos de Gráficos
Ausencia del título
No indicar las
variables
Errores en los Gráficos
Errores en los Gráficos
No colocar la escala
No indicar el punto
cero
1 2 3
Visualización confusa
No es recomendable comparar dos gráficos circularespuesto que resulta muy difícil y, por lo tanto, no es muyaconsejable.
En ocasiones existen categorías con pocas frecuencias,haciendo que la gráfica resulte "pesada" y las etiquetas seencimen.
Una posible solución es juntarlas en una sola categoría(por ejemplo, la típica "otras" o "varias"), pero entonceshabría que ponderar si se hace una gráfica extra con dichasobservaciones únicamente, haciendo la anotaciónpertinente, o simplemente se ignoran por no resultarsignificativas.
Errores en los Gráficos
3
7
5
9
1
4
200
7
425
1
6
4
8
9
4 1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
3
7
5
9
1
4
200
7
425
1
6
4
8
9
4 1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
Figura N 1. Notas de la Sección A de la Universidad
X durante el Período Y-Z
Figura N 1. Notas de la Sección B de la Universidad
X durante el Período Y-Z
Errores en los Gráficos
Análisis de los Resultados con estadísticas
Es la ciencia que:
Recolecta
Describe
Organiza
Interpreta
Los datos para transformarlos en información,de forma que se puedan tomar decisioneseficientes a partir de esos datos.
Estadística
• Es el conjunto de procedimientos y técnicas empleadaspara recolectar, organizar y analizar datos, los cuales sirvende base para tomar decisiones en las situaciones deincertidumbre que plantean las ciencias sociales onaturales.
Definición:
Estadística (Definición):
La estadística es una ciencia que estudiala recolección, análisis e interpretación dedatos, ya sea para ayudar en la resolución dela toma de decisiones o para explicarcondiciones regulares o irregulares de algúnfenómeno o estudio aplicado, de ocurrencia enforma aleatoria o condicional.
Sin embargo estadística es más que eso,en otras palabras es el vehículo que permitellevar a cabo el proceso relacionado con lainvestigación científica.
¿Para qué sirven las Estadísticas?
• La Ciencia se ocupa en general de fenómenosobservables.
• La Ciencia se desarrolla observando hechos, formulando
leyes que los explican y realizando experimentos para
validar o rechazar dichas leyes.
• Los modelos que crea la ciencia son de tipo determinista o
aleatorio (estocástico).
• La Estadística se utiliza como
tecnología al servicio de las ciencias
donde la variabilidad y la incertidumbre
forman parte de su naturaleza.
¿Quiénes usan las Estadísticas?• Organismos Oficiales
• Periodistas y Publicistas
• Políticos
• Comentadores Deportivos
• Profesionales de Marketing
• Controladores de Calidad
• Administradores
• Investigadores Científicos
• Médicos
• Educadores, etc.
Clasificación de la Estadística
Uno de los problemas fundamentales de laEstadística es el estudio de la relación existente entre unapoblación y sus muestras.
Según la dirección de tal relación la Estadísticapuede ser:
Estadística Inductiva
Estadística Deductiva
Población :
Es el conjunto de todos los individuos o elementos(unidad de análisis) que son el objetivo de nuestro interés.
Población Finita:
Alumnos de la UPTJAA
Empleados de PDVSA
Países con Convenios con Vzla
Población Infinita:
Peces del Mar Caribe
Bacterias
Flores Silvestres
La Población, según su número de elementos puedeser:
MuestraEs una parte o un subconjunto de una población.
Tiene la característica fundamental de ser representativa dela población.
La selección y estudio de una muestra facilita lainferencia de conclusiones válidas para la población dedonde se obtuvo la muestra.
Ejemplos:
Grupo de sacos de azúcar que se extraensistemáticamente de una línea de envasado.
Grupo de tornillos que se extrae para llevar a cabo elcontrol de calidad.
Población y Muestra:
Muestra
Población
Estadística Deductiva:
Es cuando a partir del conocimiento de la poblaciónse trata de caracterizar cada muestra posible.
Es cuando a partir del conocimiento derivado deuna muestra se pretende caracterizar la población.
Estadística Descriptiva:
Se refiere a la recolección, presentación,descripción, análisis e interpretación de una colección dedatos, esencialmente consiste en resumir éstos con uno odos elementos de información (medidas descriptivas) quecaracterizan la totalidad de los mismos.
Puede utilizarse para resumir o describir cualquierconjunto ya sea que se trate de una población o de unamuestra, cuando en la etapa preliminar de la InferenciaEstadística se conocen los elementos de una muestra.
Estadística Descriptiva:
Ejemplos básicos de parámetros estadísticos son:la media y la desviación estándar. Algunos ejemplosgráficos son: histograma, pirámide poblacional, clústers,entre otros.
Estadística Inferencial:Se refiere al proceso de lograr
generalizaciones acerca de las propiedades deltodo, población, partiendo de lo específico,muestra. las cuales llevan implícitos una serie deriesgos.
Para que éstas generalizaciones sean válidas lamuestra deben ser representativa de la población y lacalidad de la información debe ser controlada, ademáspuesto que las conclusiones así extraídas están sujetas aerrores, se tendrá que especificar el riesgo o probabilidadque con que se pueden cometer esos errores.
Estadística Inferencial:Estas inferencias pueden tomar la forma de
respuestas a preguntas si/no (prueba de hipótesis),estimaciones de características numéricas (estimación),pronósticos de futuras observaciones, descripciones deasociación (correlación) o modelamiento de relaciones entrevariables (análisis de regresión). Otras técnicas demodelamiento incluyen anova, series de tiempo y mineríade datos.
Estadística Inferencial:
El Rol de las Probabilidades en la inferencia estadística
MuestraPoblación
Estadística Inferencial
Probabilidad
Crítica a la Estadística
Hay una percepción general de que el conocimientoestadístico es intencionada y demasiado frecuentementemal usado, encontrando maneras de interpretar los datosque sean favorables al presentador.
Un dicho famoso, al parecer de Benjamin Disraeli, es:«Hay tres tipos de mentiras: mentiras pequeñas, mentirasgrandes y estadísticas».
El popular libro How to lie with statistics (‘cómomentir con las estadísticas’) de Darrell Huff discute muchoscasos de mal uso de la estadística, con énfasis en gráficasmalintencionadas.
Crítica a la Estadística
Al escoger (o rechazar o modificar) una ciertamuestra, los resultados pueden ser manipulados; porejemplo, mediante la eliminación selectiva de valoresatípicos (outliers).
Este puede ser el resultado de fraudes o sesgosintencionales por parte del investigador (Darrel Huff).
Lawrence Lowell (decano de la Universidad deHarvard) escribió en 1909 que las estadísticas, «comoalgunos pasteles, son buenas si se sabe quién las hizo y seestá seguro de los ingredientes».
Etapas de la Investigación Estadística
Selección y determinación de la población o muestra ylas características contenidas que se desean estudiar. En elcaso de que se desee tomar una muestra, es necesariodeterminar el tamaño de la misma y el tipo de muestreo arealizar (probabilístico o no probabilístico).
• Tomar una muestra
• Determinar el tipo de muestreo a realizar :
Probabilístico
No probabilístico
Etapas de la Investigación Estadística
Obtención de los datos: Estapuede ser realizada mediante laobservación directa de loselementos, la aplicación deencuestas y entrevistas, y larealización de experimentos.
Etapas de la Investigación Estadística
Clasificación, tabulación yorganización de los datos. Laclasificación incluye eltratamiento de los datosconsiderados anómalos quepueden en un momento dado,falsear un análisis de losindicadores estadísticos.
La tabulación implica el resumen de los datos en tablasy gráficos estadísticos.
Etapas de la Investigación Estadística
Análisis descriptivo de los datos. El análisis secomplementa con la obtención de indicadores estadísticoscomo las medidas: de tendencia central, dispersión, posicióny forma.
Etapas de la Investigación Estadística
Análisis inferencial de los datos. Se aplican técnicas detratamiento de datos que involucran elementosprobabilísticos que permiten inferir conclusiones de unamuestra hacia la población (opcional).
Elaboración de conclusiones. Se construye el informe final.
Variables
La definición de una Población y susCaracterísticas dependerán de sus unidades (Variables)elementales que deben ser observadas y dependiendo dela naturaleza del problema planteado.
Por lo tanto, una variables es unacaracterística de interés sobre cada elementoindividual de una población o muestra.
Ejemplo:
El sexo de una familia: Sexo Femenino y SexoMasculino
Dato
Valor de la variable asociada a un elemento de lapoblación o muestra. Este valor puede ser un número, unapalabra o un símbolo.
Ejemplo:
La familia González tiene “4” miembros, sus ingresosmensuales son de “US$ 685.00”, “2” son de sexo femenino y“2” sexo masculino.
Variables
Datos
Tipos de Variables
Clasifica o describe un elemento de la población.Los valores que puede asumir no constituyen un espaciométrico, por lo tanto las operaciones aritméticas, comosumar y obtener promedios, no son significativas.
Cualitativa o de Atributos:
Ejemplos:
• Sexo
• Nacionalidad
• Marcas de Auto
• Grado de Satisfacción con la Universidad
• Listado de Ferreterías
Tipos de Variables
Sólo hay dos categoría, que son excluyentes unade la otra.
Dicotómicas:
Ejemplos:
• Enfermo - Sano
• Vivo - Muerto
• Hombre - Mujer
Tipos de Variables
Tiene mas de dos categorías y no hay orden entre
ellas.
Nominal:
Ejemplos:• Color de los ojos
• Grupo Sanguíneo
Tiene varias categorías y hay orden entre ellas.
Ordinal:
Ejemplos:
• Grado Tumoral
• Calificación del riesgo en
Anestesia
Niveles de Medición de las Variables:
De acuerdo a su naturaleza pueden encontrarse en
estas escalas:
De razón
Nominal
Ordinal
Intervalar
Niveles de Medición de las Variables:
Tipos Característica Ejemplos
Nominal Valores que se agrupan en categorías disjuntas y exhaustivas
•Género: Sexo•Color de Pelo•Religión
Ordinal Hay un orden entre las categorías •Clase Social•Preferencias•Educación
De Intervalo •Hay orden•Hay distancia•Hay un cero convencional
•Temperatura•Coeficiente Intelectual•Presión
De Razón •Hay orden•Hay distancia•Hay un cero convencional
•Edad•Producción•Ingresos
Escalas de Medición
Las variables cualitativas se miden en escala Nominalu Ordinal
• Sectores de Residencia de los alumnos: Casco Viejo,Inavi, Chaguaramos, Rahme, etc.
• Color de los ojos: Azules, Verdes, Negros, Marrones
• Club de Beisbol: Caribes, Leones, Magallanes, Tigres
Ejemplos de Nominales:
Características:
• Son mutuamente excluyentes
• No pueden ser ordenados
• Es Exhaustivo: Todos deben clasificarse
Escalas de Medición
• Grado de Satisfacción en el uso de los servicios públicos:Pésimo, Malo, Bueno, Satisfactorio, Excelente
• Grado de Educación: Preescolar, Escolar, Bachillerato,Universitaria, Post-Universitaria
Ejemplos de Ordinales:
Características:
• Los valores se pueden ordenar
• No es posible determinar la diferenciaaritmética (o distancia) entre ellos.
Tipos de Variables
Cuantifica un elemento de la población. Los valoresque puede asumir constituyen un espacio métrico, por lotanto las operaciones aritméticas, como sumar y obtenerpromedios, son significativas.
Cuantitativa o Numérica:
Ejemplos:
• Cantidad de Habitaciones
• Número de Hijos
• Kilómetros Recorridos
• Ingreso
• Tiempo de vuelo
Tipos de Variables
Sólo pueden asumir ciertos valores y normalmente
hay huecos entre ellos.
Cuantitativas Discreta:
Ejemplos:• Cantidad de Materias Aprobadas
• Cantidad de Hijos: 1, 2, 3, …
Puede asumir cualquier valor dentro del rango demedición. Normalmente se miden magnitudes como serlongitud, superficie, volumen, peso, tiempo, dinero.
Cuantitativas Continuas:
Ejemplos:
• Peso al Nacer
• Salario de un Empleado
• Tiempo de viaje en un autobús
Escalas de Medición
Las variables cuantitativas se miden en escala deintervalo o razón.
Los elementos son clasificados en categorías quetienen un orden o jerarquía, es decir, la diferencia entrevalores se puede realizar y son significativas.
Ejemplo:
Intervalos:
• Temperatura en grados Celsius
Escalas de Medición
Similar al nivel ordinal con la propiedad adicionalde que se pueden determinar cantidades significativas.
Ejemplo:
Nivel Intervalar:
• Temperatura en escala en grados Celsius
• Tallas de camisas (zapatos,pantalones, etc.)
Escalas de Medición
Los elementos son clasificados en categorías quetienen un orden o jerarquía, la diferencia entre valores sepueden realizar y son significativas. Existe el “0” absoluto,es decir la ausencia de la variable medida.
Ejemplo:
Razón:
• Tiempo de viaje
• Ingresos Familiares
• Producción
Variable Cuantitativa
(Numérica)
Variable Cualitativa
(No numérica )
Continua Discreta
Puede tomar
cualquier valor
en un intervalo
dado.
(Procesos de
medición)
Nº de trabajadores
por oficina,
nº de alumnos
por curso etc.
Sexo,
ocupación,
Condición de
de empleo
(nombrado o
contratado)
NominalOrdinal
-Nivel de
Educación,
estrato
socioeconómico,
categoría de
ocupación.
Ingreso, talla,
peso etc.
Toma sólo
ciertos
valores.
(procesos de
contar)
Se caracteriza por
Tienen
un orden
predeter-
minado:
No tienen
un orden
predeter-
minado:
Clasificación de Variables
Una MTC es un indicador numérico que representa el comportamiento que se considera más representativo de un grupo de valores.
El puntaje quemás se repite.
El puntaje quedivide al grupopor la mitad
El puntaje que equipara los puntajes positivos con losnegativos
Medidas de Tendencia Central
Media
Aritmética Geométrica Armónica
Moda
Mediana
Medidas de Tendencia Central
La Moda para datos no agrupados
Se denota Mo y es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos, o sea, cual se repite más.
El puntaje que más se repite. Una distribución depuntajes puede ser bimodal, esto es, tener dos modas.Si hay más de dos valores con la mayor frecuencia sedice que no tiene moda.
En datos no tabulados, es el valor que se repite más.
EjercicioSe requiere saber el número de hijos por matrimonio
en Lima. Para este propósito, se elige una muestrarepresentativa de 50 matrimonios de ella. Se obtienenlos siguientes datos:
2 , 2 , 4 , 1 , 3 , 5 , 3 2 , 1 , 6 , 3 , 4 , 1 , 2 , 0 , 2 , 3 , 1, 7, 4 , 2, 3 , 0 , 5 , 1 , 4 , 3 , 2 , 4 , 1 , 5 , 2 , 1 , 2 , 4 , 0, 3, 3, 2 , 6 , 1 , 5 , 4 , 2 , 0 , 3 , 2 , 4 , 3 , 1.
El número total de datos se representa con laletra n. En nuestro ejemplo n = 50.
¿Cuál es el valor de la moda?
La Moda para datos no agrupados
Si los datos se ordenan de orden ascendente demagnitud, entonces la Mediana está dada por:
Me n + 1
2 =
Si n es impar, la mediana es exactamente el valorpromedio
Si n es par, la mediana es el promedio de los valorescentrales
La Mediana para datos no agrupados
Ejercicio
¿Cuál es el valor de la mediana?
Me2
= 2 + 3
Me= 2,5
Caso par:
Me2
= 50 + 1
Me= 25,5
0 1 2 2 3 4 6
0 1 2 3 3 4 7
0 1 2 3 3 4
0 1 2 3 4 5
1 1 2 3 4 5
1 2 2 3 4 5
1 2 2 3 4 5
1 2 2 3 4 6
MedianaMediana
La Mediana para datos no agrupados
Ejercicio
Se obtienen los siguientes datos:
80, 75, 56, 45, 80, 64, 53, 74, 34
El número total de datos se representa con laletra n. En nuestro ejemplo n = 9.
La Mediana para datos no agrupados
Ejercicio¿Cuál es el valor de la mediana?
Xi
34
45
53
56
64
74
75
80
80
Me2
= 9 + 1
Me= 5
Caso impar:
Mediana
La Mediana para datos no agrupados
La Media
Representa al puntaje que equilibra los valorespositivos con los negativos de una distribución.
Media Aritmética
Media Geométrica
Media Armónica
Clasificación de la media:
Representa al puntaje que equilibra los valorespositivos con los negativos de una distribución.
Es aquella medida que se obtiene al dividir la sumade todos los valores de una variable por la frecuenciatotal. En palabras más simples, corresponde a la sumade un conjunto de datos dividida por el número total dedichos datos.
Datos no Agrupados:
La Media Aritmética
Ejercicio¿Cuál es el valor de la media aritmética?
Xi
34
45
53
56
64
74
75
80
80
9 = 561
= 62,33
X
X
561
La Media Aritmética
EjercicioSe requiere saber el número de hijos por matrimonio
en Lima. Para este propósito, se elige una muestrarepresentativa de 50 matrimonios de ella. Se obtienenlos siguientes datos:
2 , 2 , 4 , 1 , 3 , 5 , 3 2 , 1 , 6 , 3 , 4 , 1 , 2 , 0 , 2 , 3 ,1 , 7, 4 , 2, 3 , 0 , 5 , 1 , 4 , 3 , 2 , 4 , 1 , 5 , 2 , 1 , 2 , 4, 0 , 3, 3, 2 , 6 , 1 , 5 , 4 , 2 , 0 , 3 , 2 , 4 , 3 , 1.
El número total de datos se representa con laletra n. En nuestro ejemplo n = 50.
La Media Aritmética
Ejercicio¿Cuál es el valor de la media aritmética?
x i f i f ix i
0 4 0
1 9 9
2 12 24
3 10 30
4 8 32
5 4 20
6 2 12
7 1 7
134
X50
= 134
X = 2,68
La Media Aritmética
La media geométrica es otro estadígrafo detendencia central, pero de poca utilización. El cálculo dela media geométrica se puede hacer en datos confrecuencia y datos sin frecuencias
Datos no Agrupados:
nn321 x·.......·· ·x xxG
n f
n
f
3
f
2
f
1n321 x ·.......·· ·x xxG Datos
Agrupados:
La Media Geométrica
Ejercicio
¿Cuál es el valor de la media geométrica?
Xi
34
45
53
56
64
74
75
80
80
60,16 80 . 80 . 75 . 74 . 64 . 56 . 53 . 45 . 34 9 G
La Media Geométrica
Ejercicio
Se requiere saber el número de hijos por matrimonioen Lima. Para este propósito, se elige una muestrarepresentativa de 50 matrimonios de ella. Se obtienenlos siguientes datos:
2 , 2 , 4 , 1 , 3 , 5 , 3 2 , 1 , 6 , 3 , 4 , 1 , 2 , 0 , 2 , 3 ,1 , 7, 4 , 2, 3 , 0 , 5 , 1 , 4 , 3 , 2 , 4 , 1 , 5 , 2 , 1 , 2 , 4, 0 , 3, 3, 2 , 6 , 1 , 5 , 4 , 2 , 0 , 3 , 2 , 4 , 3 , 1.
El número total de datos se representa con laletra n. En nuestro ejemplo n = 50.
La Media Geométrica
Ejercicio¿Cuál es el valor de la media Geométrica?
x i f i f ifi
0 4 04 0
1 9 19 1
2 12 212 4096
3 10 310 59049
4 8 48 65536
5 4 54 625
6 2 62 36
7 1 71 7
50 7.36.625.65536.59049.4096.1.0 G 1,27 G
La Media Geométrica
1. Identificar el tipo de variable Cuantitativa discretao Continua,
2. Determinar el valor mayor (Xmax) y el menor valor(Xmin),
3. Calcular el recorrido, donde R = Xmax - Xmin
Variables Cuantitativas:
La Distribución de Frecuencias
Variables Cuantitativas Discretas:
4. Si la variable es cuantitativa discreta:
a) Si el rango es pequeño, entoncestrabajar con los valores originalesordenados de las variables,
b) Si el rango es grande, entonces trabajarcon los datos ordenados agrupados enintervalos de clases, (Regla de Sturges)
La Distribución de Frecuencias
Variables Cuantitativas Continuas:
4. Si la variable es cuantitativa Continuas:
a) Determinar el número de intervalos(entre 5 y 20)
b) Utilizar las Regla de Sturges:m=1+(3,322 *Log (n))
c) Los intervalos creados son cerradospor la izquierda y abiertos por laderecha
d) Calcular la marca de clase
La Distribución de Frecuencias
Ejercicio
En un estudio de dos semanas sobre la productividad delos trabajadores de una fundición, se obtuvieron lossiguientes datos sobre el número total de piezasaceptables que produjeron los trabajadores:
Tabla de Frecuencias
Histograma: Diagrama de barras vertical
Polígono de frecuencia
Media aritmética
Mediana
Moda
La Distribución de Frecuencias
Resultados de la muestra
65 36 49 84 79 56 28 43 67 36
43 78 37 40 68 72 55 62 22 82
88 50 60 56 57 46 39 57 73 65
59 48 76 74 70 80 75 56 45
75 62 72 63 32 80 64 53 74 34
76 60 48 55 51 54 45 44 35 51
21 35 61 45 33 61 60 85 68
45 53 77 42 69 52 68 52 47
62 65 75 61 73 50 53 59 41 54
41 74 82 78 26 35 47 70 38 70
X Mínimo
X Máximo
1. Se identificó que la variable es cuantitativadiscreta,
2. Se procede a determinar los valores máximo yMínimo de la variable:
3. Se calcula el rango
X max =88
X min =21
X max = 88- X min - 21R = = 67
Solución
4. Como el rango es grande (mayor de 20), entoncesse procede a trabajar con los datos ordenadosagrupados en intervalos de clase (Regla deSturges),
5. Determine el número de intervalos
m = 1+(3,322 * Log (n)) = 1 +(3,322 * Log (97)) = 7,60
6. Como el valor dio 7,60; se redondea a m= 8, esdecir, tendrá 8 intervalos de clase
7. El menor del primer intervalo izquierdo es
X’ min = (Xmin) – menor unidad/2 = 21 – 1/2
X’ min = 20,5
Solución
8. Amplitud de clase
A = R / m = 67 / 8 = 8,375 = 9
9. Calcular la marca de clase
MC = X’min+(A/2)
MC1= 20,5 + 9/2 = 20,5 + 4,5 = 25
10. Se comienza a trabajar la Tabla de Frecuencia
Solución
INTERVALOS MC fi Fi hi Hi fi % Fi %
[20,5 – 29,5) 25 4 4 0,04 0,04 4 4
[29,5 – 38,5) 34 10 14 0,10 0,14 10 14
[38,5 – 47,5) 43 15 29 0,15 0,29 15 29
[47,5 – 56,5) 52 19 48 0,20 0,49 20 49
[56,5 – 65,5) 61 18 66 0,19 0,68 19 68
[65,5 – 74,5) 70 15 81 0,15 0,83 15 83
[74,5 – 83,5) 79 13 94 0,13 0,96 13 96
[83,5 – 92,5] 88 3 97 0,03 0,99 3 99
97 0,99 99
Solución
Para datos agrupados:
n
MC x f
X
k
1i
ii
INTERVALOS MC fi fi * MC
[20,5 – 29,5) 25 4 100
[29,5 – 38,5) 34 10 340
[38,5 – 47,5) 43 15 645
[47,5 – 56,5) 52 19 988
[56,5 – 65,5) 61 18 1098
[65,5 – 74,5) 70 15 1050
[74,5 – 83,5) 79 13 1027
[83,5 – 92,5] 88 3 264
97 5512
82,5697
5512 X
La Media Datos Agrupados
Datos Agrupados:
L : Límite inferior Clase Mediana (C Me)
Ne-1 : Frec. Acumulada hasta antes (C Me)
ne : Frecuencia Absoluta (C Me)
ae : Amplitud (C Me)
n : Tamaño de la muestra
e
e-1
e
n
Nn2
aLMe)( -
+=
xeL
ne
ae
Ne-1= fiSi = e-1
i = 1
La Mediana Datos Agrupados
Para datosagrupados: e
1-e
en
n 2
n
a L Me
56,75 Me
18
48 - 2
97
9 56,5 Me
Datos:
ae : 9n : 97L : 56,5 ne-1 :48 Ne : 18
INTERVALOS MC fi Fi fi * MC
[20,5 – 29,5) 25 4 4 100
[29,5 – 38,5) 34 10 14 340
[38,5 – 47,5) 43 15 29 645
[47,5 – 56,5) 52 19 48 988
[56,5 – 65,5) 61 18 66 1098
[65,5 – 74,5) 70 15 81 1050
[74,5 – 83,5) 79 13 94 1027
[83,5 – 92,5] 88 3 97 264
97 5512
Ne-1
Ne
L
La Mediana Datos Agrupados
Para datosagrupados:
INTERVALOS MC fi
[20,5 – 29,5) 25 4
[29,5 – 38,5) 34 10
[38,5 – 47,5) 43 15
[47,5 – 56,5) 52 19
[56,5 – 65,5) 61 18
[65,5 – 74,5) 70 15
[74,5 – 83,5) 79 13
[83,5 – 92,5] 88 3
97
A*
L Mo
21
1
54,7 Mo
9*1) (4
4 47,5 Mo
∆1 : 19 – 15 = 4
∆2 : 19 – 18 = 1
A : 9
fi menor
fi mayor
Mayor fi
La Moda Datos Agrupados
El área de Control de Calidad de la empresa Tornillos C,A,, está realizando un seguimiento a un lote de tornillosen su planta de la ciudad X, para ello toma una muestraaleatoria, con el fin de que se le realice sus respectivoanálisis descriptivo:
Tabla de Frecuencias
Histograma: Diagrama de barras vertical
Polígono de frecuencia
Media aritmética
Mediana
Moda
Ejercicio
1279,51285,01280,01273,01284,01280,51275,51278,01279,51275,01267,01272,01282,01276,01269,51266,01273,51285,51275,51283,51285,01273,0
1278,01273,01280,01277,51286,01280,01281,01275,01278,51279,51273,51275,01276,51271,51284,51276,01268,51272,51284,51286,01271,01265,5
1283,01282,51272,51275,51275,01282,01271,01280,51266,01282,51284,51276,01279,01281,01276,01287,51273,51272,51279,51279,01276,01281,5
1273,01271,51275,51277,01278,01283,51274,51279,01287,51276,01279,51268,01269,01285,51268,01272,51266,51278,01267,01271,01275,51277,0
1280,51269,01284,01287,01275,51280,01280,51278,01275,51280,01274,51285,01282,01276,51268,51275,51269,01271,51280,51287,01276,51272,0
X Mínimo X Máximo
Resultados de la muestra
1. Se identificó que la variable es cuantitativacontinua,
2. Se procede a determinar los valores máximo yMínimo de la variable
3. Se calcula el rango
X max = 1287,5
X min = 1265,5
X max = 1287,5- X min - 1265,5R= = 22
Solución
4. Como el rango es grande (mayor de 20), entoncesse procede a trabajar con los datos ordenadosagrupados en intervalos de clase (Regla deSturges),
5. Determine el número de intervalos
m = 1+(3,322 * Log (n)) = 1 +(3,322 * Log (110)) = 7,78
6. Como el valor dio 7,78; se redondea a m= 8, esdecir, tendrá 8 intervalos de clase
7. El menor del primer intervalo izquierdo es
X’ min = (Xmin) - menor unidad/2 = 1265,5 – 0,1/2
X’ min = 1265,45
Solución
8. Amplitud de clase
A = R / m = 22 / 8 = 2,75 = 2,8
9. Calcular la marca de clase
MC = X’min+(A/2)
MC1= 1265,45 + (2,8/2) = 1266,85
10. Se comienza a trabajar la Tabla de Frecuencia
Solución
INTERVALOS MC fi Fi hi Hi fi % Fi %
[1265,45 - 1268,25 ) 1266,85 8 8 0,07 0,07 7 7
[1268,25 - 1271,05 ) 1269,65 9 17 0,08 0,15 8 15
[1271,05 - 1273,85 ) 1272,45 16 33 0,15 0,30 15 30
[1273,65 - 1276,65 ) 1275,25 23 56 0,21 0,51 21 51
[1276,65 - 1279,45 ) 1278,05 12 68 0,11 0,62 11 62
[1279,45 - 1282,25 ) 1280,85 21 89 0,19 0,81 19 81
[1282,25 - 1285,05 ) 1283,65 13 102 0,12 0,93 12 93
[1285,05 - 1287,85 ] 1286,45 8 110 0,07 1,00 7 100
110 1,00 100
Solución
Para datosagrupados: n
MC x f
X
k
1i
ii
INTERVALOS MC fi fi * MC
[1265,45 - 1268,25 ) 1266,85 8 10134,80
[1268,25 - 1271,05 ) 1269,65 9 11426,85
[1271,05 - 1273,85 ) 1272,45 16 20359,20
[1273,65 - 1276,65 ) 1275,25 23 29330,75
[1276,65 - 1279,45 ) 1278,05 12 15336,60
[1279,45 - 1282,25 ) 1280,85 21 26897,85
[1282,25 - 1285,05 ) 1283,65 13 16687,45
[1285,05 - 1287,85 ] 1286,45 8 10291,60
110 140465,10
96,1276110
10,140465 X
La Media Datos Agrupados
INTERVALOS MC fi Fi fi * MC
[1265,45 - 1268,25 ) 1266,85 8 8 10134,80
[1268,25 - 1271,05 ) 1269,65 9 17 11426,85
[1271,05 - 1273,85 ) 1272,45 16 33 20359,20
[1273,65 - 1276,65 ) 1275,25 23 56 29330,75
[1276,65 - 1279,45 ) 1278,05 12 68 15336,60
[1279,45 - 1282,25 ) 1280,85 21 89 26897,85
[1282,25 - 1285,05 ) 1283,65 13 102 16687,45
[1285,05 - 1287,85 ] 1286,45 8 110 10291,60
110 140465,10
Para datosagrupados: e
1-e
en
n 2
n
a L Me
1276,33 Me
23
33 - 2
110
2,8 1273,65 Me
Datos:
L : 1273,65 ne-1 :33
ne : 23
ae : 2,8n : 110
Ne-1
Ne
L
La Mediana Datos Agrupados
Para datosagrupados:
INTERVALOS MC fi
[1265,45 - 1268,25 ) 1266,85 8
[1268,25 - 1271,05 ) 1269,65 9
[1271,05 - 1273,85 ) 1272,45 16
[1273,65 - 1276,65 ) 1275,25 23
[1276,65 - 1279,45 ) 1278,05 12
[1279,45 - 1282,25 ) 1280,85 21
[1282,25 - 1285,05 ) 1283,65 13
[1285,05 - 1287,85 ] 1286,45 8
110
A *
L Mo
21
1
1274,74 Mo
8,2*11) (7
7 1273,65 Mo
∆1 : 23 – 16 = 7
∆2 : 23 – 12 = 11
fi menor
fi mayor
Mayor fi
A : 2,8
L
La Moda Datos Agrupados
1. Percentiles: Es cuando la distribución se divide en100 partes.
2. Deciles: Es cuando la distribución se divide en 10partes.
3. Cuartiles: Es cuando la distribución se divide en 4partes.
Este tipo de medidas, nos permiten dividir a unadistribución en diferentes partes.
Según sea el número de partes o divisiones, seclasifican en:
4. Mediana: Es cuando la distribución se divide en 2partes.
Medidas de Posicionamiento
a) Las variables deben ser cuantitativas
b) Los resultados deben estar ordenados, es decir,las variables deben ser ordinales.
Requisitos:
c) Las variables deben ser discretas
Cuando todas las medidas se refieren al mismogrupo de datos se pueden hacer equivalencias entresí.
Equivalencias:
Medidas de Posición
El percentil 30 (P30), por ejemplo, es el valor en elcual la variable bajo el cual se encuentra el 30 % de loscasos y sobre el cual se encuentra el 70 % de los casos
El decil 4 (D4) es el valor de la variable que deja bajoél, el 40 % de los casos y sobre dicho decil el 60 %. Estopermite ver las equivalencias entre percentiles y deciles.
D4 P40=
El cálculo del percentil cuando los datos no estántabulados es directo. Se ubica el puntaje o valor que estáen la posición que corresponde al percentil deseado.
Ejemplo: 23 34 34 36 37 37 37 42 46 50
P60
D6
Medidas de Posición
Si los datos están en una tabla de intervalos, lafórmula para calcular el percentil, es la siguiente:
i . f
F .n100
x
L Px
n : Tamaño de la muestraL : Límite inferior Real del intervalo críticoF : Frec. Acumulada hasta el intervalo anteriorf : Frecuencia relativa en el intervalo críticoi : Amplitud del intervalo
Medidas de Posición
Son aquellas que permiten retratar la distancia de losvalores de la variable a un cierto valor central, o quepermiten identificar la concentración de los datos en uncierto sector del recorrido de las variables. Se trata decoeficientes para variables cuantitativas.
Medidas de Dispersión
Varianza Muestral:
1 -n
)x - (x f
S
k
1i
2
ii2
Datos Agrupados:
1 -n
)x - (x
S
n
1i
2
i2
Datos no Agrupados:
Datos:
s2 : frecuencia relativa clase i xi : i-ésimo valor observadox : media aritmétican : tamaño de la muestra
Datos:
fi : frecuencia relativa clase i xi : marca de clase ix : media aritmétican : tamaño de la muestrak : número de clases
Amplitud Total: Valor mayor – valor menor
Amplitud total:
Medidas de Dispersión
Desviación Muestral:
1 -n
)x - (x f
S
k
1i
2
ii
Datos Agrupados:
1 -n
)x - (x
S
n
1i
2
i
Datos no Agrupados:
Datos:
s2 : frecuencia relativa clase i xi : i-ésimo valor observadox : media aritmétican : tamaño de la muestra
Datos:
fi : frecuencia relativa clase i xi : marca de clase ix : media aritmétican : tamaño de la muestrak : número de clases
Medidas de Dispersión
Desviación Media:
Datos Agrupados:
n
x - x
MD
n
1i
i
Datos no Agrupados:
Datos:
s2 : frecuencia relativa clase i xi : i-ésimo valor observadox : media aritmétican : tamaño de la muestra
Datos:
fi : frecuencia relativa clase i xi : marca de clase ix : media aritmétican : tamaño de la muestrak : número de clases
n
x - x . f
MD
n
1i
ii
Medidas de Dispersión
Se obtienen los siguientes datos:
80, 75, 56, 45, 80, 64, 53, 74, 34
El número total de datos se representa con laletra n. En nuestro ejemplo n = 9.
Ejercicio
xi
34
45
53
56
64
74
75
80
80 9
561 X
Media:
n
x
X
k
1i
i
62,33 X
A = xmax – xmin
A = 80 – 34 = 46
Amplitud Total:
561
Solución
xi xi - x (xi – x)2
34 -28,33 802,5889
45 -17,33 300,3289
53 -9,33 87,0489
56 -6,33 40,0689
64 1,67 2,7889
74 11,67 136,1889
75 12,67 160,5289
80 17,67 312,2289
80 17,67 312,2289
2154,0001
Media: 62,33 X
Varianza Muestral:
25,269S
8
0001,2154 S
2
2
1 -n
)x - (x
S
n
1i
2
i2
Desviación Muestral:
1 -n
)x - (x
S
n
1i
2
i
41,16S
Solución
xi xi - x |xi - x|
34 -28,33 28,33
45 -17,33 17,33
53 -9,33 9,33
56 -6,33 6,33
64 1,67 1,67
74 11,67 11,67
75 12,67 12,67
80 17,67 17,67
80 17,67 17,67
122,67
Media: 62,33 X
Desviación Media:
63,13MD
9
67,122 MD
n
x - x
MD
n
1i
i
Solución
Se requiere saber el número de hijos por matrimonioen Lima. Para este propósito, se elige una muestrarepresentativa de 50 matrimonios de ella. Se obtienenlos siguientes datos:
2 , 2 , 4 , 1 , 3 , 5 , 3 2 , 1 , 6 , 3 , 4 , 1 , 2 , 0 , 2 , 3 ,1 , 7, 4 , 2, 3 , 0 , 5 , 1 , 4 , 3 , 2 , 4 , 1 , 5 , 2 , 1 , 2 , 4, 0 , 3, 3, 2 , 6 , 1 , 5 , 4 , 2 , 0 , 3 , 2 , 4 , 3 , 1.
Tabla de Frecuencias
Amplitud Total
Media Aritmética
Varianza Muestral
Desviación Muestral
Desviación Media
Ejercicio
x i f i F i h i H i f i % F i %
0 4 4 0,08 0,08 8 % 8 %
1 9 13 0,18 0,26 18 % 26 %
2 12 25 0,24 0,50 24 % 50 %
3 10 35 0,20 0,70 20 % 70 %
4 8 43 0,16 0,86 16 % 86 %
5 4 47 0,08 0,94 8 % 94 %
6 2 49 0,04 0,98 4 % 98 %
7 1 50 0,02 1,00 2 % 100 %
50 1,00 100 %
Solución
xi fi xi fi
0 4 0
1 9 9
2 12 24
3 10 30
4 8 32
5 4 20
6 2 12
7 1 7
50 134
A = xmax – xmin = 7 – 0 = 7
50
134 X
Media:
Amplitud Total:
n
f.x
X
k
1i
ii
,682 X
Solución
xi fi (xi-x) (xi-x)2 fi (xi-x)2
0 4 -2,68 7,1824 28,7296
1 9 -1,68 2,8224 25,4016
2 12 -0,68 0,4624 5,5488
3 10 0,32 0,1024 1,024
4 8 1,32 1,7424 13,9392
5 4 2,32 5,3824 21,5296
6 2 3,32 11,0224 22,0448
7 1 4,32 18,6624 18,6624
50 136,88
Varianza Muestral:
1 -n
)x - (x f
S
k
1i
2
ii2 79,2
49
88,136 S2
68,2 X
Media:
Solución
xi fi (xi-x) (xi-x)2 fi (xi-x)2
0 4 -2,68 7,1824 28,7296
1 9 -1,68 2,8224 25,4016
2 12 -0,68 0,4624 5,5488
3 10 0,32 0,1024 1,024
4 8 1,32 1,7424 13,9392
5 4 2,32 5,3824 21,5296
6 2 3,32 11,0224 22,0448
7 1 4,32 18,6624 18,6624
50 136,88
Varianza Muestral:
Desviación
Muestral:
1 -n
)x - (x f
S
k
1i
2
ii
67,1S
1 -n
)x - (x f
S
k
1i
2
ii2 79,2
49
88,136 S2
Solución
xi fi |xi-x| fi |xi-x|
0 4 2,68 10,72
1 9 1,68 15,12
2 12 0,68 8,16
3 10 0,32 3,2
4 8 1,32 10,56
5 4 2,32 9,28
6 2 3,32 6,64
7 1 4,32 4,32
50 68
Desviación Media:
n
x - x . f
MD
n
1i
ii
50
68 MD
36,1MD
68,2 X Media:
Solución
En un estudio de dos semanas sobre la productividadde los trabajadores de una fundición, se obtuvieron lossiguientes datos sobre el número total de piezasaceptables que produjeron los trabajadores:
Tabla de Frecuencias
Amplitud Total
Media Aritmética
Varianza Muestral
Desviación Muestral
Desviación Media
Ejercicio
INTERVALOS MC fi Fi hi Hi fi % Fi %
[20,5 – 29,5) 25 4 4 0,04 0,04 4 4
[29,5 – 38,5) 34 10 14 0,10 0,14 10 14
[38,5 – 47,5) 43 15 29 0,15 0,29 15 29
[47,5 – 56,5) 52 19 48 0,20 0,49 20 49
[56,5 – 65,5) 61 18 66 0,19 0,68 19 68
[65,5 – 74,5) 70 15 81 0,15 0,83 15 83
[74,5 – 83,5) 79 13 94 0,13 0,96 13 96
[83,5 – 92,5] 88 3 97 0,03 0,99 3 99
97 0,99 99
Solución
INTERVALOS MC fi fi * MC
[20,5 – 29,5) 25 4 100
[29,5 – 38,5) 34 10 340
[38,5 – 47,5) 43 15 645
[47,5 – 56,5) 52 19 988
[56,5 – 65,5) 61 18 1098
[65,5 – 74,5) 70 15 1050
[74,5 – 83,5) 79 13 1027
[83,5 – 92,5] 88 3 264
97 5512
A = xmax – xmin = 88 – 21 = 67
97
5512 X
Media:
Amplitud Total:
n
MC x f
X
k
1i
ii
82,56 X
Solución
INTERVALOS MC fi (xi-x) (xi-x)2 fi (xi-x)2
[20,5 – 29,5) 25 4 -31,82 1012,5124 4050,0496
[29,5 – 38,5) 34 10 -22,82 520,7524 5207,524
[38,5 – 47,5) 43 15 -13,82 190,9924 2864,886
[47,5 – 56,5) 52 19 -4,82 23,2324 441,4156
[56,5 – 65,5) 61 18 4,18 17,4724 314,5032
[65,5 – 74,5) 70 15 13,18 173,7124 2605,686
[74,5 – 83,5) 79 13 22,18 491,9524 6395,3812
[83,5 – 92,5] 88 3 31,18 972,1924 2916,5772
97 24796,0228
Varianza Muestral:
1 -n
)x - (x f
S
k
1i
2
ii2 29,258
96
0228,24796 S2
82,56 X
Media:
Solución
INTERVALOS MC fi fi (xi-x)2
[20,5 – 29,5) 25 4 4050,0496
[29,5 – 38,5) 34 10 5207,524
[38,5 – 47,5) 43 15 2864,886
[47,5 – 56,5) 52 19 441,4156
[56,5 – 65,5) 61 18 314,5032
[65,5 – 74,5) 70 15 2605,686
[74,5 – 83,5) 79 13 6395,3812
[83,5 – 92,5] 88 3 2916,5772
97 24796,0228
29,258S2 Varianza Muestral:
Desviación
Muestral:
1 -n
)x - (x f
S
k
1i
2
ii
07,16S
96
0228,24796 S2
Solución
INTERVALOS MC fi |xi-x| fi |xi-x|
[20,5 – 29,5) 25 4 31,82 127,28
[29,5 – 38,5) 34 10 22,82 228,2
[38,5 – 47,5) 43 15 13,82 207,3
[47,5 – 56,5) 52 19 4,82 91,58
[56,5 – 65,5) 61 18 4,18 75,24
[65,5 – 74,5) 70 15 13,18 197,7
[74,5 – 83,5) 79 13 22,18 288,34
[83,5 – 92,5] 88 3 31,18 93,54
97 1309,18
Desviación Media:
n
x - x . f
MD
n
1i
ii
97
18,1309 MD
50,13MD
82,56 X Media:
Solución
Pearson propuso el concepto de curtosis calculándolomediante el coeficiente de curtosis de cuarto orden (a4):
3 - s
)x - (x
a4
n
1i
4
i
4
Datos:
A4 > 0 --> Distribución de Frecuencias es leptocúrticaA4 = 0 --> Distribución de Frecuencias es platicúrticaA4 < 0 --> Distribución de Frecuencias es mesocrúrtica
Medidas de Apuntalamiento
Es cuando la distribución de frecuencias es másapuntada que la normal.
Leptocúrtica:
leptocúrtica
Normal
Medidas de Apuntalamiento
Es cuando la distribución de frecuencias es menosapuntada que la normal.
Platicúrtica:
Platicúrtica
Normal
Medidas de Apuntalamiento
Mesocúrtica:
Mesocúrtica
Normal
Medidas de Apuntalamiento
Miden la mayor o menor simetría de la distribución.
Datos:
a1 < 0 --> Distribución de Frecuencias es positivaa1 = 0 --> Distribución de Frecuencias es simétricaa1 < 0 --> Distribución de Frecuencias es negativa
s
)x - (x
a2
n
1i
2
i
1n
Medidas de Asimetría
Simetría Positiva:
Medidas de Asimetría
Simetría :
Medidas de Asimetría
Simetría Negativa :
Medidas de Asimetría
xi
34
45
53
56
64
74
75
80
80 0
0,5
1
1,5
2
2,5
1 2 3 4 5 6 7 8
Solución
xi fi
0 4
1 9
2 12
3 10
4 8
5 4
6 2
7 1 0
2
4
6
8
10
12
14
16
18
20
25 34 43 52 61 70 79
Gráfico de matrimonios vs. número de hijos
Solución
MC fi
25 4
34 10
43 15
52 19
61 18
70 15
79 13
88 3
97
0
2
4
6
8
10
12
14
16
18
20
25 34 43 52 61 70 79
Gráfico de productividad vs piezas
Solución
Sesión de preguntas
top related