conceptos básicos estadÍstica -...

68
ESTADÍSTICA Conceptos básicos

Upload: vucong

Post on 10-Jun-2018

228 views

Category:

Documents


0 download

TRANSCRIPT

ESTADÍSTICAConceptos básicos

ESTADÍSTICA DESCRIPTIVA

Se refiere a aquella parte del estudio de los datos que incluye la obtención, organización,presentación , descripción e interpretación de información numérica

Estadística Descriptiva

Presentación de datos

Métodos gráficos

Medidas descriptivas

Medidas de tendencia central

y de dispersión

ESTADÍSTICA INFERENCIAL

Es una técnica mediante la cual se obtienen generalizaciones o se toman decisiones con base a una información parcial o incompleta obtenida mediante técnicas descriptivas

Nos permite elegir procedimientos para analizar, interpretar y tomar decisiones sobre una población, con base en la información que se obtiene de una muestra

ESTADÍSTICA

Se refiere a un conjunto de métodos para la obtención, presentación y análisis de observaciones numéricas.

Sus fines son describir al conjunto de datos obtenidos y tomar decisiones o realizar generalizaciones acerca de las características de todas las posibles observaciones bajo consideración

TOMA DE DECISIONES

• Secuencia en la resolución de problemas• 1.-Delimitar el objetivo que se persigue

• 2.- Búsqueda de la información Define dónde, cuándo, cómo y qué datos buscar

Se puede partir de datos existentes o iniciar recopilación de los mismos

• 3.-Análisis de la información Debe sustentarse en un trabajo estadístico de los datos

• 4.-Conclusiones

• 5.- Acciones a tomar y monitoreo de resultados

CONCEPTOS

Cuando una variable es medida en un conjunto de unidades experimentales,

resulta un conjunto de mediciones o datos

Una unidad experimental es el individuo u objeto en el que se mide una variable

VARIABLES

Una variable es una propiedad que puede fluctuar y cuya variación es susceptible de medirse u observarse

También podemos considerar a una variable como una característica que cambia o se modifica con el tiempo y/o para diferentes individuos u objetos en consideración.

Atributos .- Son las características o cualidades que describen un objetoHombre, africano, conservador, honesto..

Las variables son agrupamientos de atributos Por ejemplo : género, raza, ocupación …

DATOS

Medidas que se realizan sobre los sujetos u objetos de un experimentos

Normalmente son las medidas cuantitativas de la variable dependiente o algunas características cualitativas del sujeto

“ es lo que estamos midiendo o contando”

TIPO DE VARIABLES

Variable Independiente

Es aquella característica o propiedad que se supone tiene una relación con el fenómeno o variable estudiada.

En una investigación experimental se llama así, a la variable que el investigador manipula

Variable de predicción, normalmente en el eje de las coordenadas (x)

VARIABLES

Variable Dependiente

Se define como la propiedad o característica que se trata de cambiar mediante la manipulación de la variable independiente.

Variable que se predice o se calcula a partir de la variable independiente, situada en el eje de la abscisas ( y ).

VARIABLES

VARIABLES

CUANTITATIVASCUALITATIVAS

TIPOS DE VARIABLES

CualitativasSon las variables que expresan distintas cualidades, características o modalidades . Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos.

Por ejemplo

Colores : rojo, azul , blanco …

Profesiones : Ingeniería, Médico, Administrador

Genero : Hombre o mujer

TIPOS DE VARIABLESCualitativas

Los sujetos u objetos se agrupan sobre la base de alguna característica en común , esto es, se coloca en cada categoría con el fin de hacer comparaciones

Por ejemplo : El promedio de gasto en celular de los estudiantes que trabajan es 300 pesos al mes, mientras que el gasto de los estudiantes que no trabajan es de 200 peso

VARIABLES CUANTITATIVAS

Son las variables que se expresan mediante cantidades numéricas y no tienen categorías que las diferencien

Por ejemplo : EstaturaPedro tiene una estatura de 1.86

Karla tiene una estatura de 1.65

Sigo con dudas

En Los datos de variables cualitativas , la media carece de significado 20 hombres y 10 mujeres ¿ cuál es la media?? No son 15 medios hombres

En los datos cuantitativos si podemos obtener un valor medio que tenga significado , por ejemplo el promedio de peso de los alumnos de este grupo Por ejemplo podemos saber el peso promedio de este grupo, o el tiempo en que tardan en llegar a clase…

POBLACIÓN Y MUESTRA

PoblaciónMuestra

La población es el conjunto de elementos de interés en

determinado estudio

La muestra es un subconjunto de la

población

Población

Muestra

Un parámetro es una medición numérica que

describe las características de una población

Un estadístico es una medición numérica que describe las

características de la muestra

POBLACIÓN

Si un conjunto de datos consta de todas las observaciones concebidas o hipotéticamente posibles de un fenómeno determinado, lo llamamos una población.Por ejemplo si queremos estudiar los hábitos de alimentación de los estudiantes de Unitec, tendríamos que tomar datos de TODOS los alumnos de Unitec.

MUESTRA

Si un conjunto de datos consiste sólo en una parte de estas observaciones se le conoce como : muestraLos datos deben ser representativos de la población

En el caso de una muestra representativa de los alumnos de Unitec se deben considerar la composición de los siguientes factores

Género

Carrera

Edad …etc.

ESCALAS DE MEDICIÓN

NIVEL DE MEDICIÓN NOMINAL

Las unidades de la escala nominal son categorías. Los objetos se clasifican y cuentan al determinar la categoría a la cual pertenecen. En esta escala de medición ,determinamos la frecuencia en cada categoría… o sea contamosSon variables cualitativas

No tienen una relación de magnitud entre ellas

Tiene la propiedad de la equivalencia, lo que implica que deben tener ciertas características determinadas y especificas en cada categoría .

Las categorías deben de ser mutuamente excluyentes y exhaustivas

Ejemplos:

Colores: azul, blanco, negro…

Respuesta a encuestas, como: si, no , indeciso

Se puede hacer un análisis de datos , pero cualquier promedio carece de sentido.

Nominal

2.- Nivel de medición ordinal

Tienen las propiedades de los datos nominales y estos datos pueden acomodarse en algún orden de manera significativa.

Dichas categorías se clasifican o se ordenan ( de manera jerárquica) de acuerdo con las características particulares que poseen

Esto es, representan posiciones de rango

2.- Nivel de medición ordinal

Los datos ordinales ofrecen información sobre comparaciones relativas, aunque no sobre las magnitudes de las diferencias.

Por ejemplo designar etiquetas como :

calidad de vida ( alto, medio, bajo)

calificaciones (A, B, o C)

Nivel de motivación ( bueno, regular, malo)

Cuatrimestre ( primero, segundo, tercero..)

ESCALA DE INTERVALO

Nivel de medición de intervalo

Comparte las características de la medición ordinal pero tiene la propiedad adicional de que la diferencia entre dos valores de datos tiene un tamaño constante ( intervalo)

Un intervalo indica una distancia constante entre cada valor.

Por ejemplo las medidas de temperatura en la escala de un termómetro ( de grado en grado)

Una línea de tiempo ( años, o meses, o días)

Calificaciones ( 10, 9, 8 , 7…)

ESCALA DE INTERVALOEn este caso las diferencias iguales en las características están representadas por diferencias iguales en los números asignados a las categorías

Por ejemplo en una escala de temperatura la diferencia entre 10 y 20 grados es la misma entre 30 y 40 grados

ESCALA DE RAZÓNLa escala de razón: posee las propiedades de magnitud, intervalos iguales entre unidades adyacentes y un punto de cero absoluto, lo que le permite que se puedan establecer razones y realizar todas las operaciones asociadas a los números

El punto o valor cero, representa la ausencia de la característica y se pueden obtener valores dentro de un intervalo Por ejemplo : tiempo de reacción … 10.5 min

Peso…. 5.4 kg

longitud y la frecuencia de cualquier evento, etc.

EJERCICIOS

Determine: La variable dependiente, variable independiente,

´Cuál es la variable cualitativa (s)?

Cuál es la variable cuantitativa (s) ?

Es un estudio descriptivo o inferencial?

Escalas de medición

Cuál es el parámetro de la población?

Cuál es el estadístico de la MUESTRA?

Un investigador en ginecología quiere determinar si un tipo de implante para el control natal tiene efectos colaterales sobre el peso y sobre el nivel de depresión ( alto, medio , bajo) en las mujeres . El grupo de estudio lo conforman 5000 mujeres del Estado de México que se han ofrecido como voluntarias para el experimento. El investigador elige a 200 de esas mujeres para que participen en el experimento. Se dividen en dos grupos, en el grupo 1 se le administra un tratamiento y al grupo 2 se controlo la natalidad por métodos naturales . Al inicio del tratamiento se les mide el peso promedio y el nivel de depresión. Al final del experimento se midieron el peso y el nivel de depresión y se comparan los datos para la toma de decisiones

EJERCICIO

Un investigador está interesado en evaluar tres métodos para tratar la depresión: a).- la medicación, b).- la reestructuración cognoscitiva y c).- el ejercicio de relajación . Se recluta a 60 estudiantes entre los 350 alumnos de la universidad que tienen reporte de depresión grave . Los tratamientos se administran durante seis meses, después de lo cual cada estudiante recibe un cuestionario diseñado para medir el grado de depresión. El cuestionario tiene una escala de 0 a 100, donde los puntajes mayores indican un mayor nivel de depresión. Se determina que aquellos que tienen valores menores 50 como depresión leve; entre 51 y 70 como depresión media y los que obtienen valores mayores 71 se consideran con depresión grave. Una vez que terminó el experimento se calcularon los valores promedio de depresión y se emplearon para determinar si la eficacia de cada tratamiento es diferente .

El área de producción de cierto envasado de un refresco de cola quiere saber cuáles son las causas de la fuga de gas en sus productos, para ello realiza muestras a los tres proveedores que le proporcionan los envases. El área de calidad determina el diámetro interno de los envases; la resistencia a la ruptura (medido en Kg/cm2), ´tipo de polímero empleado en la elaboración del envase.

Por otro lado determina los factores dentro de la operación dentro de los que considero: equipo empleado ( línea de producción); años de experiencia del operador del equipo; turno de producción en la que se realiza el proceso; nivel educativo del operador.

De cada proveedor se determinan analizar un lote de 10 000 unidades y de allí se toma una muestra de 125 unidades.

Un psicólogo de la salud está interesado en saber si la motivación por miedo es eficaz para reducir la incidencia en el uso del cigarro. Se eligen 40 individuos adultos fumadores entre los 700 individuos que se reportan como fumadores en la empresa donde labora el psicólogo. El experimento consiste en mostrar imágenes sobre los daños que ocasiona el cigarro a un grupo de 20 individuos, mientras que al otro grupo de 20 individuos no se le muestran ninguna clase de imágenes. El experimentador mantiene un registro de la cantidad de cigarros que fuman diariamente los participantes en la investigación. Se calcula, entonces, para cada grupo el promedio de cigarros fumados diariamente y se comparan los resultados entre los grupos para determinar si la motivación por miedo tuvo un efecto entre los fumadores

EJERCICIO

Cuál es el nivel de medición utilizado en cada una de las siguientes variables A.-Nivel de stress clasificado como alto, medio y bajo

B.- Las diferentes carreras que ofrece la Universidad

C- Clasificación de los alumnos de acuerdo al estado donde nacieron

D.-Clasificación de alumnos según el año escolar en que se encuentren.

E.- Número de horas de estudio de los estudiantes a la semana.

Identifique tipo de medición en la encuesta siguiente?

1.-¿ Estado civil?

2.-¿ Cuáles son sus ingresos?

3.-¿ Qué explorador de Internet utiliza?

4.-¿ Cómo califica el servicio de esta compañía?

5.-¿ Estaría dispuesto a viajar? Si_______ no____________

6.-Consumo alimentos “chatarra” Siempre

frecuentemente_______

Pocas veces

Nunca

ESTADÍSTICA DESCRIPTIVA

VARIABLES CUALITATIVAS

ESCALAS NOMINALES Y ORDINALES

1.- Empleo de Tablas de Distribución de frecuencias

2.- Uso Gráfica de barras o sectores

3.- Estadístico descriptivo: MODA

ESTADÍSTICA DESCRIPTIVA PARA VARIABLES CUALITATIVAS

Clase.- es un conjunto de valores o categorías en que son agrupados los datos de una serie

En el caso de género : hombre , mujeres

Colores : rojo, verde, azul …

Frecuencia.- Es la cantidad de datos que están incluidos en cada una de las clases

Por ejemplo, cuántos hombres y cuántas mujeres?

La frecuencia es Contar ¡¡¡¡

TABLA DISTRIBUCIÓN DE FRECUENCIAS

Una distribución de frecuencias es el resumen tabular de un conjunto de datos que muestra el número o frecuencia de artículos en cada una de las clases.

Organiza los datos según su clase y su frecuencia de acuerdo a el siguiente procedimiento:

1.- Definimos clase o categoría

2.- Contamos el número dentro de la categoría ( frecuencia)

3-Cuando empleamos una tabla de distribución de frecuencia para datos cualitativos, normalmente las clases se ordenan de la mayor a la menor frecuencia

ESTADÍSTICA DESCRIPTIVA PARA VARIABLES CUALITATIVAS

Qué información debe tener una tabla de frecuencias :

1.- Distribución de frecuencia

2.- Distribución de frecuencia acumulada

3.- Distribución de Frecuencias relativas .- Es la proporción de mediciones en cada categoría

Frecuencia relativa= Frecuencia individual

Número total

ESTADÍSTICA DESCRIPTIVA PARA VARIABLES CUALITATIVAS

Qué información debe tener una tabla de frecuencias :

4.- Distribución de frecuencias relativas acumuladas

5.- Porcentaje Este lo podemos calcular multiplicando la frecuencia

relativa por 100.

Una bolsa de cacahuates de M&M contiene 21 dulces de diferentes colores y la distribución de los datos es la siguiente:

Categoría frecuencia

Café 6

anaranjado 5

verde 3

amarillo 3

rojo 2

azul 2

Total (N) 21

Frecuenciaacumulada

Frecuenciarelativa

6 6/21= 0.2857

6+5=11 5/21=0.2380

11+3=14 3/21=0.1428

14+3= 17 3/21=0.1428

17+2=19 2/21=0.0952

19+2=21 2/21=0.0952

1

Frecuencia relativa PORCENTAJE PORCENTAJE ACUMULADO

fr x 100

6/21= 0.2857

28.57 28.57

5/21=0.2380 23.8 52.37

3/21=0.1428 14.28 66.65

3/21=0.142814.28 80.93

2/21=0.0952 9.52 90.45

2/21=0.0952 9.52 99.97

1

DIAGRAMAS PARA VARIABLES CUALITATIVAS

1.-Diagrama circular (pastel).- Se emplea para mostrar el porcentaje de cada clase en el total

2.- Diagrama de barras.- Está compuesto por barras rectangulares separadas que representan una clase o categoría.

Emplear la opción de gráficas agrupadas en cualquiera de

sus variantes: columna, cilíndrico, cónico

0

1

2

3

4

5

6

frecuencia

6

5

3 32 2

Café anaranjado verde amarillo rojo azul

Empleemos el ejercicio de los

dulces

29%

24%14%

14%

9%

10%

frecuencia

Café

anaranjado

verde

amarillo

rojo

azul

Calcule para los siguientes ejercicios :1-frecuencia

2.- frecuencia acumulada3.- frecuencia relativa

3.1- Porcentaje

4.-Construya un gráfico circular y un gráfico de barras

EJERCICIO

La siguiente tabla muestra las preferencias de los usuarios de Internet sobre los buscadores de la Web, en el año 2003 en los Estados Unidos

buscador Frecuencia

Ask jeeeves 6

AOL TIME WARNER 19

GOOGLE 32

MSN 15

YAHOO 25

OTROS 3

Los siguientes datos representan las quejas acerca de las habitaciones de un hotel

razón Frecuencia

Habitación sucia 32

Habitación sin equipamiento 17

Habitación que no está lista 12

Ruido 10

Camas en mal estado 13

Falla de aire acondicionado 19

Falla de agua caliente 29

Ver PARETO

EJERCICIO

La siguiente tabla representa la fuentes de energía eléctrica utilizadas en Estados Unidos en 1999.

fuente Porcentaje

Carbón 51

Plantas hidroeléctricas 6

Gas natural 16

Nuclear 21

Petróleo 7

Otras 3

Elabore un diagrama de Pareto

¿Qué gráfica prefiere usar? ¿Por qué?

Un analista registró las causas de las caídas de una red durante los pasados seis meses Razón de la falla Frecuencia

Conexión física 4

Falla de energía 3

Software del servidor 29

Hardware del servidor 2

falta de capacidad de memoriaDel servidor

32

Banda ancha inadecuada 5

Un egresado de licenciatura desea continuar sus estudios de maestría y observó que en el proceso de admisión los estudiantes muestran cierta preferencia por algunas áreas de conocimiento que se muestran en la siguiente tabla

ARTES 9ADMON 24LEYES 2CIENCIAS 13SOCIALES 26INGENIERIA 21OTRAS 5

FRECUENCIAFRECUENCIA ACUMULADA

FRECUENCIA RELATIVA

SOCIALES 26 26 0.26ADMON 24 50 0.24INGENIERIA 21 71 0.21CIENCIAS 13 84 0.13ARTES 9 93 0.09OTRAS 5 98 0.05LEYES 2 100 0.02TOTAL 100 200 1

200 2

26%

24%21%

13%

9%

5%

2%

LICENCIATURA

SOCIALES ADMON INGENIERIA CIENCIAS ARTES OTRAS LEYES

26

24

21

13

9

5

2

0

5

10

15

20

25

30

1

SOCIALES ADMON INGENIERIA

CIENCIAS ARTES OTRAS

LEYES

ANEXO

TIPOS DE VARIABLES

Variables aleatorias discretas Son aquellas que toman un número finito de posibles valores y de manera general

enteros no negativos y que de manera general podemos decir que es el resultado de contar

Variables aleatoria continuas pueden tomar un número infinito de posibles valores y los valores pueden diferir unos de otros de manera infinitesimal Sus distribuciones son llamadas distribuciones continuas y que de manera general

podemos decir que es el resultado de medir y que pueden asociarse a puntos de una escala continua.

DIAGRAMA DE PARETOEl diagrama de Pareto parte de la idea de que el 80% de los resultados en un problema se concentran en un 20% de las causas

DIAGRAMA DE PARETOEs una distribución de frecuencias de datos ordenados por categoría

Los objetivos del Diagrama de Pareto son:Determinar cuáles son los problemas más importantes de una situación. Identificar las causas que producen la mayor parte de los problemas.Puede emplearse como un paso inicial en un proceso de mejoraNos permite objetividad en el análisis de datos para la toma de decisiones

DIAGRAMA DE PARETO

Se sirve de la estratificación para ponderar el resultado del análisis

La gráfica de Pareto no identifica los defectos más importantes, sino sólo los que ocurren con más frecuencia Hay que hacer un análisis costo-beneficio para tal propósito

Es proceso continuo para profundizar en las causas de un problema

ELABORACIÓN

1.- Clasificación por categorías del eje

horizontal

2.- En el eje vertical izquierdo se deben

representar la unidades de medida que

den una clara idea de la frecuencia de

cada categoría

Ensamble 98

Laca 60

Eléctrico 20

Abolladura 12

Otros 10

TOTAL 200

ELABORACIÓN3.- En el eje vertical

derecho se representa una

escala en porcentajes del 0

al 100 que permita evaluar

la importancia de cada

categoría respecto a las

demás

En el caso de Ensamble es

98/200= 49%

En el caso de Laca es

60/200 = 30%

Y así en cada caso HASTA

SUMAR CIEN %

redondeo: usar dos cifras

después del punto

ELABORACIÓN4.- Trazar una línea acumulativa que

represente los porcentajes

acumulados de las categorías

5.- Hay que recordar qué es un

análisis jerárquico que implica ir de

mayor a menor grado de importancia

en el caso de las categorías con el fin

de visualizar los problemas que

tienen mayor incidencia

Usted acaba de ser contratado en el

área de producción con el fin de

disminuir los desperdicios en la

operación de llenado, los resultados

presentados en la tabla adjunta es el

promedio de desperdicios obtenidos en

el último mes de producción de una

refresco de marca conocida.

Realice un diagrama de Pareto y

establezca de acuerdo al mismo la

estrategia para disminuir el desperdicio

en esta operación.

DEFECTO NÚMERO DE

PIEZAS

COSTO POR

REPROCESO (

PESOS POR

PIEZA)

TAPA 35 0.5

ETIQUETA 60 0.20

ROTURA DE ENVASE 28 2.00

RAYADO DE ENVASE 12 1.00

MAL SELLADO 13 2.00

VOLUMEN FUERA DE

ESPECIFICACIONES

15 1,75

CAJA DE EMPAQUE 34 0.75