qué es la estadística “la ciencia que aplica métodos matemáticos para recopilar, organizar,...

30
Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar , organizar , sintetizar y analizar datos”. “Herramienta básica en cualquier disciplina científica, ya que sirve de ayuda en la toma de decisiones tanto en la investigación básica como aplicada”.

Upload: natalio-aguero

Post on 23-Jan-2016

242 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Qué es la Estadística

“La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”.

“Herramienta básica en cualquier disciplina científica, ya que sirve de ayuda en la toma de decisiones tanto en la investigación básica como aplicada”.

Page 2: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Estadística descriptiva

“Se encarga de la recogida, ordenación y análisis de los datos de una muestra (y de una variable)”.

Tres tipos de operaciones básicas:

Distribución de frecuencias. Representación gráfica (diagrama de barras, histograma). Estadísticos de resumen (de tendencia central, de

dispersión, de asimetría y apuntamiento).

Page 3: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Función de la Estadística Descriptiva

Muestra (datos)

Estadísticos descriptivos

Conocer el patrón global, la tendencia y el grado de variación de las respuestas

Índices o estadísticos de resumen

“Consiste en la reducción de grandes conjuntos de datos con el objeto de lograr una interpretación más sencilla de los mismos”

Cada punto representa un “caso”

Page 4: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

El concepto de “medida”

“Los objetos de investigación (mensajes mediáticos, usuarios de la comunicación, etc.) manifiestan características según

diversas modalidades” Variable. Toda característica o dimensión de un

objeto o unidad de análisis susceptible de adoptar distintos valores o modalidades (categorías).

Medir. Atribuir números a las manifestaciones de la unidad de análisis, y someter a estos números a ciertas técnicas matemáticas, basadas en las operaciones aritméticas básicas (suma, resta, multiplicación y división).

Page 5: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Las escalas de medida

Cuatro grandes tipos:

Nominal. Ordinal. Intervalo. Razón.

El tipo de escala de medida que adoptan los datos, determina el tipo de operaciones aritméticas que se pueden realizar con ellos y, por tanto, también el tipo de análisis estadístico.

Las escalas de intervalo y de razón aparecen, a veces, definidas como “cuantitativas” (o métricas).

Page 6: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Escala nominal

Sólo permiten la clasificación o diferenciación de los objetos.

Permiten establecer relaciones de igualdad o desigualdad entre dos o más objetos.

Las variables que adoptan este nivel de medida se denominan “cualitativas”.

Con los “números” de este tipo de variables no se pueden efectuar operaciones aritméticas.

Page 7: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Ejemplos

Sexo: 1 = Hombre 2 = Mujer

Cadena de TV 1 = TVE1 2 = La 2 3 = Antena 3 4 = Cuatro 5 = Tele 5 6 = La Sexta 7 = Otras

2 no es mayor que 1

El 6 no representa el doble que el 3. La Sexta no es el “doble de buena” que Antena 3

Page 8: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Escala ordinal

Los objetos son jerarquizados conforme algún criterio.

Los número que se utiliza para codificar las distintas categorías de una variable sólo permiten establecer relaciones de igualdad/desigualdad y de orden.

No se puede precisar la diferencia exacta que existe entre dos objetos.

Con los “números” de este tipo de variables no se pueden efectuar operaciones aritméticas.

Page 9: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Ejemplo

En una carrera ciclista si se carece de cronómetro, a lo sumo se puede saber el orden de llegada …

Tamaño de una noticia en un diario: 1 = Menos de 1 cuarto de página 2 = Entre 1 y 2 cuartos de página 3 = Entre 2 y 3 cuartos de página 4 = Más de 3 cuartos de página,

pero no completa 5 = Página completa

Pero no la diferencia temporal (en minutos, segundos) entre cada uno de los ciclistas

Se sabe que una noticia que puntúe 4 es mayor que una que puntúe 1, pero no la diferencia exacta en centímetros cuadrados.

Page 10: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Escala de intervalo

Se pueden observar ciertas diferencias cuantitativas entre las unidades.

Se pueden establecer relaciones de igualdad/desigualdad, de orden y además los intervalos entre los distintos números o valores son iguales.

No tiene principio ni final (no existe cero absoluto). Son números arbitrarios en cuanto al origen.

Con los números de este tipo de variables, se pueden realizar operaciones aritméticas como la suma o la resta, pero no la división ni la multiplicación.

Page 11: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Ejemplos

La medición de la temperatura mediante la escala Celsius.

Número de palabras en una determinada noticia en prensa escrita.

El valor 0 es arbitrario ya que representa la temperatura a la cual se funde el hielo. Cuando hay 0 grados centígrados no significa una ausencia total de calor

iEs imposible encontrar una noticia en un diario con 0 palabras¡

Page 12: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Escala de razón

Se pueden establecer relaciones de igualdad/desigualdad, de orden, los intervalos entre los distintos valores son iguales y se cuenta con un verdadero punto cero absoluto, en relación con el cual se expresan todos los demás valores.

El valor cero representa el origen empírico de la variable, la carencia total de cierta característica.

Se pueden efectuar todas las operaciones aritméticas (suma, resta, división y multiplicación).

Page 13: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Ejemplos

Edad medida en años. El “número de verbos

afectivos” (amar, odiar, sentir, etc.), frente a “número de verbos cognitivos” (como pensar, reflexionar, ponderar, calibrar, etc.) en un texto noticioso.

Nº total de minutos ocupados en anuncios en una pausa entre dos programas o espacios televisivos.

Tiempo dedicado (en segundos) a noticias de “sucesos” en un informativo televisivo.

Un niño recién nacido tiene 0 años

Una noticia puede escribirse si utilizar un solo verbo afectivo y seguir siendo noticia

Puede ocurrir que entre dos espacios televisivos no aparezca ningún anuncio

Un telediario “serio” quizá no dedique nada de tiempo a noticias de “sucesos”

Page 14: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Distribuciones de datos

Cuando el investigador ordena sus datos mediante un paquete informático de análisis de datos, lo que genera es una distribución de datos o “matriz de datos”.

Trabajar directamente con la “distribución de datos” no resume lo suficiente para extraer conclusiones a simple vista.

Page 15: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Distribución de frecuencias “Es una tabla en la que cada respuesta (valor

o modalidad) de una variable quedará ordenada conforme a su magnitud y la frecuencia (número de veces) de su ocurrencia”.

Variable “sexo”

Page 16: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Representaciones gráficas

Pueden diferenciarse dos tipos: Diagrama de barras (gráficos de sectores). Para

realizar representaciones gráficas de variables con un nivel de medida nominal u ordinal.

Histograma. Para representar gráficamente las variables con un nivel de medida de intervalo o de razón.

Page 17: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Ejemplo de “diagrama de barras”

5

3

2

0

1

2

3

4

5

6

7

Hombre Mujer NC

Sexo

Consiste en una serie de barras, una por cada categoría de la variable, cuya longitud depende de su número de casos.

Page 18: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Ejemplo de “histograma”

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Consumo de TV el día de ayer (en horas)

0

100

200

300

400

500

Fre

cuen

cia

El “histograma”se asemeja al diagrama de barras, ya que también representa las frecuencias. Sin embargo, existen algunas diferencias entre ambos tipos de representaciones gráficas. En el diagrama de barras cada código o categoría de la variable tiene su “barra” correspondiente, mientras que el “histograma”, salvo que haya un número muy reducido de valores, éstos se agrupan en intervalos para ser representados con una única barra.

Page 19: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Estadísticos de resumen

Son estadísticos que sintetizan mucho más, que las distribuciones de frecuencias o las representaciones gráficas, la información sobre cada variable.

El tipo de estadístico de resumen disponible depende de la escala de medida de las variables.

Los estadísticos de resumen aportan información más rica o son más apropiados para variables métricas.

Page 20: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Tipos de estadísticos de resumen

Estadísticos de posición o tendencia central

Estadísticos de variabilidad o dispersión

Moda (Mo)

Mediana (Md)

Media (M)

Desviación típica (sx)

Varianza (sx2)

Page 21: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Estadísticos de posición o tendencia central

Responden a la pregunta: ¿cuál es el resultado típico de una distribución de frecuencias?

Permiten ver lo dominante, lo típico o la tendencia de la distribución.

El “resumen” se explicita en una sola cifra numérica.

Page 22: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Moda (Mo)

El único estadístico que se puede utilizar en presencia de variables nominales.

La moda es la puntuación a la que corresponde la frecuencia máxima en una distribución de frecuencias; es el valor o categoría “que más se lleva”, que más se repite en una distribución de frecuencias.

No es preciso realizar ningún cálculo, ya que se descubre con la simple inspección ocular.

Page 23: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Mediana (Md)

Se puede utilizar cuando se dispone de variables que adoptan al menos una escala ordinal.

Con los datos ordenados del valor inferior al superior, la mediana se interpreta como el valor del caso que ocupa el valor central de la distribución, aquel que deja igual número de caso por encima que por debajo.

Es el punto o valor que deja por encima y por debajo de sí el 50% de las observaciones (punto medio de la distribución).

Cuando se utilicen variables que adoptan al menos un nivel de medida de intervalo (variables cuantitativas), la mediana dividirá el área total del histograma representado en dos áreas con igual superficie.

Page 24: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Ejemplos de calculo de la mediana

Md = 16 Md = 16

La mediana no toma en consideración las puntuaciones individuales de una distribución de frecuencias. No se ve afectada por los valores extremos existentes en una distribución de frecuencias.

Page 25: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Media (M)

El estadístico de resumen más conocido o popular. Es el centro de gravedad de una distribución de

frecuencias. Permite conocer el desempeño o comportamiento

global de un grupo en un criterio dado. Se emplea tanto en la estadística descriptiva como

en la inferencial. A diferencia de la mediana, el valor de cada una de

las puntuaciones de la distribución de frecuencias afecta de manera sustancial a la media.

Page 26: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Estadísticos de variabilidad o dispersión Los estadísticos de tendencia central indican dónde

se sitúa un grupo de puntuaciones, pero … Se necesitan otros estadísticos que, además de mostrar la

tendencia, indiquen cómo se desvían los casos con relación a estos valores centrales.

Se precisa algún estadístico que permita saber si todos los casos son parecidos o si hay grandes diferencias entre ellos.

Los estadísticos de variabilidad Indican si las puntuaciones de una distribución se encuentran muy próximas entre sí o muy alejadas; describen la forma en que los valores se diseminan a partir del punto central.

Page 27: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Desviación típica (sx)

Si la media es el estadístico “estrella” a la hora de ver la tendencia de unos datos, la desviación típica (DT, Sx) lo es cuando se desea conocer su variabilidad (grado de homogeneidad o heterogeneidad). Una desviación típica pequeña indicará

que la mayoría de las puntuaciones de la distribución se sitúan muy cerca de la media. Distribución homogénea.

Una desviación típica elevada describirá un conjunto de valores que están diseminados en un amplio radio. Distribución heterogénea.

S =

- X

X

( )X

n

i

i

n2

1

Page 28: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Ejemplo de calculo de la desviación típica

Matriz de datos:

63.1

3

8

3

404

3

2911299297)X - (= S 1A

2

n

Xn

ii

16.6

3

114

3

49164

3

29162910291)X - (= S 1B

2

n

Xn

ii

MA = 9 MB = 9

Los datos de la variable A son mucho más homogéneos (con respecto a su media) que los datos de la variable B.

El programa SPSS utiliza para el cálculo de la desviación típica (y de la varianza) el denominador n-1, en vez de n.

Page 29: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Varianza (sx2)

El cuadrado de la desviación típica.

El numerador de la fórmula de cálculo de la varianza, Σ (Xi - )², se denomina suma de cuadrados y forma parte del cálculo de otras pruebas estadísticas como el análisis de varianza.

La varianza es un concepto fundamental en la investigación y en estadística inferencial.

2

s nx =

(Xi - X) 2

i 1

n

X

X

Page 30: Qué es la Estadística “La ciencia que aplica métodos matemáticos para recopilar, organizar, sintetizar y analizar datos”. “Herramienta básica en cualquier

Ejemplo de calculo de la varianza

Matriz de datos:

MA = 9 MB = 9

El programa SPSS utiliza para el cálculo de la desviación típica (y de la varianza) el denominador n-1, en vez de n.

66.2

3

8

3

404

3

9119997)X - (= 2S

2222

1A

n

Xn

ii

38

3

114

3

49164

3

91691091)X - (= 2S

2222

1B

n

Xn

ii