tema 3: tratamiento de datos en ms. excel (i)
Post on 18-Jan-2016
49 Views
Preview:
DESCRIPTION
TRANSCRIPT
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
El proceso de definir y medir las variables es crucial.
Si se realiza una definición incorrecta o se mide mal: todos los análisis posteriores, así como las conclusiones a las que se llegue, serán incorrectas.
Variable: característica de cada sujeto (cada caso) de una base de datos.
Se denomina “variable” precisamente porque “varía” de sujeto a sujeto.
Cada sujeto tiene un valor para cada variable.
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
El tipo de variable afecta al tipo de análisis que se puede realizar.
Los métodos estadísticos utilizados dependen del tipo de variable.
– VARIABLES
– TIPOLOGÍA
• VARIABLES CONTINUAS Y DISCRETAS
• VARIABLE TEMPORAL, TRANSVERSAL Y DATOS DE PANEL
• VARIBLE CUALITATIVA Y CUANTITATIVA
– ESCALAS DE MEDIDA
• NOMINAL
• ORDINAL
• INTERVALO
• RAZÓN
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
– VARIABLES
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
– TIPOLOGÍA
• VARIABLES CONTINUAS Y DISCRETAS
• VARIABLE TEMPORAL, TRANSVERSAL Y DATOS DE PANEL
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
Discretas: el número de valores posibles entre dos valores dados es finito (se cuenta).
Continua: el número de valores posibles entre dos valores dados es infinito (se mide).
Temporal: valores a lo largo del tiempo referidos a un sujeto.
Transversal: valores en un momento del tiempo referido a varios sujetos.
Datos de Panel: Valores referidos a varios sujetos a lo largo del tiempo.
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
– TIPOLOGÍA
• VARIBLE CUALITATIVA Y CUANTITATIVA
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
Cualitativa (no paramétrica):
Los valores son “categorías”. Las categorías son valores diferentes por una cualidad, no por una cantidad.
Cuantitativa (paramétrica):
Los valores de la variable son “números” . Cada valor posible es menor o mayor que otro valor.
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
– ESCALAS DE MEDIDA
La escala nominal identifica la pertenencia de un elemento a un grupo o a otro.
Sólo se puede saber sobre I y J, si xi = xj o xi xj.
Ej.: Variable Sexo. 0:Hombre, 1:Mujer
En la escala ordinal los números asignados a la variable sirven para establecer un determinado orden entre personas u objetos.
Además de la información de la escala nominal, se conoce si xi > xj o xi < xj.
Ej.: Variable Preferencias. 1:Nada, 2: Poco, 3: Algo, 4:Mucho
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)I. Importación y organización de diversas bases de datos en Excel.
Variables, Escala de Medición y Problemas con los Datos.
– ESCALAS DE MEDIDA
En la escala de intervalo asigna números que permiten establecer la diferencia entre los distintos objetos.
Además de lo anterior podemos saber que si I es mayor que J, I es x i - xj más grande que J.
Ej.: Variable Temperatura. 0º: No indica ausencia de temperatura. 30º no implica el doble de calor que 15º.
Con la escala de razón es posible hablar del número de veces que un objeto o persona es mayor que otra.
Además de lo anterior se puede saber que si I es mayor que J, I es x i / xj veces superior a J.
Ej.: Variable Ingresos. 0 € indica ausencia de ingresos. 1.000 € es el doble de salario que 500 €.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)I. Importación y organización de diversas bases de datos en Excel.
Variables, Escala de Medición y Problemas con los Datos.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
Definición Medidas de Tendencia
Central
Medidas de Dispersión
Gráficos
Nominal Categorías NO ordenadas
Moda Ninguna Sectores o barras
Ordinal Categorías ordenadas
Moda y Mediana
Mín / Máx / Rango Amplitud Intercuartil
Sectores o barras
Escala(Intervalo, Razón)
Valores numéricos o magnitud métrica
Moda, Mediana y Media
Mín / Máx / Rango Amplitud IntercuartilDesviación típica / Varianza
Histogramas, Gráficos de Cajas, etc.
– ESCALAS DE MEDIDA
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
– IMPORTACIÓN DE DATOS A EXCEL
http://www.ine.es
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
Inebase / Sociedad / Mercado Laboral / ETCL. Encuesta Trimestral de Coste Laboral
Resultados detalladosPrincipales series desde trimestre 1T/2000
Tabla 1.2 Principales series de ETCL por comunidad autónoma, periodo, componentes del coste y unidad de medida.
Filas Columnas
Componente del Coste PeriodoComunidades Autónomas Unidad de medida
Selección:Componente del Coste (Coste total por trabajador, Coste total por hora)Comunidades Autónomas (Total, todas las CC.AA.)Periodo (Todos)Unidad de medida (Euro)
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
– IMPORTACIÓN DE DATOS A EXCEL
http://www.anuarieco.lacaixa.comunicacions.com
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
– IMPORTACIÓN DE DATOS A EXCEL
http://www.meh.es
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
Estadísticas e Informes / Presupuestos y Cuentas Públicas / Sector Público Español / Base de datos económicos del sector público español (BADESPE)
Base de datos económicos del sector público español (BADESPE)Financiación AutonómicaCuadros ResúmenesPor Comunidades y Ciudades Autónomas
FINANCIACIÓN AUTONÓMICA (Excel)
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
– IMPORTACIÓN DE DATOS A EXCEL
http://biblioteca.uam.es/cdestadistica/informacionbibliografica.html
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
SABI/
Nombre de Empresa /
Exportar (Excel)
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
– PROBLEMAS CON LOS DATOS
I. Valores Perdidos o Ausentes: cuando para una variable no se dispone de todos los datos para cada sujeto.
Soluciones a Datos Perdidos:
A. Eliminar todos los casos con valores perdidos.
B. Imputar un valor estimado.
B.1. Imputación de los valores medios: Se sustituyen los valores ausentes por los valores medios de la variable.
B.2. Imputación mediante regresión: Se realiza una regresión siendo la variable dependiente la que posee valores perdidos y como independientes el resto de variables que posean todos los datos. Los datos imputados son las predicciones calculadas en la regresión.
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
– PROBLEMAS CON LOS DATOS
II. Valores Atípicos - Outliers: Aquellos casos que alguna variable toma valores extremos que difieren del comportamiento del resto de la muestra.
Consecuencias:
- Distorsionan los resultados- Suelen afectar a la normalidad.
Causas:
- Errores en los datos (recogida e introducción).- Errores intencionados por parte del encuestado.- Errores de muestreo (introducir en la muestra un individuo que no pertenece a la población)- Outliers verdaderos: casos que pertenecen a la población objeto de estudio y que realmente difieren del resto por la variabilidad inherente
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
– PROBLEMAS CON LOS DATOS
II. Valores Atípicos - Outliers
Detección de valores atípicos
- Considerar atípicos aquellos casos cuyos valores estandarizados (media = 0 y desviación típica = 1) superen el siguiente umbral (k):
- N<80: k=2,5- N>80: k > 3
- Si la variable sigue una distribución normal k=3
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
– PROBLEMAS CON LOS DATOS
II. Valores Atípicos - Outliers
Si es un outlier verdadero o no se puede descartar que no lo sea:
-Algunos autores consideran correcto su eliminación para que los análisis reflejen la tendencia mayoritaria de la población.
- Otros consideran que la eliminación no se debe realizar:
- Suavizar su influencia con transformaciones.
- Utilizar contrastes no paramétricos.
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
– DATOS AUSENTES
http://www.ine.es
Inebase / Sociedad / Educación / Avance de la Enseñanza Universitaria
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
– DATOS AUSENTES
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
– FILTROS
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
– FILTROS
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
– FILTROS
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
– FILTROS
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
– FILTROS
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
– FILTROS
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
– FILTROS
I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.
top related