estadistica exposicion
TRANSCRIPT
ESTADISTICA INFERENCIAL
Estadística-Inferencial (UPEC) 2012
UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI
ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN INTERNACIONAL
Tulcán – Ecuador
MCS : JORGE POZO
ESTUDIANTES DE SEXTO SEMESTRE DE LA ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACION IINTERNACIONAL
JULIO PUCUNA
MARZO 2012- AGOSTO-2012
Estadística-Inferencial (UPEC) 2012
AGRADECIMIENTO
A todas las personas que de uno u otro modo colaboraron en la realización de este
trabajo y especialmente al MSC. Jorge Pozo Docente de la Universidad en la materia
de Estadística Inferencial
Estadística-Inferencial (UPEC) 2012
TEMA: Análisis de la Estadística Inferencial aplicando sistemas Informáticos
GENERAL
Manejar un programa informático aplicado a la estadística Inferencial
ESPECIFICOS
Determinar como infiere la T-student, correlación , regresión, regresión
en problemas del comercio exterior
Visualizar como ayuda este proceso a la toma de decisiones
Realizar cuadros comparativos y aplica cando las Tics en el programa
spss stadistc en problemas del contexto del comercio exterior
JUSTIFICACIÓN
En la vida hay determinantes y preguntas que todo ser humano necesita saber
para la toma de decisiones lo cual le va a permite desarrollarse de una mejor
manera en una sociedad, a través de la historia grandes matemáticos, físicos,
crearon una ciencia la cual ayuda a determinar la muestra de la población, la
cantidad etc.
Lo cual ha permito que se determine la población de un país, a través de
formulas matemáticas y también con la utilización de sistemas informáticos los
cuales realizan de manera ágil y rápida las diferentes operaciones planteadas
es por eso que este trabajo es de gran relevancia ya que se podrá determinar a
través de un problema del contexto del comercio exterior como se aplica al
programa informático spss stadistc y como esta compuesto y cuales son sus
usos en la es dística inferencial.
INTRODUCCION
La estadística y los sistemas informáticos son utilizados en la actualidad como
Estadística-Inferencial (UPEC) 2012
herramientas principales para la toma de decisiones en temas de gran
relevancia. Desde la economía hasta la arquitectura, pasando por la física y la
astronomía, el uso de sistemas estadísticos ha servido para definir
conocimientos exactos y claros, además de conclusiones exactas y
significativas.
La tecnología ha avanzado en los últimos años y en el mundo actual es
importante contar con soluciones informáticas que den la posibilidad de tomar
decisiones relevantes sobre la información obtenida mediante distintos
procesos, sean estos encuestas, cuestionarios, pruebas de conocimiento, etc.
ESTADISTICA DESCRIPTIVA
El proposito de la Estadistica Aplicada es el de obtener conluciones de una
poblacion en estudio , examinando solamente una parte de ella denominada
muestra
LA ESTADISTICA INFERENCIAL
La Estadística es una rama de las matemáticas encargada de reunir, organizar
y analizar datos generalmente numéricos, ayuda a resolver problemas y
además permite luego de realizados los cálculos tomar decisiones que puedan
beneficiar al contexto que las estudia.
La estadística y los procedimientos que con ella pueden realizarse han
permitido de manera efectiva describir con exactitud datos de casi todas las
ramas del conocimiento entre ellas: economía, psicología, política, física,
biología, química, medicina e informática y ha servido como herramientas útil
para encontrarle relación a muchos de los datos estudiados por estas ciencias.
En la actualidad para un estadístico el trabajo va mas allá de reunir datos y
calcularlos, debe de encargarse además de la difícil tarea de interpretar toda la
información obtenida en los procesos estadísticos para que esta tenga un valor
realmente importante.
Estadística-Inferencial (UPEC) 2012
La Estadística se encuentra dividida en dos grandes ramas, cada una con un
propósito específico:
• La Estadística Inferencial
• La Estadística Descriptiva
Nuestro estudio está basado en la Estadística Inferencial por lo que
ampliaremos el concepto de la misma en las siguientes secciones de este
capítulo.
Marco Teórico
La Estadística Inferencial es una parte de la estadística que sólo trabaja con
algunos de los datos de una población existente dentro de un grupo de
elementos observados; es decir solo toma una muestra n de los N elementos
existentes. Una vez que se obtiene este reducido grupo de datos la estadística
inferencial trata de encontrar aspectos o propiedades relevantes para toda la
población y basados en ellos tomar decisiones. Para obtener dichos resultados
es necesario fundamentarse en como se selecciona la muestra, como realizar la
inferencia de los datos y además la confianza que se puede tener en la
información obtenida.
Cabe recalcar que para obtener datos fiables el nivel de conocimiento y
comprensión de estadística, matemáticas y probabilidades debe de ser alto
pues se debe recordar que los procedimientos están basados en pequeñas
muestras las cuales pueden sufrir variación.
Con toda la información proporcionada es notorio que la estadística inferencial
puede proveer de modelos importantes para estudiar un sinnúmero de datos
multivalentes.
Métodos tales como Componentes Principales, Escalado Multidimensional,
Estadística-Inferencial (UPEC) 2012
Análisis de Correspondencia, Análisis de Conglomerados, Análisis Factorial,
Análisis Discriminante, entre otros brindan a los estudiosos grandes
posibilidades de entender y predecir el comportamiento que los datos pueden
tomar dada una condición.
MEDIDAS DE TENDENCIA CENTRAL
Medidas de tendencia central las que hallan en el centro de distribución de
frecuencias
a) Media aritmética -> x
b) Mediana -> Md
c) Moda -> Mo
d) Media geométrica -> Mg
e) Media Armónica -> Ma
MEDIA ARITMÉTICA
Cuando los datos no están agrupados
x = ∑ Xi
n
MEDIANA
Es el punto que divide la distribución de datos en 2 partes iguales.
Es una medida de tendencia central sonde permite dividir puntos medios que
sean iguales en la parte superior y en la parte inferior de un conjunto de datos.
Estadística-Inferencial (UPEC) 2012
RANGO
I= valor máximo – valor mínimo
DESVIACION MEDIA O VARIACIÓN MEDIA
DM=1n∑i=1
n
|xi−x|
VARIANZA.- se la define como el cuadrado de la desviación estándar
MUESTREO
Existe estudios en el que queremos conocer ciertas características de un grupo
de personas de personas o cosas, (o los que llamamos población) de manera
que no se los puede estudiar a todos porque son numerosos o porque su
naturaleza se vuelve inaccesible, existe otro recurso que es estudiar una parte
que se llama MUESTRA, generalmente cuando el n >100 se llama población,
pero si n <100 a toda la población se le puede llamar muestra.
CORRELACIÓN LINEAL
El análisis de correlación se dirige sobre todo a medir la fuerza de una relación
entre variables. El coeficiente de correlación lineal, r, es la medida de la fuerza
de la relación lineal entre dos variables. La fortaleza de la relación se determina
mediante la magnitud del efecto que cualquier cambio en una variable ejerce
sobre la otra. (JOHNSON, 1990)
MUESTREO
PROBABILISTICO
MUESTREO NO
PROBABILISTICO
Estadística-Inferencial (UPEC) 2012
Aleatorio.- Asigna un mínimo a cada
uno, selecciona la muestra a través de
mínimos aleatorios.
Sistemático.- Lista completa del
universo, selecciona cada individuo
cada 10 individuos.
Estrategico.- Los tamaños de la muestra
de cada estracto, depende de las
necesidades.
Casual.- Entrevista a los individuos en forma
casual. Ejemplo.- Los que pasan por la calle
Intencional.- Selecciona al individuo según
el criterio de un experto. Ejemplo.- Dueños
de los restaurantes
Cuotas.- Cada entrevistado debe estar
dentro de cada categoria. Ejemplo Hombres
y mujeres
Estadística-Inferencial (UPEC) 2012
COEFICIENTE DE CORRELACIÓN.- Expresa de una manera cuantitativa la
magnitud y dirección de una relación.
Coeficiente de correlación se lo designa en la letra r puede variar entre +1 a -1
el signo nos dice si la relación es positiva o negativa.
Como +1 es el mayor número posible este representa una relación perfecta
de una relación positiva.
Si el coeficiente es -1 que la relación se perfecta que la relación es negativa.
Cuando la correlación es cero (0) no existe una relación entre x ۸ y significa
que x ۸ y no crece ni decrece la recta es horizontal.
REGRESIÓN LINEAL
La regresión y la correlación están íntimamente ligados, ambos implican la
relación entre 2 variables y utilizan el mismo conjunto de datos básicos.
La regresión se centra en el uso de la relación para determinar una predicción,
cuando la relación es perfecta, esto es cuando todos los puntos están sobre la
recta y se utilizan para señalar la predicción, la situación se hace más compleja
cuando la relación es imperfecta.
Esta recta es la línea de regresión por los mínimos cuadrados. La distancia
vertical en cada punto y la recta representan el error de la predicción, pareciera
que el error total seria la suma algebraica y− y '.
El error total de predicción presentado por ∑ ( y− y' )2, es menor para la línea de
regresión por mínimos cuadrados.
FORMULA DE LA REGRESIÓN
by=N ¿¿
PRUEBA DE HIPOTESIS
Estadística-Inferencial (UPEC) 2012
Una hipótesis estadística es una proposición o supuesto sobre los parámetros
de una o más poblaciones.
Suponga que se tiene interés en la rapidez de combustión de un agente
propulsor sólido utilizado en los sistemas de salida de emergencia para la
tripulación de aeronaves. El interés se centra sobre la rapidez de combustión
promedio. De manera específica, el interés recae en decir si la rapidez de
combustión promedio es o no 50 cm/s.
Esto puede expresarse de manera formal como:
Înter%Ho; = 50 cm/s
Înter%H1; 50 cm/s
La proposición Ho; = 50 cm/s, se conoce como hipótesis nula, mientras que la
proposición H1; 50 cm/s, recibe el nombre de hipótesis alternativa. Puesto
que la hipótesis alternativa especifica valores de que pueden ser mayores o
menores que 50 cm/s, también se conoce como hipótesis alternativa bilateral.
En algunas situaciones, lo que se desea es formular una hipótesis alternativa
unilateral, como en
Înter%Ho; = 50 cm/s Ho; = 50 cm/s
Înter%ó
Înter%H1; < 50 cm/s H1; > 50 cm/s
Es importante recordar que las hipótesis siempre son proposiciones sobre la
población o distribución bajo estudio, no proposiciones sobre la muestra. Por lo
general, el valor del parámetro de la población especificado en la hipótesis nula
se determina en una de tres maneras diferentes:
Estadística-Inferencial (UPEC) 2012
1. Puede ser resultado de la experiencia pasada o del conocimiento del
proceso, entonces el objetivo de la prueba de hipótesis usualmente es
determinar si ha cambiado el valor del parámetro.
2. Puede obtenerse a partir de alguna teoría o modelo que se relaciona con el
proceso bajo estudio. En este caso, el objetivo de la prueba de hipótesis es
verificar la teoría o modelo.
3. Cuando el valor del parámetro proviene de consideraciones externas, tales
como las especificaciones de diseño o ingeniería, o de obligaciones
contractuales. En esta situación, el objetivo usual de la prueba de hipótesis es
probar el cumplimiento de las especificaciones.
T - STUDENT
En probabilidad y estadística, la distribución-t o distribución t de Student es
una distribución de probabilidad que surge del problema de estimar la media
de una población normalmente distribuida cuando el tamaño de la muestra es
pequeño.
A la teoría de pequeñas muestras también se le llama teoría exacta del
muestreo, ya que también la podemos utilizar con muestras aleatorias de
Estadística-Inferencial (UPEC) 2012
tamaño grande.
Veremos un nuevo concepto necesario para poder entender la distribución t
Student. Este concepto es "grados de libertad".
Para definir grados de libertad se hará referencia a la varianza maestral:
n
(xi x)2
s2 i 1
n 1
Una variable aleatoria se distribuye según el modelo de probabilidad t o T de
Student con k grados de libertad, donde k es un entero positivo.
CHI CUADRADO
La prueba o test chi-cuadrado es considerada como una prueba no paramétrica
que mide la discrepancia entre una distribución observada y una observación
teórica (bondad de ajuste), indicando en que medida las diferencias existentes
entre ambas, de haberlas, se deben al azar en el contraste de hipótesis.
También se utiliza el test chi-cuadrado para probar la homogeneidad entre dos
poblaciones o independencia de dos variables entre si, mediante la
presentación de datos dados en tablas de contingencia.
Es decir:
a) Chi-cuadrado de bondad de ajuste o significancia: para comprobar si los
datos se ajustan a una distribución concreta.
b) Chi-cuadrado de homogeneidad: para ver si dos muestras
provienen de una misma población o una población con una misma
Estadística-Inferencial (UPEC) 2012
familia de distribución (los datos vienen dado en una tabla de
contingencia).
c) Chi cuadrado de independencia: para comprobar si dos
muestras son independientes (los datos vienen en una tabla
de contingencia).
LA VARIANZA
La varianza, , se define como la media de las diferencias cuadráticas de n
puntuaciones con respecto a su media aritmética es decir con la siguiente
formula
APLICANDO EL PROGRAMA SPSS STADISTC
Definición de como utilizar el spss y como esta compuesto
SPSS STADIST
SPSS es un programa estadístico informático muy usado en las ciencias
sociales y las empresas de investigación de mercado. Originalmente SPSS fue
creado como el acrónimo de Statistical Package for the Social Sciences aunque
también se ha referido como "Statistical Product and Service Solutions" (Pardo,
A., & Ruiz, M.A., 2002, p. 3). Sin embargo, en la actualidad la parte SPSS del
nombre completo del software (IBM SPSS) no es acrónimo de nada. 1
Estadística-Inferencial (UPEC) 2012
Como programa estadístico es muy popular su uso debido a la capacidad de
trabajar con bases de datos de gran tamaño. En la versión 12 es de 2 millones
de registros y 250.000 variables. Además, de permitir la recodificación de las
variables y registros según las necesidades del usuario. El programa consiste
en un módulo base y módulos anexos que se han ido actualizando
constantemente con nuevos procedimientos estadísticos. Cada uno de estos
módulos se compra por separado.
Actualmente, compite no sólo con softwares licenciados como lo son SAS,
MATLAB, Statistica, Stata, sino también con software de código abierto y libre,
de los cuales el más destacado es el Lenguaje R. Recientemente ha sido
desarrollado un paquete libre llamado PSPP, con una interfaz llamada PSPPire
que ha sido compilada para diversos sistemas operativos como Linux, además
de versiones para Windows y OS X. Este último paquete pretende ser un clon
de código abierto que emule todas las posibilidades del SPSS.
El paquete estadístico SPSS, responde al funcionamiento de todo programa
que lleva a cabo análisis estadísticos: pasados los datos a analizar a un fichero
con las características del programa, éste es analizado con una serie de
órdenes, dando lugar a unos resultados de tipo estadístico que el investigador
debe interpretar. Este camino a seguir es el que guiará la presentación de
SPSS que efectúa este mini-manual, debido a que es el camino más natural de
aprendizaje del mismo.
Estadística-Inferencial (UPEC) 2012
Estos son los pasos que se deben seguir para poder descargar el programa
spss, y ya que este es un programa que necesita de una licencia, tambien se
encontraran los pasos para poder crakear el rpograma y utilizarlo sin ningun
problema con tiempo ilimitado.
Primero debes ingresar al google y poner descargar spss con crack en español,
y podras seleccionar cualquiera de las opciones y versiones que en ella
aparesca desde la 17 a la 19 son las mas recomendables.
Acontinuación se habre la pagina
http://betterfreedownload.blogspot.com/2011/09/free-download-ibm-spss-
statistics-19.html
Y se encontrará con una pantalla donde nos indicara el programa y el crack, y
en esta misma aula nos indica los pasos que debes seguir para la descar del
Estadística-Inferencial (UPEC) 2012
programa y del crack, que simplemente es una carpeta de codigos que permite
el libre uso del programa.
O en uno de los casos les dejare una opción mas direca de cómo descargar y
porsupueso unos link para que los pueda descargar
Estadística-Inferencial (UPEC) 2012
Luego seleccionamos una de las opciones de descarga que se encuentran en la
pantalla, por ejemplo
Y ponemos la dirección URL en cualquiera de los buscadores.
Estadística-Inferencial (UPEC) 2012
Y al darle enter se abrirá la página donde podemos descargar el spss, y se
abrirá la página del megaupload si no empieza el conteo automático lo ponen
en descarga normal, esperan y descargan.
Estadística-Inferencial (UPEC) 2012
Luego de descargarlo van hasta la carpeta spss e ingresan,
Ingresan y buscan un icono que dice setup, es el link de instalación, solo espera
y sigue las instrucciones hasta que se instale en el pc, este programa se puede
instalar en cualquier tipo de pc, portátil o de escritorio, pero se debe tener en
cuenta el sistema operativo que se utiliza.
Estadística-Inferencial (UPEC) 2012
Y a todas las ventanas que se abren posteriormente se les empieza a dar
siguiente hasta que el programa se empieza a instalar automáticamente.
Estadística-Inferencial (UPEC) 2012
Cuando pide el tipo de licencia, simplemente se le pone en la primera opción y
continúan.
Estadística-Inferencial (UPEC) 2012
Aceptan el contrato de licencia y continúan
Estadística-Inferencial (UPEC) 2012
Una vez instalado el programa simplemente le damos cerrar y continuamos a
craquear el programa para que lo pueda utilizar, ya que si no se crakea no se
podrá utilizar, y en el caso de que lo haga solo lo hará por un periodo de 30
días.
Luego ingresamos a la carpeta del spss que descargamos y encontramos el
crack ingresamos y copiamos todos los iconos que se encuentran ahí.
Estadística-Inferencial (UPEC) 2012
Buscamos la carpeta del spss que has instalado, nos vamos hasta la carpeta de
archivos donde se encuentran los programas instalados que están en el disco
local, y aparecerá una carpeta con nombre IBM, ingresamos ahí y encontrarás
la carpeta del statics, luego ingresamos y encontraremos la del spss que en
este es la versión 19.
Estadística-Inferencial (UPEC) 2012
Ingresamos y pegamos todo lo que obtuvimos del crack, y como estos
programas ya están en la carpeta, pues solo se manda a remplazar y listo.
Y luego de eso ya lo podrás abrir el spss 19.
Aparecerá de esta manera
Estadística-Inferencial (UPEC) 2012
Estadística-Inferencial (UPEC) 2012
Puedes seleccionar introducir datos y listo, lo puede empezar a utilizar.
Estadística-Inferencial (UPEC) 2012
La ventana principal de SPSS: el Editor de datos de SPSS.
El paquete SPSS, desde la versión 7, es un paquete adaptado al entorno
WINDOWS con lo cual la forma de ejecutarlo es a través de ventanas en las
que se despliegan menús, de los que se pueden elegir distintas opciones y así
sucesivamente; por tanto es a través de un entorno de tipo gráfico desde donde
se solventan los problemas, y no a través de comandos (aunque también se
puede hacer así) como se hacía antes en los paquetes estadísticos más
usuales.
Por lo que acabamos de decir, la forma de iniciar la ejecución del
programa SPSS es pinchando dos veces con el ratón (“pinchar” lo utilizaremos
como sinónimo de “hacer clic” con el botón principal del ratón) en el icono de
SPSS que es como el de la Figura 1.1, y que se suele
Figura 1.1 Icono del programa SPSS.
Encontrar en el escritorio en forma de enlace o en el menú de inicio dentro del
apartado de programas. Una de las primeras tareas que tendrá que hacer el
usuario de SPSS será localizar la posición del icono y adaptarlo a su gusto para
que la entrada al programa sea fácil
Menú FunciónArchivo Todas las funciones que se pueden hacer con archivos: Abrir, cerrar,
Ediciónguardar, importar, exportar, imprimir, etc.Realiza todas las funciones típicas de la edición como son: cortar,
Vercopiar, eliminar, buscar, remplazar, etc...Permite controlar la forma en la que se ve la pantalla principal,
Estadística-Inferencial (UPEC) 2012
controlando las barras que aparecen en ella así como la forma en la
DatosQue se presentan los datos.Contiene el conjunto de acciones que se pueden llevar a cabo con losdatos: definir propiedades de las variables, seleccionar casos,
TransformarOrdenar casos y muchas más.Permite realizar cualquier función conducente a crear nuevasvariables a partir de otras existentes o no: transformar, recodificar,
AnalizarAsignar rangos, etc...Acceso al conjunto de programas de SPSS, que van desde lageneración de una tabla de frecuencias a análisis multivalentes
GráficosComplejos.Acceso al conjunto de gráficos estadísticos que van desde un simple
UtilidadesHistograma al dibujo de una curva ROC.Acceso a la descripción de las variables del fichero activo, creación
VentanaDe grupos de variables, así como edición de los menús.Acceso rápido a las ventanas de datos, de resultados, de sintaxis.
? Ayuda en línea sobre todo el paquete SPSS.
Tabla 1.1. Menús de la ventana principal de SPSS
Como se puede observar en la tabla, bajo una de las letras del rótulo del menú,
aparece un subrayado, indicando tal cosa que combinando la tecla Alt con la
letra subrayada se puede desplegar el menú correspondiente, pudiendo
desplazarse uno por él sin más que usar las teclas de flecha presentes en el
teclado.
Éste también se puede abrir haciendo doble clic sobre su nombre en la
segunda caja.
También en el menú Archivo tenemos dos opciones para guardar el fichero de
datos activo. La opción Guardar permite almacenar el fichero activo en un
Estadística-Inferencial (UPEC) 2012
disco. Si el fichero activo ha sido leído previamente se guardará con el mismo
nombre que tenía (el fichero original que existía en el disco se perderá). Por el
contrario si el fichero ha sido creado sin que exista ninguna imagen de él en el
disco, se nos pedirá que demos un nombre al nuevo fichero en el que se va a
guardar la información. Debe quedar claro que esta opción siempre guarda un
fichero de datos de SPSS, es decir, aquél que tiene una extensión .sav. Por el
contrario la opción Guardar como... permite guardar el fichero activo con otro
nombre y/o con formato de otras aplicaciones informáticas, como bases de
datos u hojas de cálculo.
Cuando se selecciona la opción se abre una ventana como la presente en la
Figura , en la que se seleccionará la carpeta donde se va a guardar el archivo,
se escribirá el nombre del archivo donde se desea guardar la información, se
seleccionará el tipo de archivo deseado y se pulsará el botón
Guardar.
Normas de funcionamiento de las ventanas de SPSS.
Estadística-Inferencial (UPEC) 2012
Para ejecutar cualquier acción con SPSS se empieza siempre escogiendo tal
acción de un menú (o de un submenú, en su caso) que nos lleva a la ventana
correspondiente a la acción o procedimiento elegido, en la que hay que elegir
los componentes fundamentales de la acción y en la que
Introducción al manejo del SPSS
hay la posibilidad de elegir otros componentes accesorios, como se puede ver
en la Figura Esta ventana tiene una estructura como la que sigue: en la parte
izquierda suele haber una caja en la que aparecen todas las variables
presentes en el fichero activo y que son susceptibles de ser manejadas con el
procedimiento elegido; a la derecha de esa caja suele haber otra u otras cajas
en las que pondremos las variables seleccionadas para la acción que
deseamos llevar a cabo; la forma de establecer tal selección es pinchar, en la
caja de la izquierda, la variable de interés (inmediatamente aparecerá
remarcada) y presionar en un botón con una flecha que señala hacia la derecha
(►), lo que llevará la variable a la caja de las variables seleccionadas para el
análisis. También suele haber unos botones de particularización, o en la parte
baja de la ventana o en la parte derecha de la misma (en el caso de la Figura
están en la parte baja) que particularizan el conjunto de acciones que dentro del
procedimiento elegido se pueden llevar a cabo; en el caso de la Figura las
acciones a llevar a cabo son: elegir los estadísticos que aparecerán junto con
las tablas de frecuencias, elegir los gráficos que acompañarán a las tablas de
frecuencias y por último elegir el formato en que aparecerán las tablas de
frecuencias; todos estos botones dan lugar a ventanas en las que se harán las
Estadística-Inferencial (UPEC) 2012
elecciones que hemos señalado. También, en las ventanas de SPSS aparecen
cinco botones de acciones inmediatas, que suelen estar a la derecha de la
ventana en vertical. Tales botones aparecen en la tabla 1.2 y serán explicados
en ella para no tener que hacerlo más.
Por último, si se observa la Figura se puede ver en ella que hay un
pequeño cuadradito en el que figura una marca; tal marca puede estar
presente o no, significando su presencia que la acción que aparece está
seleccionada y se llevará a cabo, mientras que su ausencia indicará que no
se llevará a cabo tal acción. Esta forma de seleccionar las acciones secundarias
a llevar a cabo es muy frecuente en SPSS.
Botón FunciónAceptar Llevar a cabo el análisis seleccionado.Pegar Escribir en el editor de sintaxis los comandos correspondientes a las
RestablecerAcciones elegidas en la ventana (no lo veremos en este manual).Borrar todas las elecciones hechas en la ventana para poder elegir
CancelarOtras nuevas.Salir de la ventana, dejándola como está, sin llevar a cabo ninguna
Ayudaacción.Desplegar la ayuda contextual del conjunto de acciones que aparecenen la ventana.
Tabla 1.2 Botones presentes en las ventanas de los distintos procedimientos de SPSS
Procedimiento Seleccionar casos.
Seleccionar casos proporciona varios métodos para seleccionar un
subgrupo de casos
Estadística-Inferencial (UPEC) 2012
Ventana de selección de casos de un fichero de SPSS
Basándose en criterios que incluyen variables y expresiones complejas.
También se puede seleccionar una muestra aleatoria de casos. Los criterios
usados para definir un subgrupo pueden incluir: Valores y rangos de las
variables, Rangos de fechas y horas, Números de caso (filas), Expresiones
aritméticas, Expresiones lógicas y Funciones.
La forma de invocar la selección de casos es Datos Seleccionar casos.
Cuando se hace tal cosa aparece una ventana como la de la Figura La ventana
muestra, a la izquierda, una caja con las diferentes variables del fichero activo
para que sean utilizadas en las distintas formas en que uno quiere seleccionar
los casos. A la derecha aparecen las cinco formas de seleccionar casos; aquí
describiremos las dos primeras.
Todos los casos desactiva el filtrado y utiliza todos los casos (es realmente
una no-selección de casos); ella está activa cuando se entra por primera vez a
la ventana de selección de casos.
Estadística-Inferencial (UPEC) 2012
La zona de resultados: el índice y los resultados propiamente dichos.
La zona de resultados es la que ocupa la mayor parte de la ventana, siendo de
ella la zona de índice la más estrecha y que está a la izquierda y la de
resultados la de la derecha más ancha; la zona de índices se puede agrandar y
achicar a voluntad (achicando y agrandando la zona de resultados) sin más que
pinchar sobre la barra que separa ambas ventanas y arrastrar el ratón. Como
se ve en la figura, tanto la ventana de índices como la de resultados tienen
barras horizontales que se desplazan para abarcar el conjunto de la
información allí expuesta. si es que se aplica.
Estadística-Inferencial (UPEC) 2012
Menús e Iconos del Visor de resultados
Estadística-Inferencial (UPEC) 2012
Estadística Descriptiva con SPSS.A partir de ahora describiremos los procedimientos estadísticos de SPSS. Desde luego que no
describiremos todos los que están disponibles en el programa, pues estas notas pretenden ser una
iniciación al SPSS, pero sí daremos lo suficiente para que el usuario se enfrente a un volumen
importante de problemas de Estadística
Estadística-Inferencial (UPEC) 2012
Gráficos con SPSS.
Una parte importante a la hora de exponer los resultados estadísticos es
presentar algunos de ellos en forma de gráficos. A ello dedica SPSS todo un
menú de la ventana principal, que es el menú Gráficos, con las opciones que
aparecen en la Figura De ese menú no se explicarán todas las opciones, sino
sólo las más útiles para los objetivos del manual.
Las dos primeras opciones son: Galería e Interactivos. La primera ofrece de
una manera gráfica y guiada (mediante un tutor) cada uno de los gráficos que
se pueden invocar por separado y que se describen a continuación; esta opción
puede ser seguida con facilidad por parte del lector pues el tutor que emplea
SPSS es bastante amigable y claro. Interactivos permite construir los gráficos
que veremos a continuación también de una manera interactiva y con un tutor;
es el procedimiento gráfico más moderno de SPSS y mejora sensiblemente el
manejo de los gráficos del mismo, así como su calidad de presentación (3D,
colores, sombreados, etc....); una vez más debido a la facilidad de uso no nos
detendremos más en él, por lo que el usuario puede intentarlo por su cuenta
Estadística-Inferencial (UPEC) 2012
De los que aparecen en la Figura describiremos con detalle los gráficos de:
Barras, Líneas, Sectores e Histograma. En secciones posteriores se explicarán
Barras de Error y Dispersión.
Todos los gráficos tienen una forma de invocarlos y una serie de opciones que
matizan su uso, por ello encontraremos que la exposición de los mismos es
similar a la de otros procedimientos estadísticos. En el primer gráfico que
presentemos haremos mención al editor de gráficos de SPSS que permite la
manipulación de los mismos de manera muy avanzada.
Gráficos de Barras.
SPSS denomina Gráfico de barras a un gráfico de variables categóricas en el
que sobre cada modalidad se levanta una barra de altura proporcional a la
Estadística-Inferencial (UPEC) 2012
frecuencia. La llamada del Gráfico de Barras da lugar a una primera ventana en
la que ha de seleccionarse el tipo de gráfico de barras que se desea
representar. La ventana es como la de la Figura Lo primero es elegir entre los
gráficos: Simple, Agrupado y Apilado. En el Simple, sólo se representa en el
Gráfico una única variable (que es lo más común); en el Agrupado se hace un
gráfico simultáneo (compuesto) en el que se presenta la distribución de una
variable dentro de cada una de las categorías de otra variable. En el gráfico
Apilado, se representan las categorías de una variable apiladas en cada una de
las barras en las que se representa la otra variable.
Elegido el tipo de Gráfico de Barras, se debe seleccionar ahora si el Gráfico
esta hecho con casos, a base de resúmenes de variables o a partir de valores
individuales de los casos; nosotros nos ceñiremos siempre a la primera opción
dejando las otras para situaciones más complejas. Una vez elegida la primera
opción pasamos a lo que es la definición del Gráfico de Barras pulsando el
botón Definir. Hecho esto aparece la ventana de la Figura.
Gráficos de Líneas.
Los gráficos de líneas no son más que polígonos de frecuencias que se pueden
Estadística-Inferencial (UPEC) 2012
representar para una, dos o más variables.
En la primera ventana del Gráfico de líneas se debe elegir entre los gráficos
Simple, Múltiple y de Líneas Verticales. El gráfico Simple permite un polígono
de frecuencias para una variable. En el Múltiple se pueden hacer varios
polígonos de frecuencias simultáneamente (gráfico compuesto). En el caso de
gráficos de Líneas verticales se lleva a cabo un gráfico más complejo que no
describiremos aquí. El resto de la ventana es como en los gráficos de barras.
Pulsando el botón Definir aparece la ventana en todo análoga a la de la Figura
8.6. Por ello todo lo dicho para el diagrama de barras es válido ahora. Lo dicho
para el editor de gráficos sigue siendo válido por lo que pasaremos a un nuevo
gráfico.
Gráficos de Sectores.
Como su propio nombre indica, permite hacer un diagrama de sectores para la
distribución de una variable. La primera ventana del gráfico de sectores es muy
simple, en ella aparecen las opciones que conocemos de gráficos anteriores.
Pulsando el botón Definir aparece la ventana en todo análoga a la de la Figura.
Por ello, todo lo dicho para el diagrama de barras es válido ahora. Lo dicho para
el editor de gráficos sigue siendo válido, salvo que aparecerá algún icono
adicional, como el que permite desgajar cada porción del diagrama de sectores.
Histograma.
Con este procedimiento obtendremos un histograma para un carácter
cuantitativo continuo. Cuando se selecciona el procedimiento se obtiene una
Estadística-Inferencial (UPEC) 2012
ventana como la de la Figura. Como siempre, aparece una caja a la izquierda
en la que figuran todas las variables del fichero activo, de entre las que se
seleccionará la variable para la que se va a hacer el histograma; en nuestro
caso particular la variable es el peso. Pinchando sobre Mostrar curva normal se
representará la curva Normal teórica que se ajustaría al histograma. Por último,
lo referente a Plantilla y al botón Títulos... ya se ha comentado en un gráfico
anterior. Elegidas todas las opciones, pulsando el botón Aceptar, se mostrará el
histograma como el de la Figura, que es explicativo por sí sólo y del que sólo
cabe destacar que SPSS ha creado los rectángulos centrados en pesos de 5 en
5 unidades.
Ventana histograma de SPSS
VENTANAS DE SPSS Y LAS BARRAS DE MENÚS
Editor de datos
Estadística-Inferencial (UPEC) 2012
La primera ventana que encontraremos al entrar en SPSS nos permitirá, entre
otras cosas, abrir un fichero de datos creado anteriormente o bien introducir
nuevos datos. Si elegimos esta última opción o pulsamos CANCELAR
apareceremos en el editor de datos.
La ventana del editor de datos tiene una estructura similar a la de una hoja de
cálculo y se utiliza para introducir los datos que se quieren analizar.
Los datos se introducen en la pestaña de vista de datos (en la parte inferior
izquierda), dentro de variables (cada variable aparece como una columna en
la pantalla). En la pestaña de vista de variables se explicarán las
características de las mismas.
Entrar al programa
Seleccionamos SPSS y se abrirá una ventana de opciones a realizar:
Seleccionaremos Introducir datos, pulsando con el botón izquierdo del ratón en el círculo de Introducir datos y posteriormente en Aceptar y obtendremos la ventana de edición de datos:
Estadística-Inferencial (UPEC) 2012
Los archivos de datos, habitualmente toman la forma de una matriz en la que
cada fila representa los valores que un individuo determinado tiene para unas
variables. En terminología de SPSS cada fila es un caso. En las columnas de
dicha matriz aparecen los diferentes valores que una variable determinada
toma para cada uno de los En la parte inferior de la pantalla principal aparece
la barra de estado en la que hay información sobre el procesador de SPSS
(SPSS El procesador está preparado), además de dos pestañas que
permiten seleccionar "vista de datos" o "vista de variables". En la arte
superior aparece la barra de menú. Al situar el puntero del ratón sobre
cualquiera de sus elementos, aparece información sobre las operaciones que
podemos realizar:
Archivo: Crear, abrir o grabar los diferentes archivos de SPSS, mostrar
información de datos...., imprimir, acceso directo a los últimos archivos
Abiertos, salir del SPSS.
Edición: Deshacer, borrar, copiar, cortar, pegar, buscar, opciones.
Estadística-Inferencial (UPEC) 2012
Ver: Barra de estado, Barras de herramienta, Fuentes, Cuadrícula, Etiquetas
de valor.
Datos: definir fechas y efectuar modificaciones en el archivo de datos:
seleccionar, añadir, ponderar, ordenar, ir al caso.etc.
Transformar: Modificación y generación de nuevas variables. Las funciones de
Este menú y del anterior son temporales y sólo están vigentes durante la
sesión sin que afecten al archivo original de datos. Si queremos que sean
permanentes debemos grabar los cambios.
Analizar: Análisis estadísticos instalados.
Gráficos: Edición y creación de diversos tipos de gráficas de alta resolución.
Utilidades: Cambiar fuentes, información sobre archivos.
Ventana: Funciones habituales para controlar las ventanas. Se pueden
distinguir los siguientes tipos de ventanas:
Edición de datos de SPSS (Ventana principal con los menús)
Visor de SPSS
Ayuda en el formato típico de Windows.
Definición de los Datos
Antes de empezar el análisis de los datos conviene, siempre, prepararlos
para su mejor manejo e interpretación.
Estadística-Inferencial (UPEC) 2012
Asignar un Nombre: a cada variable, cumpliendo las siguientes reglas:
Nombres con no más de 8 caracteres (siendo siempre el primero una
letra o @).
No utilizar símbolos como &, /, $, etc.
No utilizar nunca espacios en blanco.
No utilizar expresiones como ALL, AND, BY, EQ, GE, GT, LE, NE, NOT,
OR, TO, o WITH.
Asignar un Tipo: a cada variable, indicando el máximo número de dígitos que
deseamos para anotar las observaciones de la variable y el tipo de la
variable con la que vamos a trabajar, alfanumérica, fecha, moneda o
numérica, indicando en este caso el número de cifras decimales con que
queremos que aparezca en el editor.
Numéricas: formato numérico estándar
Coma: comas de separación cada tres posiciones. Un punto para la
parte o decimal.
Punto: al contrario que el anterior.
Notación Científica: uso de la E para exponente.
Cadena: variable alfanumérica. (de más de 8 caracteres se considera
larga). o Además están los formatos de fecha, dólar y moneda
personalizada.
Si no las escogemos, el sistema las asigna automáticamente, siendo el formato
por defecto: Numérica 8.2 que significa: Anchura: 8 y Decimales: 2, es decir,
una amplitud de columna de 8 espacios, siendo los 2 últimos para los
decimales.
Haz un clic sobre el recuadro coloreado en la celda correspondiente al
Tipo en la variable densidad y observa estas posibilidades.
Estadística-Inferencial (UPEC) 2012
Asignar una Etiqueta: a cada variable de no más de 120 caracteres (entre 30
y 40 es el valor recomendado) que nos permita tener más información sobre
esa variable.
Asignar Valores: se trata de asignar etiquetas a los valores de cada variable.
No es obligatorio, pero sí muy útil en algunos casos
Definir Perdidos: permite definir los valores de los datos especificados como
perdidos por el usuario. A menudo es útil para saber por qué se pierde
información. Por ejemplo, puedes querer distinguir el dato perdido
correspondiente a un entrevistado que se niega a responder, del dato perdido
debido a que la pregunta no afectaba a dicho entrevistado. Los valores de
datos especificados como perdidos por el usuario aparecen marcados para un
tratamiento especial y se excluyen de la mayoría de los cálculos.
Sitúate en el campo correspondiente a Perdidos de cualquier variable y pincha sobre el recuadro coloreado, aparece:
Estadística-Inferencial (UPEC) 2012
Los códigos asignados a los valores ausentes deben de ser coherentes con el
tipo de variables declarado: Numéricos para las numéricas y alfanuméricos para
las alfanuméricas (máximo 9 caracteres). Se pueden introducir hasta 3 valores
perdidos (individuales) de tipo discreto, un rango de valores perdidos o un rango
más un valor de tipo discreto. Sólo pueden especificarse rangos para las
variables numéricas.
Estos valores ausentes son denominados por SPSS "valores ausentes
definidos por el usuario" (user-defined missing values), a diferencia de los
definidos por el sistema (system-missing values o sysmis). Estos últimos
corresponden a los que establece el sistema para los espacios en blanco y
caracteres ilegales que puedan haber en el archivo de datos. Aparecen en los
listados representados por comas.
• Definir Columnas: consiste en especificar la amplitud de la columna.
Podemos hacerlo también desde el propio archivo de datos.
• Definir Alineación: seleccionar la justificación de las entradas de la
columna: Izquierda, Derecha y Centrado.
• Especificar medida. Se puede seleccionar uno de los tres niveles de medida:
Escala: los valores de datos son numéricos en una escala de intervalo. Las
variables de escala deben ser numéricas.
Ordinal: los valores de datos representan categorías con un cierto orden
Estadística-Inferencial (UPEC) 2012
intrínseco (bajo, medio, alto; totalmente de acuerdo, de acuerdo, en
desacuerdo). Las variables ordinales pueden ser de cadena o valores
numéricos. Notar que para variables de cadena ordinales, se asume que el
orden alfabético de los valores de cadena indica el orden correcto de las
categorías; en el caso de bajo, medio y alto el orden sería alto, bajo y medio
(orden que no es correcto), por lo que es más fiable utilizar códigos numéricos
para representar datos ordinales que usar etiquetas de estos
Códigos.Nominal: los valores de datos representan categorías sin un cierto orden
intrínseco. Las variables nominales pueden ser de cadena o valores numéricos
que representan categorías diferentes, por ejemplo 1 = Hombre y 2 = Mujer
CORRELACIÓN APLICADO AL SPSS STADISTIC
El procedimiento Correlaciones Bivariadas de SPSS permite medir el grado de
dependencia existente entre dos o más variables mediante la cuantificación por
los denominados coeficientes de correlación lineal de Pearson, de Spearman y
la Tau-b de Kendall con sus respectivos niveles de significación.
Antes del cálculo de un coeficiente de correlación, inspeccionaremos los datos
con el fin de detectar valores atípicos que puedan producir resultados
equívocos.
De entre estos coeficientes, vamos a centrarnos en el coeficiente de correlación
lineal de Pearson entre dos variables X e Y, el cual ha sido objeto de estudio en
esta asignatura. Su expresión matemática es la que presentamos a
continuación.
Analizar “Correlaciones” “Bivariadas”...
Una vez seleccionadas estas opciones, aparecerá el cuadro de diálogo que
presentamos a continuación:
Estadística-Inferencial (UPEC) 2012
Introducimos en el recuadro de variables aquéllas sobre las que vamos a
cuantificar los coeficientes de correlación. Resulta obvio que al tratarse del
cálculo de correlaciones, se deberán introducir al menos dos variables. Por
ejemplo las variables pib.pc y paro 92.
Una vez seleccionadas aquellas variables, cuyos coeficientes de correlación
vamos a cuantificar, deberemos seleccionar el tipo de coeficiente de correlación
que queremos calcular, para lo cual se nos presentan tres opciones diferentes:
Pearson: Medida de la asociación lineal entre dos variables. Los valores del
coeficiente de correlación varían entre -1 a 1. El signo del coeficiente indica la
dirección de la relación y su valor absoluto indica la fuerza o grado. Los valores
mayores indican que la relación es más estrecha y un valor de 0 indica que no
existe una relación lineal.
Tau-b de Kendall: Medida no paramétrica de asociación para variables
ordinales o de rangos que tiene en consideración los empates. El signo del
coeficiente indica la dirección de la relación y su valor absoluto indica la
magnitud de la misma, de tal modo que los mayores valores absolutos indican
relaciones más fuertes. Los valores posibles varían de -1 a 1, pero un valor de -
1 o +1 sólo se puede obtener a partir de tablas cuadradas.
Estadística-Inferencial (UPEC) 2012
Spearman: Versión no paramétrica del coeficiente de correlación de Pearson,
que se basa en los rangos de los datos en lugar de hacerlo en los valores
reales. Resulta apropiada para datos ordinales (susceptibles de ser ordenador)
y para datos agrupados en intervalos que no satisfagan el supuesto de
normalidad. Los valores del coeficiente varían de -1 a +1. El signo del
coeficiente indica la dirección de la relación y el valor absoluto del coeficiente de
correlación indica la fuerza de la relación entre las variables. Los valores
absolutos mayores indican que la relación es mayor.
Resumiendo, para las variables cuantitativas normalmente distribuidas,
seleccionaremos el coeficiente de correlación de Pearson, mientras que si los
datos no están normalmente distribuidos o tienen categorías ordenadas,
seleccionaremos la Tau-b de
Kendall o de Spearman, que miden la asociación entre órdenes de rangos
Tras la especificación del coeficiente o coeficientes de correlación que
estimamos oportuno calcular, procederemos a indicar si queremos que se
realice un contraste de hipótesis estadística bilateral o unilateral1 para casos en
los que la dirección de la relación puede ser especificada a priori.
Este contraste, trata de probar la hipótesis de que el coeficiente de correlación
sea nulo (r=0), esto es, que no exista relación alguna entre las variables cuyo
coeficiente de correlación estamos cuantificando.
Finalmente, con el objeto de identificar aquellos coeficientes de correlación que
tienen una mayor significación, se puede seleccionar: Marcar las
correlaciones significativas, opción que marca los coeficientes de correlación
significativos al nivel 0,05 por medio de un solo asterisco y los significativos al
nivel 0,01 con dos.
La salida que SPSS proporciona es la que presentamos a continuación:
Estadística-Inferencial (UPEC) 2012
Si pulsamos en el botón opciones del cuadro de diálogo, SPSS nos ofrece la
posibilidad de calcular diversos estadísticos:
Medias y desviaciones típicas: Si elegimos esta opción, SPSS calcula para
cada una de las variables que se han introducido en el cuadro de variables la
media y la desviación típica. También se muestra el número de casos que no
tienen valores perdidos. Si seleccionamos esta opción y ejecutamos el
Estadística-Inferencial (UPEC) 2012
procedimiento, la salida que nos muestra SPSS es la que presentamos a
continuación:
Productos cruzados y covarianzas: Si elegimos esta opción, SPSS calcula
para cada par de variables el producto cruzado de las desviaciones, que es
igual a la suma de los productos de las variables corregidas respecto a la
media, esto es, el numerador del coeficiente de correlación de Pearson; y la
covarianza que es una medida no tipificada de la relación entre dos variables,
igual al producto cruzado diferencial dividido por N-1. Si seleccionamos esta
opción y ejecutamos el procedimiento, la salida que nos muestra SPSS es la
que presentamos a continuación:
Estadística-Inferencial (UPEC) 2012
REGRESION LINEAL APLICADO AL SPSS STADISTIC
En SPSS está en Gráficos > Dispersión…
Diagrama de Dispersión Simple, y en la siguiente ventana de diálogo, tras
oprimir la pestaña Definir, debemos seleccionar las dos variables cuantitativas
que vamos a situar en el gráfico, una en el eje X y otra en el eje Y
Da igual cuál de las variables coloquemos en cada ventana: en la correlación no
tiene sentido la dependencia de las variables, ya que estas juegan un papel
simétrico.
Gráfico
Estadística-Inferencial (UPEC) 2012
Como ya puede verse a simple vista, estas dos variables muestran una escasa
correlación lineal, arrojando una nube de puntos mudispersa, con parejas
de valores en los cuatro sectores del plano cartesiano. El coeficiente de
correlación será un número más próximo a cero (ninguna correlación) que a la
unidad (correlación lineal perfecta).
CORRELACIONES > BIVARIADAS
Estadística-Inferencial (UPEC) 2012
En el siguiente cuadro de diálogo debemos seleccionar las variables
cuantitativas que vamos a correlacionar, y así mismo indicar el tipo de
Coeficiente de Correlación que deseamos calcular (el de Pearson es el
paramétrico y el de Spearman es el no paramétrico) y si el contraste o
Prueba de significación es unilateral o bilateral. Además, en la pestaña
Opciones podemos hacer que se muestren algunos estadísticos, como las
medias y desviaciones típicas y los productos cruzados y covarianzas
El resultado que se obtiene tras aplicar es el siguiente:
CORRELACIONES
Estadística-Inferencial (UPEC) 2012
La salida de SPSS muestra primero una tabla o cuadro resumen
de las variables que se van a correlacionar, aportando los tres
índices que sintetizan las distribuciones: media ,desviación
típica y tamaño muestral. Y enseguida una tabla con la correlación lineal (por
defecto), en la que vemos una doble entrada con cuatro celdas cuyos
valores en ángulo se repiten. Es una obviedad que hace el programa pero
nos recuerda que en la correlación las variables juegan un papel simétrico y
son intercambiables.
REGRESION LINEAL
Esta opción permite la creación de un gráfico de puntos (Asignar variables,
seleccionando las dos variables cuantitativas y colocándolas en las ventanas
correspondientes del eje cartesiano) y ajustar una línea de regresión
(Ajuste, a través del método de Regresión).
Vemos como en la pestaña Ajuste es posible seleccionar un método
(Regresión), obtener la ecuación de la línea de regresión y visualizar las
líneas de pronóstico para un intervalo de confianza determinado (por
defecto del 95%).
Estadística-Inferencial (UPEC) 2012
Estadística-Inferencial (UPEC) 2012
Estadística-Inferencial (UPEC) 2012
T- STUDENT
Realiza el test de comparación de dos medias con muestras apareadas
(relacionadas les llama SPSS), llevando a cabo determinados cálculos, que
veremos, sobre cada pareja de variables implicada. Supone que la diferencia
de las variables aleatorias es Normal
Estadística-Inferencial (UPEC) 2012
Estadística-Inferencial (UPEC) 2012
La forma de ejecutar el procedimiento es Analizar Comparar medias
Prueba T para muestras relacionadas. Hecho esto, aparece una ventana
como la de la Figura. A la izquierda está la caja con las variables presentes
Estadística-Inferencial (UPEC) 2012
en el fichero activo para seleccionar de ellas la pareja que nos permitirá
realizar el test de comparación de medias con muestras apareadas. Al
seleccionar ambas variables, pinchando sobre ellas, aparecerán en la zona
de Selecciones actuales; en nuestro caso la pareja es (szl24,sztri). Para
acabar de seleccionar la pareja y ejecutar con ella el procedimiento bastará
con pulsar el botón ø y aparecerá la pareja en la caja de Variables
relacionadas. La operación la podemos repetir para cualquier otro par de
variables para el que queramos realizar la comparación. En las Opciones
aparece el mismo contenido y. Por último, pulsando el botón Aceptar se
ejecuta el procedimiento dando lugar a un resultado como el de la Figura. En
la primera tabla aparecen las medidas de resumen que calcula para las
variables implicadas en la comparación. En la siguiente tabla aparece el
coeficiente de correlación de las dos variables. En la última tabla aparecen
los resultados propios de la comparación; primero aparece la media de las
diferencias, seguida de su desviación típica, el error estándar y un intervalo
de confianza para la diferencia entre las dos medias, y a continuación
aparece el resultado del test: =14.378, 93 g.l., P<0.0
Prueba TEstadísticos de muestras relacionadas
Media N Desviación típ. Error típ. de la media
Par 1SZL24 .8073 94 .1400 1.444E-02SZTRI -.8956 94 1.2111 .1249
Correlaciones de muestras relacionadas
N Correlación Sig.
Par 1 SZL24 y SZTRI 94 .494 .000
Prueba de muestras relacionadas
Diferencias relacionadas
T glSig.
Intervalo de confianzaError (bilat.)Desviación
Media típ. de la para la diferenciatíp.
mediaInferior Superior
Par SZL24 -1.7030 1.1484 .1184 1.4678 1.9382 14.378 93 .000
Estadística-Inferencial (UPEC) 2012
1 SZTRI
Gráfico Barras de error
El test Chi-cuadrado con SPSS.La comparación de proporciones, ya sea con muestras independientes o con muestras
apareadas, y la asociación de caracteres cualitativos son problemas estadísticos que se
resuelven con el uso del estadístico chi-cuadrado; al procedimiento de SPSS dedicado a tal
estadístico es al que dedicaremos este apartado
Procedimiento Tablas de contingencia.
El procedimiento para hacer los análisis que se han citado es el
procedimiento Tablas de contingencia. Tal procedimiento se invoca
como: Analizar Estadísticos Descriptivos Tablas de Contingencia.
Cuando se lleva a cabo tal acción, se abre una ventana como la de la
Figura
Como se ve, a la izquierda aparece la típica caja con el conjunto de las
variables presentes en el fichero activo. De entre ellas se elegirán las que
Estadística-Inferencial (UPEC) 2012
irán por filas (se colocarán en la caja Filas), las que irán por columnas (se
colocarán en la caja Columnas), y, si acaso, las que determinarán las
categorías para las que se obtendrán las tablas de contingencia (se
colocarán en la caja Capa 1 de 1 y constituirán las variables de la capa 1) .
El procedimiento obtendrá una tabla de contingencia para cada
combinación de dos variables, una de filas y otra de columnas, y si
existen variables en la capa 1, dichas tablas de contingencia las obtendrá
para cada categoría de cada una de estas variables; por ejemplo, si
"tabaco" es la única variable de la capa 1, se obtendrán las tablas de
contingencia para fumadores y no fumadores. En general se pueden definir
diferentes capas de variables, lo que da más posibilidades al
procedimiento, pero lo complica (no lo veremos). En el caso de la Figura,
deseamos comprobar si la distribución del grado de retinopatía que sufren
los pacientes es la misma en hombres que en mujeres; estando por tanto
en la situación de un test de comparación de proporciones con dos
muestras independientes. También sería éste, de forma equivalente, el
problema de estudiar la asociación entre el sexo y la presencia de
retinopatía.
Estadística-Inferencial (UPEC) 2012
Estadística-Inferencial (UPEC) 2012
Estadística-Inferencial (UPEC) 2012
Inmediatamente debajo de la caja de la izquierda aparecen dos opciones
que pueden o no estar seleccionadas: la opción Mostrar los gráficos de
barras agrupadas (que muestra un gráfico de barras agrupadas para cada
combinación de variables de Filas y Columnas, dentro de las categorías de
cada variable de la capa 1) y la opción Suprimir tablas (que muestra el
análisis de las tablas de contingencia, sin llegar a mostrar las propias tablas).
Inmediatamente debajo aparecen los botones: Estadísticos..., Casillas... y
Formato... ., que hacen referencia a los estadísticos que deseamos calcular
para la tabla, las cantidades que deseamos que aparezcan en las casillas y
el formato en el que aparecerán las tablas. A continuación los describiremos
con detalle.
Cuando se pincha sobre el botón Estadísticos.... se despliega una ventana
con muchas alternativas que, marcándolas, nos permitirán el cálculo de
estadísticos o medidas aplicables a diferentes situaciones, y que, la mayoría,
van más allá de un curso básico de estadística al que pretende dar cobertura
este manual. Por ello, aquí sólo comentaremos algunas de ellas. La primera,
Chi-cuadrado, nos calcula estadísticos del tipo chi-cuadrado (entre ellos, el
chi-cuadrado de Pearson para una tabla de contingencia) y hace el test de
Fisher en el caso de tablas 2×2. La opción Coeficiente de Contingencia
nos calcula dicho coeficiente en cualquier tabla de contingencia. La opción
Riesgo nos permite obtener medidas de asociación en tablas 2×2: razón del
producto cruzado y riesgo relativo. Finalmente la opción McNemar lleva a
cabo el test de McNemar para comparar dos proporciones con muestras
apareadas (caso de una tabla 2×2).
Al pulsar el botón Casillas ... nos aparece una ventana donde, marcando las
opciones correspondientes, podemos calcular y escribir en cada casilla de la
tabla: las frecuencias observadas, las frecuencias esperadas, los
porcentajes por filas, los porcentajes por columnas, los porcentajes respecto
al total, los residuos no tipificados (diferencia entre frecuencias observadas y
esperadas) y otros residuos que no veremos aquí. Por último, la opción
Estadística-Inferencial (UPEC) 2012
Formato... permite presentar las filas de la tabla en orden ascendente o
descendente.
Elegidas todas las opciones y pulsando la tecla Aceptar se llevará a cabo el
análisis solicitado. A continuación mostraremos los resultados obtenidos
para varios análisis distintos
Resultados del procedimiento Tablas de contingencia
En la Figura aparece lo fundamental de los resultados del análisis de
asociación entre el sexo del paciente y el nivel de retinopatía que ha
alcanzado. En la primera tabla, por filas aparece el sexo del paciente y por
columnas figura el nivel de la retinopatía. En las casillas se presentan las
frecuencias observadas así como los porcentajes por filas. La segunda tabla
contiene las pruebas de chi-cuadrado. En la primera fila se muestra el
clásico test Chi-cuadrado de Pearson para tablas de
Contingencia (los otros no los veremos aquí); también al pie de esta tabla
observamos el número de casillas (de la tabla de contingencia) que tienen
Estadística-Inferencial (UPEC) 2012
frecuencia esperada inferior a 5, de utilidad para comprobar la validez del
test anterior.
En la Figura aparece lo fundamental de los resultados del test de McNemar
para la comparación de dos proporciones con muestras apareadas. Se dice
que un individuo tiene
Resultados del test de McNemar de comparación de dos proporciones con muestras
apareadas (procedimiento Tablas de contingencia
PRUEBA DE HIPOTESIS
Procedimiento Binomial.
El procedimiento Binomial permite realizar el test de hipótesis para una
proporción, contrastando si la proporción difiere significativamente de un
valor p0 especificado.
La forma de invocar el procedimiento es: Analizar Pruebas No
Estadística-Inferencial (UPEC) 2012
Paramétricas Binomial... En la ventana que aparece, como en otras
muchas ocasiones, pasaremos a la caja de la derecha las variables (que
deben ser numéricas) para las que queremos realizar el test. En la pequeña
caja contrastar proporción colocaremos el valor p0 que deseamos
contrastar. SPSS
Estadística-Inferencial (UPEC) 2012
Realizará un test de la proporción para cada variable introducida, pero
todos con el mismo p0. En la parte inferior izquierda de la ventana aparece
Definir la dicotomía, que tiene dos opciones. La primera opción es para
variables que tienen sólo dos valores posibles: el valor más pequeño
determinará el grupo 1, y el más grande el grupo 2. La segunda opción es
para variables con cualquier número de valores distintos, pudiéndose
especificar un punto de corte: los valores iguales o más pequeños que el
punto de corte determinarán el grupo 1, y los más grandes el grupo 2. Esta
definición de la dicotomía tiene que ser idéntica para todas las variables
introducidas. En cualquier caso, y para cada variable, SPSS contrastará si
la proporción de individuos o casos pertenecientes al grupo 1 difiere
significativamente del valor p0 especificado.
En la ventana del procedimiento aparece el botón de Opciones... , donde
podemos solicitar cálculos descriptivos de las variables y especificar cómo
Estadística-Inferencial (UPEC) 2012
tratar los valores perdidos. Para esto último existen dos opciones: Excluir
casos según prueba (excluye los casos con valores perdidos en la variable
implicada en el contraste) y Excluir casos según lista (excluye los casos
con valores perdidos en cualquiera de las variables introducidas en el
procedimiento Binomial). Los resultados del procedimiento se dan en una
tabla, donde aparecen, para cada test, el grupo 1 y el grupo 2, el valor p0 de
prueba y el valor P del test
VARIANZA
Análisis de la varianza con un factor
El procedimiento para realizar el Análisis de la Varianza con un factor se
encuentra en
Analizar Comparar medias! ANOVA de un factor
En el cuadro de dialogo que aparece, llevar a la casilla Dependientes la
variable respuesta a estudiar, y a la casilla Factor, la variable que contenga
los niveles del factor. Veamos que seleccionar en cada uno de los cuadros
de los que dispone SPSS.
Contrastes: con esta opción el SPSS nos permite hacer contrastes a priori,
que no vamos a manejar. Se deja en blanco y Continuar.
Post hoc: las pruebas Post hoc son lo mismo que los contrastes múltiples a
posteriori (para detectar donde se encuentran las diferencias entre medias).
Se nos permite elegir diversos métodos de control del error (elegimos
Bonferroni, que es el que manejamos en clase, asumiendo igualdad de
varianzas) y el nivel de sindicación (total) para los contrastes.
Opciones: resultan de utilidad los Descriptivos (si antes no hemos realizado
el procedimiento Explorar, ya que nos proporciona estimaciones de las
medias por nivel) y la Prueba de homogeneidad de varianza (o prueba de
Levene: según el p-valor que nos proporcione el contraste aceptaremos o
rechazaremos la hipótesis nula de que las varianzas en todos los niveles del
Estadística-Inferencial (UPEC) 2012
factor coinciden)
Estadística-Inferencial (UPEC) 2012
CONCLUSIONES
BM SPSS Statistics es un completo conjunto de datos y herramientas
de análisis predictivo fácil de utilizar para usuarios empresariales,
analistas y programadores estadísticos.
La combinación de las técnicas de estadística inferencial junto con la
minería de datos implementadas en esta tesis permite generar
información y elaborar reportes que ayuden en la toma de decisiones.
Los reportes gráficos presentan la información de una manera más
comprensible y amigable para el usuario que las tablas de resultados.
Del desarrollo de este tema concluimos que es posible presentar
gráficos/biplots que complementan los resultados mostrados
numéricamente en las tablas de datos.
IBM SPSS Advanced Statistics crea análisis más precisos y
conclusiones más fiables cuando se trabaja con relaciones complejas.
Estadística-Inferencial (UPEC) 2012
IBM SPSS proporciona técnicas efectivas ante problemas reales en
una gran variedad de disciplinas, incluidos la investigación médica, la
fabricación, los productos farmacéuticos y los estudios de mercado.
Ofrece técnicas avanzadas de análisis univariados y multivariados
muy efectivas y sofisticadas, entre las que se incluyen:
Procedimientos de modelos lineales generales (GLM) y de modelos
mixtos
Modelos lineales generalizados (GENLIN), que incluyen los modelos
estadísticos más utilizados como la regresión lineal para respuestas
distribuidas con normalidad, modelos logísticos para datos binarios y
modelos loglineales para datos de recuento.
GENLIN también ofrece varios modelos estadísticos muy útiles a
través de su propia formulación general de modelos.
Los procedimientos de las ecuaciones de estimación generalizadas
(GEE) amplían los modelos lineales generalizados para acomodar
datos longitudinales correlacionados y datos en clúster
Modelos mixtos lineales generalizados (GLMM) para utilizar con datos
jerárquicos
RECOMENDACIONES
Es necesario que IBM SPSS Statistics Professional Edición se aplique
ya que n las funciones estadísticas principales ofrecidas en Standard
Edición para tratar los problemas de calidad de datos, complejidad de
datos, automatización y pronósticos.
Realizar futuros módulos para incorporar otros estudios estadísticos
como análisis discriminante, componentes principales, regresión
múltiple
En un futuro, dada la flexibilidad que brindan los métodos presentados
y la estadística inferencial, incluir otras variables a ser estudiadas
Estadística-Inferencial (UPEC) 2012
para aumentar la información disponible para ayudar en la toma de
decisiones
Utilizar el sistema para tomar decisiones adecuadas que sirvan para
la optimización de la evaluación de la información recogida
Presentar los módulos planteados, para aplicar estos análisis
estadísticos a la base de datos de calificaciones de estudiantes, y
poder determinar así por ejemplo factores que inciden en el éxito o
fracaso de los estudiantes en una carrera específica
Es necesario identificar que los usuarios que realizan varios tipos de
análisis en profundidad y no estándar y que necesitan ahorrar tiempo
mediante la automatización de tareas de preparación. Con lo cual se
puede aplicar
IBM SPSS Statistics Professional Edición incluye las siguientes funciones
clave:
Los Modelos lineales ofrecen varios procedimientos de regresión y
estadísticas avanzados diseñados para que se adapten a las
características inherentes de los datos que describen relaciones
complejas.
Los Modelos no lineales otorgan la capacidad de aplicar más
modelos sofisticados a los datos.
Las Tablas personalizadas permiten a los usuarios comprender
fácilmente sus datos y a resumir de forma rápida en diferentes estilos
y para diferentes audiencias.
La Preparación de datos agiliza la fase de preparación de datos del
proceso analítico.
La Validez de datos y valores que faltan aumenta la oportunidad de
recibir resultados significativos desde el punto de vista estadístico.
Los Árboles de decisiones facilitan la identificación de grupos, el
descubrimiento de relaciones entre grupos y la previsión de futuros
eventos.
Estadística-Inferencial (UPEC) 2012
Las características de Previsión le permiten analizar datos históricos
y prever tendencias de forma más rápida.
ANÁLISIS
Existen diversas definiciones, veamos algunas:
Para Sierra Bravo (1991), la estadística es “la ciencia formada por un
conjunto de teorías y técnicas cuantitativas, que tiene por objeto la
organización, presentación, descripción, resumen y comparación de
conjuntos de datos numéricos, obtenidos de poblaciones en su conjunto de
individuos o fenómenos o bien de muestras que representan las poblaciones
estudiadas, así como el estudio de su variación, propiedades, relaciones
comportamiento probabilístico de dichos datos y la estimación, inferencia o
generalización de los resultados obtenidos de muestras, respecto a las
poblaciones que aquéllas representan. La estadística en la investigación
científica, dada la necesidad de manejar y tratar en ellas grandes
cantidades, progresivamente crecientes, de datos”.
VIrma Nocedo de León et al (2001), anotan que “la estadística es la ciencia
encargada de suministrar las diferentes técnicas y procedimientos que
permiten desde organizar la recolección de datos hasta su elaboración,
análisis e interpretación. Abarca dos campos fundamentales la estadística
descriptiva y la estadística inferencial”,
Para Hopkins y Glass (1997), “la estadística es un lenguaje para comunicar
información basada en datos cuantitativos”.
Douglas Montgomery (1985), define a la estadística como “el arte de tomar
Estadística-Inferencial (UPEC) 2012
decisiones acerca de un proceso o una población con base en un análisis de
la información contenida en una muestra tomada de la población”.
Otra definición de la estadística que lo vincula al uso científico de principios
matemáticos, a la colección, al análisis y a la presentación de datos
numéricos. Contribuyen con la investigación científica diseñando pruebas y
experimentos; la colección, el proceso, y el análisis de datos; y la
interpretación de los resultados, aplicando conocimientos matemáticos y
estadísticos. El conocimiento estadístico se aplica a la biología, economía,
ingeniería, medicina, salud pública, psicología, comercialización, educación y
deportes. Muchas decisiones económicas, sociales, políticas y militares no
se pueden tomar objetivamente sin el empleo adecuado de la estadística.
En nuestro medio profesional o en la sociedad en general se requiere
solucionar un problema o verificar un supuesto, para desarrollar la ciencia, la
técnica y la educación entre otros ámbitos; en particular respecto a los
alumnos sobre rendimiento académico, aptitud científica, desarrollo social y
la deserción entre otros. También respecto al docente sobre su desempeño
en aula, su formación académico-profesional, los recursos didácticos que
emplea y la producción científica, entre otros. Respecto al sistema educativo,
financiamiento de la educación, gestión académica, informática educativa y
modelos educativos, entre otros.
Todos estos problemas no pueden ser resueltos por iniciativas subjetivas,
por pareceres o lluvia de ideas; sino en base a información válida y
confiable, esto es, tener información lo más próxima a la realidad bajo
estudio. Indudablemente esto se logra empleando la ciencia llamada
estadística.
Para resolver estos problemas se debe seguir de manera organizada,
sistemática y planificada, es decir debemos realizar investigación científica
SPSS STADISTIC
Estadística-Inferencial (UPEC) 2012
Con más de 35 años de experiencia, SPSS Statistics (antes PASW) es el
paquete estadístico de referencia. Concebido para el análisis de datos en
ciencias sociales, su potencia y la cantidad de pruebas disponibles le
convierten en el programa de elección para cualquier escenario que requiera
predicciones rápidas y fiables.
El punto fuerte de SPSS Statistics es la facilidad de uso. Todos los análisis
se llevan a cabo a través de cuadros de diálogo con un excelente diseño. La
interfaz de SPSS Statistics facilita la introducción de un gran volumen de
datos y variables.
El editor de datos es una parte esencial del programa, y hay un menú entero
dedicado a la manipulación de ficheros. El nuevo editor de sintaxis de SPSS
Statistics es un cambio largo tiempo esperado y a la altura de las
expectativas.
Una vez que se ejecuten pruebas, ya sean estadísticos descriptivos,
regresiones, ANOVAs, series temporales o análisis cluster, SPSS Statistics
mostrará los resultados en un visor aparte junto a los gráficos. Desde allí se
pueden copiar y pegar a otros programas o exportar en formato PDF o DOC.
La integración con Office de SPSS Statistics se ha mejorado notablemente.
Con un rendimiento sólido y un motor gráfico sobresaliente, SPSS Statistics
sigue siendo un clásico difícil de destronar. Sus últimas mejoras y la
traducción al español de la interfaz le convierten en imprescindible.
ABSTRACT
This work introduces a Website, http://www.ugr.es/~bioestad/ which
contains information both of general interest as well as material specifically
aimed at students taking Statistics related subjects as part of their Bachelor
Degree courses in Biology or Environmental Science at the University of
Granada. It provides teaching material for these subjects as well as a self-
Estadística-Inferencial (UPEC) 2012
learning interactive program for students learning the SPSS Statistics
software package. This interactive program consists of a Web portal
http://www.ugr.es/~bioestad/guiaspss/index.html where you can find different
exercises which are explained and resolved using the SPSS program and
guided exercises resolved interactively through a tutorial emulator program
from the SPSS Statistics package.
On the one hand, the project aims to develop a computer tool where the
main teaching resource to be used is an interactive program which facilitates
student self-learning, both inside and outside the classroom. On the other
hand, it aims to encourage active student participation in his/her own
learning process and in the pursuit of a deeper understanding of course
contents. It is very important to note that this is free software and so access
is not restricted to students register ed in these subjects.
The main goal is to present the SPSS Self-Learning Interactive Guide
(Version 3.0). In this new software, Version 2.1 has been revised, amended
and extended with a new practical exercise, Exercise 6, in which parametric
and non -parametric hypotheses are contrasted
CRONOGRAMA DE ACTIVIDADES
ACTIVIDADJULIO 2012
lunes 10 martes 11 Miercoles12 jueves 13 Organización del Tema X Investigación del Tema X Análisis del Tema X Documentación del Tema X
Estadística-Inferencial (UPEC) 2012
BIBLIOGRAFÍA:
GIL, J.; DIEGO, J.L.; RODRÍGUEZ, G. y GARCÍA, E. (1996).
Problemas de Estadística Básica Aplicada a las Ciencias de la
Educación. Sevilla: Kronos.
GIL, J.; RODRÍGUEZ, G. y GARCÍA, E. (1995). Estadística Básica
Aplicada a las Ciencias de la Educación. Sevilla: Kronos
BELLIDO VASQUEZ, P, “Estadísticas para marketing (1) El Análisis
Factorial”, <http://www.ilustrados.com/publicaciones/EpyukylkEFAVid
hbVk.php>. 2003
GONDAR, J.E., “Análisis Factorial”. < http://www.estadistico.com/
arts.html?20011119>. 2001
BLOQUE DE CIUDAD, DICCIONARIO ESTADÍSTICO, <http://www.
estadistico.com/dic.html?p=85>. 2004
DISTANCIA DE MAHALANOBIS, DICCIONARIO ESTADÍSTICO,
<http://www.estadistico.com/dic.html?p=1220>. 2004
LARA-PORRAS, A., GARCÍA-LEAL, J., QUESADA-RUBIO, J.M.,
RAMOS-ÁBALOS, E., RAYA- MIRANDA, R., SÁNCHEZ-BORREGO,
I.R. Y TARIFA-BLANCO, J.A. (2006): Guía interactiva de
autoaprendizaje de SPSS versión 1.2 (CD-ROM)
LARA-PORRAS, A.M., QUESADA-RUBIO, J.M., RAMOS-ÁBALOS,
E., RAYA-MIRANDA, R., SANCHEZ-BORREGO, I.R. Y TARIFA
BLANCO. J.A. (2008a): Guía interactiva de autoaprendizaje de
SPSS versión 1.3
Estadística-Inferencial (UPEC) 2012
LARA-PORRAS, A.M., RAMOS-ÁBALOS, E., RAYA-MIRANDA, R.,
SÁNCHEZ-BORREGO, I.R., TARIFA- BLANCO. J.A. Y ALONSO-
UXÓ, A. (2008b): Guía interactiva de autoaprendizaje de SPSS
versión 2.1 (CD-ROM http://dewey.uab.es/pmarques/competen.htm,
MARQUÈS GRAELLS, P (2008): Impacto de las TIC en educación:
funciones y limitaciones. http://peremarques.pangea.org/siyedu.htm,
ANEXOS
Estadística-Inferencial (UPEC) 2012
PROBLEMA EJEMPLO DE LA FORMA NORMAL
La almacenera Aduanor estudia la relación entre ingreso importaciones (X) y de egreso de exportaciones (Y) mensuales Una muestra aleatoria de sus exportaciones y importaciones reveló los siguientes datos en dólares:
X 350 400 450 500 950 850 700 900 600Y 100 110 130 160 350 350 250 320 130
Desarrollo
Como primer paso empezamos realizando la tabla de las dos variables
Ingresos Ahorros N X Y X Y X2 Y2 (xi-x)2 (yi-y)2
1 350 100 35000 122500 10000 80275,89 12345,432 400 110 44000 160000 12100 54442,89 10223,233 450 130 58500 202500 16900 33609,89 6578,834 500 160 80000 250000 25600 17776,89 2612,235 950 350 332500 902500 122500 100279,89 19290,436 850 350 297500 722500 122500 46945,89 19290,437 700 250 175000 490000 62500 4444,89 1512,438 900 320 288000 810000 102400 71112,89 11857,039 600 130 78000 360000 16900 1110,89 6578,83∑ 5700 1900 1388500 4020000 491400 410000 90288,89
X=∑ x1
n=5700
9=633.33
Estadística-Inferencial (UPEC) 2012
Y=∑ y1
n=1900
9=211.11
r=n∑ xy−∑ x∑ y
√¿¿¿
r=9 (1388500 )−(5700)(1900)
√¿¿¿
r= 1666500
√3690000∗812600=1666500
1731616=0.96
sx=√∑ ¿¿¿¿
sx=√ 4100009
=213.44→desviacion standar
s x2=¿
sy=√∑ ¿¿¿¿
sy=√ 90288,899
=100,16→desviacionstandar
s y2=¿
Yr= y+r ( sysx ) x−r ( sysx ) x
Yr=211.11+0.96 ( 100,16213,44 ) x−0.96 ( 100,16
213,44 )633,33
Yr=211,11+0,45 x−285,31
Yr=−74,2+0,45x
b=n∑ xy−∑ x∑ y
n∑ x2−¿¿¿
Estadística-Inferencial (UPEC) 2012
b=9 (1388500 )−(5700)(1900)
9 ( 4020000 )−(5700 )
b=12496500−1083000036180000−32490000
b=16665003690000
b=0.45
a= y−bx
a=211.11−0.45 (633.33)
a=¿-73.89
Ecuación lineal de las dos variables.
y=a+bx
y=−73,89+0.45 x
Estadística-Inferencial (UPEC) 2012
Diagrama de dispersión en el plano cartesiano
300 400 500 600 700 800 900 10000
50100150200250300350400
YLinear (Y)
Axis Title
Axis Title
Ingreso que corresponde a un ahorro semanal de 90 dólares.
y=−73,89+0.45 x
y=−73.89+0.45 (90 )=−33.39
Si el ahorro es de 200 dólares que gasto puede realizar el obrero en dicha
Semana.
y=−73.89+0.45 x
y=−73.89+0.45 (200 )=16.11
Si el ingreso es de 350 dólares cual es el salario.
y=−73.89+0.45 x
350=−73.89+0.45 x
350+73.890.45
=x
x=941.98
PASOS DE UNA PRUEBA DE HIPOTESIS
Primer paso formular la hipótesis nula y la hipótesis alternativa
Estadística-Inferencial (UPEC) 2012
Hipótesis nula
Ho = β=0
La hipótesis alternativa
Ha= β<0; β>0
Segundo paso determinar si la prueba es unilateral o bilateral
Bilateral
Tercer paso Asumir el nivel se significación de la prueba
95% ± 1,96
Cuarto paso determinar la distribución maestral que se usara en la
prueba
n<30
Como n es menor que 30 utilizaremos la T de estudent
Quinto paso elaborar el esquema de la prueba
-1.96 +1.96
Sexto paso calcular el estadístico de la prueba
z= Pm−poQp
z=0.05−0
9 z=5.55
Estadística-Inferencial (UPEC) 2012
Q=√ SX 2+SY 2
n
Q=√ 45556,63+10032,109
Q=216.03
QP=√ PQnQP=√ 0(216.03)
9
QP=0
Pm= pn
Pm=0.459Pm=0.05
Estadística-Inferencial (UPEC) 2012
PROBLEMA DEL CONTEXTO DE COMERCIO EXTERIOR
APLICADO EN EL PROGRAMA SPSS STADISTIC
La almacenera Aduanor estudia la relación entre ingreso importaciones (X) y de egreso de exportaciones (Y) mensuales Una muestra aleatoria de sus exportaciones y importaciones reveló los siguientes datos en dólares:
100 27700 51185 1.600900 4380 10
525 5660 1260 11,7
1.556 7190 0
1.168 65280 48
1.332 631.350 22100 55
1.943 2080 1080 163
2.700 9470 20
4.680 266308 296
9.516 2.660789 30
9.516 2.7028.316 2.1901.586 713.261 219
40 1440 1250 146
650 25240 225
Estadística-Inferencial (UPEC) 2012
4.000 2740 55
3.650 703.650 84
50 201.350 22
50 252.700 981.500 439
40 1860 33
1.280 68100 2550 24
120 251.400 2353.680 158150 3150 12
5.522 97150 11750 37
770 6980 48
700 1580 23
4.218 1165.672 97
60 24100 109150 132
1.593 107180 65100 13
Frecuencias
Notas
Estadística-Inferencial (UPEC) 2012
Resultados creados 12-jul-2012 04:03:08
Comentarios
Entrada Datos C:\Users\USER\Documents\
estadistica ojos aja. Sav
Conjunto de datos activo Conjunto_de_datos1
Filtro <ninguno>
Peso <ninguno>
Segmentar archivo <ninguno>
Núm. de filas del archivo
de trabajo
67
Manipulación de los
valores perdidos
Definición de los perdidos Los valores perdidos definidos por el
usuario serán tratados como
perdidos.
Casos utilizados Los estadísticos se basan en todos
los casos con datos válidos.
Sintaxis FREQUENCIES VARIABLES=importa
ex pota
/NTILES=4
/STATISTICS=STDDEV VARIANCE
MINIMUM MAXIMUM MEAN MEDIAN
MODE
/ORDER=ANALYSIS.
Recursos Tiempo de procesador 0:00:00.063
Tiempo transcurrido 0:00:00.054
Estadísticos
mas de 100 menos de 100
N Válidos 67 67
Perdidos 0 0
Media 126.0319 80.1217
Mediana 50.0000 48.0000
Moda 50.00a 25.00
Des . típ. 215.95320 107.27079
Varianza 46635.785 11507.022
Mínimo 1.17 .00
Máximo 900.00 652.00
Estadística-Inferencial (UPEC) 2012
Percentiles 25 3.6800 20.0000
50 50.0000 48.0000
75 100.0000 98.0000
a. Existen varias modas. Se mostrará el menor de los valores.
Tabla de frecuencia
mas de 100
Frecuencia Porcentaje Porcentaje
válido
Porcentaje
acumulado
Válidos 1.17 1 1.5 1.5 1.5
1.28 1 1.5 1.5 3.0
1.33 1 1.5 1.5 4.5
1.35 2 3.0 3.0 7.5
1.40 1 1.5 1.5 9.0
1.50 1 1.5 1.5 10.4
1.56 1 1.5 1.5 11.9
1.59 1 1.5 1.5 13.4
1.59 1 1.5 1.5 14.9
1.94 1 1.5 1.5 16.4
2.70 2 3.0 3.0 19.4
3.26 1 1.5 1.5 20.9
3.65 2 3.0 3.0 23.9
3.68 1 1.5 1.5 25.4
4.00 1 1.5 1.5 26.9
4.22 1 1.5 1.5 28.4
4.68 1 1.5 1.5 29.9
5.52 1 1.5 1.5 31.3
5.67 1 1.5 1.5 32.8
8.32 1 1.5 1.5 34.3
9.52 2 3.0 3.0 37.3
40.00 4 6.0 6.0 43.3
50.00 6 9.0 9.0 52.2
60.00 4 6.0 6.0 58.2
70.00 1 1.5 1.5 59.7
80.00 6 9.0 9.0 68.7
90.00 1 1.5 1.5 70.1
Estadística-Inferencial (UPEC) 2012
100.00 5 7.5 7.5 77.6
120.00 1 1.5 1.5 79.1
150.00 3 4.5 4.5 83.6
180.00 1 1.5 1.5 85.1
185.00 1 1.5 1.5 86.6
240.00 1 1.5 1.5 88.1
308.00 1 1.5 1.5 89.6
525.00 1 1.5 1.5 91.0
650.00 1 1.5 1.5 92.5
700.00 2 3.0 3.0 95.5
770.00 1 1.5 1.5 97.0
789.00 1 1.5 1.5 98.5
900.00 1 1.5 1.5 100.0
Total 67 100.0 100.0
menos de 100
Frecuencia Porcentaje Porcentaje
válido
Porcentaje
acumulado
Válidos .00 1 1.5 1.5 1.5
1.60 1 1.5 1.5 3.0
2.19 1 1.5 1.5 4.5
2.66 1 1.5 1.5 6.0
2.70 1 1.5 1.5 7.5
10.00 2 3.0 3.0 10.4
12.00 3 4.5 4.5 14.9
13.00 1 1.5 1.5 16.4
14.00 1 1.5 1.5 17.9
15.00 1 1.5 1.5 19.4
18.00 1 1.5 1.5 20.9
20.00 3 4.5 4.5 25.4
22.00 2 3.0 3.0 28.4
23.00 1 1.5 1.5 29.9
24.00 2 3.0 3.0 32.8
25.00 4 6.0 6.0 38.8
27.00 2 3.0 3.0 41.8
30.00 1 1.5 1.5 43.3
31.00 1 1.5 1.5 44.8
Estadística-Inferencial (UPEC) 2012
33.00 1 1.5 1.5 46.3
37.00 1 1.5 1.5 47.8
43.00 1 1.5 1.5 49.3
48.00 2 3.0 3.0 52.2
51.00 1 1.5 1.5 53.7
55.00 2 3.0 3.0 56.7
56.00 1 1.5 1.5 58.2
63.00 1 1.5 1.5 59.7
65.00 1 1.5 1.5 61.2
68.00 1 1.5 1.5 62.7
69.00 1 1.5 1.5 64.2
70.00 1 1.5 1.5 65.7
71.00 2 3.0 3.0 68.7
84.00 1 1.5 1.5 70.1
94.00 1 1.5 1.5 71.6
97.00 2 3.0 3.0 74.6
98.00 1 1.5 1.5 76.1
100.00 1 1.5 1.5 77.6
107.00 1 1.5 1.5 79.1
109.00 1 1.5 1.5 80.6
116.00 1 1.5 1.5 82.1
117.00 1 1.5 1.5 83.6
132.00 1 1.5 1.5 85.1
146.00 1 1.5 1.5 86.6
158.00 1 1.5 1.5 88.1
163.00 1 1.5 1.5 89.6
219.00 1 1.5 1.5 91.0
225.00 1 1.5 1.5 92.5
235.00 1 1.5 1.5 94.0
266.00 1 1.5 1.5 95.5
296.00 1 1.5 1.5 97.0
439.00 1 1.5 1.5 98.5
652.00 1 1.5 1.5 100.0
Total 67 100.0 100.0
Gráfico
Notas
Estadística-Inferencial (UPEC) 2012
Resultados creados 12-jul-2012 04:03:51
Comentarios
Entrada Datos C:\Users\USER\Documents\
estadistica ojos aja sav
Conjunto de datos activo Conjunto_de_datos1
Filtro <ninguno>
Peso <ninguno>
Segmentar archivo <ninguno>
Núm. de filas del archivo de
trabajo
67
Sintaxis GRAPH
/SCATTERPLOT(BIVAR)=import
WITH export
/MISSING=LISTWISE.
Recursos Tiempo de procesador 0:00:01.046
Tiempo transcurrido 0:00:01.073
Estadística-Inferencial (UPEC) 2012
Correlaciones
Notas
Resultados creados 12-jul-2012 04:04:46
Comentarios
Entrada Datos C:\Users\USER\Documents\
estadistica ojos aja.sav
Conjunto de datos
activo
Conjunto_de_datos1
Filtro <ninguno>
Peso <ninguno>
Segmentar archivo <ninguno>
Núm. de filas del
archivo de trabajo
67
Manipulación de los
valores perdidos
Definición de valores
perdidos
Los valores perdidos definidos
por el usuario serán tratados
como perdidos.
Casos utilizados Los estadísticos para cada par de
variables se basan en todos los
casos que tengan datos válidos
para dicho par.
Sintaxis CORRELATIONS
/VARIABLES=export import
/PRINT=TWOTAIL NOSIG
/STATISTICS DESCRIPTIVES
/MISSING=PAIRWISE.
Recursos Tiempo de procesador 0:00:00.047
Tiempo transcurrido 0:00:00.121
Estadística-Inferencial (UPEC) 2012
Estadísticos descriptivos
Media Desviación
típica
N
menos de 100 80.1217 107.27079 67
mas de 100 126.0319 215.95320 67
Correlaciones
menos de 100 mas de 100
menos de 100 Correlación de Pearson 1 -.120
Sig. (bilateral) .333
N 67 67
mas de 100 Correlación de Pearson -.120 1
Sig. (bilateral) .333
N 67 67
Regresión
Notas
Resultados creados 12-jul-2012 04:05:26
Comentarios
Entrada Datos C:\Users\USER\Documents\
estadistica ojos aja.sav
Conjunto de datos activo Conjunto_de_datos1
Filtro <ninguno>
Peso <ninguno>
Segmentar archivo <ninguno>
Núm. de filas del archivo de
trabajo
67
Tratamiento de los datos
perdidos
Definición de perdidos Los valores perdidos definidos por el
usuario se tratarán como perdidos.
Casos utilizados Los estadísticos se basan en los
casos sin valores perdidos para
ninguna variable de las utilizadas.
Sintaxis REGRESSION
/DESCRIPTIVES MEAN STDDEV
Estadística-Inferencial (UPEC) 2012
CORR SIG N
/MISSING LISTWISE
/STATISTICS COEFF OUTS R
ANOVA CHANGE ZPP
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT expota
/METHOD=ENTER importa.
Recursos Tiempo de procesador 0:00:00.062
Tiempo transcurrido 0:00:00.074
Memoria necesaria 1356 bytes
Memoria adicional
requerida para los
diagramas de residuos
0 bytes
[Conjunto_de_datos1] C:\Users\USER\Documents\estadistica ojos aja.sav
Estadísticos descriptivos
Media Desviación
típica
N
menos de 100 80.1217 107.27079 67
mas de 100 126.0319 215.95320 67
Correlaciones
menos de 100 mas de 100
Correlación de Pearson menos de 100 1.000 -.120
mas de 100 -.120 1.000
Sig. (unilateral) menos de 100 . .167
Estadística-Inferencial (UPEC) 2012
mas de 100 .167 .
N menos de 100 67 67
mas de 100 67 67
Variables introducidas/eliminadas
Model
o
Variables
introducidas
Variables
eliminadas
Método
1 mas de 100 a . Introducir
a. Todas las variables solicitadas introducidas.
b. Variable dependiente: menos de 100
Resumen del modelo
Model
o R R cuadrado R cuadrado
corregida
Error típ. de la
estimación
1 .120a .014 .000 107.31146
a. Variables productoras: (Constante), mas de 100
Resumen del modelo
Model
o
Estadísticos de cambio
Cambio en R
cuadrado
Cambio en F gl1 gl2 Sig. Cambio en
F
1 .014 .950 1 65 .333
ANOVAb
Modelo Suma de
cuadrados
gl Media
cuadrática
F Sig.
1 Regresión 10939.720 1 10939.720 .950 .333a
Residual 748523.701 65 11515.749
Total 759463.421 66
a. Variables productoras: (Constante), mas de 100
b. Variable dependiente: menos de 100
Estadística-Inferencial (UPEC) 2012
Coeficientes
Modelo Coeficientes no estandarizados Coeficientes
tipificados
B Error típ. Beta t Sig.
1 (Constante) 87.635 15.209 5.762 .000
mas de 100 -.060 .061 -.120 -.975 .333
a. Variable dependiente: menos de 100
Coeficientes
Modelo Correlaciones
Orden cero Parcial Semiparcial
1 mas de 100 -.120 -.120 -.120
a. Variable dependiente: menos de 100
Estimación curvilínea
Notas
Resultados creados 12-jul-2012 04:06:06
Comentarios
Entrada Datos C:\Users\USER\Documents\
estadistica ojos aja.sav
Conjunto de datos activo Conjunto_de_datos1
Filtro <ninguno>
Peso <ninguno>
Segmentar archivo <ninguno>
Núm. de filas del archivo de
trabajo
67
Tratamiento de los datos
perdidos
Definición de perdidos Los valores perdidos definidos por el
usuario se tratarán como perdidos.
Casos utilizados Los casos con un valor perdido en
cualquier variable no se utilizan en el
análisis.
Sintaxis CURVEFIT
/VARIABLES=export WITH import
/CONSTANT
/MODEL=LINEAR
/PLOT FIT.
Estadística-Inferencial (UPEC) 2012
Recursos Tiempo de procesador 0:00:00.936
Tiempo transcurrido 0:00:01.074
Usar Desde Primera observación
Hasta Última observación
Pronóstico Desde Primera observación de acuerdo con
el período de uso
Hasta Última observación
Ajustes para las series
temporales (TSET)
Cantidad de resultados PRINT = DEFAULT
Guarda de nuevas
variables
NEWVAR = NONE
Número máximo de
retardos en los gráficos de
auto correlaciones o auto
correlaciones parciales
MXAUTO = 16
Número máximo de
retardos por gráficos de
correlaciones cruzadas
MXCROSS = 7
Número máximo de
variables nuevas
generadas por cada
procedimiento
MXNEWVAR = 60
Número máximo de casos
nuevos generados por
cada procedimiento
MXPREDICT = 1000
Tratamiento de los valores
perdidos definidos por el
usuario
MISSING = EXCLUDE
Valor del porcentaje para
los intervalos de confianza
CIN = 95
Tolerancia para la entrada
de variables en las
ecuaciones de regresión
TOLER = ,0001
Máximo cambio iterativo en
los parámetros
CNVERGE = ,001
Método para el cálculo de
los errores típicos de las
auto correlaciones
ACFSE = IND
Estadística-Inferencial (UPEC) 2012
Longitud del período
estacional
Sin especificar
Variable cuyos valores
etiquetan las
observaciones en los
gráficos
Sin especificar
Las ecuaciones incluyen CONSTANTE
Descripción del modelo
Nombre del modelo MOD_1
Variable dependiente 1 menos de 100
Ecuación 1 Lineal
Variable independiente mas de 100
Constante Incluidos
Variable cuyos valores
etiquetan las
observaciones en los
gráficos
Sin especificar
Resumen del procesamiento de los
casos
N
Total de casos 67
Casos excluidos 0
Casos pronosticados 0
Casos creados nuevos 0
a. Los casos con un valor perdido en
cualquier variable se excluyen del
análisis.
Resumen del procesamiento de las variables
Variables
Dependiente Independiente
Estadística-Inferencial (UPEC) 2012
menos de 100 mas de 100
Número de valores
positivos
66 67
Número de ceros 1 0
Número de valores
negativos
0 0
Número de valores
perdidos
Perdidos definidos por el
usuario
0 0
Perdidos del sistema 0 0
Resumen del modelo y estimaciones de los parámetros
Variable dependiente :menos de 100
Ecuaci
ón
Resumen del modelo Estimaciones de los parámetros
R cuadrado F gl1 gl2 Sig. Constante b1
Lineal .014 .950 1 65 .333 87.635 -.060
La variable independiente es mas de 100 .
Estadística-Inferencial (UPEC) 2012
Pruebas no paramétricas
Notas
Resultados creados 12-jul-2012 04:10:29
Comentarios
Entrada Datos C:\Users\USER\Documents\
estadistica ojos aja. sav
Conjunto de datos activo Conjunto_de_datos1
Filtro <ninguno>
Peso <ninguno>
Segmentar archivo <ninguno>
Núm. de filas del archivo de
trabajo
67
Manipulación de los valores
perdidos
Definición de los perdidos Los valores perdidos definidos por el
usuario será tratados como perdidos.
Estadística-Inferencial (UPEC) 2012
Casos utilizados Los estadísticos para cada prueba se
basan en todos los casos con datos
válidos para las variables usadas en
dicha prueba.
Sintaxis NPAR TESTS
/CHISQUARE=export import
/EXPECTED=EQUAL
/STATISTICS DESCRIPTIVES
QUARTILES
/MISSING ANALYSIS.
Recursos Tiempo de procesador 0:00:00.078
Tiempo transcurrido 0:00:00.097
Número de casos
permitidos
157286
a. Basado en la disponibilidad de memoria en el espacio de trabajo.
Estadísticos descriptivos
N Media Desviación
típica
Mínimo Máximo
menos de 100 67 80.1217 107.27079 .00 652.00
mas de 100 67 126.0319 215.95320 1.17 900.00
Estadísticos descriptivos
Percentiles
25 50 (Mediana) 75
menos de 100 20.0000 48.0000 98.0000
mas de 100 3.6800 50.0000 100.0000
Estadística-Inferencial (UPEC) 2012
Prueba de chi-cuadrado
Frecuencias
menos de 100
N observado N esperado Residual
.00 1 1.3 -.3
1.60 1 1.3 -.3
2.19 1 1.3 -.3
2.66 1 1.3 -.3
2.70 1 1.3 -.3
10.00 2 1.3 .7
12.00 3 1.3 1.7
13.00 1 1.3 -.3
14.00 1 1.3 -.3
15.00 1 1.3 -.3
18.00 1 1.3 -.3
20.00 3 1.3 1.7
22.00 2 1.3 .7
23.00 1 1.3 -.3
24.00 2 1.3 .7
25.00 4 1.3 2.7
27.00 2 1.3 .7
30.00 1 1.3 -.3
31.00 1 1.3 -.3
33.00 1 1.3 -.3
37.00 1 1.3 -.3
43.00 1 1.3 -.3
48.00 2 1.3 .7
51.00 1 1.3 -.3
55.00 2 1.3 .7
56.00 1 1.3 -.3
63.00 1 1.3 -.3
65.00 1 1.3 -.3
68.00 1 1.3 -.3
69.00 1 1.3 -.3
70.00 1 1.3 -.3
71.00 2 1.3 .7
84.00 1 1.3 -.3
Estadística-Inferencial (UPEC) 2012
94.00 1 1.3 -.3
97.00 2 1.3 .7
98.00 1 1.3 -.3
100.00 1 1.3 -.3
107.00 1 1.3 -.3
109.00 1 1.3 -.3
116.00 1 1.3 -.3
117.00 1 1.3 -.3
132.00 1 1.3 -.3
146.00 1 1.3 -.3
158.00 1 1.3 -.3
163.00 1 1.3 -.3
219.00 1 1.3 -.3
225.00 1 1.3 -.3
235.00 1 1.3 -.3
266.00 1 1.3 -.3
296.00 1 1.3 -.3
439.00 1 1.3 -.3
652.00 1 1.3 -.3
Total 67
mas de 100
N observado N esperado Residual
1.17 1 1.7 -.7
1.28 1 1.7 -.7
1.33 1 1.7 -.7
1.35 2 1.7 .3
1.40 1 1.7 -.7
1.50 1 1.7 -.7
1.56 1 1.7 -.7
1.59 1 1.7 -.7
1.59 1 1.7 -.7
1.94 1 1.7 -.7
2.70 2 1.7 .3
3.26 1 1.7 -.7
Estadística-Inferencial (UPEC) 2012
3.65 2 1.7 .3
3.68 1 1.7 -.7
4.00 1 1.7 -.7
4.22 1 1.7 -.7
4.68 1 1.7 -.7
5.52 1 1.7 -.7
5.67 1 1.7 -.7
8.32 1 1.7 -.7
9.52 2 1.7 .3
40.00 4 1.7 2.3
50.00 6 1.7 4.3
60.00 4 1.7 2.3
70.00 1 1.7 -.7
80.00 6 1.7 4.3
90.00 1 1.7 -.7
100.00 5 1.7 3.3
120.00 1 1.7 -.7
150.00 3 1.7 1.3
180.00 1 1.7 -.7
185.00 1 1.7 -.7
240.00 1 1.7 -.7
308.00 1 1.7 -.7
525.00 1 1.7 -.7
650.00 1 1.7 -.7
700.00 2 1.7 .3
770.00 1 1.7 -.7
789.00 1 1.7 -.7
900.00 1 1.7 -.7
Total 67
Estadísticos de contraste
menos de 100 mas de 100
Chi-cuadrado 16.045a 44.642b
gl 51 39
Sig. asintót. 1.000 .247
a. 52 casillas (100,0%) tienen frecuencias
esperadas menores que 5. La frecuencia de
Estadística-Inferencial (UPEC) 2012
casilla esperada mínima es 1,3.
b. 40 casillas (100,0%) tienen frecuencias
esperadas menores que 5. La frecuencia de
casilla esperada mínima es 1,7.
Prueba T
Notas
Resultados creados 12-jul-2012 04:26:46
Comentarios
Entrada Datos C:\Users\USER\Documents\
estadistica ojos aja. sav
Conjunto de datos activo Conjunto_de_datos1
Filtro <ninguno>
Peso <ninguno>
Segmentar archivo <ninguno>
Núm. de filas del archivo de
trabajo
25
Tratamiento de los valores
perdidos
Definición de los perdidos Los valores perdidos definidos por el
usuario serán tratados como perdidos.
Casos utilizados Los estadísticos de cada análisis de
una lista se basan en los casos que
no tienen datos perdidos ni quedan
fuera de rango en cualquiera de las
variables de la lista.
Sintaxis T-TEST GROUPS=importa(2)
/MISSING=LISTWISE
/VARIABLES=expota
/CRITERIA=CI(.95).
Recursos Tiempo de procesador 0:00:00.031
Tiempo transcurrido 0:00:00.020
Estadísticos de grupo
mas de N Media Desviación típ. Error típ. de la
Estadística-Inferencial (UPEC) 2012
100 media
menos de 100 >= 2,00 20 64.3981 84.64776 18.92782
< 2,00 5 165.6000 272.89247 122.04122
Prueba de muestras independientes
Prueba de Levene para la
igualdad de varianzas
Prueba T para la igualdad de
medias
F Sig. t gl
menos de 100 Se han asumido
varianzas iguales
9.646 .005 -1.473 23
No se han asumido
varianzas iguales
-.819 4.194
Prueba de muestras independientes
Prueba T para la igualdad de medias
Sig. (bilateral) Diferencia de
medias
Error típ. de la
diferencia
menos de 100 Se han asumido varianzas
iguales
.154 -101.20190 68.68492
No se han asumido
varianzas iguales
.457 -101.20190 123.50029
Prueba de muestras independientes
Prueba T para la igualdad de
medias
95% Intervalo de confianza para
la diferencia
Inferior Superior
menos de 100 Se han asumido varianzas
iguales
-243.28747 40.88367
No se han asumido
varianzas iguales
-437.92105 235.51725