estadistica exposicion

ESTADISTICA INFERENCIAL

Estadística-Inferencial (UPEC) 2012

UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI

ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN INTERNACIONAL

Tulcán – Ecuador

MCS : JORGE POZO

ESTUDIANTES DE SEXTO SEMESTRE DE LA ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACION IINTERNACIONAL

JULIO PUCUNA

MARZO 2012- AGOSTO-2012


AGRADECIMIENTO

A todas las personas que de uno u otro modo colaboraron en la realización de este

trabajo y especialmente al MSC. Jorge Pozo Docente de la Universidad en la materia

de Estadística Inferencial


TEMA: Análisis de la Estadística Inferencial aplicando sistemas Informáticos

GENERAL

Manejar un programa informático aplicado a la estadística Inferencial

ESPECIFICOS

Determinar como infiere la T-student, correlación , regresión, regresión

en problemas del comercio exterior

Visualizar como ayuda este proceso a la toma de decisiones

Realizar cuadros comparativos y aplica cando las Tics en el programa

spss stadistc en problemas del contexto del comercio exterior

JUSTIFICACIÓN

En la vida hay determinantes y preguntas que todo ser humano necesita saber

para la toma de decisiones lo cual le va a permite desarrollarse de una mejor

manera en una sociedad, a través de la historia grandes matemáticos, físicos,

crearon una ciencia la cual ayuda a determinar la muestra de la población, la

cantidad etc.

Lo cual ha permito que se determine la población de un país, a través de

formulas matemáticas y también con la utilización de sistemas informáticos los

cuales realizan de manera ágil y rápida las diferentes operaciones planteadas

es por eso que este trabajo es de gran relevancia ya que se podrá determinar a

través de un problema del contexto del comercio exterior como se aplica al

programa informático spss stadistc y como esta compuesto y cuales son sus

usos en la es dística inferencial.

INTRODUCCION

La estadística y los sistemas informáticos son utilizados en la actualidad como


herramientas principales para la toma de decisiones en temas de gran

relevancia. Desde la economía hasta la arquitectura, pasando por la física y la

astronomía, el uso de sistemas estadísticos ha servido para definir

conocimientos exactos y claros, además de conclusiones exactas y

significativas.

La tecnología ha avanzado en los últimos años y en el mundo actual es

importante contar con soluciones informáticas que den la posibilidad de tomar

decisiones relevantes sobre la información obtenida mediante distintos

procesos, sean estos encuestas, cuestionarios, pruebas de conocimiento, etc.

ESTADISTICA DESCRIPTIVA

El proposito de la Estadistica Aplicada es el de obtener conluciones de una

poblacion en estudio , examinando solamente una parte de ella denominada

muestra

LA ESTADISTICA INFERENCIAL

La Estadística es una rama de las matemáticas encargada de reunir, organizar

y analizar datos generalmente numéricos, ayuda a resolver problemas y

además permite luego de realizados los cálculos tomar decisiones que puedan

beneficiar al contexto que las estudia.

La estadística y los procedimientos que con ella pueden realizarse han

permitido de manera efectiva describir con exactitud datos de casi todas las

ramas del conocimiento entre ellas: economía, psicología, política, física,

biología, química, medicina e informática y ha servido como herramientas útil

para encontrarle relación a muchos de los datos estudiados por estas ciencias.

En la actualidad para un estadístico el trabajo va mas allá de reunir datos y

calcularlos, debe de encargarse además de la difícil tarea de interpretar toda la

información obtenida en los procesos estadísticos para que esta tenga un valor

realmente importante.


La Estadística se encuentra dividida en dos grandes ramas, cada una con un

propósito específico:

• La Estadística Inferencial

• La Estadística Descriptiva

Nuestro estudio está basado en la Estadística Inferencial por lo que

ampliaremos el concepto de la misma en las siguientes secciones de este

capítulo.

Marco Teórico

La Estadística Inferencial es una parte de la estadística que sólo trabaja con

algunos de los datos de una población existente dentro de un grupo de

elementos observados; es decir solo toma una muestra n de los N elementos

existentes. Una vez que se obtiene este reducido grupo de datos la estadística

inferencial trata de encontrar aspectos o propiedades relevantes para toda la

población y basados en ellos tomar decisiones. Para obtener dichos resultados

es necesario fundamentarse en como se selecciona la muestra, como realizar la

inferencia de los datos y además la confianza que se puede tener en la

información obtenida.

Cabe recalcar que para obtener datos fiables el nivel de conocimiento y

comprensión de estadística, matemáticas y probabilidades debe de ser alto

pues se debe recordar que los procedimientos están basados en pequeñas

muestras las cuales pueden sufrir variación.

Con toda la información proporcionada es notorio que la estadística inferencial

puede proveer de modelos importantes para estudiar un sinnúmero de datos

multivalentes.

Métodos tales como Componentes Principales, Escalado Multidimensional,


Análisis de Correspondencia, Análisis de Conglomerados, Análisis Factorial,

Análisis Discriminante, entre otros brindan a los estudiosos grandes

posibilidades de entender y predecir el comportamiento que los datos pueden

tomar dada una condición.

MEDIDAS DE TENDENCIA CENTRAL

Medidas de tendencia central las que hallan en el centro de distribución de

frecuencias

a) Media aritmética -> x

b) Mediana -> Md

c) Moda -> Mo

d) Media geométrica -> Mg

e) Media Armónica -> Ma

MEDIA ARITMÉTICA

Cuando los datos no están agrupados

x = ∑ Xi

n

MEDIANA

Es el punto que divide la distribución de datos en 2 partes iguales.

Es una medida de tendencia central sonde permite dividir puntos medios que

sean iguales en la parte superior y en la parte inferior de un conjunto de datos.


RANGO

I= valor máximo – valor mínimo

DESVIACION MEDIA O VARIACIÓN MEDIA

DM=1n∑i=1

n

|xi−x|

VARIANZA.- se la define como el cuadrado de la desviación estándar

MUESTREO

Existe estudios en el que queremos conocer ciertas características de un grupo

de personas de personas o cosas, (o los que llamamos población) de manera

que no se los puede estudiar a todos porque son numerosos o porque su

naturaleza se vuelve inaccesible, existe otro recurso que es estudiar una parte

que se llama MUESTRA, generalmente cuando el n >100 se llama población,

pero si n <100 a toda la población se le puede llamar muestra.

CORRELACIÓN LINEAL

El análisis de correlación se dirige sobre todo a medir la fuerza de una relación

entre variables. El coeficiente de correlación lineal, r, es la medida de la fuerza

de la relación lineal entre dos variables. La fortaleza de la relación se determina

mediante la magnitud del efecto que cualquier cambio en una variable ejerce

sobre la otra. (JOHNSON, 1990)

MUESTREO

PROBABILISTICO

MUESTREO NO

PROBABILISTICO


Aleatorio.- Asigna un mínimo a cada

uno, selecciona la muestra a través de

mínimos aleatorios.

Sistemático.- Lista completa del

universo, selecciona cada individuo

cada 10 individuos.

Estrategico.- Los tamaños de la muestra

de cada estracto, depende de las

necesidades.

Casual.- Entrevista a los individuos en forma

casual. Ejemplo.- Los que pasan por la calle

Intencional.- Selecciona al individuo según

el criterio de un experto. Ejemplo.- Dueños

de los restaurantes

Cuotas.- Cada entrevistado debe estar

dentro de cada categoria. Ejemplo Hombres

y mujeres


COEFICIENTE DE CORRELACIÓN.- Expresa de una manera cuantitativa la

magnitud y dirección de una relación.

Coeficiente de correlación se lo designa en la letra r puede variar entre +1 a -1

el signo nos dice si la relación es positiva o negativa.

Como +1 es el mayor número posible este representa una relación perfecta

de una relación positiva.

Si el coeficiente es -1 que la relación se perfecta que la relación es negativa.

Cuando la correlación es cero (0) no existe una relación entre x ۸ y significa

que x ۸ y no crece ni decrece la recta es horizontal.

REGRESIÓN LINEAL

La regresión y la correlación están íntimamente ligados, ambos implican la

relación entre 2 variables y utilizan el mismo conjunto de datos básicos.

La regresión se centra en el uso de la relación para determinar una predicción,

cuando la relación es perfecta, esto es cuando todos los puntos están sobre la

recta y se utilizan para señalar la predicción, la situación se hace más compleja

cuando la relación es imperfecta.

Esta recta es la línea de regresión por los mínimos cuadrados. La distancia

vertical en cada punto y la recta representan el error de la predicción, pareciera

que el error total seria la suma algebraica y− y '.

El error total de predicción presentado por ∑ ( y− y' )2, es menor para la línea de

regresión por mínimos cuadrados.

FORMULA DE LA REGRESIÓN

by=N ¿¿

PRUEBA DE HIPOTESIS


Una hipótesis estadística es una proposición o supuesto sobre los parámetros

de una o más poblaciones.

Suponga que se tiene interés en la rapidez de combustión de un agente

propulsor sólido utilizado en los sistemas de salida de emergencia para la

tripulación de aeronaves. El interés se centra sobre la rapidez de combustión

promedio. De manera específica, el interés recae en decir si la rapidez de

combustión promedio es o no 50 cm/s.

Esto puede expresarse de manera formal como:

Înter%Ho; = 50 cm/s

Înter%H1; 50 cm/s

La proposición Ho; = 50 cm/s, se conoce como hipótesis nula, mientras que la

proposición H1; 50 cm/s, recibe el nombre de hipótesis alternativa. Puesto

que la hipótesis alternativa especifica valores de que pueden ser mayores o

menores que 50 cm/s, también se conoce como hipótesis alternativa bilateral.

En algunas situaciones, lo que se desea es formular una hipótesis alternativa

unilateral, como en

Înter%Ho; = 50 cm/s Ho; = 50 cm/s

Înter%ó

Înter%H1; < 50 cm/s H1; > 50 cm/s

Es importante recordar que las hipótesis siempre son proposiciones sobre la

población o distribución bajo estudio, no proposiciones sobre la muestra. Por lo

general, el valor del parámetro de la población especificado en la hipótesis nula

se determina en una de tres maneras diferentes:


1. Puede ser resultado de la experiencia pasada o del conocimiento del

proceso, entonces el objetivo de la prueba de hipótesis usualmente es

determinar si ha cambiado el valor del parámetro.

2. Puede obtenerse a partir de alguna teoría o modelo que se relaciona con el

proceso bajo estudio. En este caso, el objetivo de la prueba de hipótesis es

verificar la teoría o modelo.

3. Cuando el valor del parámetro proviene de consideraciones externas, tales

como las especificaciones de diseño o ingeniería, o de obligaciones

contractuales. En esta situación, el objetivo usual de la prueba de hipótesis es

probar el cumplimiento de las especificaciones.

T - STUDENT

En probabilidad y estadística, la distribución-t o distribución t de Student es

una distribución de probabilidad que surge del problema de estimar la media

de una población normalmente distribuida cuando el tamaño de la muestra es

pequeño.

A la teoría de pequeñas muestras también se le llama teoría exacta del

muestreo, ya que también la podemos utilizar con muestras aleatorias de


tamaño grande.

Veremos un nuevo concepto necesario para poder entender la distribución t

Student. Este concepto es "grados de libertad".

Para definir grados de libertad se hará referencia a la varianza maestral:

n

(xi x)2

s2 i 1

n 1

Una variable aleatoria se distribuye según el modelo de probabilidad t o T de

Student con k grados de libertad, donde k es un entero positivo.

CHI CUADRADO

La prueba o test chi-cuadrado es considerada como una prueba no paramétrica

que mide la discrepancia entre una distribución observada y una observación

teórica (bondad de ajuste), indicando en que medida las diferencias existentes

entre ambas, de haberlas, se deben al azar en el contraste de hipótesis.

También se utiliza el test chi-cuadrado para probar la homogeneidad entre dos

poblaciones o independencia de dos variables entre si, mediante la

presentación de datos dados en tablas de contingencia.

Es decir:

a) Chi-cuadrado de bondad de ajuste o significancia: para comprobar si los

datos se ajustan a una distribución concreta.

b) Chi-cuadrado de homogeneidad: para ver si dos muestras

provienen de una misma población o una población con una misma


familia de distribución (los datos vienen dado en una tabla de

contingencia).

c) Chi cuadrado de independencia: para comprobar si dos

muestras son independientes (los datos vienen en una tabla

de contingencia).

LA VARIANZA

La varianza, , se define como la media de las diferencias cuadráticas de n

puntuaciones con respecto a su media aritmética es decir con la siguiente

formula

APLICANDO EL PROGRAMA SPSS STADISTC

Definición de como utilizar el spss y como esta compuesto

SPSS STADIST

SPSS es un programa estadístico informático muy usado en las ciencias

sociales y las empresas de investigación de mercado. Originalmente SPSS fue

creado como el acrónimo de Statistical Package for the Social Sciences aunque

también se ha referido como "Statistical Product and Service Solutions" (Pardo,

A., & Ruiz, M.A., 2002, p. 3). Sin embargo, en la actualidad la parte SPSS del

nombre completo del software (IBM SPSS) no es acrónimo de nada. 1

http://es.wikipedia.org/wiki/SPSS#cite_note-0

http://es.wikipedia.org/wiki/Ciencias_sociales

http://es.wikipedia.org/wiki/Ciencias_sociales

http://es.wikipedia.org/wiki/Paquete_estad%C3%ADstico


Como programa estadístico es muy popular su uso debido a la capacidad de

trabajar con bases de datos de gran tamaño. En la versión 12 es de 2 millones

de registros y 250.000 variables. Además, de permitir la recodificación de las

variables y registros según las necesidades del usuario. El programa consiste

en un módulo base y módulos anexos que se han ido actualizando

constantemente con nuevos procedimientos estadísticos. Cada uno de estos

módulos se compra por separado.

Actualmente, compite no sólo con softwares licenciados como lo son SAS,

MATLAB, Statistica, Stata, sino también con software de código abierto y libre,

de los cuales el más destacado es el Lenguaje R. Recientemente ha sido

desarrollado un paquete libre llamado PSPP, con una interfaz llamada PSPPire

que ha sido compilada para diversos sistemas operativos como Linux, además

de versiones para Windows y OS X. Este último paquete pretende ser un clon

de código abierto que emule todas las posibilidades del SPSS.

El paquete estadístico SPSS, responde al funcionamiento de todo programa

que lleva a cabo análisis estadísticos: pasados los datos a analizar a un fichero

con las características del programa, éste es analizado con una serie de

órdenes, dando lugar a unos resultados de tipo estadístico que el investigador

debe interpretar. Este camino a seguir es el que guiará la presentación de

SPSS que efectúa este mini-manual, debido a que es el camino más natural de

aprendizaje del mismo.

http://es.wikipedia.org/wiki/OS_X

http://es.wikipedia.org/wiki/Windows

http://es.wikipedia.org/wiki/Linux

http://es.wikipedia.org/w/index.php?title=PSPPire&action=edit&redlink=1

http://es.wikipedia.org/wiki/PSPP

http://es.wikipedia.org/wiki/Lenguaje_R

http://es.wikipedia.org/wiki/Stata

http://es.wikipedia.org/wiki/Statistica

http://es.wikipedia.org/wiki/MATLAB


Estos son los pasos que se deben seguir para poder descargar el programa

spss, y ya que este es un programa que necesita de una licencia, tambien se

encontraran los pasos para poder crakear el rpograma y utilizarlo sin ningun

problema con tiempo ilimitado.

Primero debes ingresar al google y poner descargar spss con crack en español,

y podras seleccionar cualquiera de las opciones y versiones que en ella

aparesca desde la 17 a la 19 son las mas recomendables.

Acontinuación se habre la pagina

http://betterfreedownload.blogspot.com/2011/09/free-download-ibm-spss-

statistics-19.html

Y se encontrará con una pantalla donde nos indicara el programa y el crack, y

en esta misma aula nos indica los pasos que debes seguir para la descar del

http://betterfreedownload.blogspot.com/2011/09/free-download-ibm-spss-statistics-19.html

http://betterfreedownload.blogspot.com/2011/09/free-download-ibm-spss-statistics-19.html


programa y del crack, que simplemente es una carpeta de codigos que permite

el libre uso del programa.

O en uno de los casos les dejare una opción mas direca de cómo descargar y

porsupueso unos link para que los pueda descargar


Luego seleccionamos una de las opciones de descarga que se encuentran en la

pantalla, por ejemplo

Y ponemos la dirección URL en cualquiera de los buscadores.


Y al darle enter se abrirá la página donde podemos descargar el spss, y se

abrirá la página del megaupload si no empieza el conteo automático lo ponen

en descarga normal, esperan y descargan.


Luego de descargarlo van hasta la carpeta spss e ingresan,

Ingresan y buscan un icono que dice setup, es el link de instalación, solo espera

y sigue las instrucciones hasta que se instale en el pc, este programa se puede

instalar en cualquier tipo de pc, portátil o de escritorio, pero se debe tener en

cuenta el sistema operativo que se utiliza.


Y a todas las ventanas que se abren posteriormente se les empieza a dar

siguiente hasta que el programa se empieza a instalar automáticamente.


Cuando pide el tipo de licencia, simplemente se le pone en la primera opción y

continúan.


Aceptan el contrato de licencia y continúan


Una vez instalado el programa simplemente le damos cerrar y continuamos a

craquear el programa para que lo pueda utilizar, ya que si no se crakea no se

podrá utilizar, y en el caso de que lo haga solo lo hará por un periodo de 30

días.

Luego ingresamos a la carpeta del spss que descargamos y encontramos el

crack ingresamos y copiamos todos los iconos que se encuentran ahí.


Buscamos la carpeta del spss que has instalado, nos vamos hasta la carpeta de

archivos donde se encuentran los programas instalados que están en el disco

local, y aparecerá una carpeta con nombre IBM, ingresamos ahí y encontrarás

la carpeta del statics, luego ingresamos y encontraremos la del spss que en

este es la versión 19.


Ingresamos y pegamos todo lo que obtuvimos del crack, y como estos

programas ya están en la carpeta, pues solo se manda a remplazar y listo.

Y luego de eso ya lo podrás abrir el spss 19.

Aparecerá de esta manera


Puedes seleccionar introducir datos y listo, lo puede empezar a utilizar.


La ventana principal de SPSS: el Editor de datos de SPSS.

El paquete SPSS, desde la versión 7, es un paquete adaptado al entorno

WINDOWS con lo cual la forma de ejecutarlo es a través de ventanas en las

que se despliegan menús, de los que se pueden elegir distintas opciones y así

sucesivamente; por tanto es a través de un entorno de tipo gráfico desde donde

se solventan los problemas, y no a través de comandos (aunque también se

puede hacer así) como se hacía antes en los paquetes estadísticos más

usuales.

Por lo que acabamos de decir, la forma de iniciar la ejecución del

programa SPSS es pinchando dos veces con el ratón (“pinchar” lo utilizaremos

como sinónimo de “hacer clic” con el botón principal del ratón) en el icono de

SPSS que es como el de la Figura 1.1, y que se suele

Figura 1.1 Icono del programa SPSS.

Encontrar en el escritorio en forma de enlace o en el menú de inicio dentro del

apartado de programas. Una de las primeras tareas que tendrá que hacer el

usuario de SPSS será localizar la posición del icono y adaptarlo a su gusto para

que la entrada al programa sea fácil

Menú FunciónArchivo Todas las funciones que se pueden hacer con archivos: Abrir, cerrar,

Ediciónguardar, importar, exportar, imprimir, etc.Realiza todas las funciones típicas de la edición como son: cortar,

Vercopiar, eliminar, buscar, remplazar, etc...Permite controlar la forma en la que se ve la pantalla principal,


controlando las barras que aparecen en ella así como la forma en la

DatosQue se presentan los datos.Contiene el conjunto de acciones que se pueden llevar a cabo con losdatos: definir propiedades de las variables, seleccionar casos,

TransformarOrdenar casos y muchas más.Permite realizar cualquier función conducente a crear nuevasvariables a partir de otras existentes o no: transformar, recodificar,

AnalizarAsignar rangos, etc...Acceso al conjunto de programas de SPSS, que van desde lageneración de una tabla de frecuencias a análisis multivalentes

GráficosComplejos.Acceso al conjunto de gráficos estadísticos que van desde un simple

UtilidadesHistograma al dibujo de una curva ROC.Acceso a la descripción de las variables del fichero activo, creación

VentanaDe grupos de variables, así como edición de los menús.Acceso rápido a las ventanas de datos, de resultados, de sintaxis.

? Ayuda en línea sobre todo el paquete SPSS.

Tabla 1.1. Menús de la ventana principal de SPSS

Como se puede observar en la tabla, bajo una de las letras del rótulo del menú,

aparece un subrayado, indicando tal cosa que combinando la tecla Alt con la

letra subrayada se puede desplegar el menú correspondiente, pudiendo

desplazarse uno por él sin más que usar las teclas de flecha presentes en el

teclado.

Éste también se puede abrir haciendo doble clic sobre su nombre en la

segunda caja.

También en el menú Archivo tenemos dos opciones para guardar el fichero de

datos activo. La opción Guardar permite almacenar el fichero activo en un


disco. Si el fichero activo ha sido leído previamente se guardará con el mismo

nombre que tenía (el fichero original que existía en el disco se perderá). Por el

contrario si el fichero ha sido creado sin que exista ninguna imagen de él en el

disco, se nos pedirá que demos un nombre al nuevo fichero en el que se va a

guardar la información. Debe quedar claro que esta opción siempre guarda un

fichero de datos de SPSS, es decir, aquél que tiene una extensión .sav. Por el

contrario la opción Guardar como... permite guardar el fichero activo con otro

nombre y/o con formato de otras aplicaciones informáticas, como bases de

datos u hojas de cálculo.

Cuando se selecciona la opción se abre una ventana como la presente en la

Figura , en la que se seleccionará la carpeta donde se va a guardar el archivo,

se escribirá el nombre del archivo donde se desea guardar la información, se

seleccionará el tipo de archivo deseado y se pulsará el botón

Guardar.

Normas de funcionamiento de las ventanas de SPSS.


Para ejecutar cualquier acción con SPSS se empieza siempre escogiendo tal

acción de un menú (o de un submenú, en su caso) que nos lleva a la ventana

correspondiente a la acción o procedimiento elegido, en la que hay que elegir

los componentes fundamentales de la acción y en la que

Introducción al manejo del SPSS

hay la posibilidad de elegir otros componentes accesorios, como se puede ver

en la Figura Esta ventana tiene una estructura como la que sigue: en la parte

izquierda suele haber una caja en la que aparecen todas las variables

presentes en el fichero activo y que son susceptibles de ser manejadas con el

procedimiento elegido; a la derecha de esa caja suele haber otra u otras cajas

en las que pondremos las variables seleccionadas para la acción que

deseamos llevar a cabo; la forma de establecer tal selección es pinchar, en la

caja de la izquierda, la variable de interés (inmediatamente aparecerá

remarcada) y presionar en un botón con una flecha que señala hacia la derecha

(►), lo que llevará la variable a la caja de las variables seleccionadas para el

análisis. También suele haber unos botones de particularización, o en la parte

baja de la ventana o en la parte derecha de la misma (en el caso de la Figura

están en la parte baja) que particularizan el conjunto de acciones que dentro del

procedimiento elegido se pueden llevar a cabo; en el caso de la Figura las

acciones a llevar a cabo son: elegir los estadísticos que aparecerán junto con

las tablas de frecuencias, elegir los gráficos que acompañarán a las tablas de

frecuencias y por último elegir el formato en que aparecerán las tablas de

frecuencias; todos estos botones dan lugar a ventanas en las que se harán las


elecciones que hemos señalado. También, en las ventanas de SPSS aparecen

cinco botones de acciones inmediatas, que suelen estar a la derecha de la

ventana en vertical. Tales botones aparecen en la tabla 1.2 y serán explicados

en ella para no tener que hacerlo más.

Por último, si se observa la Figura se puede ver en ella que hay un

pequeño cuadradito en el que figura una marca; tal marca puede estar

presente o no, significando su presencia que la acción que aparece está

seleccionada y se llevará a cabo, mientras que su ausencia indicará que no

se llevará a cabo tal acción. Esta forma de seleccionar las acciones secundarias

a llevar a cabo es muy frecuente en SPSS.

Botón FunciónAceptar Llevar a cabo el análisis seleccionado.Pegar Escribir en el editor de sintaxis los comandos correspondientes a las

RestablecerAcciones elegidas en la ventana (no lo veremos en este manual).Borrar todas las elecciones hechas en la ventana para poder elegir

CancelarOtras nuevas.Salir de la ventana, dejándola como está, sin llevar a cabo ninguna

Ayudaacción.Desplegar la ayuda contextual del conjunto de acciones que aparecenen la ventana.

Tabla 1.2 Botones presentes en las ventanas de los distintos procedimientos de SPSS

Procedimiento Seleccionar casos.

Seleccionar casos proporciona varios métodos para seleccionar un

subgrupo de casos


Ventana de selección de casos de un fichero de SPSS

Basándose en criterios que incluyen variables y expresiones complejas.

También se puede seleccionar una muestra aleatoria de casos. Los criterios

usados para definir un subgrupo pueden incluir: Valores y rangos de las

variables, Rangos de fechas y horas, Números de caso (filas), Expresiones

aritméticas, Expresiones lógicas y Funciones.

La forma de invocar la selección de casos es Datos Seleccionar casos.

Cuando se hace tal cosa aparece una ventana como la de la Figura La ventana

muestra, a la izquierda, una caja con las diferentes variables del fichero activo

para que sean utilizadas en las distintas formas en que uno quiere seleccionar

los casos. A la derecha aparecen las cinco formas de seleccionar casos; aquí

describiremos las dos primeras.

Todos los casos desactiva el filtrado y utiliza todos los casos (es realmente

una no-selección de casos); ella está activa cuando se entra por primera vez a

la ventana de selección de casos.


La zona de resultados: el índice y los resultados propiamente dichos.

La zona de resultados es la que ocupa la mayor parte de la ventana, siendo de

ella la zona de índice la más estrecha y que está a la izquierda y la de

resultados la de la derecha más ancha; la zona de índices se puede agrandar y

achicar a voluntad (achicando y agrandando la zona de resultados) sin más que

pinchar sobre la barra que separa ambas ventanas y arrastrar el ratón. Como

se ve en la figura, tanto la ventana de índices como la de resultados tienen

barras horizontales que se desplazan para abarcar el conjunto de la

información allí expuesta. si es que se aplica.


Menús e Iconos del Visor de resultados


Estadística Descriptiva con SPSS.A partir de ahora describiremos los procedimientos estadísticos de SPSS. Desde luego que no

describiremos todos los que están disponibles en el programa, pues estas notas pretenden ser una

iniciación al SPSS, pero sí daremos lo suficiente para que el usuario se enfrente a un volumen

importante de problemas de Estadística


Gráficos con SPSS.

Una parte importante a la hora de exponer los resultados estadísticos es

presentar algunos de ellos en forma de gráficos. A ello dedica SPSS todo un

menú de la ventana principal, que es el menú Gráficos, con las opciones que

aparecen en la Figura De ese menú no se explicarán todas las opciones, sino

sólo las más útiles para los objetivos del manual.

Las dos primeras opciones son: Galería e Interactivos. La primera ofrece de

una manera gráfica y guiada (mediante un tutor) cada uno de los gráficos que

se pueden invocar por separado y que se describen a continuación; esta opción

puede ser seguida con facilidad por parte del lector pues el tutor que emplea

SPSS es bastante amigable y claro. Interactivos permite construir los gráficos

que veremos a continuación también de una manera interactiva y con un tutor;

es el procedimiento gráfico más moderno de SPSS y mejora sensiblemente el

manejo de los gráficos del mismo, así como su calidad de presentación (3D,

colores, sombreados, etc....); una vez más debido a la facilidad de uso no nos

detendremos más en él, por lo que el usuario puede intentarlo por su cuenta


De los que aparecen en la Figura describiremos con detalle los gráficos de:

Barras, Líneas, Sectores e Histograma. En secciones posteriores se explicarán

Barras de Error y Dispersión.

Todos los gráficos tienen una forma de invocarlos y una serie de opciones que

matizan su uso, por ello encontraremos que la exposición de los mismos es

similar a la de otros procedimientos estadísticos. En el primer gráfico que

presentemos haremos mención al editor de gráficos de SPSS que permite la

manipulación de los mismos de manera muy avanzada.

Gráficos de Barras.

SPSS denomina Gráfico de barras a un gráfico de variables categóricas en el

que sobre cada modalidad se levanta una barra de altura proporcional a la


frecuencia. La llamada del Gráfico de Barras da lugar a una primera ventana en

la que ha de seleccionarse el tipo de gráfico de barras que se desea

representar. La ventana es como la de la Figura Lo primero es elegir entre los

gráficos: Simple, Agrupado y Apilado. En el Simple, sólo se representa en el

Gráfico una única variable (que es lo más común); en el Agrupado se hace un

gráfico simultáneo (compuesto) en el que se presenta la distribución de una

variable dentro de cada una de las categorías de otra variable. En el gráfico

Apilado, se representan las categorías de una variable apiladas en cada una de

las barras en las que se representa la otra variable.

Elegido el tipo de Gráfico de Barras, se debe seleccionar ahora si el Gráfico

esta hecho con casos, a base de resúmenes de variables o a partir de valores

individuales de los casos; nosotros nos ceñiremos siempre a la primera opción

dejando las otras para situaciones más complejas. Una vez elegida la primera

opción pasamos a lo que es la definición del Gráfico de Barras pulsando el

botón Definir. Hecho esto aparece la ventana de la Figura.

Gráficos de Líneas.

Los gráficos de líneas no son más que polígonos de frecuencias que se pueden


representar para una, dos o más variables.

En la primera ventana del Gráfico de líneas se debe elegir entre los gráficos

Simple, Múltiple y de Líneas Verticales. El gráfico Simple permite un polígono

de frecuencias para una variable. En el Múltiple se pueden hacer varios

polígonos de frecuencias simultáneamente (gráfico compuesto). En el caso de

gráficos de Líneas verticales se lleva a cabo un gráfico más complejo que no

describiremos aquí. El resto de la ventana es como en los gráficos de barras.

Pulsando el botón Definir aparece la ventana en todo análoga a la de la Figura

8.6. Por ello todo lo dicho para el diagrama de barras es válido ahora. Lo dicho

para el editor de gráficos sigue siendo válido por lo que pasaremos a un nuevo

gráfico.

Gráficos de Sectores.

Como su propio nombre indica, permite hacer un diagrama de sectores para la

distribución de una variable. La primera ventana del gráfico de sectores es muy

simple, en ella aparecen las opciones que conocemos de gráficos anteriores.

Pulsando el botón Definir aparece la ventana en todo análoga a la de la Figura.

Por ello, todo lo dicho para el diagrama de barras es válido ahora. Lo dicho para

el editor de gráficos sigue siendo válido, salvo que aparecerá algún icono

adicional, como el que permite desgajar cada porción del diagrama de sectores.

Histograma.

Con este procedimiento obtendremos un histograma para un carácter

cuantitativo continuo. Cuando se selecciona el procedimiento se obtiene una


ventana como la de la Figura. Como siempre, aparece una caja a la izquierda

en la que figuran todas las variables del fichero activo, de entre las que se

seleccionará la variable para la que se va a hacer el histograma; en nuestro

caso particular la variable es el peso. Pinchando sobre Mostrar curva normal se

representará la curva Normal teórica que se ajustaría al histograma. Por último,

lo referente a Plantilla y al botón Títulos... ya se ha comentado en un gráfico

anterior. Elegidas todas las opciones, pulsando el botón Aceptar, se mostrará el

histograma como el de la Figura, que es explicativo por sí sólo y del que sólo

cabe destacar que SPSS ha creado los rectángulos centrados en pesos de 5 en

5 unidades.

Ventana histograma de SPSS

VENTANAS DE SPSS Y LAS BARRAS DE MENÚS

Editor de datos


La primera ventana que encontraremos al entrar en SPSS nos permitirá, entre

otras cosas, abrir un fichero de datos creado anteriormente o bien introducir

nuevos datos. Si elegimos esta última opción o pulsamos CANCELAR

apareceremos en el editor de datos.

La ventana del editor de datos tiene una estructura similar a la de una hoja de

cálculo y se utiliza para introducir los datos que se quieren analizar.

Los datos se introducen en la pestaña de vista de datos (en la parte inferior

izquierda), dentro de variables (cada variable aparece como una columna en

la pantalla). En la pestaña de vista de variables se explicarán las

características de las mismas.

Entrar al programa

Seleccionamos SPSS y se abrirá una ventana de opciones a realizar:

Seleccionaremos Introducir datos, pulsando con el botón izquierdo del ratón en el círculo de Introducir datos y posteriormente en Aceptar y obtendremos la ventana de edición de datos:


Los archivos de datos, habitualmente toman la forma de una matriz en la que

cada fila representa los valores que un individuo determinado tiene para unas

variables. En terminología de SPSS cada fila es un caso. En las columnas de

dicha matriz aparecen los diferentes valores que una variable determinada

toma para cada uno de los En la parte inferior de la pantalla principal aparece

la barra de estado en la que hay información sobre el procesador de SPSS

(SPSS El procesador está preparado), además de dos pestañas que

permiten seleccionar "vista de datos" o "vista de variables". En la arte

superior aparece la barra de menú. Al situar el puntero del ratón sobre

cualquiera de sus elementos, aparece información sobre las operaciones que

podemos realizar:

Archivo: Crear, abrir o grabar los diferentes archivos de SPSS, mostrar

información de datos...., imprimir, acceso directo a los últimos archivos

Abiertos, salir del SPSS.

Edición: Deshacer, borrar, copiar, cortar, pegar, buscar, opciones.


Ver: Barra de estado, Barras de herramienta, Fuentes, Cuadrícula, Etiquetas

de valor.

Datos: definir fechas y efectuar modificaciones en el archivo de datos:

seleccionar, añadir, ponderar, ordenar, ir al caso.etc.

Transformar: Modificación y generación de nuevas variables. Las funciones de

Este menú y del anterior son temporales y sólo están vigentes durante la

sesión sin que afecten al archivo original de datos. Si queremos que sean

permanentes debemos grabar los cambios.

Analizar: Análisis estadísticos instalados.

Gráficos: Edición y creación de diversos tipos de gráficas de alta resolución.

Utilidades: Cambiar fuentes, información sobre archivos.

Ventana: Funciones habituales para controlar las ventanas. Se pueden

distinguir los siguientes tipos de ventanas:

Edición de datos de SPSS (Ventana principal con los menús)

Visor de SPSS

Ayuda en el formato típico de Windows.

Definición de los Datos

Antes de empezar el análisis de los datos conviene, siempre, prepararlos

para su mejor manejo e interpretación.


Asignar un Nombre: a cada variable, cumpliendo las siguientes reglas:

Nombres con no más de 8 caracteres (siendo siempre el primero una

letra o @).

No utilizar símbolos como &, /, $, etc.

No utilizar nunca espacios en blanco.

No utilizar expresiones como ALL, AND, BY, EQ, GE, GT, LE, NE, NOT,

OR, TO, o WITH.

Asignar un Tipo: a cada variable, indicando el máximo número de dígitos que

deseamos para anotar las observaciones de la variable y el tipo de la

variable con la que vamos a trabajar, alfanumérica, fecha, moneda o

numérica, indicando en este caso el número de cifras decimales con que

queremos que aparezca en el editor.

Numéricas: formato numérico estándar

Coma: comas de separación cada tres posiciones. Un punto para la

parte o decimal.

Punto: al contrario que el anterior.

Notación Científica: uso de la E para exponente.

Cadena: variable alfanumérica. (de más de 8 caracteres se considera

larga). o Además están los formatos de fecha, dólar y moneda

personalizada.

Si no las escogemos, el sistema las asigna automáticamente, siendo el formato

por defecto: Numérica 8.2 que significa: Anchura: 8 y Decimales: 2, es decir,

una amplitud de columna de 8 espacios, siendo los 2 últimos para los

decimales.

Haz un clic sobre el recuadro coloreado en la celda correspondiente al

Tipo en la variable densidad y observa estas posibilidades.


Asignar una Etiqueta: a cada variable de no más de 120 caracteres (entre 30

y 40 es el valor recomendado) que nos permita tener más información sobre

esa variable.

Asignar Valores: se trata de asignar etiquetas a los valores de cada variable.

No es obligatorio, pero sí muy útil en algunos casos

Definir Perdidos: permite definir los valores de los datos especificados como

perdidos por el usuario. A menudo es útil para saber por qué se pierde

información. Por ejemplo, puedes querer distinguir el dato perdido

correspondiente a un entrevistado que se niega a responder, del dato perdido

debido a que la pregunta no afectaba a dicho entrevistado. Los valores de

datos especificados como perdidos por el usuario aparecen marcados para un

tratamiento especial y se excluyen de la mayoría de los cálculos.

Sitúate en el campo correspondiente a Perdidos de cualquier variable y pincha sobre el recuadro coloreado, aparece:


Los códigos asignados a los valores ausentes deben de ser coherentes con el

tipo de variables declarado: Numéricos para las numéricas y alfanuméricos para

las alfanuméricas (máximo 9 caracteres). Se pueden introducir hasta 3 valores

perdidos (individuales) de tipo discreto, un rango de valores perdidos o un rango

más un valor de tipo discreto. Sólo pueden especificarse rangos para las

variables numéricas.

Estos valores ausentes son denominados por SPSS "valores ausentes

definidos por el usuario" (user-defined missing values), a diferencia de los

definidos por el sistema (system-missing values o sysmis). Estos últimos

corresponden a los que establece el sistema para los espacios en blanco y

caracteres ilegales que puedan haber en el archivo de datos. Aparecen en los

listados representados por comas.

• Definir Columnas: consiste en especificar la amplitud de la columna.

Podemos hacerlo también desde el propio archivo de datos.

• Definir Alineación: seleccionar la justificación de las entradas de la

columna: Izquierda, Derecha y Centrado.

• Especificar medida. Se puede seleccionar uno de los tres niveles de medida:

Escala: los valores de datos son numéricos en una escala de intervalo. Las

variables de escala deben ser numéricas.

Ordinal: los valores de datos representan categorías con un cierto orden


intrínseco (bajo, medio, alto; totalmente de acuerdo, de acuerdo, en

desacuerdo). Las variables ordinales pueden ser de cadena o valores

numéricos. Notar que para variables de cadena ordinales, se asume que el

orden alfabético de los valores de cadena indica el orden correcto de las

categorías; en el caso de bajo, medio y alto el orden sería alto, bajo y medio

(orden que no es correcto), por lo que es más fiable utilizar códigos numéricos

para representar datos ordinales que usar etiquetas de estos

Códigos.Nominal: los valores de datos representan categorías sin un cierto orden

intrínseco. Las variables nominales pueden ser de cadena o valores numéricos

que representan categorías diferentes, por ejemplo 1 = Hombre y 2 = Mujer

CORRELACIÓN APLICADO AL SPSS STADISTIC

El procedimiento Correlaciones Bivariadas de SPSS permite medir el grado de

dependencia existente entre dos o más variables mediante la cuantificación por

los denominados coeficientes de correlación lineal de Pearson, de Spearman y

la Tau-b de Kendall con sus respectivos niveles de significación.

Antes del cálculo de un coeficiente de correlación, inspeccionaremos los datos

con el fin de detectar valores atípicos que puedan producir resultados

equívocos.

De entre estos coeficientes, vamos a centrarnos en el coeficiente de correlación

lineal de Pearson entre dos variables X e Y, el cual ha sido objeto de estudio en

esta asignatura. Su expresión matemática es la que presentamos a

continuación.

Analizar “Correlaciones” “Bivariadas”...

Una vez seleccionadas estas opciones, aparecerá el cuadro de diálogo que

presentamos a continuación:


Introducimos en el recuadro de variables aquéllas sobre las que vamos a

cuantificar los coeficientes de correlación. Resulta obvio que al tratarse del

cálculo de correlaciones, se deberán introducir al menos dos variables. Por

ejemplo las variables pib.pc y paro 92.

Una vez seleccionadas aquellas variables, cuyos coeficientes de correlación

vamos a cuantificar, deberemos seleccionar el tipo de coeficiente de correlación

que queremos calcular, para lo cual se nos presentan tres opciones diferentes:

Pearson: Medida de la asociación lineal entre dos variables. Los valores del

coeficiente de correlación varían entre -1 a 1. El signo del coeficiente indica la

dirección de la relación y su valor absoluto indica la fuerza o grado. Los valores

mayores indican que la relación es más estrecha y un valor de 0 indica que no

existe una relación lineal.

Tau-b de Kendall: Medida no paramétrica de asociación para variables

ordinales o de rangos que tiene en consideración los empates. El signo del

coeficiente indica la dirección de la relación y su valor absoluto indica la

magnitud de la misma, de tal modo que los mayores valores absolutos indican

relaciones más fuertes. Los valores posibles varían de -1 a 1, pero un valor de -

1 o +1 sólo se puede obtener a partir de tablas cuadradas.


Spearman: Versión no paramétrica del coeficiente de correlación de Pearson,

que se basa en los rangos de los datos en lugar de hacerlo en los valores

reales. Resulta apropiada para datos ordinales (susceptibles de ser ordenador)

y para datos agrupados en intervalos que no satisfagan el supuesto de

normalidad. Los valores del coeficiente varían de -1 a +1. El signo del

coeficiente indica la dirección de la relación y el valor absoluto del coeficiente de

correlación indica la fuerza de la relación entre las variables. Los valores

absolutos mayores indican que la relación es mayor.

Resumiendo, para las variables cuantitativas normalmente distribuidas,

seleccionaremos el coeficiente de correlación de Pearson, mientras que si los

datos no están normalmente distribuidos o tienen categorías ordenadas,

seleccionaremos la Tau-b de

Kendall o de Spearman, que miden la asociación entre órdenes de rangos

Tras la especificación del coeficiente o coeficientes de correlación que

estimamos oportuno calcular, procederemos a indicar si queremos que se

realice un contraste de hipótesis estadística bilateral o unilateral1 para casos en

los que la dirección de la relación puede ser especificada a priori.

Este contraste, trata de probar la hipótesis de que el coeficiente de correlación

sea nulo (r=0), esto es, que no exista relación alguna entre las variables cuyo

coeficiente de correlación estamos cuantificando.

Finalmente, con el objeto de identificar aquellos coeficientes de correlación que

tienen una mayor significación, se puede seleccionar: Marcar las

correlaciones significativas, opción que marca los coeficientes de correlación

significativos al nivel 0,05 por medio de un solo asterisco y los significativos al

nivel 0,01 con dos.

La salida que SPSS proporciona es la que presentamos a continuación:


Si pulsamos en el botón opciones del cuadro de diálogo, SPSS nos ofrece la

posibilidad de calcular diversos estadísticos:

Medias y desviaciones típicas: Si elegimos esta opción, SPSS calcula para

cada una de las variables que se han introducido en el cuadro de variables la

media y la desviación típica. También se muestra el número de casos que no

tienen valores perdidos. Si seleccionamos esta opción y ejecutamos el


procedimiento, la salida que nos muestra SPSS es la que presentamos a

continuación:

Productos cruzados y covarianzas: Si elegimos esta opción, SPSS calcula

para cada par de variables el producto cruzado de las desviaciones, que es

igual a la suma de los productos de las variables corregidas respecto a la

media, esto es, el numerador del coeficiente de correlación de Pearson; y la

covarianza que es una medida no tipificada de la relación entre dos variables,

igual al producto cruzado diferencial dividido por N-1. Si seleccionamos esta

opción y ejecutamos el procedimiento, la salida que nos muestra SPSS es la

que presentamos a continuación:


REGRESION LINEAL APLICADO AL SPSS STADISTIC

En SPSS está en Gráficos > Dispersión…

Diagrama de Dispersión Simple, y en la siguiente ventana de diálogo, tras

oprimir la pestaña Definir, debemos seleccionar las dos variables cuantitativas

que vamos a situar en el gráfico, una en el eje X y otra en el eje Y

Da igual cuál de las variables coloquemos en cada ventana: en la correlación no

tiene sentido la dependencia de las variables, ya que estas juegan un papel

simétrico.

Gráfico


Como ya puede verse a simple vista, estas dos variables muestran una escasa

correlación lineal, arrojando una nube de puntos mudispersa, con parejas

de valores en los cuatro sectores del plano cartesiano. El coeficiente de

correlación será un número más próximo a cero (ninguna correlación) que a la

unidad (correlación lineal perfecta).

CORRELACIONES > BIVARIADAS


En el siguiente cuadro de diálogo debemos seleccionar las variables

cuantitativas que vamos a correlacionar, y así mismo indicar el tipo de

Coeficiente de Correlación que deseamos calcular (el de Pearson es el

paramétrico y el de Spearman es el no paramétrico) y si el contraste o

Prueba de significación es unilateral o bilateral. Además, en la pestaña

Opciones podemos hacer que se muestren algunos estadísticos, como las

medias y desviaciones típicas y los productos cruzados y covarianzas

El resultado que se obtiene tras aplicar es el siguiente:

CORRELACIONES


La salida de SPSS muestra primero una tabla o cuadro resumen

de las variables que se van a correlacionar, aportando los tres

índices que sintetizan las distribuciones: media ,desviación

típica y tamaño muestral. Y enseguida una tabla con la correlación lineal (por

defecto), en la que vemos una doble entrada con cuatro celdas cuyos

valores en ángulo se repiten. Es una obviedad que hace el programa pero

nos recuerda que en la correlación las variables juegan un papel simétrico y

son intercambiables.

REGRESION LINEAL

Esta opción permite la creación de un gráfico de puntos (Asignar variables,

seleccionando las dos variables cuantitativas y colocándolas en las ventanas

correspondientes del eje cartesiano) y ajustar una línea de regresión

(Ajuste, a través del método de Regresión).

Vemos como en la pestaña Ajuste es posible seleccionar un método

(Regresión), obtener la ecuación de la línea de regresión y visualizar las

líneas de pronóstico para un intervalo de confianza determinado (por

defecto del 95%).


T- STUDENT

Realiza el test de comparación de dos medias con muestras apareadas

(relacionadas les llama SPSS), llevando a cabo determinados cálculos, que

veremos, sobre cada pareja de variables implicada. Supone que la diferencia

de las variables aleatorias es Normal


La forma de ejecutar el procedimiento es Analizar Comparar medias

Prueba T para muestras relacionadas. Hecho esto, aparece una ventana

como la de la Figura. A la izquierda está la caja con las variables presentes


en el fichero activo para seleccionar de ellas la pareja que nos permitirá

realizar el test de comparación de medias con muestras apareadas. Al

seleccionar ambas variables, pinchando sobre ellas, aparecerán en la zona

de Selecciones actuales; en nuestro caso la pareja es (szl24,sztri). Para

acabar de seleccionar la pareja y ejecutar con ella el procedimiento bastará

con pulsar el botón ø y aparecerá la pareja en la caja de Variables

relacionadas. La operación la podemos repetir para cualquier otro par de

variables para el que queramos realizar la comparación. En las Opciones

aparece el mismo contenido y. Por último, pulsando el botón Aceptar se

ejecuta el procedimiento dando lugar a un resultado como el de la Figura. En

la primera tabla aparecen las medidas de resumen que calcula para las

variables implicadas en la comparación. En la siguiente tabla aparece el

coeficiente de correlación de las dos variables. En la última tabla aparecen

los resultados propios de la comparación; primero aparece la media de las

diferencias, seguida de su desviación típica, el error estándar y un intervalo

de confianza para la diferencia entre las dos medias, y a continuación

aparece el resultado del test: =14.378, 93 g.l., P<0.0

Prueba TEstadísticos de muestras relacionadas

Media N Desviación típ. Error típ. de la media

Par 1SZL24 .8073 94 .1400 1.444E-02SZTRI -.8956 94 1.2111 .1249

Correlaciones de muestras relacionadas

N Correlación Sig.

Par 1 SZL24 y SZTRI 94 .494 .000

Prueba de muestras relacionadas

Diferencias relacionadas

T glSig.

Intervalo de confianzaError (bilat.)Desviación

Media típ. de la para la diferenciatíp.

mediaInferior Superior

Par SZL24 -1.7030 1.1484 .1184 1.4678 1.9382 14.378 93 .000


1 SZTRI

Gráfico Barras de error

El test Chi-cuadrado con SPSS.La comparación de proporciones, ya sea con muestras independientes o con muestras

apareadas, y la asociación de caracteres cualitativos son problemas estadísticos que se

resuelven con el uso del estadístico chi-cuadrado; al procedimiento de SPSS dedicado a tal

estadístico es al que dedicaremos este apartado

Procedimiento Tablas de contingencia.

El procedimiento para hacer los análisis que se han citado es el

procedimiento Tablas de contingencia. Tal procedimiento se invoca

como: Analizar Estadísticos Descriptivos Tablas de Contingencia.

Cuando se lleva a cabo tal acción, se abre una ventana como la de la

Figura

Como se ve, a la izquierda aparece la típica caja con el conjunto de las

variables presentes en el fichero activo. De entre ellas se elegirán las que


irán por filas (se colocarán en la caja Filas), las que irán por columnas (se

colocarán en la caja Columnas), y, si acaso, las que determinarán las

categorías para las que se obtendrán las tablas de contingencia (se

colocarán en la caja Capa 1 de 1 y constituirán las variables de la capa 1) .

El procedimiento obtendrá una tabla de contingencia para cada

combinación de dos variables, una de filas y otra de columnas, y si

existen variables en la capa 1, dichas tablas de contingencia las obtendrá

para cada categoría de cada una de estas variables; por ejemplo, si

"tabaco" es la única variable de la capa 1, se obtendrán las tablas de

contingencia para fumadores y no fumadores. En general se pueden definir

diferentes capas de variables, lo que da más posibilidades al

procedimiento, pero lo complica (no lo veremos). En el caso de la Figura,

deseamos comprobar si la distribución del grado de retinopatía que sufren

los pacientes es la misma en hombres que en mujeres; estando por tanto

en la situación de un test de comparación de proporciones con dos

muestras independientes. También sería éste, de forma equivalente, el

problema de estudiar la asociación entre el sexo y la presencia de

retinopatía.


Inmediatamente debajo de la caja de la izquierda aparecen dos opciones

que pueden o no estar seleccionadas: la opción Mostrar los gráficos de

barras agrupadas (que muestra un gráfico de barras agrupadas para cada

combinación de variables de Filas y Columnas, dentro de las categorías de

cada variable de la capa 1) y la opción Suprimir tablas (que muestra el

análisis de las tablas de contingencia, sin llegar a mostrar las propias tablas).

Inmediatamente debajo aparecen los botones: Estadísticos..., Casillas... y

Formato... ., que hacen referencia a los estadísticos que deseamos calcular

para la tabla, las cantidades que deseamos que aparezcan en las casillas y

el formato en el que aparecerán las tablas. A continuación los describiremos

con detalle.

Cuando se pincha sobre el botón Estadísticos.... se despliega una ventana

con muchas alternativas que, marcándolas, nos permitirán el cálculo de

estadísticos o medidas aplicables a diferentes situaciones, y que, la mayoría,

van más allá de un curso básico de estadística al que pretende dar cobertura

este manual. Por ello, aquí sólo comentaremos algunas de ellas. La primera,

Chi-cuadrado, nos calcula estadísticos del tipo chi-cuadrado (entre ellos, el

chi-cuadrado de Pearson para una tabla de contingencia) y hace el test de

Fisher en el caso de tablas 2×2. La opción Coeficiente de Contingencia

nos calcula dicho coeficiente en cualquier tabla de contingencia. La opción

Riesgo nos permite obtener medidas de asociación en tablas 2×2: razón del

producto cruzado y riesgo relativo. Finalmente la opción McNemar lleva a

cabo el test de McNemar para comparar dos proporciones con muestras

apareadas (caso de una tabla 2×2).

Al pulsar el botón Casillas ... nos aparece una ventana donde, marcando las

opciones correspondientes, podemos calcular y escribir en cada casilla de la

tabla: las frecuencias observadas, las frecuencias esperadas, los

porcentajes por filas, los porcentajes por columnas, los porcentajes respecto

al total, los residuos no tipificados (diferencia entre frecuencias observadas y

esperadas) y otros residuos que no veremos aquí. Por último, la opción


Formato... permite presentar las filas de la tabla en orden ascendente o

descendente.

Elegidas todas las opciones y pulsando la tecla Aceptar se llevará a cabo el

análisis solicitado. A continuación mostraremos los resultados obtenidos

para varios análisis distintos

Resultados del procedimiento Tablas de contingencia

En la Figura aparece lo fundamental de los resultados del análisis de

asociación entre el sexo del paciente y el nivel de retinopatía que ha

alcanzado. En la primera tabla, por filas aparece el sexo del paciente y por

columnas figura el nivel de la retinopatía. En las casillas se presentan las

frecuencias observadas así como los porcentajes por filas. La segunda tabla

contiene las pruebas de chi-cuadrado. En la primera fila se muestra el

clásico test Chi-cuadrado de Pearson para tablas de

Contingencia (los otros no los veremos aquí); también al pie de esta tabla

observamos el número de casillas (de la tabla de contingencia) que tienen


frecuencia esperada inferior a 5, de utilidad para comprobar la validez del

test anterior.

En la Figura aparece lo fundamental de los resultados del test de McNemar

para la comparación de dos proporciones con muestras apareadas. Se dice

que un individuo tiene

Resultados del test de McNemar de comparación de dos proporciones con muestras

apareadas (procedimiento Tablas de contingencia

PRUEBA DE HIPOTESIS

Procedimiento Binomial.

El procedimiento Binomial permite realizar el test de hipótesis para una

proporción, contrastando si la proporción difiere significativamente de un

valor p0 especificado.

La forma de invocar el procedimiento es: Analizar Pruebas No


Paramétricas Binomial... En la ventana que aparece, como en otras

muchas ocasiones, pasaremos a la caja de la derecha las variables (que

deben ser numéricas) para las que queremos realizar el test. En la pequeña

caja contrastar proporción colocaremos el valor p0 que deseamos

contrastar. SPSS


Realizará un test de la proporción para cada variable introducida, pero

todos con el mismo p0. En la parte inferior izquierda de la ventana aparece

Definir la dicotomía, que tiene dos opciones. La primera opción es para

variables que tienen sólo dos valores posibles: el valor más pequeño

determinará el grupo 1, y el más grande el grupo 2. La segunda opción es

para variables con cualquier número de valores distintos, pudiéndose

especificar un punto de corte: los valores iguales o más pequeños que el

punto de corte determinarán el grupo 1, y los más grandes el grupo 2. Esta

definición de la dicotomía tiene que ser idéntica para todas las variables

introducidas. En cualquier caso, y para cada variable, SPSS contrastará si

la proporción de individuos o casos pertenecientes al grupo 1 difiere

significativamente del valor p0 especificado.

En la ventana del procedimiento aparece el botón de Opciones... , donde

podemos solicitar cálculos descriptivos de las variables y especificar cómo


tratar los valores perdidos. Para esto último existen dos opciones: Excluir

casos según prueba (excluye los casos con valores perdidos en la variable

implicada en el contraste) y Excluir casos según lista (excluye los casos

con valores perdidos en cualquiera de las variables introducidas en el

procedimiento Binomial). Los resultados del procedimiento se dan en una

tabla, donde aparecen, para cada test, el grupo 1 y el grupo 2, el valor p0 de

prueba y el valor P del test

VARIANZA

Análisis de la varianza con un factor

El procedimiento para realizar el Análisis de la Varianza con un factor se

encuentra en

Analizar Comparar medias! ANOVA de un factor

En el cuadro de dialogo que aparece, llevar a la casilla Dependientes la

variable respuesta a estudiar, y a la casilla Factor, la variable que contenga

los niveles del factor. Veamos que seleccionar en cada uno de los cuadros

de los que dispone SPSS.

Contrastes: con esta opción el SPSS nos permite hacer contrastes a priori,

que no vamos a manejar. Se deja en blanco y Continuar.

Post hoc: las pruebas Post hoc son lo mismo que los contrastes múltiples a

posteriori (para detectar donde se encuentran las diferencias entre medias).

Se nos permite elegir diversos métodos de control del error (elegimos

Bonferroni, que es el que manejamos en clase, asumiendo igualdad de

varianzas) y el nivel de sindicación (total) para los contrastes.

Opciones: resultan de utilidad los Descriptivos (si antes no hemos realizado

el procedimiento Explorar, ya que nos proporciona estimaciones de las

medias por nivel) y la Prueba de homogeneidad de varianza (o prueba de

Levene: según el p-valor que nos proporcione el contraste aceptaremos o

rechazaremos la hipótesis nula de que las varianzas en todos los niveles del


factor coinciden)


CONCLUSIONES

BM SPSS Statistics es un completo conjunto de datos y herramientas

de análisis predictivo fácil de utilizar para usuarios empresariales,

analistas y programadores estadísticos.

La combinación de las técnicas de estadística inferencial junto con la

minería de datos implementadas en esta tesis permite generar

información y elaborar reportes que ayuden en la toma de decisiones.

Los reportes gráficos presentan la información de una manera más

comprensible y amigable para el usuario que las tablas de resultados.

Del desarrollo de este tema concluimos que es posible presentar

gráficos/biplots que complementan los resultados mostrados

numéricamente en las tablas de datos.

IBM SPSS Advanced Statistics crea análisis más precisos y

conclusiones más fiables cuando se trabaja con relaciones complejas.


IBM SPSS proporciona técnicas efectivas ante problemas reales en

una gran variedad de disciplinas, incluidos la investigación médica, la

fabricación, los productos farmacéuticos y los estudios de mercado.

Ofrece técnicas avanzadas de análisis univariados y multivariados

muy efectivas y sofisticadas, entre las que se incluyen:

Procedimientos de modelos lineales generales (GLM) y de modelos

mixtos

Modelos lineales generalizados (GENLIN), que incluyen los modelos

estadísticos más utilizados como la regresión lineal para respuestas

distribuidas con normalidad, modelos logísticos para datos binarios y

modelos loglineales para datos de recuento.

GENLIN también ofrece varios modelos estadísticos muy útiles a

través de su propia formulación general de modelos.

Los procedimientos de las ecuaciones de estimación generalizadas

(GEE) amplían los modelos lineales generalizados para acomodar

datos longitudinales correlacionados y datos en clúster

Modelos mixtos lineales generalizados (GLMM) para utilizar con datos

jerárquicos

RECOMENDACIONES

Es necesario que IBM SPSS Statistics Professional Edición se aplique

ya que n las funciones estadísticas principales ofrecidas en Standard

Edición para tratar los problemas de calidad de datos, complejidad de

datos, automatización y pronósticos.

Realizar futuros módulos para incorporar otros estudios estadísticos

como análisis discriminante, componentes principales, regresión

múltiple

En un futuro, dada la flexibilidad que brindan los métodos presentados

y la estadística inferencial, incluir otras variables a ser estudiadas


para aumentar la información disponible para ayudar en la toma de

decisiones

Utilizar el sistema para tomar decisiones adecuadas que sirvan para

la optimización de la evaluación de la información recogida

Presentar los módulos planteados, para aplicar estos análisis

estadísticos a la base de datos de calificaciones de estudiantes, y

poder determinar así por ejemplo factores que inciden en el éxito o

fracaso de los estudiantes en una carrera específica

Es necesario identificar que los usuarios que realizan varios tipos de

análisis en profundidad y no estándar y que necesitan ahorrar tiempo

mediante la automatización de tareas de preparación. Con lo cual se

puede aplicar

IBM SPSS Statistics Professional Edición incluye las siguientes funciones

clave:

Los Modelos lineales ofrecen varios procedimientos de regresión y

estadísticas avanzados diseñados para que se adapten a las

características inherentes de los datos que describen relaciones

complejas.

Los Modelos no lineales otorgan la capacidad de aplicar más

modelos sofisticados a los datos.

Las Tablas personalizadas permiten a los usuarios comprender

fácilmente sus datos y a resumir de forma rápida en diferentes estilos

y para diferentes audiencias.

La Preparación de datos agiliza la fase de preparación de datos del

proceso analítico.

La Validez de datos y valores que faltan aumenta la oportunidad de

recibir resultados significativos desde el punto de vista estadístico.

Los Árboles de decisiones facilitan la identificación de grupos, el

descubrimiento de relaciones entre grupos y la previsión de futuros

eventos.


Las características de Previsión le permiten analizar datos históricos

y prever tendencias de forma más rápida.

ANÁLISIS

Existen diversas definiciones, veamos algunas:

Para Sierra Bravo (1991), la estadística es “la ciencia formada por un

conjunto de teorías y técnicas cuantitativas, que tiene por objeto la

organización, presentación, descripción, resumen y comparación de

conjuntos de datos numéricos, obtenidos de poblaciones en su conjunto de

individuos o fenómenos o bien de muestras que representan las poblaciones

estudiadas, así como el estudio de su variación, propiedades, relaciones

comportamiento probabilístico de dichos datos y la estimación, inferencia o

generalización de los resultados obtenidos de muestras, respecto a las

poblaciones que aquéllas representan. La estadística en la investigación

científica, dada la necesidad de manejar y tratar en ellas grandes

cantidades, progresivamente crecientes, de datos”.

VIrma Nocedo de León et al (2001), anotan que “la estadística es la ciencia

encargada de suministrar las diferentes técnicas y procedimientos que

permiten desde organizar la recolección de datos hasta su elaboración,

análisis e interpretación. Abarca dos campos fundamentales la estadística

descriptiva y la estadística inferencial”,

Para Hopkins y Glass (1997), “la estadística es un lenguaje para comunicar

información basada en datos cuantitativos”.

Douglas Montgomery (1985), define a la estadística como “el arte de tomar


decisiones acerca de un proceso o una población con base en un análisis de

la información contenida en una muestra tomada de la población”.

Otra definición de la estadística que lo vincula al uso científico de principios

matemáticos, a la colección, al análisis y a la presentación de datos

numéricos. Contribuyen con la investigación científica diseñando pruebas y

experimentos; la colección, el proceso, y el análisis de datos; y la

interpretación de los resultados, aplicando conocimientos matemáticos y

estadísticos. El conocimiento estadístico se aplica a la biología, economía,

ingeniería, medicina, salud pública, psicología, comercialización, educación y

deportes. Muchas decisiones económicas, sociales, políticas y militares no

se pueden tomar objetivamente sin el empleo adecuado de la estadística.

En nuestro medio profesional o en la sociedad en general se requiere

solucionar un problema o verificar un supuesto, para desarrollar la ciencia, la

técnica y la educación entre otros ámbitos; en particular respecto a los

alumnos sobre rendimiento académico, aptitud científica, desarrollo social y

la deserción entre otros. También respecto al docente sobre su desempeño

en aula, su formación académico-profesional, los recursos didácticos que

emplea y la producción científica, entre otros. Respecto al sistema educativo,

financiamiento de la educación, gestión académica, informática educativa y

modelos educativos, entre otros.

Todos estos problemas no pueden ser resueltos por iniciativas subjetivas,

por pareceres o lluvia de ideas; sino en base a información válida y

confiable, esto es, tener información lo más próxima a la realidad bajo

estudio. Indudablemente esto se logra empleando la ciencia llamada

estadística.

Para resolver estos problemas se debe seguir de manera organizada,

sistemática y planificada, es decir debemos realizar investigación científica

SPSS STADISTIC


Con más de 35 años de experiencia, SPSS Statistics (antes PASW) es el

paquete estadístico de referencia. Concebido para el análisis de datos en

ciencias sociales, su potencia y la cantidad de pruebas disponibles le

convierten en el programa de elección para cualquier escenario que requiera

predicciones rápidas y fiables.

El punto fuerte de SPSS Statistics es la facilidad de uso. Todos los análisis

se llevan a cabo a través de cuadros de diálogo con un excelente diseño. La

interfaz de SPSS Statistics facilita la introducción de un gran volumen de

datos y variables.

El editor de datos es una parte esencial del programa, y hay un menú entero

dedicado a la manipulación de ficheros. El nuevo editor de sintaxis de SPSS

Statistics es un cambio largo tiempo esperado y a la altura de las

expectativas.

Una vez que se ejecuten pruebas, ya sean estadísticos descriptivos,

regresiones, ANOVAs, series temporales o análisis cluster, SPSS Statistics

mostrará los resultados en un visor aparte junto a los gráficos. Desde allí se

pueden copiar y pegar a otros programas o exportar en formato PDF o DOC.

La integración con Office de SPSS Statistics se ha mejorado notablemente.

Con un rendimiento sólido y un motor gráfico sobresaliente, SPSS Statistics

sigue siendo un clásico difícil de destronar. Sus últimas mejoras y la

traducción al español de la interfaz le convierten en imprescindible.

ABSTRACT

This work introduces a Website, http://www.ugr.es/~bioestad/ which

contains information both of general interest as well as material specifically

aimed at students taking Statistics related subjects as part of their Bachelor

Degree courses in Biology or Environmental Science at the University of

Granada. It provides teaching material for these subjects as well as a self-


learning interactive program for students learning the SPSS Statistics

software package. This interactive program consists of a Web portal

http://www.ugr.es/~bioestad/guiaspss/index.html where you can find different

exercises which are explained and resolved using the SPSS program and

guided exercises resolved interactively through a tutorial emulator program

from the SPSS Statistics package.

On the one hand, the project aims to develop a computer tool where the

main teaching resource to be used is an interactive program which facilitates

student self-learning, both inside and outside the classroom. On the other

hand, it aims to encourage active student participation in his/her own

learning process and in the pursuit of a deeper understanding of course

contents. It is very important to note that this is free software and so access

is not restricted to students register ed in these subjects.

The main goal is to present the SPSS Self-Learning Interactive Guide

(Version 3.0). In this new software, Version 2.1 has been revised, amended

and extended with a new practical exercise, Exercise 6, in which parametric

and non -parametric hypotheses are contrasted

CRONOGRAMA DE ACTIVIDADES

ACTIVIDADJULIO 2012

lunes 10 martes 11 Miercoles12 jueves 13 Organización del Tema X Investigación del Tema X Análisis del Tema X Documentación del Tema X


BIBLIOGRAFÍA:

GIL, J.; DIEGO, J.L.; RODRÍGUEZ, G. y GARCÍA, E. (1996).

Problemas de Estadística Básica Aplicada a las Ciencias de la

Educación. Sevilla: Kronos.

GIL, J.; RODRÍGUEZ, G. y GARCÍA, E. (1995). Estadística Básica

Aplicada a las Ciencias de la Educación. Sevilla: Kronos

BELLIDO VASQUEZ, P, “Estadísticas para marketing (1) El Análisis

Factorial”, <http://www.ilustrados.com/publicaciones/EpyukylkEFAVid

hbVk.php>. 2003

GONDAR, J.E., “Análisis Factorial”. < http://www.estadistico.com/

arts.html?20011119>. 2001

BLOQUE DE CIUDAD, DICCIONARIO ESTADÍSTICO, <http://www.

estadistico.com/dic.html?p=85>. 2004

DISTANCIA DE MAHALANOBIS, DICCIONARIO ESTADÍSTICO,

<http://www.estadistico.com/dic.html?p=1220>. 2004

LARA-PORRAS, A., GARCÍA-LEAL, J., QUESADA-RUBIO, J.M.,

RAMOS-ÁBALOS, E., RAYA- MIRANDA, R., SÁNCHEZ-BORREGO,

I.R. Y TARIFA-BLANCO, J.A. (2006): Guía interactiva de

autoaprendizaje de SPSS versión 1.2 (CD-ROM)

LARA-PORRAS, A.M., QUESADA-RUBIO, J.M., RAMOS-ÁBALOS,

E., RAYA-MIRANDA, R., SANCHEZ-BORREGO, I.R. Y TARIFA

BLANCO. J.A. (2008a): Guía interactiva de autoaprendizaje de

SPSS versión 1.3


LARA-PORRAS, A.M., RAMOS-ÁBALOS, E., RAYA-MIRANDA, R.,

SÁNCHEZ-BORREGO, I.R., TARIFA- BLANCO. J.A. Y ALONSO-

UXÓ, A. (2008b): Guía interactiva de autoaprendizaje de SPSS

versión 2.1 (CD-ROM http://dewey.uab.es/pmarques/competen.htm,

MARQUÈS GRAELLS, P (2008): Impacto de las TIC en educación:

funciones y limitaciones. http://peremarques.pangea.org/siyedu.htm,

ANEXOS


PROBLEMA EJEMPLO DE LA FORMA NORMAL

La almacenera Aduanor estudia la relación entre ingreso importaciones (X) y de egreso de exportaciones (Y) mensuales Una muestra aleatoria de sus exportaciones y importaciones reveló los siguientes datos en dólares:

X 350 400 450 500 950 850 700 900 600Y 100 110 130 160 350 350 250 320 130

Desarrollo

Como primer paso empezamos realizando la tabla de las dos variables

Ingresos Ahorros N X Y X Y X2 Y2 (xi-x)2 (yi-y)2

1 350 100 35000 122500 10000 80275,89 12345,432 400 110 44000 160000 12100 54442,89 10223,233 450 130 58500 202500 16900 33609,89 6578,834 500 160 80000 250000 25600 17776,89 2612,235 950 350 332500 902500 122500 100279,89 19290,436 850 350 297500 722500 122500 46945,89 19290,437 700 250 175000 490000 62500 4444,89 1512,438 900 320 288000 810000 102400 71112,89 11857,039 600 130 78000 360000 16900 1110,89 6578,83∑ 5700 1900 1388500 4020000 491400 410000 90288,89

X=∑ x1

n=5700

9=633.33


Y=∑ y1

n=1900

9=211.11

r=n∑ xy−∑ x∑ y

√¿¿¿

r=9 (1388500 )−(5700)(1900)

√¿¿¿

r= 1666500

√3690000∗812600=1666500

1731616=0.96

sx=√∑ ¿¿¿¿

sx=√ 4100009

=213.44→desviacion standar

s x2=¿

sy=√∑ ¿¿¿¿

sy=√ 90288,899

=100,16→desviacionstandar

s y2=¿

Yr= y+r ( sysx ) x−r ( sysx ) x

Yr=211.11+0.96 ( 100,16213,44 ) x−0.96 ( 100,16

213,44 )633,33

Yr=211,11+0,45 x−285,31

Yr=−74,2+0,45x

b=n∑ xy−∑ x∑ y

n∑ x2−¿¿¿


b=9 (1388500 )−(5700)(1900)

9 ( 4020000 )−(5700 )

b=12496500−1083000036180000−32490000

b=16665003690000

b=0.45

a= y−bx

a=211.11−0.45 (633.33)

a=¿-73.89

Ecuación lineal de las dos variables.

y=a+bx

y=−73,89+0.45 x


Diagrama de dispersión en el plano cartesiano

300 400 500 600 700 800 900 10000

50100150200250300350400

YLinear (Y)

Axis Title

Axis Title

Ingreso que corresponde a un ahorro semanal de 90 dólares.

y=−73,89+0.45 x

y=−73.89+0.45 (90 )=−33.39

Si el ahorro es de 200 dólares que gasto puede realizar el obrero en dicha

Semana.

y=−73.89+0.45 x

y=−73.89+0.45 (200 )=16.11

Si el ingreso es de 350 dólares cual es el salario.

y=−73.89+0.45 x

350=−73.89+0.45 x

350+73.890.45

=x

x=941.98

PASOS DE UNA PRUEBA DE HIPOTESIS

Primer paso formular la hipótesis nula y la hipótesis alternativa


Hipótesis nula

Ho = β=0

La hipótesis alternativa

Ha= β<0; β>0

Segundo paso determinar si la prueba es unilateral o bilateral

Bilateral

Tercer paso Asumir el nivel se significación de la prueba

95% ± 1,96

Cuarto paso determinar la distribución maestral que se usara en la

prueba

n<30

Como n es menor que 30 utilizaremos la T de estudent

Quinto paso elaborar el esquema de la prueba

-1.96 +1.96

Sexto paso calcular el estadístico de la prueba

z= Pm−poQp

z=0.05−0

9 z=5.55


Q=√ SX 2+SY 2

n

Q=√ 45556,63+10032,109

Q=216.03

QP=√ PQnQP=√ 0(216.03)

9

QP=0

Pm= pn

Pm=0.459Pm=0.05


PROBLEMA DEL CONTEXTO DE COMERCIO EXTERIOR

APLICADO EN EL PROGRAMA SPSS STADISTIC

La almacenera Aduanor estudia la relación entre ingreso importaciones (X) y de egreso de exportaciones (Y) mensuales Una muestra aleatoria de sus exportaciones y importaciones reveló los siguientes datos en dólares:

100 27700 51185 1.600900 4380 10

525 5660 1260 11,7

1.556 7190 0

1.168 65280 48

1.332 631.350 22100 55

1.943 2080 1080 163

2.700 9470 20

4.680 266308 296

9.516 2.660789 30

9.516 2.7028.316 2.1901.586 713.261 219

40 1440 1250 146

650 25240 225


4.000 2740 55

3.650 703.650 84

50 201.350 22

50 252.700 981.500 439

40 1860 33

1.280 68100 2550 24

120 251.400 2353.680 158150 3150 12

5.522 97150 11750 37

770 6980 48

700 1580 23

4.218 1165.672 97

60 24100 109150 132

1.593 107180 65100 13

Frecuencias

Notas


Resultados creados 12-jul-2012 04:03:08

Comentarios

Entrada Datos C:\Users\USER\Documents\

estadistica ojos aja. Sav

Conjunto de datos activo Conjunto_de_datos1

Filtro <ninguno>

Peso <ninguno>

Segmentar archivo <ninguno>

Núm. de filas del archivo

de trabajo

67

Manipulación de los

valores perdidos

Definición de los perdidos Los valores perdidos definidos por el

usuario serán tratados como

perdidos.

Casos utilizados Los estadísticos se basan en todos

los casos con datos válidos.

Sintaxis FREQUENCIES VARIABLES=importa

ex pota

/NTILES=4

/STATISTICS=STDDEV VARIANCE

MINIMUM MAXIMUM MEAN MEDIAN

MODE

/ORDER=ANALYSIS.

Recursos Tiempo de procesador 0:00:00.063

Tiempo transcurrido 0:00:00.054

Estadísticos

mas de 100 menos de 100

N Válidos 67 67

Perdidos 0 0

Media 126.0319 80.1217

Mediana 50.0000 48.0000

Moda 50.00a 25.00

Des . típ. 215.95320 107.27079

Varianza 46635.785 11507.022

Mínimo 1.17 .00

Máximo 900.00 652.00


Percentiles 25 3.6800 20.0000

50 50.0000 48.0000

75 100.0000 98.0000

a. Existen varias modas. Se mostrará el menor de los valores.

Tabla de frecuencia

mas de 100

Frecuencia Porcentaje Porcentaje

válido

Porcentaje

acumulado

Válidos 1.17 1 1.5 1.5 1.5

1.28 1 1.5 1.5 3.0

1.33 1 1.5 1.5 4.5

1.35 2 3.0 3.0 7.5

1.40 1 1.5 1.5 9.0

1.50 1 1.5 1.5 10.4

1.56 1 1.5 1.5 11.9

1.59 1 1.5 1.5 13.4

1.59 1 1.5 1.5 14.9

1.94 1 1.5 1.5 16.4

2.70 2 3.0 3.0 19.4

3.26 1 1.5 1.5 20.9

3.65 2 3.0 3.0 23.9

3.68 1 1.5 1.5 25.4

4.00 1 1.5 1.5 26.9

4.22 1 1.5 1.5 28.4

4.68 1 1.5 1.5 29.9

5.52 1 1.5 1.5 31.3

5.67 1 1.5 1.5 32.8

8.32 1 1.5 1.5 34.3

9.52 2 3.0 3.0 37.3

40.00 4 6.0 6.0 43.3

50.00 6 9.0 9.0 52.2

60.00 4 6.0 6.0 58.2

70.00 1 1.5 1.5 59.7

80.00 6 9.0 9.0 68.7

90.00 1 1.5 1.5 70.1


100.00 5 7.5 7.5 77.6

120.00 1 1.5 1.5 79.1

150.00 3 4.5 4.5 83.6

180.00 1 1.5 1.5 85.1

185.00 1 1.5 1.5 86.6

240.00 1 1.5 1.5 88.1

308.00 1 1.5 1.5 89.6

525.00 1 1.5 1.5 91.0

650.00 1 1.5 1.5 92.5

700.00 2 3.0 3.0 95.5

770.00 1 1.5 1.5 97.0

789.00 1 1.5 1.5 98.5

900.00 1 1.5 1.5 100.0

Total 67 100.0 100.0

menos de 100

Frecuencia Porcentaje Porcentaje

válido

Porcentaje

acumulado

Válidos .00 1 1.5 1.5 1.5

1.60 1 1.5 1.5 3.0

2.19 1 1.5 1.5 4.5

2.66 1 1.5 1.5 6.0

2.70 1 1.5 1.5 7.5

10.00 2 3.0 3.0 10.4

12.00 3 4.5 4.5 14.9

13.00 1 1.5 1.5 16.4

14.00 1 1.5 1.5 17.9

15.00 1 1.5 1.5 19.4

18.00 1 1.5 1.5 20.9

20.00 3 4.5 4.5 25.4

22.00 2 3.0 3.0 28.4

23.00 1 1.5 1.5 29.9

24.00 2 3.0 3.0 32.8

25.00 4 6.0 6.0 38.8

27.00 2 3.0 3.0 41.8

30.00 1 1.5 1.5 43.3

31.00 1 1.5 1.5 44.8


33.00 1 1.5 1.5 46.3

37.00 1 1.5 1.5 47.8

43.00 1 1.5 1.5 49.3

48.00 2 3.0 3.0 52.2

51.00 1 1.5 1.5 53.7

55.00 2 3.0 3.0 56.7

56.00 1 1.5 1.5 58.2

63.00 1 1.5 1.5 59.7

65.00 1 1.5 1.5 61.2

68.00 1 1.5 1.5 62.7

69.00 1 1.5 1.5 64.2

70.00 1 1.5 1.5 65.7

71.00 2 3.0 3.0 68.7

84.00 1 1.5 1.5 70.1

94.00 1 1.5 1.5 71.6

97.00 2 3.0 3.0 74.6

98.00 1 1.5 1.5 76.1

100.00 1 1.5 1.5 77.6

107.00 1 1.5 1.5 79.1

109.00 1 1.5 1.5 80.6

116.00 1 1.5 1.5 82.1

117.00 1 1.5 1.5 83.6

132.00 1 1.5 1.5 85.1

146.00 1 1.5 1.5 86.6

158.00 1 1.5 1.5 88.1

163.00 1 1.5 1.5 89.6

219.00 1 1.5 1.5 91.0

225.00 1 1.5 1.5 92.5

235.00 1 1.5 1.5 94.0

266.00 1 1.5 1.5 95.5

296.00 1 1.5 1.5 97.0

439.00 1 1.5 1.5 98.5

652.00 1 1.5 1.5 100.0

Total 67 100.0 100.0

Gráfico

Notas



Comentarios


estadistica ojos aja sav


Filtro <ninguno>

Peso <ninguno>


Núm. de filas del archivo de

trabajo

67

Sintaxis GRAPH

/SCATTERPLOT(BIVAR)=import

WITH export

/MISSING=LISTWISE.




Correlaciones

Notas


Comentarios


estadistica ojos aja.sav

Conjunto de datos

activo

Conjunto_de_datos1

Filtro <ninguno>

Peso <ninguno>


Núm. de filas del

archivo de trabajo

67

Manipulación de los

valores perdidos

Definición de valores

perdidos

Los valores perdidos definidos

por el usuario serán tratados

como perdidos.

Casos utilizados Los estadísticos para cada par de

variables se basan en todos los

casos que tengan datos válidos

para dicho par.

Sintaxis CORRELATIONS

/VARIABLES=export import

/PRINT=TWOTAIL NOSIG

/STATISTICS DESCRIPTIVES

/MISSING=PAIRWISE.




Estadísticos descriptivos

Media Desviación

típica

N

menos de 100 80.1217 107.27079 67

mas de 100 126.0319 215.95320 67

Correlaciones

menos de 100 mas de 100

menos de 100 Correlación de Pearson 1 -.120

Sig. (bilateral) .333

N 67 67

mas de 100 Correlación de Pearson -.120 1

Sig. (bilateral) .333

N 67 67

Regresión

Notas


Comentarios




Filtro <ninguno>

Peso <ninguno>



trabajo

67

Tratamiento de los datos

perdidos

Definición de perdidos Los valores perdidos definidos por el

usuario se tratarán como perdidos.

Casos utilizados Los estadísticos se basan en los

casos sin valores perdidos para

ninguna variable de las utilizadas.

Sintaxis REGRESSION

/DESCRIPTIVES MEAN STDDEV


CORR SIG N

/MISSING LISTWISE

/STATISTICS COEFF OUTS R

ANOVA CHANGE ZPP

/CRITERIA=PIN(.05) POUT(.10)

/NOORIGIN

/DEPENDENT expota

/METHOD=ENTER importa.



Memoria necesaria 1356 bytes

Memoria adicional

requerida para los

diagramas de residuos

0 bytes

[Conjunto_de_datos1] C:\Users\USER\Documents\estadistica ojos aja.sav


Media Desviación

típica

N

menos de 100 80.1217 107.27079 67

mas de 100 126.0319 215.95320 67

Correlaciones


Correlación de Pearson menos de 100 1.000 -.120

mas de 100 -.120 1.000

Sig. (unilateral) menos de 100 . .167


mas de 100 .167 .

N menos de 100 67 67

mas de 100 67 67

Variables introducidas/eliminadas

Model

o

Variables

introducidas

Variables

eliminadas

Método

1 mas de 100 a . Introducir

a. Todas las variables solicitadas introducidas.

b. Variable dependiente: menos de 100

Resumen del modelo

Model

o R R cuadrado R cuadrado

corregida

Error típ. de la

estimación

1 .120a .014 .000 107.31146

a. Variables productoras: (Constante), mas de 100

Resumen del modelo

Model

o

Estadísticos de cambio

Cambio en R

cuadrado

Cambio en F gl1 gl2 Sig. Cambio en

F

1 .014 .950 1 65 .333

ANOVAb

Modelo Suma de

cuadrados

gl Media

cuadrática

F Sig.

1 Regresión 10939.720 1 10939.720 .950 .333a

Residual 748523.701 65 11515.749

Total 759463.421 66

a. Variables productoras: (Constante), mas de 100

b. Variable dependiente: menos de 100


Coeficientes

Modelo Coeficientes no estandarizados Coeficientes

tipificados

B Error típ. Beta t Sig.

1 (Constante) 87.635 15.209 5.762 .000

mas de 100 -.060 .061 -.120 -.975 .333

a. Variable dependiente: menos de 100

Coeficientes

Modelo Correlaciones

Orden cero Parcial Semiparcial

1 mas de 100 -.120 -.120 -.120

a. Variable dependiente: menos de 100

Estimación curvilínea

Notas


Comentarios




Filtro <ninguno>

Peso <ninguno>



trabajo

67

Tratamiento de los datos

perdidos

Definición de perdidos Los valores perdidos definidos por el

usuario se tratarán como perdidos.

Casos utilizados Los casos con un valor perdido en

cualquier variable no se utilizan en el

análisis.

Sintaxis CURVEFIT

/VARIABLES=export WITH import

/CONSTANT

/MODEL=LINEAR

/PLOT FIT.




Usar Desde Primera observación

Hasta Última observación

Pronóstico Desde Primera observación de acuerdo con

el período de uso

Hasta Última observación

Ajustes para las series

temporales (TSET)

Cantidad de resultados PRINT = DEFAULT

Guarda de nuevas

variables

NEWVAR = NONE

Número máximo de

retardos en los gráficos de

auto correlaciones o auto

correlaciones parciales

MXAUTO = 16

Número máximo de

retardos por gráficos de

correlaciones cruzadas

MXCROSS = 7

Número máximo de

variables nuevas

generadas por cada

procedimiento

MXNEWVAR = 60

Número máximo de casos

nuevos generados por

cada procedimiento

MXPREDICT = 1000

Tratamiento de los valores

perdidos definidos por el

usuario

MISSING = EXCLUDE

Valor del porcentaje para

los intervalos de confianza

CIN = 95

Tolerancia para la entrada

de variables en las

ecuaciones de regresión

TOLER = ,0001

Máximo cambio iterativo en

los parámetros

CNVERGE = ,001

Método para el cálculo de

los errores típicos de las

auto correlaciones

ACFSE = IND


Longitud del período

estacional

Sin especificar

Variable cuyos valores

etiquetan las

observaciones en los

gráficos

Sin especificar

Las ecuaciones incluyen CONSTANTE

Descripción del modelo

Nombre del modelo MOD_1

Variable dependiente 1 menos de 100

Ecuación 1 Lineal

Variable independiente mas de 100

Constante Incluidos

Variable cuyos valores

etiquetan las

observaciones en los

gráficos

Sin especificar

Resumen del procesamiento de los

casos

N

Total de casos 67

Casos excluidos 0

Casos pronosticados 0

Casos creados nuevos 0

a. Los casos con un valor perdido en

cualquier variable se excluyen del

análisis.

Resumen del procesamiento de las variables

Variables

Dependiente Independiente



Número de valores

positivos

66 67

Número de ceros 1 0

Número de valores

negativos

0 0

Número de valores

perdidos

Perdidos definidos por el

usuario

0 0

Perdidos del sistema 0 0

Resumen del modelo y estimaciones de los parámetros

Variable dependiente :menos de 100

Ecuaci

ón

Resumen del modelo Estimaciones de los parámetros

R cuadrado F gl1 gl2 Sig. Constante b1

Lineal .014 .950 1 65 .333 87.635 -.060

La variable independiente es mas de 100 .


Pruebas no paramétricas

Notas


Comentarios


estadistica ojos aja. sav


Filtro <ninguno>

Peso <ninguno>



trabajo

67

Manipulación de los valores

perdidos


usuario será tratados como perdidos.


Casos utilizados Los estadísticos para cada prueba se

basan en todos los casos con datos

válidos para las variables usadas en

dicha prueba.

Sintaxis NPAR TESTS

/CHISQUARE=export import

/EXPECTED=EQUAL

/STATISTICS DESCRIPTIVES

QUARTILES

/MISSING ANALYSIS.



Número de casos

permitidos

157286

a. Basado en la disponibilidad de memoria en el espacio de trabajo.


N Media Desviación

típica

Mínimo Máximo

menos de 100 67 80.1217 107.27079 .00 652.00

mas de 100 67 126.0319 215.95320 1.17 900.00


Percentiles

25 50 (Mediana) 75

menos de 100 20.0000 48.0000 98.0000

mas de 100 3.6800 50.0000 100.0000


Prueba de chi-cuadrado

Frecuencias

menos de 100

N observado N esperado Residual

.00 1 1.3 -.3

1.60 1 1.3 -.3

2.19 1 1.3 -.3

2.66 1 1.3 -.3

2.70 1 1.3 -.3

10.00 2 1.3 .7

12.00 3 1.3 1.7

13.00 1 1.3 -.3

14.00 1 1.3 -.3

15.00 1 1.3 -.3

18.00 1 1.3 -.3

20.00 3 1.3 1.7

22.00 2 1.3 .7

23.00 1 1.3 -.3

24.00 2 1.3 .7

25.00 4 1.3 2.7

27.00 2 1.3 .7

30.00 1 1.3 -.3

31.00 1 1.3 -.3

33.00 1 1.3 -.3

37.00 1 1.3 -.3

43.00 1 1.3 -.3

48.00 2 1.3 .7

51.00 1 1.3 -.3

55.00 2 1.3 .7

56.00 1 1.3 -.3

63.00 1 1.3 -.3

65.00 1 1.3 -.3

68.00 1 1.3 -.3

69.00 1 1.3 -.3

70.00 1 1.3 -.3

71.00 2 1.3 .7

84.00 1 1.3 -.3


94.00 1 1.3 -.3

97.00 2 1.3 .7

98.00 1 1.3 -.3

100.00 1 1.3 -.3

107.00 1 1.3 -.3

109.00 1 1.3 -.3

116.00 1 1.3 -.3

117.00 1 1.3 -.3

132.00 1 1.3 -.3

146.00 1 1.3 -.3

158.00 1 1.3 -.3

163.00 1 1.3 -.3

219.00 1 1.3 -.3

225.00 1 1.3 -.3

235.00 1 1.3 -.3

266.00 1 1.3 -.3

296.00 1 1.3 -.3

439.00 1 1.3 -.3

652.00 1 1.3 -.3

Total 67

mas de 100

N observado N esperado Residual

1.17 1 1.7 -.7

1.28 1 1.7 -.7

1.33 1 1.7 -.7

1.35 2 1.7 .3

1.40 1 1.7 -.7

1.50 1 1.7 -.7

1.56 1 1.7 -.7

1.59 1 1.7 -.7

1.59 1 1.7 -.7

1.94 1 1.7 -.7

2.70 2 1.7 .3

3.26 1 1.7 -.7


3.65 2 1.7 .3

3.68 1 1.7 -.7

4.00 1 1.7 -.7

4.22 1 1.7 -.7

4.68 1 1.7 -.7

5.52 1 1.7 -.7

5.67 1 1.7 -.7

8.32 1 1.7 -.7

9.52 2 1.7 .3

40.00 4 1.7 2.3

50.00 6 1.7 4.3

60.00 4 1.7 2.3

70.00 1 1.7 -.7

80.00 6 1.7 4.3

90.00 1 1.7 -.7

100.00 5 1.7 3.3

120.00 1 1.7 -.7

150.00 3 1.7 1.3

180.00 1 1.7 -.7

185.00 1 1.7 -.7

240.00 1 1.7 -.7

308.00 1 1.7 -.7

525.00 1 1.7 -.7

650.00 1 1.7 -.7

700.00 2 1.7 .3

770.00 1 1.7 -.7

789.00 1 1.7 -.7

900.00 1 1.7 -.7

Total 67

Estadísticos de contraste


Chi-cuadrado 16.045a 44.642b

gl 51 39

Sig. asintót. 1.000 .247

a. 52 casillas (100,0%) tienen frecuencias

esperadas menores que 5. La frecuencia de


casilla esperada mínima es 1,3.

b. 40 casillas (100,0%) tienen frecuencias

esperadas menores que 5. La frecuencia de

casilla esperada mínima es 1,7.

Prueba T

Notas


Comentarios


estadistica ojos aja. sav


Filtro <ninguno>

Peso <ninguno>



trabajo

25

Tratamiento de los valores

perdidos


usuario serán tratados como perdidos.

Casos utilizados Los estadísticos de cada análisis de

una lista se basan en los casos que

no tienen datos perdidos ni quedan

fuera de rango en cualquiera de las

variables de la lista.

Sintaxis T-TEST GROUPS=importa(2)

/MISSING=LISTWISE

/VARIABLES=expota

/CRITERIA=CI(.95).



Estadísticos de grupo

mas de N Media Desviación típ. Error típ. de la


100 media

menos de 100 >= 2,00 20 64.3981 84.64776 18.92782

< 2,00 5 165.6000 272.89247 122.04122

Prueba de muestras independientes

Prueba de Levene para la

igualdad de varianzas

Prueba T para la igualdad de

medias

F Sig. t gl

menos de 100 Se han asumido

varianzas iguales

9.646 .005 -1.473 23

No se han asumido

varianzas iguales

-.819 4.194


Prueba T para la igualdad de medias

Sig. (bilateral) Diferencia de

medias

Error típ. de la

diferencia

menos de 100 Se han asumido varianzas

iguales

.154 -101.20190 68.68492

No se han asumido

varianzas iguales

.457 -101.20190 123.50029


Prueba T para la igualdad de

medias

95% Intervalo de confianza para

la diferencia

Inferior Superior

menos de 100 Se han asumido varianzas

iguales

-243.28747 40.88367

No se han asumido

varianzas iguales

-437.92105 235.51725

estadistica exposicion

Education