estadistica descriptiva
TRANSCRIPT
REPÚBLICA BOLIVARIANA DE VENEZUELA
MINISTERIO DEL PODER POPULAR PARA LA DEFENSA
UNIVERSIDAD NACIONAL EXPERIMENTAL POLITÉCNICA
DE LA FUERZA ARMADA NACIONAL BOLIVARIANA
NÚCLEO MARACAY – SEDE MARACAY
DEPARTAMENTO DE POSTGRADO
CÁTEDRA TÉCNICAS CUANTITATIVAS DE GESTIÓN
ESTADÍSTICA DESCRIPTIVA
ING. MARLYN ROMERO.
ING. MAGALY ZAMBRANO.
ING. FELGRY MARTINEZ
ING. SIMÓN GUEVARA
TERMINO 1º
PERÍODO 3-2013
BOCA DE RIO, 14 DE OCTUBRE DE 2013
PROF: DR. EDGUIN VELIZ
INTRODUCCIÓN
La estadística es la ciencia que trata la teoría y aplicación de métodos
apropiados para coleccionar, representar, resumir y analizar datos, así como realizar
inferencias a partir de los mismos. A partir de esta definición, podemos considerar
dos partes o vertientes de la Estadística, en lo que se refiere fundamentalmente a su
enfoque, esta son la: Descriptiva e Inferencial.
La estadística descriptiva se define como la ciencia que sistematiza, recoge,
ordena y presenta los datos referentes a un asunto, fenómeno o problema de
investigación, sin pretender extender las conclusiones que puedan extraerse de los
datos a otros grupos distintos o más amplios. Se calcula a partir de los datos de una
muestra o de una población. Dentro de una investigación es importante establecer
cuál es la población y si de esta se ha tomado una muestra, cuando se trata de seres
vivos, en caso de objetos se debe establecer cuál será el objeto, evento o fenómeno a
estudiar.
Para realizar investigaciones exhaustivas sobre diferentes ámbitos surgen tres
problemas básicos a la hora del trabajo de campo, como el tiempo que tardaríamos en
entrevistar a toda la población y el costo económico y de personal de estas
entrevistas. Con las técnicas de muestreo se consigue hacer buenas investigaciones
sobre una pequeña parte de esa población, obteniendo resultados válidos para toda
ella. En los procesos estadísticos conocemos dos tipos de muestreo, el probabilístico
(aleatorio), en este tipo de muestreo, todos los individuos de la población pueden
formar parte de la muestra, tienen probabilidad positiva de formar parte de la muestra.
Por lo tanto es el tipo de muestreo que deberemos utilizar en nuestras investigaciones,
por ser el riguroso y científico y el no probabilístico en el cual puede haber clara
influencia de la persona o personas que seleccionan la muestra o simplemente se
realiza atendiendo a razones de comodidad. Salvo en situaciones muy concretas en la
que los errores cometidos no son grandes, debido a la homogeneidad de la población,
en general no es un tipo de muestreo riguroso y científico, dado que no todos los
elementos de la población pueden formar parte de la muestra.
ESTADÍSTICA
1.1. ORIGEN DE LA ESTADÍSTICA.
La estadística nació en épocas muy remotas; como todas las ciencias, no se creó
de improviso, sino mediante un proceso largo de desarrollo y evolución constante,
desde la simple recolección de datos hasta la diversidad y rigurosa interpretación de
los datos que se dan hoy en día
Desde que comenzó el proceso de civilización y desarrollo han existido formas
sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros
símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número
de personas, animales o cosas. Es una ciencia más antigua como lo es la escritura.
Se dice que las primeras manifestaciones de la estadística fueron 3050 a.C en
Egipto donde faraones lograron recopilar, datos relativos a la población y la riqueza
del país. Según el historiador griego Herodoto, dicho registro de riqueza y población
se hizo con el objetivo de preparar la construcción de las pirámides. También fueron
realizados censos con la finalidad de verificar un nuevo reparto.
Haciendo un resumen descriptivo de la evolución de la estadística tenemos lo
siguiente:
Los babilonios 3000 a.C, usaban pequeñas tablillas de arcilla para recopilar
datos sobre la producción agrícola y sobre los géneros vendidos o cambiados
mediante trueque.
En el antiguo Israel la Biblia da referencia del uso estadístico, principalmente
en los libros de Números y Crónicas que incluyen, en algunas partes, trabajos
de esta índole.
En China fueron efectuados censos de población, pues varios registros
numéricos con anterioridad al año 2000 a.C. dan fe de ello.
Los griegos realizaban censos periódicamente hacia 594 a. C., con fines
tributarios, sociales (división de tierras) y militares (cálculo de recursos y
hombres disponibles).
El Imperio romano, maestro de la organización política, fue el primer
gobierno que supo emplear los recursos de la estadística, mediante la
recopilación de una gran cantidad de datos sobre la población, superficie y
renta de todos los territorios bajo su control.
Durante los mil años siguientes a la caída del imperio Romano realizaron
operaciones sobre las relaciones de tierras pertenecientes a la Iglesia; en la
edad media sólo se realizaron algunos censos exhaustivos en Europa.
Así se fueron creando numeroso avances en la ciencia de la estadística, creándose
la estadística moderna, protagonizada por Ronald Arnold Fisher, pues la situó como
una poderosa herramienta para la planeación y análisis de experimentos.
1.2. IMPORTANCIA Y UTILIDAD DE LA ESTADÍSTICA.
En las últimas décadas, la estadística ha alcanzado un alto grado de desarrollo
hasta el punto de incursionar en todas las ciencias y ramas del saber, convirtiéndose
así, en un método efectivo para describir con exactitud los valores de datos
económicos, políticos, sociales, psicológicos, biológicos o físicos, y sirve como
herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico
no consiste ya sólo en reunir y tabular los datos, sino sobre todo en el proceso de
“interpretación” de esa información.
Puntos de importancia:
La estadística como ciencia que interviene en todas las ciencias.
Ciencia aplicada en el día a día de la vida cotidiana.
En aclarar incertidumbres e interrogantes ante cierta situación.
En la toma de decisiones con cierto grado de confianza.
Se emplea para mostrar los aspectos cuantitativos de una situación.
Describen con considerable precisión en el comportamiento global de
grandes conjuntos de sucesos particulares.
En la ciencia de la contabilidad la estadística es muy importante, pues se
aplica para seleccionar muestras, cuando se pretende hacer una auditoria;
también funciona para medir la variación de costos de producción.
Aumenta la credibilidad y confiabilidad de las investigaciones.
El mal uso o el abuso de la estadística, utilizando herramientas o modelos
inapropiados o razonamientos ilógicos y erróneos que conducen al fracaso de
la investigación.
Verificación de la información que sea utilizada para los modelos estadísticos
sean válidas.
1.3. CONCEPTO DE ESTADÍSTICA.
Entre los principales aspectos, antes de conceptualizar el término estadístico seria
describir su origen etimológico. El termino estadística proviene del término
alemán Statistik que se traduce como “La ciencia del Estado”, por lo que designaba
originalmente el análisis de datos del Estado. En el siglo XIX cuando el militar
británico Sir John Sinclair (1754-1835) introdujo al término estadística el significado
de recolectar y clasificar datos.
Entre los conceptos estudiados están:
La rama de las matemáticas que recopila, organiza, analiza e interpreta los
datos obtenidos de un problema estadístico, para obtener conocimiento de los
hechos pasados, para prever situaciones futuras y tomar decisiones en base a
las experiencias”.
Es un conjunto de métodos científicos ligados a la toma, organización,
recopilación, presentación y análisis de datos, tanto para la deducción de
conclusiones como para tomar decisiones razonables de acuerdo con tales
análisis.
Conjunto de métodos y técnicas que permiten la obtención, organización,
síntesis, descripción e interpretación de los datos para la toma de decisiones
en ambiente de incertidumbre.
Aunque existen diferencias en la manera como se puede definir la estadística,
todos los autores coinciden en que “consiste en reunir, recolectar e interpretar
datos”. Este aspecto en común se da precisamente porque la estadística tiene esa
finalidad, es decir que se utiliza con ese propósito.
1.4. USO DE LA ESTADÍSTICA.
Durante el siglo XX, la creación de instrumentos precisos para asuntos de salud
pública (epidemiología, bioestadística, etc.) y propósitos económicos y sociales (tasa
de desempleo, econometría, etc.) necesitó de avances sustanciales en las prácticas
estadísticas.
Hoy el uso de la estadística se ha extendido más allá de sus orígenes como un
servicio al Estado o al gobierno. Personas y organizaciones usan la estadística para
entender datos y tomar decisiones en ciencias naturales y sociales, medicina, negocios
y otras áreas. La estadística es entendida generalmente no como un sub-área de las
matemáticas sino como una ciencia diferente «aliada». Muchas universidades tienen
departamentos académicos de matemáticas y estadística separadamente. La
estadística se enseña en departamentos tan diversos como psicología, educación y
salud pública.
Al aplicar la estadística a un problema científico, industrial o social, se comienza
con un proceso o población a ser estudiado. Esta puede ser la población de un país, de
granos cristalizados en una roca o de bienes manufacturados por una fábrica en
particular durante un periodo dado. También podría ser un proceso observado en
varios ascos instantes y los datos recogidos de esta manera constituyen una serie de
tiempo.
Por razones prácticas, en lugar de compilar datos de una población entera,
usualmente se estudia un subconjunto seleccionado de la población, llamado muestra.
Datos acerca de la muestra son recogidos de manera observacional o experimental.
Los datos son entonces analizados estadísticamente lo cual sigue dos propósitos:
descripción e inferencia.
El concepto de correlación es particularmente valioso. Análisis estadísticos de un
conjunto de datos puede revelar que dos variables (esto es, dos propiedades de la
población bajo consideración) tienden a variar conjuntamente, como si hubiera una
conexión entre ellas. Por ejemplo, un estudio del ingreso anual y la edad de muerte
podrían resultar en que personas pobres tienden a tener vidas más cortas que personas
de mayor ingreso. Las dos variables se dicen que están correlacionadas. Sin embargo,
no se puede inferir inmediatamente la existencia de una relación de causalidad entre
las dos variables. El fenómeno correlacionado podría ser la causa de una tercera,
previamente no considerada, llamada variable confusora.
Si la muestra es representativa de la población, inferencias y conclusiones hechas
en la muestra pueden ser extendidas a la población completa. Un problema mayor es
el de determinar qué tan representativa es la muestra extraída. La estadística ofrece
medidas para estimar y corregir por aleatoriedad en la muestra y en el proceso de
recolección de los datos, así como métodos para diseñar experimentos robustos como
primera medida.
El concepto matemático fundamental empleado para entender la aleatoriedad es el
de probabilidad. La estadística matemática (también llamada teoría estadística) es la
rama de las matemáticas aplicadas que usa la teoría de probabilidades y el análisis
matemático para examinar las bases teóricas de la estadística.
El uso de cualquier método estadístico es válido solo cuando el sistema o
población bajo consideración satisface los supuestos matemáticos del método. El mal
uso de la estadística puede producir serios errores en la descripción e interpretación,
afectando las políticas sociales, la práctica médica y la calidad de estructuras tales
como puentes y plantas de reacción nuclear.
Incluso cuando la estadística es correctamente aplicada, los resultados pueden ser
difícilmente interpretados por un inexperto. Por ejemplo, el significado estadístico de
una tendencia en los datos, que mide el grado al cual la tendencia puede ser causada
por una variación aleatoria en la muestra, puede no estar de acuerdo con el sentido
intuitivo. El conjunto de habilidades estadísticas básicas (y el escepticismo) que una
persona necesita para manejar información en el día a día se refiere como “cultura
estadística”.
POBLACIÓN Y MUESTRA
2.1. POBLACIÓN
El conjunto de datos de los cuales se ocupa un determinado estudio estadístico se
llama población y estás íntimamente ligado a lo que se pretende estudiar. Los
estadísticos usan la palabra población para referirse no sólo a personas sino a todos
los elementos que han sido escogidos para su estudio.
Desde el punto de vista estadístico, una población o universo puede estar referido
a cualquier conjunto de elementos de los cuales se pretende indagar y conocer sus
características, o una de ellas, y para el cual serán válidas las conclusiones obtenidas
en la investigación. También se puede definir como el conjunto de datos acerca de
unidades de análisis (individuos, objetos) en relación a una misma característica,
propiedad o atributo (variable).
La población en sentido demográfico, es un conjunto de individuos (todos los
habitantes de un país). Además, se estudia la estructura interna, la dinámica y su
distribución sobre el espacio de las poblaciones humanas y las leyes que rigen estos
fenómenos.
Algunos autores han manifestado diversas definiciones referidas a la población,
expresadas de la siguiente manera:
“Es un conjunto finito o infinito de elementos con características comunes para
los cuales serán extensivas las conclusiones de la investigación. Está queda
delimitada por problema y por los objetivos del estudio”. (Arias, 2006:81).
“El conjunto formado por todos los valores posibles que puede asumir la
variable objeto de estudio.” (Lincoln, 1993:12)
“El conjunto de unidades o individuos que satisfacen una definición común y
constituyen la colectividad por la cual nos interesamos”. (Morice, 1794:135).
2.2. TIPOS DE POBLACIONES.
Cuando se realiza una investigación, debemos escoger el tipo de población que
ayude a determinar el número de unidades que la conforman, con la finalidad de
extraer conclusiones generadas por el objeto de estudio.
Según Fidias (citado por Sierra, 1991), distingue los tipos de población de dos
formas:
2.2.1. POBLACIÓN FINITA:
“Agrupación en la que se conoce la cantidad de unidades que la integran.
Además, existe un registro documental de dichas unidades. Desde el punto de vista
estadístico, una población finita es la constituida por un número inferior a cien mil
unidades”.
2.2.2. POBLACIÓN INFINITA:
“Es aquella en la que se desconoce el total de elementos que la conforman; por
cuanto no existe un registro documental de éstos debido a que su elaboración sería
prácticamente imposible. En la disciplina estadística, se considera una población
infinita a la conformada por cien mil unidades o más”.
2.3. MUESTRA
La muestra estadística es una parte de la población, o sea, un número de
individuos u objetos seleccionados científicamente, cada uno de los cuales es un
elemento del universo. La muestra descansa en el principio de que las partes
representan al todo; reflejando las características que definen la población de la que
fue extraída.
Entre las definiciones de muestras se encuentran:
“Se refiere al grupo de unidades extraídas de una población, definida
previamente, de acuerdo con un plan de sondeo dado y sobre las cuales se realizarán
las observaciones previstas en la encuesta”. (Morice, 1994:135).
“Es cualquier subconjunto de la población, escogido al seguir ciertos criterios
de selección”. (Shao, 1993:12)
“Un subconjunto representativo y finito que se extrae de la población
accesible”. (Arias, 2006:83).
2.3.1. RAZONES PARA EL USO DE UNA MUESTRA
Existen algunas razones, que pueden ser usadas por el investigador para aplicar
una muestra. Entre los atributos que caracterizan la muestra, se encuentran los
siguientes:
• Cuando la población es grande, o infinitas es imposible analizar en su totalidad, ya
que los elementos no presenta las mismas características.
• Reduce el costo, al estudiar una pequeña parte de la población los gastos que son
utilizados para el tratamiento de los datos serán menores, que si se trabaja con el total
de la población. Una muestra puede suministrar datos de precisión suficiente y a
mucho menor costo si la comparamos con un censo.
• Rapidez, al reducir el tiempo que se utilizará para aplicar y recoger el tratamiento de
los datos. Una muestra proporciona información más rápida por dos razones
importantes. Primero, generalmente un muestreo toma menos tiempo para terminarse
que un censo debido a que es una tarea de menor escala. Segundo, la clasificación,
codificación, y tabulación de los resultados de la encuesta generalmente toman menos
tiempo para una muestra que para un censo y con el uso de las computadoras este
proceso se hace más rápido.
Cualquier encuesta proporciona información útil solamente después de que los
datos han sido recopilados y tabulados. Es por esto que resulta tan importante el
tiempo requerido para tabular los resultados al considerar la oportunidad de la
información de la muestra y del censo.
• Confiabilidad y control, la elección de una muestra permite la realización de
estudios que serían imposible hacerlo sobre el total de la población, ya que se obtiene
una mejor información y es posible cuidar más la precisión de la observación o
medida de cada elemento.
2.4. SELECCIÓN DE LA MUESTRA
Para seleccionar una muestra lo primero que hay que definir es la unidad de
análisis (personas, organizaciones, periódicos, situaciones, eventos). El sobre qué o
quiénes se van a recolectar datos depende del planteamiento del problema a investigar
y de los alcances del estudio. Estas acciones nos llevaran al siguiente paso, que
consiste en delimitar una población. Una deficiencia que se presenta en algunos
trabajos de investigación es que no describen lo suficiente las características de la
población o considera que la muestra la representa de manera automática.
Es preferible entonces establecer con claridad las características de la población, con
la finalidad de delimitar cuáles serán los parámetros muestrales.
Un estudio no será mejor por tener una población más grande; la calidad de un trabajo
investigativo estriba en delimitar claramente la población con base en el
planteamiento del problema.
2.4.1. VARIABLES DE LAS QUE DEPENDE EL TAMAÑO DE LA
MUESTRA
Suponiendo que la muestra es la adecuada, el tamaño necesario de la muestra
para poder extrapolar los resultados a la población depende básicamente de tres
variables:
1) El nivel de confianza o riesgo que aceptamos de equivocarnos al presentar
nuestros resultados: lo que deseamos es que en otras muestras semejantes los
resultados sean los mismos o muy parecidos.
El nivel de confianza va a entrar en la fórmula para determinar el número de
sujetos con un valor de zeta, que en la distribución normal está asociado a una
determinada probabilidad de ocurrencia.
2) La varianza (o diversidad de opiniones…) estimada en la población. Esta
diversidad en la población es la diversidad estimada; si la conociéramos
(cuántos van a decir que sí y cuántos van a decir que no) en primer lugar no
necesitaríamos hacer la encuesta.
Si sabemos de antemano que todos piensan lo mismo (aunque no sabemos qué
piensan y por eso lo preguntamos), nos bastará preguntar a un solo sujeto,
pero si las opiniones pueden ser muy distintas nos harán falta más sujetos. A
mayor diversidad esperada, o al menos posible, en las opiniones o posibles
respuestas en la población hará falta un mayor número de sujetos en la
muestra.
3) El margen de error que estamos dispuestos a aceptar.
Si por ejemplo el 20% de la muestra está de acuerdo con una proposición (o
dice que va votar a un determinado candidato o que prefiere un determinado
producto) eso no significa que el 20% exacto de la población vaya a responder
lo mismo, puede ser el 22% o el 18%…necesitaremos muestras mayores si
queremos que el margen de error o de oscilación de muestra a muestra de los
resultados sea muy pequeño (el resultado exacto lo tendríamos si respondiera
el 100% y la muestra coincidiera con la población).
Esto puede ser más o menos importante según la situación; el margen de error
en sondeos pre-electorales es, por ejemplo, muy importante y este margen de
error suele ponerse en torno a un 3%.
2.5. ¿CÓMO CALCULAR EL TAMAÑO DE LA MUESTRA?
Vamos a distinguir entre poblaciones infinitas (de tamaño muy grande,
indefinido, cuyo Tamaño exacto podemos desconocer) y poblaciones finitas (tamaño
más reducido y que conocemos).
En la práctica disponemos de tablas en numerosos textos y de programas de
Internet en los que podemos ver con toda facilidad el tamaño necesario de la muestra
en función del tamaño de la población, del nivel de confianza y del margen de error
tolerado; también es muy utilizar las fórmulas porque nos hacen ver cómo se
relacionan las variables que condicionan el tamaño de la muestra.
2.5.1. EN EL CASO DE POBLACIONES INFINITAS (TAMAÑO GRANDE,
INDEFINIDO…)
FÓRMULAS PARA DETERMINAR EL TAMAÑO DE LA MUESTRA:
Para extrapolar a poblaciones muy grandes utilizamos la fórmula [1] para obtener
el tamaño de la muestra:
Z2pq
n=---------------
e2
LEYENDA
z = Valor de z correspondiente al nivel de confianza; Un nivel de confianza del 95%
corresponde a z = 1.96.
Con z = 2.57 el nivel de confianza sube al 99% (nos equivocaríamos una vez de cada
100),
K 1,15 1,28 1,44 1,65 1,96 2 2,58
Nivel de confianza 75% 80% 85% 90% 95% 95,5% 99%
Pq = Varianza de la población:
Como la varianza de la población la desconocemos, ponemos la varianza mayor
posible Porque a mayor varianza hará falta una muestra mayor.
p = proporción de respuestas en una categoría.
q = proporción de repuestas en la otra categoría igual a pq y la varianza mayor (la
mayor diversidad de respuestas) se da cuando p = q = 0.50 (la mitad de los sujetos
responde sí y la otra mitad responde no) por lo que en esta fórmula pq es siempre
igual a (0.50). (0.50) = .25 (es una constante).
e = Error muestral:
Lo representamos con la letra e que significa error o desviación posible cuando
extrapolemos los resultados. Es el margen de error que aceptamos.
Ejemplo: Si el margen de error es 3.16%, en la fórmula pondremos e = 0.0316. Si
dice que sí un 64.3% en la muestra, entendemos que dice que sí en la población entre
un (64.3 - 3.16) % y un (64.3 + 3.16) %.
Por ejemplo ¿qué muestra necesitaremos con un nivel de confianza del 95% al
que corresponde z = 1.96, y admitiendo un margen de error del 5%? .Ya sabemos que
pq =0 .25.
Z2pq
n=_____________
e2
(1.96)2. 0.25
n=_______________= 384 es el tamaño de muestra
(0.05)2
2.5.2. EN EL CASO DE POBLACIONES FINITAS (TAMAÑO CONOCIDO,
PEQUEÑO)
Fórmula para determinar el tamaño de la muestra
Cuando conocemos el tamaño de la población, la muestra necesaria es más
pequeña y su Tamaño se determina mediante la fórmula:
n=______N_____
1+ e2(N-1)
______
Z2pq
LEYENDA:
n = tamaño de la muestra que deseamos conocer
N = tamaño conocido de la población,
E, z y pq como antes.
EJEMPLO:
Por ejemplo: deseamos hacer un sondeo de opiniones en un centro escolar que
tiene 600 alumnos. En este caso N = 600; es el tamaño de la población que ya
conocemos. Nuestro nivel de confianza va a ser del 95%, por lo tanto z = 1.96.
Y como no queremos un error mayor del 3%, tenemos que e = 0.03. A falta de otros
datos y para mayor seguridad suponemos que pq = (0.50) (0.50) =0 .25. La muestra
necesaria será:
n=______N_____
1+ e2 (N-1)
______
Z2pq
n=______600_______
1+ 0.032(600-1)
__________
1.9620.25
n= 384; necesitamos por lo tanto una muestra de 384 sujetos.
TIPOS DE MUESTREO
Las técnicas de tomar un muestreo se pueden dividir en dos tipos generales:
muestreo probabilístico y muestreo determinístico.
El muestreo probabilístico es un muestreo en el cual todos los elementos de la
población tienen posibilidad de ser seleccionados. Se debe mencionar que no es
necesario que la posibilidad sea igual, porque se puede especificar la posibilidad de
seleccionar algunos elementos de la población y estimar la posibilidad de que un
elemento de la población sea seleccionado. No hay manera de asegurar que el
muestreo sea representativo. Todas las técnicas muéstrales determinísticas están
basadas en el juicio personal del investigador. En efecto, es posible que estos juicios
personales sean una buena estimación de las características de la población, pero los
modelos determinísticos de muestreo no permiten evaluar su grado de exactitud.
Hay otros tipos de muestreo que el investigador debe conocer y seleccionar para
el tipo de muestreo que desea usar.
El muestreo fijo implica un muestreo de tamaño constante que se determinó antes
de recopilar datos; mientras que en el muestreo secuencial, el tamaño de muestreo no
es fijo, y se recopilan datos secuencialmente, o sea después de la recopilación de
datos, si no se logró suficiente evidencia para tomar decisiones necesarias con las
informaciones que se tienen, continuarán recopilándose más datos; una vez más se
verificará si se obtuvo suficiente evidencia; si no, se continuarán recopilando datos
hasta que se llegue a un punto en que se encuentre la evidencia necesaria para la toma
de decisión.
El muestreo puede ser sin reemplazo o con reemplazo. En el muestreo sin
reemplazo cada elemento muestral de la población tiene una sola oportunidad de ser
seleccionado, mientras que en el muestreo con reemplazo cada elemento muestral de
la población puede ser elegido varias veces.
Las técnicas para tomar un muestreo en su clasificación amplia (probabilísticas y
determinística) se pueden dividir en otros tipos; por ejemplo, el muestreo
determinístico puede ser convencional, intencional y de cuota; el muestreo
probabilístico se divide en: muestreo aleatorio simple, muestreo estratificado
(proporcional y desproporcional) y muestreo por grupos (sistemático o por área).
3.1. MUESTREO DETERMINÍSTICO.
Por lo general, el muestreo determinístico implica un juicio personal, algunas veces el
del investigador, y otras el del recopilador de datos.
3.2. MUESTREO CONVENCIONAL O ACCIDENTAL.
El muestreo convencional se refiere a recopilar datos de los sujetos de estudio
más convenientes, o sea, recopilar datos de los elementos muestrales de la población
que más convengan. Un ejemplo muy popular es entrevistar a cualquier persona que
pase por la calle, y pedirle su opinión respecto a, por ejemplo, algún tema político de
actualidad, o que algunos investigadores pidan a los alumnos de un salón que
contesten cierto cuestionario.
Este muestreo es muy rápido y cuesta poco, pero también tiene ciertas
deficiencias. La opinión de los alumnos de un salón o de cualquier persona, no puede
ser representativa de la población en estudio. Este tipo de muestreo es recomendable
solamente en el proceso de un estudio exploratorio que trata de definir el camino de la
investigación.
3.3. MUESTREO INTENCIONAL.
En el muestreo intencional todos los elementos muestrales de la población serán
seleccionados bajo estricto juicio personal del investigador. En este tipo de muestreo
el investigador tiene previo conocimiento de los elementos poblacionales.
Aunque este muestreo es subjetivo, requiere que el investigador conozca los
elementos muestrales, lo que permite que el muestreo sea representativo.
3.4. CONCEPTOS BÁSICOS DE MUESTREO PROBABILÍSTICO.
Para facilitar el entendimiento del proceso de muestreo probabilístico, es
conveniente recordar ciertos conceptos estadísticos.
Si en lugar de tomar un muestreo se estudian todos los miembros de la población
(censo), a las características estudiadas o valores obtenidos se les conoce como
parámetros; por definición, los parámetros tienen un valor fijo o constante. Si se
seleccionan unos miembros de la población (muestreo) y se estudian los datos
obtenidos, se llama estadística y sirve para hacer inferencias a los parámetros. El
valor que toman las estadísticas varía de muestreo a muestreo. Como se mencionó,
los parámetros son fijos para distinguir diferentes poblaciones. Suponga que la
compañía X quiere conocer la tendencia política de sus empleados de nivel ejecutivo
y que tiene 20 empleados en este nivel, la tabla proporciona datos como ingreso,
experiencia y su afiliación a dos partidos políticos, X y Y. Se puede calcular el
promedio de ingreso semanal, la dispersión de la variable de experiencia, la
proporción de miembros de cada partido político, etcétera. Estas cantidades son fijas
en valores; si se levanta un censo, simplemente se pueden calcular estos parámetros.
En lugar de levantar un censo, usualmente se toma un muestreo y se utilizan
valores calculados en el muestreo para estimar los parámetros (valores para la
población).
Para calcular las estadísticas (los valores del muestreo) se usan las mismas
fórmulas que se utilizan para estimar los parámetros; se debe saber que el valor
estadístico depende de diferentes muestreos seleccionados de una población, es decir,
que de una población se pueden tomar diferentes muestreos, cada uno con diferentes
estadísticas y estimaciones.
Se va a considerar todo posible muestreo que se puede tomar de la población de
nuestro ejemplo (ejecutivos en la compañía X) con un muestreo de tamaño 2 (n = 2)
con el método aleatorio simple. Sin reemplazo, hay 190 combinaciones de 20
empleados tomándolos de 2 en 2, y para cada combinación se puede calcular el
promedio muestral de ingreso, por ejemplo, el muestreo AB, XI = (5,600 + 6,000) 2 =
5,800).
ÁREAS DE LA ESTADÍSTICA
Describiremos brevemente cada una de las áreas en que puede dividirse la
estadística:
Diseño: Planeamiento y desarrollo de investigaciones.
Descripción: Resumen y exploración de datos.
Inferencia: Hacer predicciones o generalizaciones acerca de características de
una población en base a la información de una muestra de la población.
4.1. DISEÑO
Es una actividad crucial. Consiste en definir como se desarrollará la
investigación para dar respuesta a las preguntas que motivaron la misma. La
recolección de los datos requiere en general de un gran esfuerzo, por lo que, dedicar
especial cuidado a la etapa de planificación de la investigación ahorra trabajo en las
siguientes etapas. Un estudio bien diseñado resulta simple de analizar y las
conclusiones suelen ser obvias. Un experimento pobremente diseñado o con datos
inapropiadamente recolectados o registrados puede ser incapaz de dar respuesta a las
preguntas que motivaron la investigación, más allá de lo sofisticado que sea el
análisis estadístico.
Aún en los casos en que se estudian datos ya registrados, en que estamos
restringidos a la información existente, los principios del buen diseño de
experimentos, pueden ser útiles para ayudar a seleccionar un conjunto razonable de
datos que esté relacionado con el problema de interés.
4.2. DESCRIPCIÓN
Los métodos de la Estadística Descriptiva o Análisis Exploratorio de Datos
ayudan a presentar los datos de modo tal que sobresalga su estructura. Hay varias
formas simples e interesantes de organizar los datos en gráficos que permiten detectar
tanto las características sobresalientes como las características inesperadas. El otro
modo de describir los datos es resumirlos en uno o dos números que pretenden
caracterizar el conjunto con la menor distorsión o pérdida de información posible.
Explorar los datos, debe ser la primera etapa de todo análisis de datos. ¿Por qué
no analizarlos directamente? En primer lugar porque las computadoras no son
demasiado hábiles (sólo son rápidas), hacen aquello para lo que están programadas y
actúan sobre los datos que les ofrecemos. Datos erróneos o inesperados serán
procesados de modo inapropiado y ni usted, ni la computadora se darán cuenta a
menos que realice previamente un análisis exploratorio de los datos.
4.3. INFERENCIA
Inferencia Estadística hace referencia a un conjunto de métodos que permiten
hacer predicciones acerca de características de un fenómeno sobre la base de
información parcial acerca del mismo. Los métodos de la inferencia nos permiten
proponer el valor de una cantidad desconocida (estimación) o decidir entre dos
teorías contrapuestas cuál de ellas explica mejor los datos observados (test de
hipótesis).
El fin último de cualquier estudio es aprender sobre las poblaciones. Pero es
usualmente necesario, y más práctico, estudiar solo una muestra de cada una de las
poblaciones.
Definimos:
POBLACIÓN ⇒ total de sujetos o unidades de análisis de interés en el estudio
MUESTRA ⇒ cualquier subconjunto de los sujetos o unidades de análisis de la
población, en el cual se recolectarán los datos.
Usamos una muestra para conocer o estimar características de la población,
denominamos:
PARÁMETRO ⇒ una medida resumen calculada sobre la población.
ESTADÍSTICO ⇒ una medida resumen calculada sobre la muestra.
La calidad de la estimación puede ser muy variada, y generalmente las
estimaciones estadísticas son erróneas, en el sentido que no son perfectamente
exactas. La ventaja de los métodos estadísticos es que aplicados sobre datos
obtenidos a partir de muestras aleatorias permiten cuantificar el error que podemos
cometer en nuestra estimación o calcular la probabilidad de cometer un error al tomar
una decisión en un test de hipótesis.
Finalmente, cuando existen datos para toda la población (CENSO) no hay
necesidad de usar métodos de estadística inferencial, ya que es posible calcular
exactamente los parámetros de interés. En el censo poblacional, por ejemplo, se
registra el sexo de todas las personas censadas, que son prácticamente toda la
población, así que es posible conocer exactamente la proporción de habitantes de los
dos sexos.
TIPOS DE ESTADÍSTICAS
La estadística es una técnica basada en la recolección, recuento, clasificación, e
interpretación de un conjunto de datos obtenidos a partir de la observación, con el
propósito de poder llevar a cabo comparaciones y realizar estimaciones.
Existen distintos tipos de estadística:
5.1. DESCRIPTIVA O DEDUCTIVA:
Esta clase de estadística se utiliza con el propósito de recolectar, describir y
resumir un conjunto de datos obtenidos. Estos pueden visualizarse de manera
numérica y gráfica. Sin embargo, su uso se acota sólo al uso de la información
obtenida. Es decir, que a partir de loa misma no se puede realizar ningún tipo de
generalización.
5.2. INFERENCIAL O INDUCTIVA:
De manera contraria a la anterior, esta clase de estadística tiene la particularidad
de que a partir de los datos muestrales que maneja, es posible realizar conclusiones y
predicciones que incluyan a toda la población. Es decir, que los resultados obtenidos
a partir del análisis y conclusión podrán ser extrapolados, y de esta forma realizar un
pronóstico inclusivo. Las inferencias pueden presentarse a través de respuestas a
preguntas del tipo si/no, relaciones entre una serie de variables, estimaciones
numéricas, entre otras.
5.3. APLICADA:
Está conformada por las dos clases de estadísticas anteriores. Su objetivo
consiste en deducir resultados sobre un universo, a partir de una muestra determinada.
Este tipo de estadística puede ser aplicada en cualquier área que no pertenezca a ella,
tal como historia, psicología, etc.
5.4. ESTADÍSTICA MATEMÁTICA:
Se refiere al empleo de la estadística pero desde un punto de vista formal, a
través del uso de distintas ramas propias de la matemática y de la teoría de la
probabilidad. Su uso es necesario debido a que los datos que maneja la estadística
matemática son aleatorios e inciertos.
ESTADÍSTICA DESCRIPTIVA
Se refiere a la recolección, presentación, descripción, análisis e interpretación de
una colección de datos, esencialmente consiste en resumir éstos con uno o dos
elementos de información (medidas descriptivas) que caracterizan la totalidad de los
mismos. La estadística descriptiva es el método de obtener de un conjunto de datos
conclusiones sobre sí mismos y no sobrepasan el conocimiento proporcionado por
éstos.
Puede utilizarse para resumir o describir cualquier conjunto ya sea que se trate de
una población o de una muestra, cuando en la etapa preliminar de la Inferencia
Estadística se conocen los elementos de una muestra
6.1. TIPOS DE VARIABLES
Como se ilustra en la figura, existen dos tipos de datos: categóricos (o cualitativos) y
numéricos (cuantitativos).
A. Los datos CATEGÓRICOS O CUALITATIVOS representan categorías o
atributos (como, por ejemplo, "sí" o "no") que pueden clasificarse como un
criterio o cualidad.
B. Los datos NUMÉRICOS O CUANTITATIVOS producen respuestas
numéricas, como el peso en kilogramos o el número de universidades que hay
en la Costa Atlántica. Estos datos son de dos tipos; discretos y continuos.
Los DATOS DISCRETOS producen respuestas numéricas que
surgen de un conteo.
Los DATOS CONTINUOS producen respuestas numéricas que
surgen de proceso de medición, donde la característica de que se mide
puede tomar cualquier valor numérico en un intervalo.
6.2. ORGANIZACIÓN DE DATOS MEDIANTE TABLAS.
En esta forma de organización de datos es importante el concepto de frecuencia
de un dato.
La frecuencia (absoluta) de un dato, simbolizado con la letra f, es el número de
veces que aparece ese dato en una colección de datos.
Ejemplo: En el conjunto de datos 4 5 5 3 2 6 7 7 7 2, el cuatro sólo aparece una
vez (por lo tanto, tiene frecuencia f = 1), el cinco aparece dos veces (o sea, frecuencia
f = 2), el 7 tiene frecuencia f = 3, etc.
6.3. PRESENTACIÓN DE DATOS CATEGÓRICOS
6.3.1. TABLA DE FRECUENCIAS.
El modo más simple de presentar datos categóricos es por medio de una tabla de
frecuencias. Esta tabla indica el número de unidades de análisis que caen en cada una
de las clases de la variable cualitativa.
Consideremos los casos de meningitis notificados durante el año 2000 al
SI.NA.VE (Argentina) clasificados según tipo de meningitis.
La primer y segunda columna de la Tabla 1 muestran las categorías de la variable
(tipo de meningitis y la sigla correspondiente), la tercer columna presenta el número
de casos de meningitis de cada tipo notificados, es decir la frecuencia o frecuencia
absoluta, en tanto que la última columna presenta la frecuencia relativa o el
porcentaje de casos notificados de cada tipo de meningitis. Por ejemplo, la frecuencia
relativa de la categoría BSA se calcula del siguiente modo:
La representación gráfica de una distribución de frecuencias puede realizarse a
través de un gráfico de barras o de un gráfico de tortas. A continuación se presentan
ambos métodos.
6.3.1.1. GRÁFICO DE BARRAS.
Este gráfico es útil para representar datos categóricos nominales u ordinales. A
cada categoría o clase de la variable se le asocia una barra cuya altura representa la
frecuencia o la frecuencia relativa de esa clase. Las barras difieren sólo en altura, no
en ancho.
La escala en el eje horizontal es arbitraria y en general, las barras se dibujan
equiespaciadas, por esta razón este tipo de gráfico sólo debe usarse para variables
categóricas.
Es importante que el eje vertical comience en cero, de modo que no se exageren
diferencias entre clases. En un gráfico de barras, así como en cualquier tipo de gráfico
se debe indicar el número total de datos ya que el gráfico sólo muestra porcentajes o
frecuencias relativas y la fuente de la que se obtuvieron los mismos.
Cuando se desea comparar dos o más distribuciones cualitativas, el modo más
sencillo de representación es el gráfico de barras combinadas. En la Figura 2 se
presentan las distribuciones de casos notificados de meningitis en Argentina para los
años 1999 y 2000.
6.3.1.2. GRÁFICO DE TORTAS
En este gráfico, ampliamente utilizado, se representa la frecuencia relativa de
cada categoría como una porción de un círculo, en la que el ángulo se corresponde
con la frecuencia relativa correspondiente. Como en todo gráfico es importante
indicar el número total de sujetos.
Esta representación gráfica es muy simple y permite comparar la distribución de
una variable categórica en 2 o más grupos.
Las Figura 3 muestra los datos sobre meningitis presentados en la Figura 2.
6.3.1.3. ¿CUÁL PREFERIR: GRÁFICO DE BARRAS O DE TORTAS?
La información que brindan los dos tipos de gráficos es equivalente, sin
embargo, el gráfico de barras resulta más natural para comparar las distribuciones de
dos grupos, debido a que nuestro ojo percibe mejor diferencias en longitudes que en
ángulos. Por otra parte, en el gráfico de barras todas las barras comienzan al mismo
nivel, lo que facilita la comparación.
CONCLUSIÓN
Después de haber realizado el análisis referido a los aspectos básicos del estudio de la
estadística descriptiva para la elaboración de los procesos logísticos, se llegó a las
siguientes conclusiones:
Toda investigación o análisis que se lleve a cabo tiene que tratarse dentro de
una población como conjunto total de las personas o elementos que se desea
estudiar. Para facilitar de modo práctico el estudio, por cuanto se recurre a
seleccionar una muestra, que como subconjunto de la población se procura
que sea representativa.
En todas las investigaciones se utiliza el muestreo, cuando no es posible
contar o medir los elementos de la población.
El muestreo es una herramienta de la investigación científica. Su función
básica es determinar que parte de una realidad en estudio (población o
universo) debe examinarse, con la finalidad de hacer inferencias sobre dicha
población.
La estadística descriptiva es el método de obtener de un conjunto de datos
conclusiones sobre sí mismos y no sobrepasan el conocimiento proporcionado
por éstos.
RECOMENDACIONES
Aplicar las técnicas básicas de muestras y población a todas aquellas investigaciones
cuya naturaleza requiere de la aplicación de herramientas estadísticas.
Es indispensable que el investigador utilice el muestreo, ya que es imposible
entrevistar a todos los miembros de una población debido a problemas de
tiempo, recursos y esfuerzo.
En el momento de seleccionar el tamaño adecuado de la muestra, los
investigadores deben asegurarse que ésta sea pequeña, ya que si se toma una
muestra más grande esto constituye una pérdida de tiempo y dinero, además
seria engorroso a la hora de obtener la información.
A la hora de aplicar alguna técnica estadística se debe seleccionar el modelo o
diseño que mejor se adapte a las necesidades de la investigación.
Utilizar un procedimiento válido mediante el uso de los datos suministrados
por la muestra con el objeto de estimar parámetros poblacionales.
BIBLIOGRAFÍA
ARIAS, Fidias. (2006). Proyecto de investigación. Introducción a la Metodología
Científica. (Quinta Edición). Caracas: Editorial Epitesme, C.A
HERNÁNDEZ, R, FERNÁNDEZ, C y BAPTISTA, P. (2003). Metodología de la
Investigación (Tercera Edición). México: Editorial MC.GRAW- HILL.
KAZMIER, L. y DÍAZ, A. (1993). Estadística Aplicada a la Administración y a la
Economía. (Segunda Edición). México: Editorial MC.GRAW- HILL.
LEVIN, RICHAR. (1998). Estadística para Administradores. (Segunda Edición).
México: Prentice – Hall – Hispanoamérica, S.A
MASON R, LIND, D Y MARCHAL, W. (2000).Estadística para Administración y
Economía. (Décima Edición). México: Alfaomega.
MORICE, E. (1974). Diccionario de Estadística. (Primera Edición). México:
Compañía Editorial Continental, S.A.
NETER, JOHN. (1970).Fundamentos de Estadística Aplicada a los Negocios.
México. Compañía Continental.
SABINO, Carlos. (2002). El proceso de Investigación. (Nueva Edición
Actualizada).Caracas: Editorial Panapo de Venezuela.
SHAO, Stephen. (1971). Estadística para Economistas y Administradores