estadistica descriptiva

REPÚBLICA BOLIVARIANA DE VENEZUELA

MINISTERIO DEL PODER POPULAR PARA LA DEFENSA

UNIVERSIDAD NACIONAL EXPERIMENTAL POLITÉCNICA

DE LA FUERZA ARMADA NACIONAL BOLIVARIANA

NÚCLEO MARACAY – SEDE MARACAY

DEPARTAMENTO DE POSTGRADO

CÁTEDRA TÉCNICAS CUANTITATIVAS DE GESTIÓN

ESTADÍSTICA DESCRIPTIVA

ING. MARLYN ROMERO.

ING. MAGALY ZAMBRANO.

ING. FELGRY MARTINEZ

ING. SIMÓN GUEVARA

TERMINO 1º

PERÍODO 3-2013

BOCA DE RIO, 14 DE OCTUBRE DE 2013

PROF: DR. EDGUIN VELIZ

INTRODUCCIÓN

La estadística es la ciencia que trata la teoría y aplicación de métodos

apropiados para coleccionar, representar, resumir y analizar datos, así como realizar

inferencias a partir de los mismos. A partir de esta definición, podemos considerar

dos partes o vertientes de la Estadística, en lo que se refiere fundamentalmente a su

enfoque, esta son la: Descriptiva e Inferencial.

La estadística descriptiva se define como la ciencia que sistematiza, recoge,

ordena y presenta los datos referentes a un asunto, fenómeno o problema de

investigación, sin pretender extender las conclusiones que puedan extraerse de los

datos a otros grupos distintos o más amplios. Se calcula a partir de los datos de una

muestra o de una población. Dentro de una investigación es importante establecer

cuál es la población y si de esta se ha tomado una muestra, cuando se trata de seres

vivos, en caso de objetos se debe establecer cuál será el objeto, evento o fenómeno a

estudiar.

Para realizar investigaciones exhaustivas sobre diferentes ámbitos surgen tres

problemas básicos a la hora del trabajo de campo, como el tiempo que tardaríamos en

entrevistar a toda la población y el costo económico y de personal de estas

entrevistas. Con las técnicas de muestreo se consigue hacer buenas investigaciones

sobre una pequeña parte de esa población, obteniendo resultados válidos para toda

ella. En los procesos estadísticos conocemos dos tipos de muestreo, el probabilístico

(aleatorio), en este tipo de muestreo, todos los individuos de la población pueden

formar parte de la muestra, tienen probabilidad positiva de formar parte de la muestra.

Por lo tanto es el tipo de muestreo que deberemos utilizar en nuestras investigaciones,

por ser el riguroso y científico y el no probabilístico en el cual puede haber clara

influencia de la persona o personas que seleccionan la muestra o simplemente se

realiza atendiendo a razones de comodidad. Salvo en situaciones muy concretas en la

que los errores cometidos no son grandes, debido a la homogeneidad de la población,

en general no es un tipo de muestreo riguroso y científico, dado que no todos los

elementos de la población pueden formar parte de la muestra.

ESTADÍSTICA

1.1. ORIGEN DE LA ESTADÍSTICA.

La estadística nació en épocas muy remotas; como todas las ciencias, no se creó

de improviso, sino mediante un proceso largo de desarrollo y evolución constante,

desde la simple recolección de datos hasta la diversidad y rigurosa interpretación de

los datos que se dan hoy en día

Desde que comenzó el proceso de civilización y desarrollo han existido formas

sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros

símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número

de personas, animales o cosas. Es una ciencia más antigua como lo es la escritura.

Se dice que las primeras manifestaciones de la estadística fueron 3050 a.C en

Egipto donde faraones lograron recopilar, datos relativos a la población y la riqueza

del país. Según el historiador griego Herodoto, dicho registro de riqueza y población

se hizo con el objetivo de preparar la construcción de las pirámides. También fueron

realizados censos con la finalidad de verificar un nuevo reparto.

Haciendo un resumen descriptivo de la evolución de la estadística tenemos lo

siguiente:

Los babilonios 3000 a.C, usaban pequeñas tablillas de arcilla para recopilar

datos sobre la producción agrícola y sobre los géneros vendidos o cambiados

mediante trueque.

En el antiguo Israel la Biblia da referencia del uso estadístico, principalmente

en los libros de Números y Crónicas que incluyen, en algunas partes, trabajos

de esta índole.

En China fueron efectuados censos de población, pues varios registros

numéricos con anterioridad al año 2000 a.C. dan fe de ello.

Los griegos realizaban censos periódicamente hacia 594 a. C., con fines

tributarios, sociales (división de tierras) y militares (cálculo de recursos y

hombres disponibles).

El Imperio romano, maestro de la organización política, fue el primer

gobierno que supo emplear los recursos de la estadística, mediante la

recopilación de una gran cantidad de datos sobre la población, superficie y

renta de todos los territorios bajo su control.

Durante los mil años siguientes a la caída del imperio Romano realizaron

operaciones sobre las relaciones de tierras pertenecientes a la Iglesia; en la

edad media sólo se realizaron algunos censos exhaustivos en Europa.

Así se fueron creando numeroso avances en la ciencia de la estadística, creándose

la estadística moderna, protagonizada por Ronald Arnold Fisher, pues la situó como

una poderosa herramienta para la planeación y análisis de experimentos.

1.2. IMPORTANCIA Y UTILIDAD DE LA ESTADÍSTICA.

En las últimas décadas, la estadística ha alcanzado un alto grado de desarrollo

hasta el punto de incursionar en todas las ciencias y ramas del saber, convirtiéndose

así, en un método efectivo para describir con exactitud los valores de datos

económicos, políticos, sociales, psicológicos, biológicos o físicos, y sirve como

herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico

no consiste ya sólo en reunir y tabular los datos, sino sobre todo en el proceso de

“interpretación” de esa información.

Puntos de importancia:

La estadística como ciencia que interviene en todas las ciencias.

Ciencia aplicada en el día a día de la vida cotidiana.

En aclarar incertidumbres e interrogantes ante cierta situación.

En la toma de decisiones con cierto grado de confianza.

Se emplea para mostrar los aspectos cuantitativos de una situación.

Describen con considerable precisión en el comportamiento global de

grandes conjuntos de sucesos particulares.

En la ciencia de la contabilidad la estadística es muy importante, pues se

aplica para seleccionar muestras, cuando se pretende hacer una auditoria;

también funciona para medir la variación de costos de producción.

Aumenta la credibilidad y confiabilidad de las investigaciones.

El mal uso o el abuso de la estadística, utilizando herramientas o modelos

inapropiados o razonamientos ilógicos y erróneos que conducen al fracaso de

la investigación.

Verificación de la información que sea utilizada para los modelos estadísticos

sean válidas.

1.3. CONCEPTO DE ESTADÍSTICA.

Entre los principales aspectos, antes de conceptualizar el término estadístico seria

describir su origen etimológico. El termino estadística proviene del término

alemán Statistik que se traduce como “La ciencia del Estado”, por lo que designaba

originalmente el análisis de datos del Estado. En el siglo XIX cuando el militar

británico Sir John Sinclair (1754-1835) introdujo al término estadística el significado

de recolectar y clasificar datos.

Entre los conceptos estudiados están:

La rama de las matemáticas que recopila, organiza, analiza e interpreta los

datos obtenidos de un problema estadístico, para obtener conocimiento de los

hechos pasados, para prever situaciones futuras y tomar decisiones en base a

las experiencias”.

Es un conjunto de métodos científicos ligados a la toma, organización,

recopilación, presentación y análisis de datos, tanto para la deducción de

conclusiones como para tomar decisiones razonables de acuerdo con tales

análisis.

Conjunto de métodos y técnicas que permiten la obtención, organización,

síntesis, descripción e interpretación de los datos para la toma de decisiones

en ambiente de incertidumbre.

Aunque existen diferencias en la manera como se puede definir la estadística,

todos los autores coinciden en que “consiste en reunir, recolectar e interpretar

datos”. Este aspecto en común se da precisamente porque la estadística tiene esa

finalidad, es decir que se utiliza con ese propósito.

1.4. USO DE LA ESTADÍSTICA.

Durante el siglo XX, la creación de instrumentos precisos para asuntos de salud

pública (epidemiología, bioestadística, etc.) y propósitos económicos y sociales (tasa

de desempleo, econometría, etc.) necesitó de avances sustanciales en las prácticas

estadísticas.

Hoy el uso de la estadística se ha extendido más allá de sus orígenes como un

servicio al Estado o al gobierno. Personas y organizaciones usan la estadística para

entender datos y tomar decisiones en ciencias naturales y sociales, medicina, negocios

y otras áreas. La estadística es entendida generalmente no como un sub-área de las

matemáticas sino como una ciencia diferente «aliada». Muchas universidades tienen

departamentos académicos de matemáticas y estadística separadamente. La

http://es.wikipedia.org/wiki/Siglo_XX

http://es.wikipedia.org/wiki/Salud_p%C3%BAblica


http://es.wikipedia.org/wiki/Epidemiolog%C3%ADa

http://es.wikipedia.org/wiki/Bioestad%C3%ADstica

http://es.wikipedia.org/wiki/Desempleo

http://es.wikipedia.org/wiki/Econometr%C3%ADa

http://es.wikipedia.org/wiki/Estado

http://es.wikipedia.org/wiki/Universidad

estadística se enseña en departamentos tan diversos como psicología, educación y

salud pública.

Al aplicar la estadística a un problema científico, industrial o social, se comienza

con un proceso o población a ser estudiado. Esta puede ser la población de un país, de

granos cristalizados en una roca o de bienes manufacturados por una fábrica en

particular durante un periodo dado. También podría ser un proceso observado en

varios ascos instantes y los datos recogidos de esta manera constituyen una serie de

tiempo.

Por razones prácticas, en lugar de compilar datos de una población entera,

usualmente se estudia un subconjunto seleccionado de la población, llamado muestra.

Datos acerca de la muestra son recogidos de manera observacional o experimental.

Los datos son entonces analizados estadísticamente lo cual sigue dos propósitos:

descripción e inferencia.

El concepto de correlación es particularmente valioso. Análisis estadísticos de un

conjunto de datos puede revelar que dos variables (esto es, dos propiedades de la

población bajo consideración) tienden a variar conjuntamente, como si hubiera una

conexión entre ellas. Por ejemplo, un estudio del ingreso anual y la edad de muerte

podrían resultar en que personas pobres tienden a tener vidas más cortas que personas

de mayor ingreso. Las dos variables se dicen que están correlacionadas. Sin embargo,

no se puede inferir inmediatamente la existencia de una relación de causalidad entre

las dos variables. El fenómeno correlacionado podría ser la causa de una tercera,

previamente no considerada, llamada variable confusora.

Si la muestra es representativa de la población, inferencias y conclusiones hechas

en la muestra pueden ser extendidas a la población completa. Un problema mayor es

el de determinar qué tan representativa es la muestra extraída. La estadística ofrece

http://es.wikipedia.org/wiki/Psicolog%C3%ADa

http://es.wikipedia.org/wiki/Educaci%C3%B3n


http://es.wikipedia.org/wiki/Poblaci%C3%B3n_estad%C3%ADstica

http://es.wikipedia.org/wiki/Serie_temporal

http://es.wikipedia.org/wiki/Serie_temporal

http://es.wikipedia.org/wiki/Muestreo_(estad%C3%ADstica)

http://es.wikipedia.org/wiki/Experimento

http://es.wikipedia.org/wiki/Conjunto

http://es.wikipedia.org/w/index.php?title=Variable_confusora&action=edit&redlink=1

medidas para estimar y corregir por aleatoriedad en la muestra y en el proceso de

recolección de los datos, así como métodos para diseñar experimentos robustos como

primera medida.

El concepto matemático fundamental empleado para entender la aleatoriedad es el

de probabilidad. La estadística matemática (también llamada teoría estadística) es la

rama de las matemáticas aplicadas que usa la teoría de probabilidades y el análisis

matemático para examinar las bases teóricas de la estadística.

El uso de cualquier método estadístico es válido solo cuando el sistema o

población bajo consideración satisface los supuestos matemáticos del método. El mal

uso de la estadística puede producir serios errores en la descripción e interpretación,

afectando las políticas sociales, la práctica médica y la calidad de estructuras tales

como puentes y plantas de reacción nuclear.

Incluso cuando la estadística es correctamente aplicada, los resultados pueden ser

difícilmente interpretados por un inexperto. Por ejemplo, el significado estadístico de

una tendencia en los datos, que mide el grado al cual la tendencia puede ser causada

por una variación aleatoria en la muestra, puede no estar de acuerdo con el sentido

intuitivo. El conjunto de habilidades estadísticas básicas (y el escepticismo) que una

persona necesita para manejar información en el día a día se refiere como “cultura

estadística”.

http://es.wikipedia.org/wiki/Probabilidad

http://es.wikipedia.org/wiki/Estad%C3%ADstica_matem%C3%A1tica

http://es.wikipedia.org/wiki/Matem%C3%A1ticas_aplicadas

http://es.wikipedia.org/wiki/Teor%C3%ADa_de_probabilidades

http://es.wikipedia.org/wiki/An%C3%A1lisis_matem%C3%A1tico

http://es.wikipedia.org/wiki/An%C3%A1lisis_matem%C3%A1tico

POBLACIÓN Y MUESTRA

2.1. POBLACIÓN

El conjunto de datos de los cuales se ocupa un determinado estudio estadístico se

llama población y estás íntimamente ligado a lo que se pretende estudiar. Los

estadísticos usan la palabra población para referirse no sólo a personas sino a todos

los elementos que han sido escogidos para su estudio.

Desde el punto de vista estadístico, una población o universo puede estar referido

a cualquier conjunto de elementos de los cuales se pretende indagar y conocer sus

características, o una de ellas, y para el cual serán válidas las conclusiones obtenidas

en la investigación. También se puede definir como el conjunto de datos acerca de

unidades de análisis (individuos, objetos) en relación a una misma característica,

propiedad o atributo (variable).

La población en sentido demográfico, es un conjunto de individuos (todos los

habitantes de un país). Además, se estudia la estructura interna, la dinámica y su

distribución sobre el espacio de las poblaciones humanas y las leyes que rigen estos

fenómenos.

Algunos autores han manifestado diversas definiciones referidas a la población,

expresadas de la siguiente manera:

“Es un conjunto finito o infinito de elementos con características comunes para

los cuales serán extensivas las conclusiones de la investigación. Está queda

delimitada por problema y por los objetivos del estudio”. (Arias, 2006:81).

“El conjunto formado por todos los valores posibles que puede asumir la

variable objeto de estudio.” (Lincoln, 1993:12)

“El conjunto de unidades o individuos que satisfacen una definición común y

constituyen la colectividad por la cual nos interesamos”. (Morice, 1794:135).

2.2. TIPOS DE POBLACIONES.

Cuando se realiza una investigación, debemos escoger el tipo de población que

ayude a determinar el número de unidades que la conforman, con la finalidad de

extraer conclusiones generadas por el objeto de estudio.

Según Fidias (citado por Sierra, 1991), distingue los tipos de población de dos

formas:

2.2.1. POBLACIÓN FINITA:

“Agrupación en la que se conoce la cantidad de unidades que la integran.

Además, existe un registro documental de dichas unidades. Desde el punto de vista

estadístico, una población finita es la constituida por un número inferior a cien mil

unidades”.

2.2.2. POBLACIÓN INFINITA:

“Es aquella en la que se desconoce el total de elementos que la conforman; por

cuanto no existe un registro documental de éstos debido a que su elaboración sería

prácticamente imposible. En la disciplina estadística, se considera una población

infinita a la conformada por cien mil unidades o más”.

2.3. MUESTRA

La muestra estadística es una parte de la población, o sea, un número de

individuos u objetos seleccionados científicamente, cada uno de los cuales es un

elemento del universo. La muestra descansa en el principio de que las partes

representan al todo; reflejando las características que definen la población de la que

fue extraída.

Entre las definiciones de muestras se encuentran:

“Se refiere al grupo de unidades extraídas de una población, definida

previamente, de acuerdo con un plan de sondeo dado y sobre las cuales se realizarán

las observaciones previstas en la encuesta”. (Morice, 1994:135).

“Es cualquier subconjunto de la población, escogido al seguir ciertos criterios

de selección”. (Shao, 1993:12)

“Un subconjunto representativo y finito que se extrae de la población

accesible”. (Arias, 2006:83).

2.3.1. RAZONES PARA EL USO DE UNA MUESTRA

Existen algunas razones, que pueden ser usadas por el investigador para aplicar

una muestra. Entre los atributos que caracterizan la muestra, se encuentran los

siguientes:

• Cuando la población es grande, o infinitas es imposible analizar en su totalidad, ya

que los elementos no presenta las mismas características.

• Reduce el costo, al estudiar una pequeña parte de la población los gastos que son

utilizados para el tratamiento de los datos serán menores, que si se trabaja con el total

de la población. Una muestra puede suministrar datos de precisión suficiente y a

mucho menor costo si la comparamos con un censo.

• Rapidez, al reducir el tiempo que se utilizará para aplicar y recoger el tratamiento de

los datos. Una muestra proporciona información más rápida por dos razones

importantes. Primero, generalmente un muestreo toma menos tiempo para terminarse

que un censo debido a que es una tarea de menor escala. Segundo, la clasificación,

codificación, y tabulación de los resultados de la encuesta generalmente toman menos

tiempo para una muestra que para un censo y con el uso de las computadoras este

proceso se hace más rápido.

Cualquier encuesta proporciona información útil solamente después de que los

datos han sido recopilados y tabulados. Es por esto que resulta tan importante el

tiempo requerido para tabular los resultados al considerar la oportunidad de la

información de la muestra y del censo.

• Confiabilidad y control, la elección de una muestra permite la realización de

estudios que serían imposible hacerlo sobre el total de la población, ya que se obtiene

una mejor información y es posible cuidar más la precisión de la observación o

medida de cada elemento.

2.4. SELECCIÓN DE LA MUESTRA

Para seleccionar una muestra lo primero que hay que definir es la unidad de

análisis (personas, organizaciones, periódicos, situaciones, eventos). El sobre qué o

quiénes se van a recolectar datos depende del planteamiento del problema a investigar

y de los alcances del estudio. Estas acciones nos llevaran al siguiente paso, que

consiste en delimitar una población. Una deficiencia que se presenta en algunos

trabajos de investigación es que no describen lo suficiente las características de la

población o considera que la muestra la representa de manera automática.

Es preferible entonces establecer con claridad las características de la población, con

la finalidad de delimitar cuáles serán los parámetros muestrales.

Un estudio no será mejor por tener una población más grande; la calidad de un trabajo

investigativo estriba en delimitar claramente la población con base en el

planteamiento del problema.

2.4.1. VARIABLES DE LAS QUE DEPENDE EL TAMAÑO DE LA

MUESTRA

Suponiendo que la muestra es la adecuada, el tamaño necesario de la muestra

para poder extrapolar los resultados a la población depende básicamente de tres

variables:

1) El nivel de confianza o riesgo que aceptamos de equivocarnos al presentar

nuestros resultados: lo que deseamos es que en otras muestras semejantes los

resultados sean los mismos o muy parecidos.

El nivel de confianza va a entrar en la fórmula para determinar el número de

sujetos con un valor de zeta, que en la distribución normal está asociado a una

determinada probabilidad de ocurrencia.

2) La varianza (o diversidad de opiniones…) estimada en la población. Esta

diversidad en la población es la diversidad estimada; si la conociéramos

(cuántos van a decir que sí y cuántos van a decir que no) en primer lugar no

necesitaríamos hacer la encuesta.

Si sabemos de antemano que todos piensan lo mismo (aunque no sabemos qué

piensan y por eso lo preguntamos), nos bastará preguntar a un solo sujeto,

pero si las opiniones pueden ser muy distintas nos harán falta más sujetos. A

mayor diversidad esperada, o al menos posible, en las opiniones o posibles

respuestas en la población hará falta un mayor número de sujetos en la

muestra.

3) El margen de error que estamos dispuestos a aceptar.

Si por ejemplo el 20% de la muestra está de acuerdo con una proposición (o

dice que va votar a un determinado candidato o que prefiere un determinado

producto) eso no significa que el 20% exacto de la población vaya a responder

lo mismo, puede ser el 22% o el 18%…necesitaremos muestras mayores si

queremos que el margen de error o de oscilación de muestra a muestra de los

resultados sea muy pequeño (el resultado exacto lo tendríamos si respondiera

el 100% y la muestra coincidiera con la población).

Esto puede ser más o menos importante según la situación; el margen de error

en sondeos pre-electorales es, por ejemplo, muy importante y este margen de

error suele ponerse en torno a un 3%.

2.5. ¿CÓMO CALCULAR EL TAMAÑO DE LA MUESTRA?

Vamos a distinguir entre poblaciones infinitas (de tamaño muy grande,

indefinido, cuyo Tamaño exacto podemos desconocer) y poblaciones finitas (tamaño

más reducido y que conocemos).

En la práctica disponemos de tablas en numerosos textos y de programas de

Internet en los que podemos ver con toda facilidad el tamaño necesario de la muestra

en función del tamaño de la población, del nivel de confianza y del margen de error

tolerado; también es muy utilizar las fórmulas porque nos hacen ver cómo se

relacionan las variables que condicionan el tamaño de la muestra.

2.5.1. EN EL CASO DE POBLACIONES INFINITAS (TAMAÑO GRANDE,

INDEFINIDO…)

FÓRMULAS PARA DETERMINAR EL TAMAÑO DE LA MUESTRA:

Para extrapolar a poblaciones muy grandes utilizamos la fórmula [1] para obtener

el tamaño de la muestra:

Z2pq

n=---------------

e2

LEYENDA

z = Valor de z correspondiente al nivel de confianza; Un nivel de confianza del 95%

corresponde a z = 1.96.

Con z = 2.57 el nivel de confianza sube al 99% (nos equivocaríamos una vez de cada

100),

K 1,15 1,28 1,44 1,65 1,96 2 2,58

Nivel de confianza 75% 80% 85% 90% 95% 95,5% 99%

Pq = Varianza de la población:

Como la varianza de la población la desconocemos, ponemos la varianza mayor

posible Porque a mayor varianza hará falta una muestra mayor.

p = proporción de respuestas en una categoría.

q = proporción de repuestas en la otra categoría igual a pq y la varianza mayor (la

mayor diversidad de respuestas) se da cuando p = q = 0.50 (la mitad de los sujetos

responde sí y la otra mitad responde no) por lo que en esta fórmula pq es siempre

igual a (0.50). (0.50) = .25 (es una constante).

e = Error muestral:

Lo representamos con la letra e que significa error o desviación posible cuando

extrapolemos los resultados. Es el margen de error que aceptamos.

Ejemplo: Si el margen de error es 3.16%, en la fórmula pondremos e = 0.0316. Si

dice que sí un 64.3% en la muestra, entendemos que dice que sí en la población entre

un (64.3 - 3.16) % y un (64.3 + 3.16) %.

Por ejemplo ¿qué muestra necesitaremos con un nivel de confianza del 95% al

que corresponde z = 1.96, y admitiendo un margen de error del 5%? .Ya sabemos que

pq =0 .25.

Z2pq

n=_____________

e2

(1.96)2. 0.25

n=_______________= 384 es el tamaño de muestra

(0.05)2

2.5.2. EN EL CASO DE POBLACIONES FINITAS (TAMAÑO CONOCIDO,

PEQUEÑO)

Fórmula para determinar el tamaño de la muestra

Cuando conocemos el tamaño de la población, la muestra necesaria es más

pequeña y su Tamaño se determina mediante la fórmula:

n=______N_____

1+ e2(N-1)

______

Z2pq

LEYENDA:

n = tamaño de la muestra que deseamos conocer

N = tamaño conocido de la población,

E, z y pq como antes.

EJEMPLO:

Por ejemplo: deseamos hacer un sondeo de opiniones en un centro escolar que

tiene 600 alumnos. En este caso N = 600; es el tamaño de la población que ya

conocemos. Nuestro nivel de confianza va a ser del 95%, por lo tanto z = 1.96.

Y como no queremos un error mayor del 3%, tenemos que e = 0.03. A falta de otros

datos y para mayor seguridad suponemos que pq = (0.50) (0.50) =0 .25. La muestra

necesaria será:

n=______N_____

1+ e2 (N-1)

______

Z2pq

n=______600_______

1+ 0.032(600-1)

__________

1.9620.25

n= 384; necesitamos por lo tanto una muestra de 384 sujetos.

TIPOS DE MUESTREO

Las técnicas de tomar un muestreo se pueden dividir en dos tipos generales:

muestreo probabilístico y muestreo determinístico.

El muestreo probabilístico es un muestreo en el cual todos los elementos de la

población tienen posibilidad de ser seleccionados. Se debe mencionar que no es

necesario que la posibilidad sea igual, porque se puede especificar la posibilidad de

seleccionar algunos elementos de la población y estimar la posibilidad de que un

elemento de la población sea seleccionado. No hay manera de asegurar que el

muestreo sea representativo. Todas las técnicas muéstrales determinísticas están

basadas en el juicio personal del investigador. En efecto, es posible que estos juicios

personales sean una buena estimación de las características de la población, pero los

modelos determinísticos de muestreo no permiten evaluar su grado de exactitud.

Hay otros tipos de muestreo que el investigador debe conocer y seleccionar para

el tipo de muestreo que desea usar.

El muestreo fijo implica un muestreo de tamaño constante que se determinó antes

de recopilar datos; mientras que en el muestreo secuencial, el tamaño de muestreo no

es fijo, y se recopilan datos secuencialmente, o sea después de la recopilación de

datos, si no se logró suficiente evidencia para tomar decisiones necesarias con las

informaciones que se tienen, continuarán recopilándose más datos; una vez más se

verificará si se obtuvo suficiente evidencia; si no, se continuarán recopilando datos

hasta que se llegue a un punto en que se encuentre la evidencia necesaria para la toma

de decisión.

El muestreo puede ser sin reemplazo o con reemplazo. En el muestreo sin

reemplazo cada elemento muestral de la población tiene una sola oportunidad de ser

seleccionado, mientras que en el muestreo con reemplazo cada elemento muestral de

la población puede ser elegido varias veces.

Las técnicas para tomar un muestreo en su clasificación amplia (probabilísticas y

determinística) se pueden dividir en otros tipos; por ejemplo, el muestreo

determinístico puede ser convencional, intencional y de cuota; el muestreo

probabilístico se divide en: muestreo aleatorio simple, muestreo estratificado

(proporcional y desproporcional) y muestreo por grupos (sistemático o por área).

3.1. MUESTREO DETERMINÍSTICO.

Por lo general, el muestreo determinístico implica un juicio personal, algunas veces el

del investigador, y otras el del recopilador de datos.

3.2. MUESTREO CONVENCIONAL O ACCIDENTAL.

El muestreo convencional se refiere a recopilar datos de los sujetos de estudio

más convenientes, o sea, recopilar datos de los elementos muestrales de la población

que más convengan. Un ejemplo muy popular es entrevistar a cualquier persona que

pase por la calle, y pedirle su opinión respecto a, por ejemplo, algún tema político de

actualidad, o que algunos investigadores pidan a los alumnos de un salón que

contesten cierto cuestionario.

Este muestreo es muy rápido y cuesta poco, pero también tiene ciertas

deficiencias. La opinión de los alumnos de un salón o de cualquier persona, no puede

ser representativa de la población en estudio. Este tipo de muestreo es recomendable

solamente en el proceso de un estudio exploratorio que trata de definir el camino de la

investigación.

3.3. MUESTREO INTENCIONAL.

En el muestreo intencional todos los elementos muestrales de la población serán

seleccionados bajo estricto juicio personal del investigador. En este tipo de muestreo

el investigador tiene previo conocimiento de los elementos poblacionales.

Aunque este muestreo es subjetivo, requiere que el investigador conozca los

elementos muestrales, lo que permite que el muestreo sea representativo.

3.4. CONCEPTOS BÁSICOS DE MUESTREO PROBABILÍSTICO.

Para facilitar el entendimiento del proceso de muestreo probabilístico, es

conveniente recordar ciertos conceptos estadísticos.

Si en lugar de tomar un muestreo se estudian todos los miembros de la población

(censo), a las características estudiadas o valores obtenidos se les conoce como

parámetros; por definición, los parámetros tienen un valor fijo o constante. Si se

seleccionan unos miembros de la población (muestreo) y se estudian los datos

obtenidos, se llama estadística y sirve para hacer inferencias a los parámetros. El

valor que toman las estadísticas varía de muestreo a muestreo. Como se mencionó,

los parámetros son fijos para distinguir diferentes poblaciones. Suponga que la

compañía X quiere conocer la tendencia política de sus empleados de nivel ejecutivo

y que tiene 20 empleados en este nivel, la tabla proporciona datos como ingreso,

experiencia y su afiliación a dos partidos políticos, X y Y. Se puede calcular el

promedio de ingreso semanal, la dispersión de la variable de experiencia, la

proporción de miembros de cada partido político, etcétera. Estas cantidades son fijas

en valores; si se levanta un censo, simplemente se pueden calcular estos parámetros.

En lugar de levantar un censo, usualmente se toma un muestreo y se utilizan

valores calculados en el muestreo para estimar los parámetros (valores para la

población).

Para calcular las estadísticas (los valores del muestreo) se usan las mismas

fórmulas que se utilizan para estimar los parámetros; se debe saber que el valor

estadístico depende de diferentes muestreos seleccionados de una población, es decir,

que de una población se pueden tomar diferentes muestreos, cada uno con diferentes

estadísticas y estimaciones.

Se va a considerar todo posible muestreo que se puede tomar de la población de

nuestro ejemplo (ejecutivos en la compañía X) con un muestreo de tamaño 2 (n = 2)

con el método aleatorio simple. Sin reemplazo, hay 190 combinaciones de 20

empleados tomándolos de 2 en 2, y para cada combinación se puede calcular el

promedio muestral de ingreso, por ejemplo, el muestreo AB, XI = (5,600 + 6,000) 2 =

5,800).

ÁREAS DE LA ESTADÍSTICA

Describiremos brevemente cada una de las áreas en que puede dividirse la

estadística:

Diseño: Planeamiento y desarrollo de investigaciones.

Descripción: Resumen y exploración de datos.

Inferencia: Hacer predicciones o generalizaciones acerca de características de

una población en base a la información de una muestra de la población.

4.1. DISEÑO

Es una actividad crucial. Consiste en definir como se desarrollará la

investigación para dar respuesta a las preguntas que motivaron la misma. La

recolección de los datos requiere en general de un gran esfuerzo, por lo que, dedicar

especial cuidado a la etapa de planificación de la investigación ahorra trabajo en las

siguientes etapas. Un estudio bien diseñado resulta simple de analizar y las

conclusiones suelen ser obvias. Un experimento pobremente diseñado o con datos

inapropiadamente recolectados o registrados puede ser incapaz de dar respuesta a las

preguntas que motivaron la investigación, más allá de lo sofisticado que sea el

análisis estadístico.

Aún en los casos en que se estudian datos ya registrados, en que estamos

restringidos a la información existente, los principios del buen diseño de

experimentos, pueden ser útiles para ayudar a seleccionar un conjunto razonable de

datos que esté relacionado con el problema de interés.

4.2. DESCRIPCIÓN

Los métodos de la Estadística Descriptiva o Análisis Exploratorio de Datos

ayudan a presentar los datos de modo tal que sobresalga su estructura. Hay varias

formas simples e interesantes de organizar los datos en gráficos que permiten detectar

tanto las características sobresalientes como las características inesperadas. El otro

modo de describir los datos es resumirlos en uno o dos números que pretenden

caracterizar el conjunto con la menor distorsión o pérdida de información posible.

Explorar los datos, debe ser la primera etapa de todo análisis de datos. ¿Por qué

no analizarlos directamente? En primer lugar porque las computadoras no son

demasiado hábiles (sólo son rápidas), hacen aquello para lo que están programadas y

actúan sobre los datos que les ofrecemos. Datos erróneos o inesperados serán

procesados de modo inapropiado y ni usted, ni la computadora se darán cuenta a

menos que realice previamente un análisis exploratorio de los datos.

4.3. INFERENCIA

Inferencia Estadística hace referencia a un conjunto de métodos que permiten

hacer predicciones acerca de características de un fenómeno sobre la base de

información parcial acerca del mismo. Los métodos de la inferencia nos permiten

proponer el valor de una cantidad desconocida (estimación) o decidir entre dos

teorías contrapuestas cuál de ellas explica mejor los datos observados (test de

hipótesis).

El fin último de cualquier estudio es aprender sobre las poblaciones. Pero es

usualmente necesario, y más práctico, estudiar solo una muestra de cada una de las

poblaciones.

Definimos:

POBLACIÓN ⇒ total de sujetos o unidades de análisis de interés en el estudio

MUESTRA ⇒ cualquier subconjunto de los sujetos o unidades de análisis de la

población, en el cual se recolectarán los datos.

Usamos una muestra para conocer o estimar características de la población,

denominamos:

PARÁMETRO ⇒ una medida resumen calculada sobre la población.

ESTADÍSTICO ⇒ una medida resumen calculada sobre la muestra.

La calidad de la estimación puede ser muy variada, y generalmente las

estimaciones estadísticas son erróneas, en el sentido que no son perfectamente

exactas. La ventaja de los métodos estadísticos es que aplicados sobre datos

obtenidos a partir de muestras aleatorias permiten cuantificar el error que podemos

cometer en nuestra estimación o calcular la probabilidad de cometer un error al tomar

una decisión en un test de hipótesis.

Finalmente, cuando existen datos para toda la población (CENSO) no hay

necesidad de usar métodos de estadística inferencial, ya que es posible calcular

exactamente los parámetros de interés. En el censo poblacional, por ejemplo, se

registra el sexo de todas las personas censadas, que son prácticamente toda la

población, así que es posible conocer exactamente la proporción de habitantes de los

dos sexos.

TIPOS DE ESTADÍSTICAS

La estadística es una técnica basada en la recolección, recuento, clasificación, e

interpretación de un conjunto de datos obtenidos a partir de la observación, con el

propósito de poder llevar a cabo comparaciones y realizar estimaciones.

Existen distintos tipos de estadística:

5.1. DESCRIPTIVA O DEDUCTIVA:

Esta clase de estadística se utiliza con el propósito de recolectar, describir y

resumir un conjunto de datos obtenidos. Estos pueden visualizarse de manera

numérica y gráfica. Sin embargo, su uso se acota sólo al uso de la información

obtenida. Es decir, que a partir de loa misma no se puede realizar ningún tipo de

generalización.

5.2. INFERENCIAL O INDUCTIVA:

De manera contraria a la anterior, esta clase de estadística tiene la particularidad

de que a partir de los datos muestrales que maneja, es posible realizar conclusiones y

predicciones que incluyan a toda la población. Es decir, que los resultados obtenidos

a partir del análisis y conclusión podrán ser extrapolados, y de esta forma realizar un

pronóstico inclusivo. Las inferencias pueden presentarse a través de respuestas a

preguntas del tipo si/no, relaciones entre una serie de variables, estimaciones

numéricas, entre otras.

5.3. APLICADA:

Está conformada por las dos clases de estadísticas anteriores. Su objetivo

consiste en deducir resultados sobre un universo, a partir de una muestra determinada.

Este tipo de estadística puede ser aplicada en cualquier área que no pertenezca a ella,

tal como historia, psicología, etc.

5.4. ESTADÍSTICA MATEMÁTICA:

Se refiere al empleo de la estadística pero desde un punto de vista formal, a

través del uso de distintas ramas propias de la matemática y de la teoría de la

probabilidad. Su uso es necesario debido a que los datos que maneja la estadística

matemática son aleatorios e inciertos.

ESTADÍSTICA DESCRIPTIVA

Se refiere a la recolección, presentación, descripción, análisis e interpretación de

una colección de datos, esencialmente consiste en resumir éstos con uno o dos

elementos de información (medidas descriptivas) que caracterizan la totalidad de los

mismos. La estadística descriptiva es el método de obtener de un conjunto de datos

conclusiones sobre sí mismos y no sobrepasan el conocimiento proporcionado por

éstos.

Puede utilizarse para resumir o describir cualquier conjunto ya sea que se trate de

una población o de una muestra, cuando en la etapa preliminar de la Inferencia

Estadística se conocen los elementos de una muestra

6.1. TIPOS DE VARIABLES

Como se ilustra en la figura, existen dos tipos de datos: categóricos (o cualitativos) y

numéricos (cuantitativos).

A. Los datos CATEGÓRICOS O CUALITATIVOS representan categorías o

atributos (como, por ejemplo, "sí" o "no") que pueden clasificarse como un

criterio o cualidad.

B. Los datos NUMÉRICOS O CUANTITATIVOS producen respuestas

numéricas, como el peso en kilogramos o el número de universidades que hay

en la Costa Atlántica. Estos datos son de dos tipos; discretos y continuos.

Los DATOS DISCRETOS producen respuestas numéricas que

surgen de un conteo.

Los DATOS CONTINUOS producen respuestas numéricas que

surgen de proceso de medición, donde la característica de que se mide

puede tomar cualquier valor numérico en un intervalo.

6.2. ORGANIZACIÓN DE DATOS MEDIANTE TABLAS.

En esta forma de organización de datos es importante el concepto de frecuencia

de un dato.

La frecuencia (absoluta) de un dato, simbolizado con la letra f, es el número de

veces que aparece ese dato en una colección de datos.

Ejemplo: En el conjunto de datos 4 5 5 3 2 6 7 7 7 2, el cuatro sólo aparece una

vez (por lo tanto, tiene frecuencia f = 1), el cinco aparece dos veces (o sea, frecuencia

f = 2), el 7 tiene frecuencia f = 3, etc.

6.3. PRESENTACIÓN DE DATOS CATEGÓRICOS

6.3.1. TABLA DE FRECUENCIAS.

El modo más simple de presentar datos categóricos es por medio de una tabla de

frecuencias. Esta tabla indica el número de unidades de análisis que caen en cada una

de las clases de la variable cualitativa.

Consideremos los casos de meningitis notificados durante el año 2000 al

SI.NA.VE (Argentina) clasificados según tipo de meningitis.

La primer y segunda columna de la Tabla 1 muestran las categorías de la variable

(tipo de meningitis y la sigla correspondiente), la tercer columna presenta el número

de casos de meningitis de cada tipo notificados, es decir la frecuencia o frecuencia

absoluta, en tanto que la última columna presenta la frecuencia relativa o el

porcentaje de casos notificados de cada tipo de meningitis. Por ejemplo, la frecuencia

relativa de la categoría BSA se calcula del siguiente modo:

La representación gráfica de una distribución de frecuencias puede realizarse a

través de un gráfico de barras o de un gráfico de tortas. A continuación se presentan

ambos métodos.

6.3.1.1. GRÁFICO DE BARRAS.

Este gráfico es útil para representar datos categóricos nominales u ordinales. A

cada categoría o clase de la variable se le asocia una barra cuya altura representa la

frecuencia o la frecuencia relativa de esa clase. Las barras difieren sólo en altura, no

en ancho.

La escala en el eje horizontal es arbitraria y en general, las barras se dibujan

equiespaciadas, por esta razón este tipo de gráfico sólo debe usarse para variables

categóricas.

Es importante que el eje vertical comience en cero, de modo que no se exageren

diferencias entre clases. En un gráfico de barras, así como en cualquier tipo de gráfico

se debe indicar el número total de datos ya que el gráfico sólo muestra porcentajes o

frecuencias relativas y la fuente de la que se obtuvieron los mismos.

Cuando se desea comparar dos o más distribuciones cualitativas, el modo más

sencillo de representación es el gráfico de barras combinadas. En la Figura 2 se

presentan las distribuciones de casos notificados de meningitis en Argentina para los

años 1999 y 2000.

6.3.1.2. GRÁFICO DE TORTAS

En este gráfico, ampliamente utilizado, se representa la frecuencia relativa de

cada categoría como una porción de un círculo, en la que el ángulo se corresponde

con la frecuencia relativa correspondiente. Como en todo gráfico es importante

indicar el número total de sujetos.

Esta representación gráfica es muy simple y permite comparar la distribución de

una variable categórica en 2 o más grupos.

Las Figura 3 muestra los datos sobre meningitis presentados en la Figura 2.

6.3.1.3. ¿CUÁL PREFERIR: GRÁFICO DE BARRAS O DE TORTAS?

La información que brindan los dos tipos de gráficos es equivalente, sin

embargo, el gráfico de barras resulta más natural para comparar las distribuciones de

dos grupos, debido a que nuestro ojo percibe mejor diferencias en longitudes que en

ángulos. Por otra parte, en el gráfico de barras todas las barras comienzan al mismo

nivel, lo que facilita la comparación.

CONCLUSIÓN

Después de haber realizado el análisis referido a los aspectos básicos del estudio de la

estadística descriptiva para la elaboración de los procesos logísticos, se llegó a las

siguientes conclusiones:

Toda investigación o análisis que se lleve a cabo tiene que tratarse dentro de

una población como conjunto total de las personas o elementos que se desea

estudiar. Para facilitar de modo práctico el estudio, por cuanto se recurre a

seleccionar una muestra, que como subconjunto de la población se procura

que sea representativa.

En todas las investigaciones se utiliza el muestreo, cuando no es posible

contar o medir los elementos de la población.

El muestreo es una herramienta de la investigación científica. Su función

básica es determinar que parte de una realidad en estudio (población o

universo) debe examinarse, con la finalidad de hacer inferencias sobre dicha

población.

La estadística descriptiva es el método de obtener de un conjunto de datos

conclusiones sobre sí mismos y no sobrepasan el conocimiento proporcionado

por éstos.

RECOMENDACIONES

Aplicar las técnicas básicas de muestras y población a todas aquellas investigaciones

cuya naturaleza requiere de la aplicación de herramientas estadísticas.

Es indispensable que el investigador utilice el muestreo, ya que es imposible

entrevistar a todos los miembros de una población debido a problemas de

tiempo, recursos y esfuerzo.

En el momento de seleccionar el tamaño adecuado de la muestra, los

investigadores deben asegurarse que ésta sea pequeña, ya que si se toma una

muestra más grande esto constituye una pérdida de tiempo y dinero, además

seria engorroso a la hora de obtener la información.

A la hora de aplicar alguna técnica estadística se debe seleccionar el modelo o

diseño que mejor se adapte a las necesidades de la investigación.

Utilizar un procedimiento válido mediante el uso de los datos suministrados

por la muestra con el objeto de estimar parámetros poblacionales.

BIBLIOGRAFÍA

ARIAS, Fidias. (2006). Proyecto de investigación. Introducción a la Metodología

Científica. (Quinta Edición). Caracas: Editorial Epitesme, C.A

HERNÁNDEZ, R, FERNÁNDEZ, C y BAPTISTA, P. (2003). Metodología de la

Investigación (Tercera Edición). México: Editorial MC.GRAW- HILL.

KAZMIER, L. y DÍAZ, A. (1993). Estadística Aplicada a la Administración y a la

Economía. (Segunda Edición). México: Editorial MC.GRAW- HILL.

LEVIN, RICHAR. (1998). Estadística para Administradores. (Segunda Edición).

México: Prentice – Hall – Hispanoamérica, S.A

MASON R, LIND, D Y MARCHAL, W. (2000).Estadística para Administración y

Economía. (Décima Edición). México: Alfaomega.

MORICE, E. (1974). Diccionario de Estadística. (Primera Edición). México:

Compañía Editorial Continental, S.A.

NETER, JOHN. (1970).Fundamentos de Estadística Aplicada a los Negocios.

México. Compañía Continental.

SABINO, Carlos. (2002). El proceso de Investigación. (Nueva Edición

Actualizada).Caracas: Editorial Panapo de Venezuela.

SHAO, Stephen. (1971). Estadística para Economistas y Administradores

estadistica descriptiva

Documents