capÍtulo 8 muestra y población

16

Click here to load reader

Upload: veronica

Post on 04-Jul-2015

3.483 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: CAPÍTULO 8 muestra y población

CAPIacuteTULO 8

iquestCOacuteMO SELECCIONAR UNA MUESTRA

PROCESO DE INVESTIGACIOacuteN

Seacuteptimo paso

SELECCIONAR UNA MUESTRA APROPIADA PARA LA INVESTIGACIOacuteN1048766 Definir los sujetos que van a ser medidos1048766 Delimitar la poblacioacuten1048766 Elegir el tipo de muestra- Probabiliacutestica simple estratificada y por racimos- No probabiliacutestica sujetos voluntarios experimentos sujetos-tipo y por cuotas1048766 Definir el tamantildeo de la muestra1048766 Aplicar el procedimiento de seleccioacuten1048766 Obtener la muestra

iquestQUIEacuteNES VAN A SER MEDIDOSAquiacute el intereacutes se centra en quieacutenes es decir en los sujetos u objetos de estudio Esto depende del planteamiento inicial de la investigacioacuten Asiacute si el objetivo es describir el uso que hacen los nintildeos de la televisioacuten lo maacutes factible es que deberemos interrogar a un grupo de nintildeos Tambieacuten serviriacutea entrevistar a las mamaacutes de los nintildeos Escoger entre los nintildeos o sus mamaacutes o ambos dependeriacutea no soacutelo del objetivo de la investigacioacuten sino del disentildeo de la mismaEn el caso de la investigacioacuten de Fernaacutendez Collado Baptista y Elkes (1986) donde el objetivo baacutesico del estudio era describir la relacioacuten nintildeo-televisioacuten se determinoacute que los sujetos seleccionados para el estudio fueran nintildeos que respondieron sobre sus conductas y percepciones relacionadas con este medio de comunicacioacutenEn otro estudio de Greenberg Ericson y VIahos (1972) el objetivo de anaacutelisis era investigar las discrepancias o semejanzas en las opiniones de madres e hijos con respecto al uso de la televisioacuten Aquiacute el objetivo del estudio supuso la seleccioacuten de mamaacutes y nintildeos para entrevistarlos por separado correlacionando posteriormente la respuesta de cada par madre-hijoLo anterior puede parecer muy obvio pues los objetivos de los dos ejemplos mencionados son claros En la praacutectica esto no parece ser tan simple para muchos estudiantes que en propuestas de investigacioacuten y de tesis no logran una coherencia entre los objetivos de la investigacioacuten y la unidad de anaacutelisis de la misma Por tanto para seleccionar una muestra lo primero es definir la unidad de anaacutelisis (personas organizaciones perioacutedicos etceacutetera) El quieacutenes van a ser medidos depende de precisar claramente el problema a investigar y los objetivos de la investigacioacuten Estas acciones nos llevaraacuten al siguiente paso que es delimitar una poblacioacutenEn el estudio del SIDA la unidad de anaacutelisis fueron los receptores directos de sangre o derivados contaminados con VIH que sobreviven y los contactos de receptores directos (coacutenyuge e hijos nacidos durante el periodo 1984-1987) tanto si sobreviven como si no

iquestCOacuteMO SE DELIMITA UNA POBLACIOacuteNUna vez que se ha definido cuaacutel seraacute la unidad de anaacutelisis se procede a delimitar la poblacioacuten que va a ser estudiada y sobre la cual se pretende generalizar los resultados Asiacute una poblacioacuten es el conjunto de todos los casos que concuerdan con una serie de especificaciones (Selltiz 1974) La muestra suele ser definida como un subgrupo de la poblacioacuten (Sudman 1976) Para seleccionar la muestra deben delimitarse las caracteriacutesticas de la poblacioacuten Muchos investigadores no describen lo suficiente las caracteriacutesticas de la poblacioacuten o asumen que la muestra la representa automaacuteticamente Es frecuente que muchos estudios que uacutenicamente se basan en muestras de estudiantes universitarios (porque es faacutecil aplicar en ellos el instrumento demedicioacuten pues estaacuten a la mano) hagan generalizaciones temerarias sobre joacutevenes que probablemente posean otras caracteriacutesticas sociales Es preferible entonces establecer

claramente las caracteriacutesticas de la poblacioacuten a fin de delimitar cuaacuteles seraacuten los paraacutemetros muestralesLo anterior puede ilustrarse con el ejemplo de la investigacioacuten sobre el uso de la televisioacuten por los nintildeos Estaacute claro que en dicha investigacioacuten la unidad de anaacutelisis son los nintildeos Pero iquestde queacute poblacioacuten se trata iquestde todos los nintildeos del mundo iquestde todos los nintildeos de la Repuacuteblica Mexicana Seriacutea muy ambicioso y praacutecticamente imposible referimos a poblaciones tan grandes Asiacute en nuestro ejemplo la poblacioacuten fue delimitada de la siguiente manera

Liacutemites de poblacioacutenTodos los nintildeos del aacuterea metropolitana que cursen 4deg 5ordm y 6deg de primaria en escuelas privadas y puacuteblicas del turno matutino Esta definicioacuten eliminoacute entonces a nintildeos mexicanos que no vivieran en el aacuterea metropolitana del DF a los que no van a la escuela y a los menores de 9 antildeos Pero por otra parte permitioacute hacer una investigacioacuten costeable con cuestionarios contestados por nintildeos que ya sabiacutean escribir y un control sobre la inclusioacuten de nintildeos de todas las zonas de la metroacutepolis al usar la ubicacioacuten de las escuelas como puntos de referencia y de seleccioacuten En eacuteste y otros casos la delimitacioacuten de las caracteriacutesticas de la poblacioacuten no soacutelo depende de los objetivos del estudio sino de otras razones praacutecticas Un estudio no seraacute mejor por tener una poblacioacuten maacutes grande la calidad de un trabajo estriba en delimitar claramente la poblacioacuten con base en los objetivos del estudioLas poblaciones deben situarse claramente en tomo a sus caracteriacutesticas de contenido lugar y en el tiempo Por ejemplo en un estudio sobre los directivos de empresa en Meacutexico (Baptista 1983) y con base en las consideraciones teoacutericas del estudio que describe el comportamiento gerencial de los individuos y la relacioacuten de eacuteste con otras variables de tipo organizacional se procedioacute a definir la poblacioacuten de la siguiente maneraNuestra poblacioacuten comprende a todos aquellos directores generales de empresas industriales y comerciales que en 1983 tienen un capital social superior a 30 millones de pesos con ventas superiores a los 100 millones de pesos y lo con maacutes de 300 personas empleadasEn este ejemplo se delimita claramente la poblacioacuten excluyendo a personas que no son directores generales a empresas que no pertenezcan al giro industrial y comercial Se establece tambieacuten claramente que se trata de empresas medianas y grandes con base en criterios de capital y de recursos humanos Finalmente se indica que estos criterios operaron en 1983Los criterios que cada investigador cumpla dependen de sus objetivos de estudio lo importante es establecerlos claramenteToda investigacioacuten debe ser transparente sujeta a criacutetica y a reacuteplica y este ejercicio no es posible si al examinar los resultados el lector no puede referirlos a la poblacioacuten utilizada en un estudio

iquestCOacuteMO SELECCIONAR LA MUESTRAHasta este momento hemos visto que se debe definir cuaacutel seraacute la unidad de anaacutelisis y cuaacuteles son las caracteriacutesticas de la poblacioacuten En este inciso hablaremos de la muestra o mejor dicho de los tipos de muestra a fin de poder elegir la maacutes conveniente para un estudioLa muestra es en esencia un subgrupo de la poblacioacuten Digamos que es un sub conjunto de elementos que pertenecen a ese conjunto definido en sus caracteriacutesticas al que llamamos poblacioacuten Con frecuencia leemos y oiacutemos hablar de muestra representativa muestra al azar muestra aleatoria como si con los simples teacuterminos se pudiera dar maacutes seriedad a los resultados En realidad pocas veces se puede medir a toda la poblacioacuten por lo que obtenemos o seleccionamos una muestra y desde luego se pretende que este sub conjunto sea un reflejo fiel del conjunto de la poblacioacuten Todas las muestras deben ser representativas por tanto el uso de este teacutermino es por demaacutes inuacutetil Los teacuterminos al azar y aleatorio denotan un tipo de procedimiento mecaacutenico relacionado con la probabilidad y con la seleccioacuten de elementos pero no logra esclarecer tampoco el tipo de muestra y el procedimiento de muestreo

Tipos de muestraBaacutesicamente categorizamos las muestras en dos grandes ramas las muestras no probabiliacutesticas y las muestras probabiliacutesticas En estas uacuteltimas todos los elementos de la poblacioacuten tienen la misma posibilidad de ser escogidos Esto se obtiene definiendo las caracteriacutesticas de la

poblacioacuten el tamantildeo de la muestra y a traveacutes de una seleccioacuten aleatoria yo mecaacutenica de las unidades de anaacutelisis Imagiacutenese el procedimiento para obtener el nuacutemero premiado en un sorteo de loteriacutea Este nuacutemero se va formando en el momento del sorteo a partir de las esferas con un diacutegito que se van sacando (despueacutes de revolverlas mecaacutenicamente) hasta formar el nuacutemero de manera que todos los nuacutemeros tienen la misma probabilidad de ser elegidosEn las muestras no probabiliacutesticas la eleccioacuten de los elementos no depende de la probabilidad sino de causas relacionadas con las caracteriacutesticas del investigador o del que hace la muestra Aquiacute el procedimiento no es mecaacutenico ni con base en foacutermulas de probabilidad sino que depende del proceso de toma de decisiones de una persona o grupo de personas y desde luego las muestras seleccionadas por decisiones subjetivas tienden a estar sesgadasElegir entre una muestra probabiliacutestica o una no probabiliacutestica depende de los objetivos del estudio del esquema de investigacioacuten y de la contribucioacuten que se piensa hacer con ella

iquestCOacuteMO SE HACE UNA MUESTRA PROBABILIacuteSTICALa eleccioacuten entre la muestra probabiliacutestica y una no probabiliacutestica se determina con base en los objetivos del estudio el esquema de la investigacioacuten y el alcance de sus contribuciones Las muestras probabiliacutesticas tienen muchas ventajas quizaacute la principal es que puede medirse el tamantildeo de error en nuestras predicciones Puede decirse incluso que el principal objetivo en el disentildeo de una muestra probabiliacutestica es reducir al miacutenimo este error al que se le llama error estaacutendar (Kish 1965)Las muestras probabiliacutesticas son esenciales en los disentildeos de investigacioacuten por encuestas en las que se pretende hacer estimaciones de variables en la poblacioacuten estas variables se miden con instrumentos de medicioacuten y se analizan con pruebas estadiacutesticas para el anaacutelisis de datos donde se presupone que la muestra es probabiliacutestica donde todos los elementos de la poblacioacuten tienen una misma probabilidad de ser elegidos Los elementos muestrales tendraacuten valores muy parecidos a los de la poblacioacuten de manera que las mediciones en el sub conjunto nos daraacuten estimados precisos del conjunto mayor La precisioacuten de dichos estimados depende del error en el muestreo que se puede calcular pues hay errores que dependen de la medicioacuten y estos errores no pueden ser calculados matemaacuteticamentePara una muestra probabiliacutestica necesitamos principalmente dos cosas determinar el tamantildeo de la muestra y seleccionar los elementos muestrales de manera que todos tengan la misma posibilidad de ser elegidos Para lo primero daremos una foacutermula que contiene las expresiones ya descritas Para lo segundo necesitamos un marco de seleccioacuten adecuado y un procedimiento que permita la aleatoriedad en la seleccioacuten

El tamantildeo de la muestraCuando se hace una muestra probabiliacutestica uno debe preguntarse dado que una poblacioacuten es de N iquestcuaacutel es el menor nuacutemero de unidades muestrales (personas organizaciones capiacutetulos de telenovelas etceacutetera) que necesito para conformar una muestra (n) que me asegure un error estaacutendar menor de 01La solucioacuten a esta pregunta pretende encontrar la probabilidad de ocurrencia de y que mi estimado de y se acerque a Y el valor real de la poblacioacuten Si nosotros establecemos el error estaacutendar y fijamos 01 sugerimos que esta fluctuacioacuten promedio de nuestro estimado y con respecto a los valores reales de la poblacioacuten Y no sea gt 01 es decir que de 100 casos 99 veces mi prediccioacuten sea correcta y que el valor de y se situacutee en un intervalo de confianza que comprenda el valor de YResumiendo para una determinada varianza (V) de y iquestqueacute tan grande debe ser mi muestra Esto puede determinarse en dos pasos1 n =S ~ = Tamantildeo provisional de la muestra = Varianza de la muestraV2 Varianza de la poblacioacuten2 n = n -1 + nNPongamos el siguiente ejemplo En el ejemplo que ya habiacuteamos dado en este capiacutetulo delimitamos una poblacioacuten diciendo que para un estudio de directores generales consideramos a todos aquellos directores generales de empresas industriales y comerciales que en 1983 tienen

un capital social superior a 30 millones de pesos con ventas superiores a los 100 millones de pesos yo con maacutes de 300 personas empleadas Con estas caracteriacutesticas se precisoacute que la poblacioacuten era de N = 1176 directores generales ya que 1176 empresas reuniacutean las mencionadas caracteriacutesticas iquestCuaacutel es entonces el nuacutemero de directores generales n que se tiene que entrevistar para tener un error estaacutendar menor de 015 y dado que la poblacioacuten total es de 1176N = tamantildeo de la poblacioacuten de 1176 empresasy = valor promedio de una variable = 1 un director general por empresaSe = error estaacutendar = 015 determinado por nosotrosV2 = varianza de la poblacioacuten Su definicioacuten (Se) cuadrado del error estaacutendarS2 = varianza de la muestra expresada como la probabilidad de ocurrencia de yn = tamantildeo de la muestra sin ajustarn = tamantildeo de la muestraSustituyendo tenemos quen= S2V2S2 = p(1 - p) = 9(1 - 9) = 09V = (015)2 = 000225nrsquo = 09 - = 400000225n = nrsquo - = 400 -1 + nN 1 + 4001176n = 298Es decir para nuestra investigacioacuten necesitaremos una muestra de 298 directores generalesEsto es el primer procedimiento para obtener la muestra probabiliacutestica determinar su tamantildeo con base en estimados de la poblacioacuten El segundo procedimiento estriba en coacutemo y de doacutende seleccionar a esos 298 sujetos

Muestra probabiliacutestica estratificadaEl ejemplo anterior corresponde a una muestra probabiliacutestica simpleDeterminamos en este caso que el tamantildeo de la muestra seriacutea de n = 298 directivos de empresa Pero supongamos que la situacioacuten se complica y que deberemos estratificar esta n a fin de que los elementos muestrales o unidades de anaacutelisis posean un determinado atributo En nuestro ejemplo este atributo es el giro de la empresa Es decir cuando no basta que cada uno de los elementos muestrales tengan la misma probabilidad de ser escogidos sino que ademaacutes es necesario estratificar la muestra en relacioacuten a estratos o categoriacuteas que se presentan en la poblacioacuten y que aparte son relevantes para los objetivos del estudio se disentildea una muestra probabiliacutestica estratificada Lo que aquiacute se hace es dividir a la poblacioacuten en sub-poblaciones o estratos y se selecciona una muestra para cada estratoLa estratificacioacuten aumenta la precisioacuten de la muestra e implica el uso deliberado de diferentes tamantildeos de muestra para cada estrato ldquoa fin de lograr reducir la varianza de cada unidad de la media muestral (Kish 1965) Dice Kish (p 92) en su libro de muestreo que en un nuacutemero determinado de elementos muestrales n = l n h la varianza de la media muestral y puede reducirse al miacutenimo si el tamantildeo de la muestra para cada estrato es proporcional a la desviacioacuten estaacutendar dentro del estratoSiguiendo con nuestro ejemplo de los directores de empresa la poblacioacuten es de 1176 directores de empresa y el tamantildeo de muestra es n = 298 iquestQueacute muestra necesitaremos para cada estraton 298kSh=- = = 2534N 1176De manera que el total de la subpoblacioacuten se multiplicaraacute por esta fraccioacuten constante a fin de obtener el tamantildeo de muestra para el estrato

Muestreo probabiliacutestico por racimosEn algunos casos donde el investigador se ve limitado por recursos financieros por tiempo por distancias geograacuteficas o por una combinacioacuten de eacutestos y otros obstaacuteculos se recurre al muestreo por racimos En este tipo de muestreo se reducen costos tiempo y energiacutea al considerar que muchas veces las unidades de anaacutelisis se encuentran encapsuladas o encerradas en determinados lugares fiacutesicos o geograacuteficos a los que se denomina racimosMuestrear por racimos implica diferenciar entre la unidad de anaacutelisis y la unidad muestral La unidad de anaacutelisis indica quieacutenes van a ser medidos o sea el sujeto o sujetos a quienes en uacuteltima instancia vamos a aplicar el instrumento de medicioacuten La unidad muestral (en este tipo de muestra) se refiere al racimo a traveacutes del cual se logra el acceso a la unidad de anaacutelisis El muestreo por racimos supone una seleccioacuten en dos etapas ambas con procedimientos probabiliacutesticos En la primera se seleccionan los racimos siguiendo los ya sentildealados pasos de una muestra probabiliacutestica simple o estratificada En la segunda y dentro de estos racimos se seleccionan a los sujetos u objetos que van a ser medidos Para ello se hace una seleccioacuten que asegure que todos los elementos del racimo tienen la misma probabilidad de ser elegidos

iquestCOacuteMO SE LLEVA A CABO EL PROCEDIMIENTO DE SELECCIOacuteNCuando iniciamos nuestra discusioacuten de la muestra probabiliacutestica sentildealamos que los tipos de muestra dependen de dos cosas del tamantildeo de la muestra y del procedimiento de seleccioacutenDe lo primero hemos hablado con todo detalle de lo segundo hablaremos ahora Se determina el tamantildeo de la muestra n pero iquestcoacutemo seleccionar los elementos muestrales Se precisa el nuacutemero de racimos necesario y iquestcoacutemo se seleccionan los sujetos dentro de cada racimo Hasta el momento soacutelo hemos dicho que los elementos se eligen aleatoriamente pero iquestcoacutemo se hace esto Las unidades de anaacutelisis o los elementos muestrales se eligen siempre aleatoriamente para aseguramos de que cada elemento tenga la misma probabilidad de ser elegido Pueden usarse 3 procedimientos de seleccioacuten

ToacutembolaMuy simple y no muy raacutepido consiste en numerar todos los elementos muestrales del 1 al n Hacer fichas una por cada elemento revolverlas en una caja e ir sacando n fichas seguacuten el tamantildeo de la muestra Los nuacutemeros elegidos al azar conformaraacuten la muestra

Nuacutemeros random o nuacutemeros aleatoriosEl uso de nuacutemeros random no significa la seleccioacuten azarosa o fortuita sino la utilizacioacuten de una tabla de nuacutemeros que implica un mecanismo de probabilidad muy bien disentildeado Los nuacutemeros random de la Corporacioacuten Rand fueron generados con una especie de ruleta electroacutenica Existe una tabla de un milloacuten de diacutegitos publicada por esta corporacioacuten partes de dicha tabla se encuentran en los apeacutendices de muchos libros de estadiacutestica

Seleccioacuten sistemaacutetica de elementos muestralesEste procedimiento de seleccioacuten es muy uacutetil y faacutecil de aplicar e implica seleccionar dentro de una poblacioacuten N un nuacutemero n de elementos a partir de un intervalo KK es un intervalo que va a estar determinado por el tamantildeo de la poblacioacuten y el tamantildeo de la muestra De manera que tenemos que K = Nn en donde K = es un intervalo de seleccioacuten sistemaacutetica N = es la poblacioacuten n = es la muestraSupongamos que se quiere hacer un estudio sobre varios aspectos de la publicidad en Meacutexico Especiacuteficamente se pretende medir queacute nuacutemero de mensajes informativos y queacute nuacutemero de mensajes motivacionales tienen los comerciales en la televisioacuten mexicana Para tal efecto supongamos que los investigadores consiguen videocasetes con todos los comerciales que han pasado al aire en los diferentes canales de televisioacuten durante un periodo de tres antildeos Quitando los comerciales repetidos se tiene una poblacioacuten de N = 1 548 comerciales Se procede con este dato a determinar queacute nuacutemero de comerciales necesitamos analizar para generalizar a toda la poblacioacuten nuestros resultados con un error estaacutendar no mayor de 015 Con la foacutermula que ya hemos dado tenemos que si p = 5 entonces S2 = p(l - p) = 5 - (5) = 25

n= S2V2Si necesitamos una muestra de n = 647 comerciales podemos utilizar para la seleccioacuten al intervalo K dondeK = N = 1 548 = 239 = 3 (redondeando)n 647El intervalo 1K = 3 indica que cada tercer comercial 1K seraacute seleccionado hasta completar n = 647 239 se redondea para que sea un iacutentegro Veacutease Kish (1969) pp 115117La seleccioacuten sistemaacutetica de elementos muestrales 1K se puede utilizar al elegir los elementos de n para cada estrato yo para cada racimo La regla de probabilidad seguacuten la cual cada elemento de la poblacioacuten debe tener la misma probabilidad de ser elegido se cumple empezando la seleccioacuten de 1K al azarSiguiendo nuestro ejemplo no empezamos a elegir de los 1 548 comerciales grabados el 1 3 6 9 sino que procuramos que el empiezo sea determinado por el azar Asiacute en este caso podemos tirar unos dados y si en sus caras muestran 1 6 9 empezaremos en el comercial 169 y seguiremos 169 172 175 1K volver a empezar por los primeros si es necesario Este procedimiento de seleccioacuten es poco complicado y tiene varias ventajas cualquier tipo de estratos en una poblacioacuten X se veraacuten reflejados en la muestra Asimismo la seleccioacuten sistemaacutetica logra una muestra proporcionada pues por ejemplo tenemos que el procedimiento de seleccioacuten 1K nos daraacute una muestra con nombres que inician con las letras del abecedario en forma proporcional a la letra inicial de los nombres de la poblacioacuten

LOS LISTADOS Y OTROS MARCOS MUESTRALESLas muestras probabiliacutesticas requieren la determinacioacuten del tamantildeo de la muestra y de un proceso de seleccioacuten aleatoria que asegure que todos los elementos de la poblacioacuten tengan la misma probabilidad de ser elegidos Todo esto lo hemos visto pero nos falta discutir sobre algo esencial que procede a la seleccioacuten de una muestra el listado el marco muestral El listado se refiere a una lista existente o a una lista que es necesario confeccionar ad hoc con los elementos de la poblacioacuten y a partir de la cual se seleccionaraacuten los elementos muestrales El segundo teacutermino se refiere a un marco de referencia que nos permita identificar fiacutesicamente los elementos de la poblacioacuten la posibilidad de enumerarlos y por ende proceder a la seleccioacuten de los elementos muestrales Los listados con base en listas existentes sobre una poblacioacuten pueden ser variados el directorio telefoacutenico la lista de miembros de una asociacioacuten directorios especializados las listas oficiales de escuelas de la zona las listas de las canciones de eacutexito publicadas por una revista la lista de alumnos de una universidad etceacutetera En todo caso hay que tener en cuenta lo completo de una lista su exactitud veracidad su calidad y su nivel de cobertura en relacioacuten con el problema a investigar y la poblacioacuten que va a medirse ya que todos estos aspectos influyen en la seleccioacuten de la muestraPor ejemplo para algunas encuestas se considera que el directorio telefoacutenico es muy uacutetil Sin embargo hay que tomar en cuenta que muchos teleacutefonos no apareceraacuten porque son privados o que hay hogares que no tienen teleacutefono La lista de socios de una asociacioacuten como Canacintra (Caacutemara Nacional de la industria de la Transformacioacuten) puede servimos si el propoacutesito del estudio es por ejemplo conocer la opinioacuten de los asociados con respecto a una medida gubernamental Pero si el objetivo de la investigacioacuten es el anaacutelisis de opinioacuten del sector patronal del paiacutes el listado de una asociacioacuten no seraacute adecuado por varias razones como hay otras asociaciones patronales la Canacintra representa solamente el sector de la Industria de Transformacioacuten las asociaciones son voluntarias y no todo patroacuten o empresa pertenece a ellas Lo correcto en este caso seria construir una nueva lista con base en los listados existentes de las asociaciones patronales eliminando de dicha lista los casos duplicados suponiendo que una o maacutes empresas pudieran pertenecer a dos asociaciones al mismo tiempo como director a la Coparmex (Confederacioacuten Patronal de la Repuacuteblica Mexicana) y como empresa a la ANIQ (AsociacioacutenNacional de Ingenieros Quiacutemicos)Hay listas que proporcionan una gran ayuda al investigador Pensamos en directorios especializados como el lndustridata que enlista a las empresas mexicanas medianas y grandes

el directorio de la ciudad de Meacutexico por calles el directorio de medios que enlista casas productoras estaciones de radio y televisioacuten perioacutedicos y revistas Este tipo de directorios realizados por profesionales son uacutetiles al investigador pues representan una compilacioacuten (sujetos empresas instituciones) resultado de horas de trabajo e inversioacuten de recursos Recomendamos pues utilizarIos cuando sea pertinente tomando en cuenta las consideraciones que estos directorios hacen en su introduccioacuten y que revelan a queacute antildeo pertenecen los datos coacutemo los obtuvieron (exhaustivamente por cuestionarios por voluntarios) y muy importante quieacutenes y por queacute quedan excluidos del directorioEn Meacutexico se cuenta tambieacuten con directorios de anunciantes en publicidad y mercadotecnia como el publicado por Mercameacutetrica Ediciones S A Frecuentemente es necesario construir listas ad hoc a partir de las cuales se seleccionaraacuten los elementos que constituiraacuten las unidades de anaacutelisis en una determinada investigacioacuten Por ejemplo en la investigacioacuten de La televisioacuten y el nintildeo (Fernaacutendez Collado et al 1986) se hizo una muestra probabiliacutestica estratificada por racimo donde en una primera etapa se relacionaron escuelas para en uacuteltima instancia llegar a los nintildeos Pues bien para tal efecto se consiguioacute una lista de las escuelas primarias del Distrito Federal Cada escuela teniacutea un coacutedigo identificable por medio del cual se eliminaron las escuelas para nintildeos atiacutepicos Este listado conteniacutea ademaacutes informacioacuten sobre cada escuela sobre su ubicacioacuten (calle y colonia) sobre su propiedad (puacuteblica o privada)Con ayuda de otro estudio que catalogaba en diferentes estratos socioeconoacutemicos a las colonias del Distrito Federal con base en el ingreso promedio de la zona se hicieron 8 listas1 escuela puacuteblica clase A2 escuelas privadas clase A3 escuelas puacuteblicas clase B4 escuelas privadas clase B5 escuelas puacuteblicas clase C6 escuelas privadas clase C7 escuelas puacuteblicas clase D8 escuelas privadas clase DCada lista representaba un estrato de la poblacioacuten y de cada una de ellas se seleccionoacute una muestra de escuelas No siempre existen listas que permitan identificar nuestra poblacioacuten Seraacute necesario recurrir a otros marcos de referencia que contengan descripciones del material organizaciones o sujetos que seraacuten seleccionados como unidades de anaacutelisis Algunos de estos marcos de referencia son los archivos los mapas voluacutemenes de perioacutedicos empastados en una biblioteca o las horas de transmisioacuten de varios canales de televisioacuten De cada una de estas instancias daremos ejemplos con maacutes detalles

ArchivosUn jefe de reclutamiento y seleccioacuten de una institucioacuten quiere precisar si algunos datos que se dan en una solicitud de trabajo estaacuten correlacionados con el ausentismo del empleado Es decir si a partir de datos como edad sexo estado civil y duracioacuten en otro trabajo puede predecirse que alguien tenderaacute a ausentarse Para establecer correlaciones se consideraraacuten como poblacioacuten a todos los sujetos contratados durante 10 antildeos Se relacionan sus datos en la solicitud de empleo con los registros de faltas Como no hay una lista elaborada de estos sujetos el investigador decide acudir a los archivos de las solicitudes de empleo Estos archivos constituyen su marco muestral a partir del cual obtendraacute la muestra Calcula el tamantildeo de la poblacioacuten obtiene el tamantildeo de la muestra y selecciona sistemaacuteticamente cada elemento 1K cada solicitud que seraacute analizada Aqui el problema que surge es que en el archivo hay solicitudes de gente que no fue contratada y por tanto no pueden ser consideradas en el estudioEn este caso y en otros donde no todos los elementos del marco de referencia o de una lista (por ejemplo nombres en el directorio que no corresponden a una persona fiacutesica) los especialistas en muestreo (Kish 1965 Sutman 1976) no aconsejan el reemplazo con el siguiente elemento sino simplemente no tomar en cuenta ese elemento es decir como si no existiera continuaacutendose con el intervalo de seleccioacuten sistemaacutetica

MapasLos mapas son muy uacutetiles como marco de referencia en muestras de racimoPor ejemplo un investigador quiere saber queacute motiva a los compradores en una determinada tienda de autoservicio A partir de una lista de tiendas de cada cadena competidora marca sobre un mapa de la ciudad todas las tiendas de autoservicios las cuales constituyen una poblacioacuten de racimos pues en cada tienda seleccionada entrevistaraacute a un nuacutemero n de clientes El mapa le permite ver la poblacioacuten (tiendas autoservicio) y su situacioacuten geograacutefica de manera que eligioacute zonas donde coexistan tiendas de la competencia para asegurarse de que el consumidor de la zona tenga todas las posibles alternativas

VoluacutemenesEn este ejemplo supongamos que un estudioso del periodismo quiere hacer un anaacutelisis de contenido de los editoriales de los tres principales diarios de la ciudad durante el porfiriato El investigador va a la Hemeroteca Nacional y encuentra que los diarios son encuadernados por trimestre y antildeo lo cual le proporciona un marco de referencia ideal a partir del cual seleccionaraacuten voluacutemenes para su anaacutelisis Supongamos sin embargo que encuentra que el volumen X que contiene el perioacutedico El Hijo del Ahuizote (enero-marzo 1899) falta en la Hemeroteca iquestQueacute hace Pues redefine la poblacioacuten manifestando expliacutecitamente que de N voluacutemenes tiene 99 de los elementos y a partir de este nuevo nuacutemero de N calculoacute su muestra n y la seleccionoacute

Horas de transmisioacutenEn un estudio de Portilla y Soloacuterzano (1982) los investigadores queriacutean hacer un anaacutelisis de anuncios en la televisioacuten mexicana Las emisoras no proporcionan una lista de anuncios ni sus horas de transmisioacuten Por otra parte saldriacutea muy caro grabar todos los anuncios a todas horas y seriacutea imposible estar frente al televisor para hacerloAnte la imposibilidad de tener un listado de comerciales se hicieron listados que identificaron cada media hora de transmisioacuten televisiva en cada canal 2 4 5 9 y 13 de las 7 a las 24 horas durante siete diacuteas de una semana de octubre de 1982 La poblacioacuten estaba constituida del nuacutemero total de medias horas de transmisioacuten televisiva N = 1 190 horas Esta poblacioacuten se dividioacute en estratos mantildeana mediodiacutea tarde y noche y se procedioacute a calcular el tamantildeo de la muestra tomando en consideracioacuten que por cada media hora de transmisioacuten hay 6 minutos de comerciales (De Noriega 1979)Se calculoacute el nuacutemero de medias horas que se seleccionariacutean para obtener una muestra n Una vez obtenido el tamantildeo de la muestra se seleccionaron aleatoriamente n medias horas y por uacuteltimo se grabaron y analizaron uacutenicamente aquellos comerciales contenidos en las medias horas seleccionadas al azar y que representaron diferentes canales y segmentos del diacutea El punto en este ejemplo es la construccioacuten concreta de un marco muestral que permitiera el anaacutelisis de una muestra probabiliacutestica de comerciales

TAMANtildeO OacutePTIMO DE UNA MUESTRA Y EL TEOREMA DEL LIacuteMITE CENTRALLas muestras probabiliacutesticas requieren dos procedimientos baacutesicos 1 La determinacioacuten del tamantildeo de la muestra y 2 la seleccioacuten aleatoria de los elementos muestrales El primer procedimiento lo hemos descrito en su modalidad maacutes simple en este capiacutetulo Precisar adecuadamente el tamantildeo de la muestra puede tornarse muy complejo dependiendo del problema de investigacioacuten y la poblacioacuten a estudiar Para el alumno seraacute muy uacutetil comparar que tamantildeo de muestra han utilizado otros investigadores en ciencias sociales

iquestCOacuteMO SON LAS MUESTRAS NO PROBABILIacuteSTICASLas muestras no probabiliacutesticas tambieacuten llamadas muestras dirigidas suponen un procedimiento de seleccioacuten informal y un poco arbitrario Auacuten asiacute se utilizan en muchas investigaciones y a partir de ellas se hacen inferencias sobre la poblacioacuten Es como si juzgaacutesemos el sabor de un cargamento de limones solamente probando alguno como si para muestra bastase un botoacuten La muestra dirigida selecciona sujetos tiacutepicos con la vaga esperanza de que seraacuten casos representativos de una poblacioacuten determinada

La verdad es que las muestras dirigidas tienen muchas desventajas La primera es que al no ser probabiliacutesticas no podemos calcular con precisioacuten el error estaacutendar es decir no podemos calcular con queacute nivel de confianza hacemos una estimacioacuten Esto es un grave inconveniente si consideramos que la estadiacutestica inferencial se basa en teoriacutea de la probabilidad por lo que pruebas estadiacutesticas en muestras no probabiliacutesticas tienen un valor limitado y relativo ala muestra en siacute mas no a la poblacioacuten Es decir los datos no pueden generalizarse a una poblacioacuten que no se consideroacute ni en sus paraacutemetros ni en sus elementos para obtener la muestra Recordemos que en las muestras de este tipo la eleccioacuten de los sujetos no depende de que todos tengan la misma probabilidad de ser elegidos sino de la decisioacuten de un investigador o grupo de encuestadoresLa ventaja de una muestra no probabiliacutestica es su utilidad para determinado disentildeo de estudio que requiere no tanto una representatividad de elementos de una poblacioacuten sino una cuidadosa y controlada eleccioacuten de sujetos con ciertas caracteriacutesticas especificadas previamente en el planteamiento del problemaHay variacuteas clases de muestras dirigidas y se definiraacuten a continuacioacuten

La muestra de sujetos voluntariosLas muestras de sujetos voluntarios son frecuentes en ciencias sociales y ciencias de la conducta Se trata de muestras fortuitas utilizadas tambieacuten en la medicina y la arqueologiacutea donde el investigador elabora conclusiones sobre especiacutemenes que llegan a sus manos de manera casual Pensemos por ejemplo en los sujetos que voluntariamente acceden a participar en un estudio que monitorea los efectos de un medicamento o en el investigador que anuncia en una clase que estaacute haciendo un estudio sobre motivacioacuten en el universitario e invita a aquellos que acepten someterse a una prueba proyectiva TAT En estos casos la eleccioacuten de los individuos que seraacuten sujetos a anaacutelisis depende de circunstancias fortuitas Este tipo de muestra se usa en estudios de laboratorio donde se procura que los sujetos sean homogeacuteneos en variables tales como edad sexo inteligencia de manera que los resultados o efectos no obedezcan a diferencias individuales sino a las condiciones a las que fueron sometidos

La muestra de expertosEn ciertos estudios es necesaria la opinioacuten de sujetos expertos en un temaEstas muestras son frecuentes en estudios cualitativos y exploratorios que para generar hipoacutetesis maacutes precisas o la materia prima del disentildeo de cuestionarios Por ejemplo en un estudio sobre el perfil de la mujer periodista en Meacutexico (Barrera et al 1989) se recurrioacute a una muestra de TI = 227 mujeres periodistas pues se consideroacute que eran los sujetos idoacuteneos para hablar de contratacioacuten sueldos y desempentildeo de las mujeres periodistas Estas muestras son vaacutelidas y uacutetiles cuando los objetivos del estudio asiacute lo requieren

Los sujetos-tipoTambieacuten esta muestra se utiliza en estudios exploratorios y en investigaciones de tipo cualitativo donde el objetivo es la riqueza profundidad y calidad de la informacioacuten no la cantidad ni la estandarizacioacuten En estudios de perspectiva fenomenoloacutegica donde el objetivo es analizar los valores ritos y significados de un determinado grupo social el uso tanto de expertos como de sujetos-tipo es frecuente Por ejemplo pensamos en los trabajos de Howard Becker (El muacutesica de jazz Las muchachas de blanco) que se basan en grupos de tiacutepicos muacutesicos de jazz y tiacutepicos estudiantes de medicina para adentrarse en el anaacutelisis de los patrones de identificacioacuten y socializacioacuten de estas dos profesiones la de muacutesico y la de meacutedicoLos estudios motivacionales los cuales se hacen para el anaacutelisis de las actitudes y conductas del consumidor tambieacuten utilizan muestras de sujeto-tipoAquiacute se definen los grupos a los que va dirigido un determinado producto (por ejemplo joacutevenes clase socio econoacutemica A y B amas de casa clase B ejecutivos clase A-B) y se construyen grupos de 8 o 10 personas cuyos integrantes tengan las caracteriacutesticas sociales y demograacuteficas de dicho sub grupo

Con ese grupo se efectuacutea una sesioacuten un facilitador o moderador dirigiraacute una conversacioacuten donde los miembros del grupo expresen sus actitudes valores medios expectativas motivaciones hacia las caracteriacutesticas de determinado producto o servicio

La muestra por cuotasEste tipo de muestra se utiliza mucho en estudios de opinioacuten y de mercadotecnia Los encuestadores reciben instrucciones de administrar cuestionarios con sujetos en la calle y al hacerla van conformando o llenando cuotas de acuerdo con la proporcioacuten de ciertas variables demograacuteficas en la poblacioacuten Asiacute en un estudio sobre la actitud de la poblacioacuten hacia un candidato poliacutetico se dice a los encuestadores que vayan a determinada colonia y entrevisten a 150 sujetos Que el 25 sean hombres mayores de 30 antildeos 25 mujeres mayores de 30 antildeos 25 hombres menores de 25 antildeos y 25 mujeres menores de 25 antildeos Asiacute se construyen estas muestras que como vemos dependen en cierta medida del juicio del entrevistadorPara el caso de los infectados con el VIH se realizoacute una muestra no probabiliacutestica (porque se encuestoacute y se analizoacute a cuantas personas se pudieron localizar lo que representoacute un 18 de los receptores de sangre o derivados provenientes del laboratorio Transfusiones y Hematologiacutea SA que habiacutean sido atendidos en los servicios meacutedicos de Petroacuteleos Mexicanos y no se analizoacute a posibles portadores del VIH que hubieran adquirido el virus de otra manera) La muestra se obtuvo de tres fuentes baacutesicas a) presentacioacuten espontaacutenea por siacutentomas b) captado por exaacutemenes de rutina o contractuales y e) tras la aplicacioacuten de una encuesta seroloacutegica a 482 receptores de sangre y plasma provenientes del laboratorio de referencia Dicho de otra manera no se pudo detectar a todos los infectados con el VIH contenido en la sangre o derivados provenientes del laboratorio aludido pero con el 18 de eacutestos se pudo establecer que 17 de cada 100 casos habriacutean sido infectados con el VIH

RESUMENEn este capiacutetulo describimos coacutemo seleccionar una muestra Lo primero que se debe plantear es quieacutenes van a ser medidos lo que corresponde a definir la unidad de anaacutelisis Se procede despueacutes a delimitar claramente la poblacioacuten con base en los objetivos del estudio y en cuanto a caracteriacutesticas de contenido de lugar y en el tiempoLa muestra es un subgrupo de la poblacioacuten y puede ser probabiliacutestica o no probabiliacutesticaElegir queacute tipo de muestra se requiere depende de los objetivos del estudio y del esquema de investigacioacutenLas muestras probabiliacutesticas son esenciales en los disentildeos de investigacioacuten por encuestas donde se pretenden generalizar los resultados a una poblacioacuten La caracteriacutestica de este tipo de muestra es que todos los elementos de la poblacioacuten tienen al inicio la misma probabilidad de ser elegidos de esta manera los elementos muestrales tendraacuten valores muy aproximados a los valores de la poblacioacuten ya que las mediciones del subconjunto seraacuten estimaciones muy precisas del conjunto mayor Esta precisioacuten depende del error de muestreo llamado tambieacuten error estaacutendarPara una muestra probabiliacutestica necesitamos dos cosas determinar el tamantildeo de la muestra y seleccionar los elementos muestrales en forma aleatoriaEl tamantildeo de la muestra se calcula con base en la varianza de la poblacioacuten y la varianza de la muestra Esta uacuteltima expresada en teacuterminos de probabilidad de ocurrencia La varianza de la poblacioacuten se calcula con el cuadrado del error estaacutendar el cual determinamos Entre menor sea el error estaacutendar mayor seraacute el tamantildeo de la muestraLas muestras probabiliacutesticas pueden ser simples estratificadas y por racimosLa estratificacioacuten aumenta la precisioacuten de la muestra e implica el uso deliberado de sub-muestras para cada estrato o categoriacutea que sea relevante en la poblacioacuten Muestrear por racimos implica diferencias entre la unidad de anaacutelisis y la unidad muestral En este tipo de muestreo hay una seleccioacuten en dos etapas ambas con procedimientos probabiliacutesticos En la primera se seleccionan los racimos escuelas organizaciones salones de clase en la segunda y dentro de los racimos a los sujetos que van a ser medidos

Los elementos muestrales de una muestra probabiliacutestica siempre se eligen aleatoriamente para aseguramos de que cada elemento tenga la misma probabilidad de ser elegido Pueden usarse tres procedimientos de seleccioacuten1 Toacutembola 2 Tabla de nuacutemeros random y 3 Seleccioacuten sistemaacutetica Todo procedimiento de seleccioacuten depende de listados ya sea existentes o construidos ad hoc Listados pueden ser el directorio telefoacutenico listas de asociaciones listas de escuelas oficiales etceacutetera Cuando no existen listas de elementos de la poblacioacuten se recurren a otros marcos de referencia que contengan descripciones del material organizaciones o sujetos seleccionados como unidades de anaacutelisis Algunos de eacutestos pueden ser los archivos hemerotecas y los mapasLas muestras no-probabiliacutesticas pueden tambieacuten llamarse muestras dirigidas pues la eleccioacuten de sujetos u objetos de estudio depende del criterio del investigador Las muestras dirigidas pueden ser de varias clases 1 Muestra de sujetos voluntarios frecuentemente utilizados con disentildeos experimentales y situaciones de laboratorio 2 Muestra de expertos frecuentemente utilizados en estudios exploratorios 3 Muestra de sujetos tipo o estudios de casos utilizados en estudios cualitativos y motivacionales y 4 muestreo por cuotas frecuentes en estudios de opinioacuten y de mercadotecnia Las muestras dirigidas son vaacutelidas en cuanto a que un determinado disentildeo de investigacioacuten asiacute los requiere sin embargo los resultados son generalizables a la muestra en siacute o a muestras similares No son generalizables a una poblacioacutenEn el teorema de liacutemite central se sentildeala que una muestra de maacutes de cien casos seraacute una muestra con una distribucioacuten normal en sus caracteriacutesticas sin embargo la normalidad no debe conjuntarse con probabilidad Mientras lo primero es necesario para efectuar pruebas estadiacutesticas lo segundo es requisito indispensable para hacer inferencias correctas sobre una poblacioacuten

Page 2: CAPÍTULO 8 muestra y población

claramente las caracteriacutesticas de la poblacioacuten a fin de delimitar cuaacuteles seraacuten los paraacutemetros muestralesLo anterior puede ilustrarse con el ejemplo de la investigacioacuten sobre el uso de la televisioacuten por los nintildeos Estaacute claro que en dicha investigacioacuten la unidad de anaacutelisis son los nintildeos Pero iquestde queacute poblacioacuten se trata iquestde todos los nintildeos del mundo iquestde todos los nintildeos de la Repuacuteblica Mexicana Seriacutea muy ambicioso y praacutecticamente imposible referimos a poblaciones tan grandes Asiacute en nuestro ejemplo la poblacioacuten fue delimitada de la siguiente manera

Liacutemites de poblacioacutenTodos los nintildeos del aacuterea metropolitana que cursen 4deg 5ordm y 6deg de primaria en escuelas privadas y puacuteblicas del turno matutino Esta definicioacuten eliminoacute entonces a nintildeos mexicanos que no vivieran en el aacuterea metropolitana del DF a los que no van a la escuela y a los menores de 9 antildeos Pero por otra parte permitioacute hacer una investigacioacuten costeable con cuestionarios contestados por nintildeos que ya sabiacutean escribir y un control sobre la inclusioacuten de nintildeos de todas las zonas de la metroacutepolis al usar la ubicacioacuten de las escuelas como puntos de referencia y de seleccioacuten En eacuteste y otros casos la delimitacioacuten de las caracteriacutesticas de la poblacioacuten no soacutelo depende de los objetivos del estudio sino de otras razones praacutecticas Un estudio no seraacute mejor por tener una poblacioacuten maacutes grande la calidad de un trabajo estriba en delimitar claramente la poblacioacuten con base en los objetivos del estudioLas poblaciones deben situarse claramente en tomo a sus caracteriacutesticas de contenido lugar y en el tiempo Por ejemplo en un estudio sobre los directivos de empresa en Meacutexico (Baptista 1983) y con base en las consideraciones teoacutericas del estudio que describe el comportamiento gerencial de los individuos y la relacioacuten de eacuteste con otras variables de tipo organizacional se procedioacute a definir la poblacioacuten de la siguiente maneraNuestra poblacioacuten comprende a todos aquellos directores generales de empresas industriales y comerciales que en 1983 tienen un capital social superior a 30 millones de pesos con ventas superiores a los 100 millones de pesos y lo con maacutes de 300 personas empleadasEn este ejemplo se delimita claramente la poblacioacuten excluyendo a personas que no son directores generales a empresas que no pertenezcan al giro industrial y comercial Se establece tambieacuten claramente que se trata de empresas medianas y grandes con base en criterios de capital y de recursos humanos Finalmente se indica que estos criterios operaron en 1983Los criterios que cada investigador cumpla dependen de sus objetivos de estudio lo importante es establecerlos claramenteToda investigacioacuten debe ser transparente sujeta a criacutetica y a reacuteplica y este ejercicio no es posible si al examinar los resultados el lector no puede referirlos a la poblacioacuten utilizada en un estudio

iquestCOacuteMO SELECCIONAR LA MUESTRAHasta este momento hemos visto que se debe definir cuaacutel seraacute la unidad de anaacutelisis y cuaacuteles son las caracteriacutesticas de la poblacioacuten En este inciso hablaremos de la muestra o mejor dicho de los tipos de muestra a fin de poder elegir la maacutes conveniente para un estudioLa muestra es en esencia un subgrupo de la poblacioacuten Digamos que es un sub conjunto de elementos que pertenecen a ese conjunto definido en sus caracteriacutesticas al que llamamos poblacioacuten Con frecuencia leemos y oiacutemos hablar de muestra representativa muestra al azar muestra aleatoria como si con los simples teacuterminos se pudiera dar maacutes seriedad a los resultados En realidad pocas veces se puede medir a toda la poblacioacuten por lo que obtenemos o seleccionamos una muestra y desde luego se pretende que este sub conjunto sea un reflejo fiel del conjunto de la poblacioacuten Todas las muestras deben ser representativas por tanto el uso de este teacutermino es por demaacutes inuacutetil Los teacuterminos al azar y aleatorio denotan un tipo de procedimiento mecaacutenico relacionado con la probabilidad y con la seleccioacuten de elementos pero no logra esclarecer tampoco el tipo de muestra y el procedimiento de muestreo

Tipos de muestraBaacutesicamente categorizamos las muestras en dos grandes ramas las muestras no probabiliacutesticas y las muestras probabiliacutesticas En estas uacuteltimas todos los elementos de la poblacioacuten tienen la misma posibilidad de ser escogidos Esto se obtiene definiendo las caracteriacutesticas de la

poblacioacuten el tamantildeo de la muestra y a traveacutes de una seleccioacuten aleatoria yo mecaacutenica de las unidades de anaacutelisis Imagiacutenese el procedimiento para obtener el nuacutemero premiado en un sorteo de loteriacutea Este nuacutemero se va formando en el momento del sorteo a partir de las esferas con un diacutegito que se van sacando (despueacutes de revolverlas mecaacutenicamente) hasta formar el nuacutemero de manera que todos los nuacutemeros tienen la misma probabilidad de ser elegidosEn las muestras no probabiliacutesticas la eleccioacuten de los elementos no depende de la probabilidad sino de causas relacionadas con las caracteriacutesticas del investigador o del que hace la muestra Aquiacute el procedimiento no es mecaacutenico ni con base en foacutermulas de probabilidad sino que depende del proceso de toma de decisiones de una persona o grupo de personas y desde luego las muestras seleccionadas por decisiones subjetivas tienden a estar sesgadasElegir entre una muestra probabiliacutestica o una no probabiliacutestica depende de los objetivos del estudio del esquema de investigacioacuten y de la contribucioacuten que se piensa hacer con ella

iquestCOacuteMO SE HACE UNA MUESTRA PROBABILIacuteSTICALa eleccioacuten entre la muestra probabiliacutestica y una no probabiliacutestica se determina con base en los objetivos del estudio el esquema de la investigacioacuten y el alcance de sus contribuciones Las muestras probabiliacutesticas tienen muchas ventajas quizaacute la principal es que puede medirse el tamantildeo de error en nuestras predicciones Puede decirse incluso que el principal objetivo en el disentildeo de una muestra probabiliacutestica es reducir al miacutenimo este error al que se le llama error estaacutendar (Kish 1965)Las muestras probabiliacutesticas son esenciales en los disentildeos de investigacioacuten por encuestas en las que se pretende hacer estimaciones de variables en la poblacioacuten estas variables se miden con instrumentos de medicioacuten y se analizan con pruebas estadiacutesticas para el anaacutelisis de datos donde se presupone que la muestra es probabiliacutestica donde todos los elementos de la poblacioacuten tienen una misma probabilidad de ser elegidos Los elementos muestrales tendraacuten valores muy parecidos a los de la poblacioacuten de manera que las mediciones en el sub conjunto nos daraacuten estimados precisos del conjunto mayor La precisioacuten de dichos estimados depende del error en el muestreo que se puede calcular pues hay errores que dependen de la medicioacuten y estos errores no pueden ser calculados matemaacuteticamentePara una muestra probabiliacutestica necesitamos principalmente dos cosas determinar el tamantildeo de la muestra y seleccionar los elementos muestrales de manera que todos tengan la misma posibilidad de ser elegidos Para lo primero daremos una foacutermula que contiene las expresiones ya descritas Para lo segundo necesitamos un marco de seleccioacuten adecuado y un procedimiento que permita la aleatoriedad en la seleccioacuten

El tamantildeo de la muestraCuando se hace una muestra probabiliacutestica uno debe preguntarse dado que una poblacioacuten es de N iquestcuaacutel es el menor nuacutemero de unidades muestrales (personas organizaciones capiacutetulos de telenovelas etceacutetera) que necesito para conformar una muestra (n) que me asegure un error estaacutendar menor de 01La solucioacuten a esta pregunta pretende encontrar la probabilidad de ocurrencia de y que mi estimado de y se acerque a Y el valor real de la poblacioacuten Si nosotros establecemos el error estaacutendar y fijamos 01 sugerimos que esta fluctuacioacuten promedio de nuestro estimado y con respecto a los valores reales de la poblacioacuten Y no sea gt 01 es decir que de 100 casos 99 veces mi prediccioacuten sea correcta y que el valor de y se situacutee en un intervalo de confianza que comprenda el valor de YResumiendo para una determinada varianza (V) de y iquestqueacute tan grande debe ser mi muestra Esto puede determinarse en dos pasos1 n =S ~ = Tamantildeo provisional de la muestra = Varianza de la muestraV2 Varianza de la poblacioacuten2 n = n -1 + nNPongamos el siguiente ejemplo En el ejemplo que ya habiacuteamos dado en este capiacutetulo delimitamos una poblacioacuten diciendo que para un estudio de directores generales consideramos a todos aquellos directores generales de empresas industriales y comerciales que en 1983 tienen

un capital social superior a 30 millones de pesos con ventas superiores a los 100 millones de pesos yo con maacutes de 300 personas empleadas Con estas caracteriacutesticas se precisoacute que la poblacioacuten era de N = 1176 directores generales ya que 1176 empresas reuniacutean las mencionadas caracteriacutesticas iquestCuaacutel es entonces el nuacutemero de directores generales n que se tiene que entrevistar para tener un error estaacutendar menor de 015 y dado que la poblacioacuten total es de 1176N = tamantildeo de la poblacioacuten de 1176 empresasy = valor promedio de una variable = 1 un director general por empresaSe = error estaacutendar = 015 determinado por nosotrosV2 = varianza de la poblacioacuten Su definicioacuten (Se) cuadrado del error estaacutendarS2 = varianza de la muestra expresada como la probabilidad de ocurrencia de yn = tamantildeo de la muestra sin ajustarn = tamantildeo de la muestraSustituyendo tenemos quen= S2V2S2 = p(1 - p) = 9(1 - 9) = 09V = (015)2 = 000225nrsquo = 09 - = 400000225n = nrsquo - = 400 -1 + nN 1 + 4001176n = 298Es decir para nuestra investigacioacuten necesitaremos una muestra de 298 directores generalesEsto es el primer procedimiento para obtener la muestra probabiliacutestica determinar su tamantildeo con base en estimados de la poblacioacuten El segundo procedimiento estriba en coacutemo y de doacutende seleccionar a esos 298 sujetos

Muestra probabiliacutestica estratificadaEl ejemplo anterior corresponde a una muestra probabiliacutestica simpleDeterminamos en este caso que el tamantildeo de la muestra seriacutea de n = 298 directivos de empresa Pero supongamos que la situacioacuten se complica y que deberemos estratificar esta n a fin de que los elementos muestrales o unidades de anaacutelisis posean un determinado atributo En nuestro ejemplo este atributo es el giro de la empresa Es decir cuando no basta que cada uno de los elementos muestrales tengan la misma probabilidad de ser escogidos sino que ademaacutes es necesario estratificar la muestra en relacioacuten a estratos o categoriacuteas que se presentan en la poblacioacuten y que aparte son relevantes para los objetivos del estudio se disentildea una muestra probabiliacutestica estratificada Lo que aquiacute se hace es dividir a la poblacioacuten en sub-poblaciones o estratos y se selecciona una muestra para cada estratoLa estratificacioacuten aumenta la precisioacuten de la muestra e implica el uso deliberado de diferentes tamantildeos de muestra para cada estrato ldquoa fin de lograr reducir la varianza de cada unidad de la media muestral (Kish 1965) Dice Kish (p 92) en su libro de muestreo que en un nuacutemero determinado de elementos muestrales n = l n h la varianza de la media muestral y puede reducirse al miacutenimo si el tamantildeo de la muestra para cada estrato es proporcional a la desviacioacuten estaacutendar dentro del estratoSiguiendo con nuestro ejemplo de los directores de empresa la poblacioacuten es de 1176 directores de empresa y el tamantildeo de muestra es n = 298 iquestQueacute muestra necesitaremos para cada estraton 298kSh=- = = 2534N 1176De manera que el total de la subpoblacioacuten se multiplicaraacute por esta fraccioacuten constante a fin de obtener el tamantildeo de muestra para el estrato

Muestreo probabiliacutestico por racimosEn algunos casos donde el investigador se ve limitado por recursos financieros por tiempo por distancias geograacuteficas o por una combinacioacuten de eacutestos y otros obstaacuteculos se recurre al muestreo por racimos En este tipo de muestreo se reducen costos tiempo y energiacutea al considerar que muchas veces las unidades de anaacutelisis se encuentran encapsuladas o encerradas en determinados lugares fiacutesicos o geograacuteficos a los que se denomina racimosMuestrear por racimos implica diferenciar entre la unidad de anaacutelisis y la unidad muestral La unidad de anaacutelisis indica quieacutenes van a ser medidos o sea el sujeto o sujetos a quienes en uacuteltima instancia vamos a aplicar el instrumento de medicioacuten La unidad muestral (en este tipo de muestra) se refiere al racimo a traveacutes del cual se logra el acceso a la unidad de anaacutelisis El muestreo por racimos supone una seleccioacuten en dos etapas ambas con procedimientos probabiliacutesticos En la primera se seleccionan los racimos siguiendo los ya sentildealados pasos de una muestra probabiliacutestica simple o estratificada En la segunda y dentro de estos racimos se seleccionan a los sujetos u objetos que van a ser medidos Para ello se hace una seleccioacuten que asegure que todos los elementos del racimo tienen la misma probabilidad de ser elegidos

iquestCOacuteMO SE LLEVA A CABO EL PROCEDIMIENTO DE SELECCIOacuteNCuando iniciamos nuestra discusioacuten de la muestra probabiliacutestica sentildealamos que los tipos de muestra dependen de dos cosas del tamantildeo de la muestra y del procedimiento de seleccioacutenDe lo primero hemos hablado con todo detalle de lo segundo hablaremos ahora Se determina el tamantildeo de la muestra n pero iquestcoacutemo seleccionar los elementos muestrales Se precisa el nuacutemero de racimos necesario y iquestcoacutemo se seleccionan los sujetos dentro de cada racimo Hasta el momento soacutelo hemos dicho que los elementos se eligen aleatoriamente pero iquestcoacutemo se hace esto Las unidades de anaacutelisis o los elementos muestrales se eligen siempre aleatoriamente para aseguramos de que cada elemento tenga la misma probabilidad de ser elegido Pueden usarse 3 procedimientos de seleccioacuten

ToacutembolaMuy simple y no muy raacutepido consiste en numerar todos los elementos muestrales del 1 al n Hacer fichas una por cada elemento revolverlas en una caja e ir sacando n fichas seguacuten el tamantildeo de la muestra Los nuacutemeros elegidos al azar conformaraacuten la muestra

Nuacutemeros random o nuacutemeros aleatoriosEl uso de nuacutemeros random no significa la seleccioacuten azarosa o fortuita sino la utilizacioacuten de una tabla de nuacutemeros que implica un mecanismo de probabilidad muy bien disentildeado Los nuacutemeros random de la Corporacioacuten Rand fueron generados con una especie de ruleta electroacutenica Existe una tabla de un milloacuten de diacutegitos publicada por esta corporacioacuten partes de dicha tabla se encuentran en los apeacutendices de muchos libros de estadiacutestica

Seleccioacuten sistemaacutetica de elementos muestralesEste procedimiento de seleccioacuten es muy uacutetil y faacutecil de aplicar e implica seleccionar dentro de una poblacioacuten N un nuacutemero n de elementos a partir de un intervalo KK es un intervalo que va a estar determinado por el tamantildeo de la poblacioacuten y el tamantildeo de la muestra De manera que tenemos que K = Nn en donde K = es un intervalo de seleccioacuten sistemaacutetica N = es la poblacioacuten n = es la muestraSupongamos que se quiere hacer un estudio sobre varios aspectos de la publicidad en Meacutexico Especiacuteficamente se pretende medir queacute nuacutemero de mensajes informativos y queacute nuacutemero de mensajes motivacionales tienen los comerciales en la televisioacuten mexicana Para tal efecto supongamos que los investigadores consiguen videocasetes con todos los comerciales que han pasado al aire en los diferentes canales de televisioacuten durante un periodo de tres antildeos Quitando los comerciales repetidos se tiene una poblacioacuten de N = 1 548 comerciales Se procede con este dato a determinar queacute nuacutemero de comerciales necesitamos analizar para generalizar a toda la poblacioacuten nuestros resultados con un error estaacutendar no mayor de 015 Con la foacutermula que ya hemos dado tenemos que si p = 5 entonces S2 = p(l - p) = 5 - (5) = 25

n= S2V2Si necesitamos una muestra de n = 647 comerciales podemos utilizar para la seleccioacuten al intervalo K dondeK = N = 1 548 = 239 = 3 (redondeando)n 647El intervalo 1K = 3 indica que cada tercer comercial 1K seraacute seleccionado hasta completar n = 647 239 se redondea para que sea un iacutentegro Veacutease Kish (1969) pp 115117La seleccioacuten sistemaacutetica de elementos muestrales 1K se puede utilizar al elegir los elementos de n para cada estrato yo para cada racimo La regla de probabilidad seguacuten la cual cada elemento de la poblacioacuten debe tener la misma probabilidad de ser elegido se cumple empezando la seleccioacuten de 1K al azarSiguiendo nuestro ejemplo no empezamos a elegir de los 1 548 comerciales grabados el 1 3 6 9 sino que procuramos que el empiezo sea determinado por el azar Asiacute en este caso podemos tirar unos dados y si en sus caras muestran 1 6 9 empezaremos en el comercial 169 y seguiremos 169 172 175 1K volver a empezar por los primeros si es necesario Este procedimiento de seleccioacuten es poco complicado y tiene varias ventajas cualquier tipo de estratos en una poblacioacuten X se veraacuten reflejados en la muestra Asimismo la seleccioacuten sistemaacutetica logra una muestra proporcionada pues por ejemplo tenemos que el procedimiento de seleccioacuten 1K nos daraacute una muestra con nombres que inician con las letras del abecedario en forma proporcional a la letra inicial de los nombres de la poblacioacuten

LOS LISTADOS Y OTROS MARCOS MUESTRALESLas muestras probabiliacutesticas requieren la determinacioacuten del tamantildeo de la muestra y de un proceso de seleccioacuten aleatoria que asegure que todos los elementos de la poblacioacuten tengan la misma probabilidad de ser elegidos Todo esto lo hemos visto pero nos falta discutir sobre algo esencial que procede a la seleccioacuten de una muestra el listado el marco muestral El listado se refiere a una lista existente o a una lista que es necesario confeccionar ad hoc con los elementos de la poblacioacuten y a partir de la cual se seleccionaraacuten los elementos muestrales El segundo teacutermino se refiere a un marco de referencia que nos permita identificar fiacutesicamente los elementos de la poblacioacuten la posibilidad de enumerarlos y por ende proceder a la seleccioacuten de los elementos muestrales Los listados con base en listas existentes sobre una poblacioacuten pueden ser variados el directorio telefoacutenico la lista de miembros de una asociacioacuten directorios especializados las listas oficiales de escuelas de la zona las listas de las canciones de eacutexito publicadas por una revista la lista de alumnos de una universidad etceacutetera En todo caso hay que tener en cuenta lo completo de una lista su exactitud veracidad su calidad y su nivel de cobertura en relacioacuten con el problema a investigar y la poblacioacuten que va a medirse ya que todos estos aspectos influyen en la seleccioacuten de la muestraPor ejemplo para algunas encuestas se considera que el directorio telefoacutenico es muy uacutetil Sin embargo hay que tomar en cuenta que muchos teleacutefonos no apareceraacuten porque son privados o que hay hogares que no tienen teleacutefono La lista de socios de una asociacioacuten como Canacintra (Caacutemara Nacional de la industria de la Transformacioacuten) puede servimos si el propoacutesito del estudio es por ejemplo conocer la opinioacuten de los asociados con respecto a una medida gubernamental Pero si el objetivo de la investigacioacuten es el anaacutelisis de opinioacuten del sector patronal del paiacutes el listado de una asociacioacuten no seraacute adecuado por varias razones como hay otras asociaciones patronales la Canacintra representa solamente el sector de la Industria de Transformacioacuten las asociaciones son voluntarias y no todo patroacuten o empresa pertenece a ellas Lo correcto en este caso seria construir una nueva lista con base en los listados existentes de las asociaciones patronales eliminando de dicha lista los casos duplicados suponiendo que una o maacutes empresas pudieran pertenecer a dos asociaciones al mismo tiempo como director a la Coparmex (Confederacioacuten Patronal de la Repuacuteblica Mexicana) y como empresa a la ANIQ (AsociacioacutenNacional de Ingenieros Quiacutemicos)Hay listas que proporcionan una gran ayuda al investigador Pensamos en directorios especializados como el lndustridata que enlista a las empresas mexicanas medianas y grandes

el directorio de la ciudad de Meacutexico por calles el directorio de medios que enlista casas productoras estaciones de radio y televisioacuten perioacutedicos y revistas Este tipo de directorios realizados por profesionales son uacutetiles al investigador pues representan una compilacioacuten (sujetos empresas instituciones) resultado de horas de trabajo e inversioacuten de recursos Recomendamos pues utilizarIos cuando sea pertinente tomando en cuenta las consideraciones que estos directorios hacen en su introduccioacuten y que revelan a queacute antildeo pertenecen los datos coacutemo los obtuvieron (exhaustivamente por cuestionarios por voluntarios) y muy importante quieacutenes y por queacute quedan excluidos del directorioEn Meacutexico se cuenta tambieacuten con directorios de anunciantes en publicidad y mercadotecnia como el publicado por Mercameacutetrica Ediciones S A Frecuentemente es necesario construir listas ad hoc a partir de las cuales se seleccionaraacuten los elementos que constituiraacuten las unidades de anaacutelisis en una determinada investigacioacuten Por ejemplo en la investigacioacuten de La televisioacuten y el nintildeo (Fernaacutendez Collado et al 1986) se hizo una muestra probabiliacutestica estratificada por racimo donde en una primera etapa se relacionaron escuelas para en uacuteltima instancia llegar a los nintildeos Pues bien para tal efecto se consiguioacute una lista de las escuelas primarias del Distrito Federal Cada escuela teniacutea un coacutedigo identificable por medio del cual se eliminaron las escuelas para nintildeos atiacutepicos Este listado conteniacutea ademaacutes informacioacuten sobre cada escuela sobre su ubicacioacuten (calle y colonia) sobre su propiedad (puacuteblica o privada)Con ayuda de otro estudio que catalogaba en diferentes estratos socioeconoacutemicos a las colonias del Distrito Federal con base en el ingreso promedio de la zona se hicieron 8 listas1 escuela puacuteblica clase A2 escuelas privadas clase A3 escuelas puacuteblicas clase B4 escuelas privadas clase B5 escuelas puacuteblicas clase C6 escuelas privadas clase C7 escuelas puacuteblicas clase D8 escuelas privadas clase DCada lista representaba un estrato de la poblacioacuten y de cada una de ellas se seleccionoacute una muestra de escuelas No siempre existen listas que permitan identificar nuestra poblacioacuten Seraacute necesario recurrir a otros marcos de referencia que contengan descripciones del material organizaciones o sujetos que seraacuten seleccionados como unidades de anaacutelisis Algunos de estos marcos de referencia son los archivos los mapas voluacutemenes de perioacutedicos empastados en una biblioteca o las horas de transmisioacuten de varios canales de televisioacuten De cada una de estas instancias daremos ejemplos con maacutes detalles

ArchivosUn jefe de reclutamiento y seleccioacuten de una institucioacuten quiere precisar si algunos datos que se dan en una solicitud de trabajo estaacuten correlacionados con el ausentismo del empleado Es decir si a partir de datos como edad sexo estado civil y duracioacuten en otro trabajo puede predecirse que alguien tenderaacute a ausentarse Para establecer correlaciones se consideraraacuten como poblacioacuten a todos los sujetos contratados durante 10 antildeos Se relacionan sus datos en la solicitud de empleo con los registros de faltas Como no hay una lista elaborada de estos sujetos el investigador decide acudir a los archivos de las solicitudes de empleo Estos archivos constituyen su marco muestral a partir del cual obtendraacute la muestra Calcula el tamantildeo de la poblacioacuten obtiene el tamantildeo de la muestra y selecciona sistemaacuteticamente cada elemento 1K cada solicitud que seraacute analizada Aqui el problema que surge es que en el archivo hay solicitudes de gente que no fue contratada y por tanto no pueden ser consideradas en el estudioEn este caso y en otros donde no todos los elementos del marco de referencia o de una lista (por ejemplo nombres en el directorio que no corresponden a una persona fiacutesica) los especialistas en muestreo (Kish 1965 Sutman 1976) no aconsejan el reemplazo con el siguiente elemento sino simplemente no tomar en cuenta ese elemento es decir como si no existiera continuaacutendose con el intervalo de seleccioacuten sistemaacutetica

MapasLos mapas son muy uacutetiles como marco de referencia en muestras de racimoPor ejemplo un investigador quiere saber queacute motiva a los compradores en una determinada tienda de autoservicio A partir de una lista de tiendas de cada cadena competidora marca sobre un mapa de la ciudad todas las tiendas de autoservicios las cuales constituyen una poblacioacuten de racimos pues en cada tienda seleccionada entrevistaraacute a un nuacutemero n de clientes El mapa le permite ver la poblacioacuten (tiendas autoservicio) y su situacioacuten geograacutefica de manera que eligioacute zonas donde coexistan tiendas de la competencia para asegurarse de que el consumidor de la zona tenga todas las posibles alternativas

VoluacutemenesEn este ejemplo supongamos que un estudioso del periodismo quiere hacer un anaacutelisis de contenido de los editoriales de los tres principales diarios de la ciudad durante el porfiriato El investigador va a la Hemeroteca Nacional y encuentra que los diarios son encuadernados por trimestre y antildeo lo cual le proporciona un marco de referencia ideal a partir del cual seleccionaraacuten voluacutemenes para su anaacutelisis Supongamos sin embargo que encuentra que el volumen X que contiene el perioacutedico El Hijo del Ahuizote (enero-marzo 1899) falta en la Hemeroteca iquestQueacute hace Pues redefine la poblacioacuten manifestando expliacutecitamente que de N voluacutemenes tiene 99 de los elementos y a partir de este nuevo nuacutemero de N calculoacute su muestra n y la seleccionoacute

Horas de transmisioacutenEn un estudio de Portilla y Soloacuterzano (1982) los investigadores queriacutean hacer un anaacutelisis de anuncios en la televisioacuten mexicana Las emisoras no proporcionan una lista de anuncios ni sus horas de transmisioacuten Por otra parte saldriacutea muy caro grabar todos los anuncios a todas horas y seriacutea imposible estar frente al televisor para hacerloAnte la imposibilidad de tener un listado de comerciales se hicieron listados que identificaron cada media hora de transmisioacuten televisiva en cada canal 2 4 5 9 y 13 de las 7 a las 24 horas durante siete diacuteas de una semana de octubre de 1982 La poblacioacuten estaba constituida del nuacutemero total de medias horas de transmisioacuten televisiva N = 1 190 horas Esta poblacioacuten se dividioacute en estratos mantildeana mediodiacutea tarde y noche y se procedioacute a calcular el tamantildeo de la muestra tomando en consideracioacuten que por cada media hora de transmisioacuten hay 6 minutos de comerciales (De Noriega 1979)Se calculoacute el nuacutemero de medias horas que se seleccionariacutean para obtener una muestra n Una vez obtenido el tamantildeo de la muestra se seleccionaron aleatoriamente n medias horas y por uacuteltimo se grabaron y analizaron uacutenicamente aquellos comerciales contenidos en las medias horas seleccionadas al azar y que representaron diferentes canales y segmentos del diacutea El punto en este ejemplo es la construccioacuten concreta de un marco muestral que permitiera el anaacutelisis de una muestra probabiliacutestica de comerciales

TAMANtildeO OacutePTIMO DE UNA MUESTRA Y EL TEOREMA DEL LIacuteMITE CENTRALLas muestras probabiliacutesticas requieren dos procedimientos baacutesicos 1 La determinacioacuten del tamantildeo de la muestra y 2 la seleccioacuten aleatoria de los elementos muestrales El primer procedimiento lo hemos descrito en su modalidad maacutes simple en este capiacutetulo Precisar adecuadamente el tamantildeo de la muestra puede tornarse muy complejo dependiendo del problema de investigacioacuten y la poblacioacuten a estudiar Para el alumno seraacute muy uacutetil comparar que tamantildeo de muestra han utilizado otros investigadores en ciencias sociales

iquestCOacuteMO SON LAS MUESTRAS NO PROBABILIacuteSTICASLas muestras no probabiliacutesticas tambieacuten llamadas muestras dirigidas suponen un procedimiento de seleccioacuten informal y un poco arbitrario Auacuten asiacute se utilizan en muchas investigaciones y a partir de ellas se hacen inferencias sobre la poblacioacuten Es como si juzgaacutesemos el sabor de un cargamento de limones solamente probando alguno como si para muestra bastase un botoacuten La muestra dirigida selecciona sujetos tiacutepicos con la vaga esperanza de que seraacuten casos representativos de una poblacioacuten determinada

La verdad es que las muestras dirigidas tienen muchas desventajas La primera es que al no ser probabiliacutesticas no podemos calcular con precisioacuten el error estaacutendar es decir no podemos calcular con queacute nivel de confianza hacemos una estimacioacuten Esto es un grave inconveniente si consideramos que la estadiacutestica inferencial se basa en teoriacutea de la probabilidad por lo que pruebas estadiacutesticas en muestras no probabiliacutesticas tienen un valor limitado y relativo ala muestra en siacute mas no a la poblacioacuten Es decir los datos no pueden generalizarse a una poblacioacuten que no se consideroacute ni en sus paraacutemetros ni en sus elementos para obtener la muestra Recordemos que en las muestras de este tipo la eleccioacuten de los sujetos no depende de que todos tengan la misma probabilidad de ser elegidos sino de la decisioacuten de un investigador o grupo de encuestadoresLa ventaja de una muestra no probabiliacutestica es su utilidad para determinado disentildeo de estudio que requiere no tanto una representatividad de elementos de una poblacioacuten sino una cuidadosa y controlada eleccioacuten de sujetos con ciertas caracteriacutesticas especificadas previamente en el planteamiento del problemaHay variacuteas clases de muestras dirigidas y se definiraacuten a continuacioacuten

La muestra de sujetos voluntariosLas muestras de sujetos voluntarios son frecuentes en ciencias sociales y ciencias de la conducta Se trata de muestras fortuitas utilizadas tambieacuten en la medicina y la arqueologiacutea donde el investigador elabora conclusiones sobre especiacutemenes que llegan a sus manos de manera casual Pensemos por ejemplo en los sujetos que voluntariamente acceden a participar en un estudio que monitorea los efectos de un medicamento o en el investigador que anuncia en una clase que estaacute haciendo un estudio sobre motivacioacuten en el universitario e invita a aquellos que acepten someterse a una prueba proyectiva TAT En estos casos la eleccioacuten de los individuos que seraacuten sujetos a anaacutelisis depende de circunstancias fortuitas Este tipo de muestra se usa en estudios de laboratorio donde se procura que los sujetos sean homogeacuteneos en variables tales como edad sexo inteligencia de manera que los resultados o efectos no obedezcan a diferencias individuales sino a las condiciones a las que fueron sometidos

La muestra de expertosEn ciertos estudios es necesaria la opinioacuten de sujetos expertos en un temaEstas muestras son frecuentes en estudios cualitativos y exploratorios que para generar hipoacutetesis maacutes precisas o la materia prima del disentildeo de cuestionarios Por ejemplo en un estudio sobre el perfil de la mujer periodista en Meacutexico (Barrera et al 1989) se recurrioacute a una muestra de TI = 227 mujeres periodistas pues se consideroacute que eran los sujetos idoacuteneos para hablar de contratacioacuten sueldos y desempentildeo de las mujeres periodistas Estas muestras son vaacutelidas y uacutetiles cuando los objetivos del estudio asiacute lo requieren

Los sujetos-tipoTambieacuten esta muestra se utiliza en estudios exploratorios y en investigaciones de tipo cualitativo donde el objetivo es la riqueza profundidad y calidad de la informacioacuten no la cantidad ni la estandarizacioacuten En estudios de perspectiva fenomenoloacutegica donde el objetivo es analizar los valores ritos y significados de un determinado grupo social el uso tanto de expertos como de sujetos-tipo es frecuente Por ejemplo pensamos en los trabajos de Howard Becker (El muacutesica de jazz Las muchachas de blanco) que se basan en grupos de tiacutepicos muacutesicos de jazz y tiacutepicos estudiantes de medicina para adentrarse en el anaacutelisis de los patrones de identificacioacuten y socializacioacuten de estas dos profesiones la de muacutesico y la de meacutedicoLos estudios motivacionales los cuales se hacen para el anaacutelisis de las actitudes y conductas del consumidor tambieacuten utilizan muestras de sujeto-tipoAquiacute se definen los grupos a los que va dirigido un determinado producto (por ejemplo joacutevenes clase socio econoacutemica A y B amas de casa clase B ejecutivos clase A-B) y se construyen grupos de 8 o 10 personas cuyos integrantes tengan las caracteriacutesticas sociales y demograacuteficas de dicho sub grupo

Con ese grupo se efectuacutea una sesioacuten un facilitador o moderador dirigiraacute una conversacioacuten donde los miembros del grupo expresen sus actitudes valores medios expectativas motivaciones hacia las caracteriacutesticas de determinado producto o servicio

La muestra por cuotasEste tipo de muestra se utiliza mucho en estudios de opinioacuten y de mercadotecnia Los encuestadores reciben instrucciones de administrar cuestionarios con sujetos en la calle y al hacerla van conformando o llenando cuotas de acuerdo con la proporcioacuten de ciertas variables demograacuteficas en la poblacioacuten Asiacute en un estudio sobre la actitud de la poblacioacuten hacia un candidato poliacutetico se dice a los encuestadores que vayan a determinada colonia y entrevisten a 150 sujetos Que el 25 sean hombres mayores de 30 antildeos 25 mujeres mayores de 30 antildeos 25 hombres menores de 25 antildeos y 25 mujeres menores de 25 antildeos Asiacute se construyen estas muestras que como vemos dependen en cierta medida del juicio del entrevistadorPara el caso de los infectados con el VIH se realizoacute una muestra no probabiliacutestica (porque se encuestoacute y se analizoacute a cuantas personas se pudieron localizar lo que representoacute un 18 de los receptores de sangre o derivados provenientes del laboratorio Transfusiones y Hematologiacutea SA que habiacutean sido atendidos en los servicios meacutedicos de Petroacuteleos Mexicanos y no se analizoacute a posibles portadores del VIH que hubieran adquirido el virus de otra manera) La muestra se obtuvo de tres fuentes baacutesicas a) presentacioacuten espontaacutenea por siacutentomas b) captado por exaacutemenes de rutina o contractuales y e) tras la aplicacioacuten de una encuesta seroloacutegica a 482 receptores de sangre y plasma provenientes del laboratorio de referencia Dicho de otra manera no se pudo detectar a todos los infectados con el VIH contenido en la sangre o derivados provenientes del laboratorio aludido pero con el 18 de eacutestos se pudo establecer que 17 de cada 100 casos habriacutean sido infectados con el VIH

RESUMENEn este capiacutetulo describimos coacutemo seleccionar una muestra Lo primero que se debe plantear es quieacutenes van a ser medidos lo que corresponde a definir la unidad de anaacutelisis Se procede despueacutes a delimitar claramente la poblacioacuten con base en los objetivos del estudio y en cuanto a caracteriacutesticas de contenido de lugar y en el tiempoLa muestra es un subgrupo de la poblacioacuten y puede ser probabiliacutestica o no probabiliacutesticaElegir queacute tipo de muestra se requiere depende de los objetivos del estudio y del esquema de investigacioacutenLas muestras probabiliacutesticas son esenciales en los disentildeos de investigacioacuten por encuestas donde se pretenden generalizar los resultados a una poblacioacuten La caracteriacutestica de este tipo de muestra es que todos los elementos de la poblacioacuten tienen al inicio la misma probabilidad de ser elegidos de esta manera los elementos muestrales tendraacuten valores muy aproximados a los valores de la poblacioacuten ya que las mediciones del subconjunto seraacuten estimaciones muy precisas del conjunto mayor Esta precisioacuten depende del error de muestreo llamado tambieacuten error estaacutendarPara una muestra probabiliacutestica necesitamos dos cosas determinar el tamantildeo de la muestra y seleccionar los elementos muestrales en forma aleatoriaEl tamantildeo de la muestra se calcula con base en la varianza de la poblacioacuten y la varianza de la muestra Esta uacuteltima expresada en teacuterminos de probabilidad de ocurrencia La varianza de la poblacioacuten se calcula con el cuadrado del error estaacutendar el cual determinamos Entre menor sea el error estaacutendar mayor seraacute el tamantildeo de la muestraLas muestras probabiliacutesticas pueden ser simples estratificadas y por racimosLa estratificacioacuten aumenta la precisioacuten de la muestra e implica el uso deliberado de sub-muestras para cada estrato o categoriacutea que sea relevante en la poblacioacuten Muestrear por racimos implica diferencias entre la unidad de anaacutelisis y la unidad muestral En este tipo de muestreo hay una seleccioacuten en dos etapas ambas con procedimientos probabiliacutesticos En la primera se seleccionan los racimos escuelas organizaciones salones de clase en la segunda y dentro de los racimos a los sujetos que van a ser medidos

Los elementos muestrales de una muestra probabiliacutestica siempre se eligen aleatoriamente para aseguramos de que cada elemento tenga la misma probabilidad de ser elegido Pueden usarse tres procedimientos de seleccioacuten1 Toacutembola 2 Tabla de nuacutemeros random y 3 Seleccioacuten sistemaacutetica Todo procedimiento de seleccioacuten depende de listados ya sea existentes o construidos ad hoc Listados pueden ser el directorio telefoacutenico listas de asociaciones listas de escuelas oficiales etceacutetera Cuando no existen listas de elementos de la poblacioacuten se recurren a otros marcos de referencia que contengan descripciones del material organizaciones o sujetos seleccionados como unidades de anaacutelisis Algunos de eacutestos pueden ser los archivos hemerotecas y los mapasLas muestras no-probabiliacutesticas pueden tambieacuten llamarse muestras dirigidas pues la eleccioacuten de sujetos u objetos de estudio depende del criterio del investigador Las muestras dirigidas pueden ser de varias clases 1 Muestra de sujetos voluntarios frecuentemente utilizados con disentildeos experimentales y situaciones de laboratorio 2 Muestra de expertos frecuentemente utilizados en estudios exploratorios 3 Muestra de sujetos tipo o estudios de casos utilizados en estudios cualitativos y motivacionales y 4 muestreo por cuotas frecuentes en estudios de opinioacuten y de mercadotecnia Las muestras dirigidas son vaacutelidas en cuanto a que un determinado disentildeo de investigacioacuten asiacute los requiere sin embargo los resultados son generalizables a la muestra en siacute o a muestras similares No son generalizables a una poblacioacutenEn el teorema de liacutemite central se sentildeala que una muestra de maacutes de cien casos seraacute una muestra con una distribucioacuten normal en sus caracteriacutesticas sin embargo la normalidad no debe conjuntarse con probabilidad Mientras lo primero es necesario para efectuar pruebas estadiacutesticas lo segundo es requisito indispensable para hacer inferencias correctas sobre una poblacioacuten

Page 3: CAPÍTULO 8 muestra y población

poblacioacuten el tamantildeo de la muestra y a traveacutes de una seleccioacuten aleatoria yo mecaacutenica de las unidades de anaacutelisis Imagiacutenese el procedimiento para obtener el nuacutemero premiado en un sorteo de loteriacutea Este nuacutemero se va formando en el momento del sorteo a partir de las esferas con un diacutegito que se van sacando (despueacutes de revolverlas mecaacutenicamente) hasta formar el nuacutemero de manera que todos los nuacutemeros tienen la misma probabilidad de ser elegidosEn las muestras no probabiliacutesticas la eleccioacuten de los elementos no depende de la probabilidad sino de causas relacionadas con las caracteriacutesticas del investigador o del que hace la muestra Aquiacute el procedimiento no es mecaacutenico ni con base en foacutermulas de probabilidad sino que depende del proceso de toma de decisiones de una persona o grupo de personas y desde luego las muestras seleccionadas por decisiones subjetivas tienden a estar sesgadasElegir entre una muestra probabiliacutestica o una no probabiliacutestica depende de los objetivos del estudio del esquema de investigacioacuten y de la contribucioacuten que se piensa hacer con ella

iquestCOacuteMO SE HACE UNA MUESTRA PROBABILIacuteSTICALa eleccioacuten entre la muestra probabiliacutestica y una no probabiliacutestica se determina con base en los objetivos del estudio el esquema de la investigacioacuten y el alcance de sus contribuciones Las muestras probabiliacutesticas tienen muchas ventajas quizaacute la principal es que puede medirse el tamantildeo de error en nuestras predicciones Puede decirse incluso que el principal objetivo en el disentildeo de una muestra probabiliacutestica es reducir al miacutenimo este error al que se le llama error estaacutendar (Kish 1965)Las muestras probabiliacutesticas son esenciales en los disentildeos de investigacioacuten por encuestas en las que se pretende hacer estimaciones de variables en la poblacioacuten estas variables se miden con instrumentos de medicioacuten y se analizan con pruebas estadiacutesticas para el anaacutelisis de datos donde se presupone que la muestra es probabiliacutestica donde todos los elementos de la poblacioacuten tienen una misma probabilidad de ser elegidos Los elementos muestrales tendraacuten valores muy parecidos a los de la poblacioacuten de manera que las mediciones en el sub conjunto nos daraacuten estimados precisos del conjunto mayor La precisioacuten de dichos estimados depende del error en el muestreo que se puede calcular pues hay errores que dependen de la medicioacuten y estos errores no pueden ser calculados matemaacuteticamentePara una muestra probabiliacutestica necesitamos principalmente dos cosas determinar el tamantildeo de la muestra y seleccionar los elementos muestrales de manera que todos tengan la misma posibilidad de ser elegidos Para lo primero daremos una foacutermula que contiene las expresiones ya descritas Para lo segundo necesitamos un marco de seleccioacuten adecuado y un procedimiento que permita la aleatoriedad en la seleccioacuten

El tamantildeo de la muestraCuando se hace una muestra probabiliacutestica uno debe preguntarse dado que una poblacioacuten es de N iquestcuaacutel es el menor nuacutemero de unidades muestrales (personas organizaciones capiacutetulos de telenovelas etceacutetera) que necesito para conformar una muestra (n) que me asegure un error estaacutendar menor de 01La solucioacuten a esta pregunta pretende encontrar la probabilidad de ocurrencia de y que mi estimado de y se acerque a Y el valor real de la poblacioacuten Si nosotros establecemos el error estaacutendar y fijamos 01 sugerimos que esta fluctuacioacuten promedio de nuestro estimado y con respecto a los valores reales de la poblacioacuten Y no sea gt 01 es decir que de 100 casos 99 veces mi prediccioacuten sea correcta y que el valor de y se situacutee en un intervalo de confianza que comprenda el valor de YResumiendo para una determinada varianza (V) de y iquestqueacute tan grande debe ser mi muestra Esto puede determinarse en dos pasos1 n =S ~ = Tamantildeo provisional de la muestra = Varianza de la muestraV2 Varianza de la poblacioacuten2 n = n -1 + nNPongamos el siguiente ejemplo En el ejemplo que ya habiacuteamos dado en este capiacutetulo delimitamos una poblacioacuten diciendo que para un estudio de directores generales consideramos a todos aquellos directores generales de empresas industriales y comerciales que en 1983 tienen

un capital social superior a 30 millones de pesos con ventas superiores a los 100 millones de pesos yo con maacutes de 300 personas empleadas Con estas caracteriacutesticas se precisoacute que la poblacioacuten era de N = 1176 directores generales ya que 1176 empresas reuniacutean las mencionadas caracteriacutesticas iquestCuaacutel es entonces el nuacutemero de directores generales n que se tiene que entrevistar para tener un error estaacutendar menor de 015 y dado que la poblacioacuten total es de 1176N = tamantildeo de la poblacioacuten de 1176 empresasy = valor promedio de una variable = 1 un director general por empresaSe = error estaacutendar = 015 determinado por nosotrosV2 = varianza de la poblacioacuten Su definicioacuten (Se) cuadrado del error estaacutendarS2 = varianza de la muestra expresada como la probabilidad de ocurrencia de yn = tamantildeo de la muestra sin ajustarn = tamantildeo de la muestraSustituyendo tenemos quen= S2V2S2 = p(1 - p) = 9(1 - 9) = 09V = (015)2 = 000225nrsquo = 09 - = 400000225n = nrsquo - = 400 -1 + nN 1 + 4001176n = 298Es decir para nuestra investigacioacuten necesitaremos una muestra de 298 directores generalesEsto es el primer procedimiento para obtener la muestra probabiliacutestica determinar su tamantildeo con base en estimados de la poblacioacuten El segundo procedimiento estriba en coacutemo y de doacutende seleccionar a esos 298 sujetos

Muestra probabiliacutestica estratificadaEl ejemplo anterior corresponde a una muestra probabiliacutestica simpleDeterminamos en este caso que el tamantildeo de la muestra seriacutea de n = 298 directivos de empresa Pero supongamos que la situacioacuten se complica y que deberemos estratificar esta n a fin de que los elementos muestrales o unidades de anaacutelisis posean un determinado atributo En nuestro ejemplo este atributo es el giro de la empresa Es decir cuando no basta que cada uno de los elementos muestrales tengan la misma probabilidad de ser escogidos sino que ademaacutes es necesario estratificar la muestra en relacioacuten a estratos o categoriacuteas que se presentan en la poblacioacuten y que aparte son relevantes para los objetivos del estudio se disentildea una muestra probabiliacutestica estratificada Lo que aquiacute se hace es dividir a la poblacioacuten en sub-poblaciones o estratos y se selecciona una muestra para cada estratoLa estratificacioacuten aumenta la precisioacuten de la muestra e implica el uso deliberado de diferentes tamantildeos de muestra para cada estrato ldquoa fin de lograr reducir la varianza de cada unidad de la media muestral (Kish 1965) Dice Kish (p 92) en su libro de muestreo que en un nuacutemero determinado de elementos muestrales n = l n h la varianza de la media muestral y puede reducirse al miacutenimo si el tamantildeo de la muestra para cada estrato es proporcional a la desviacioacuten estaacutendar dentro del estratoSiguiendo con nuestro ejemplo de los directores de empresa la poblacioacuten es de 1176 directores de empresa y el tamantildeo de muestra es n = 298 iquestQueacute muestra necesitaremos para cada estraton 298kSh=- = = 2534N 1176De manera que el total de la subpoblacioacuten se multiplicaraacute por esta fraccioacuten constante a fin de obtener el tamantildeo de muestra para el estrato

Muestreo probabiliacutestico por racimosEn algunos casos donde el investigador se ve limitado por recursos financieros por tiempo por distancias geograacuteficas o por una combinacioacuten de eacutestos y otros obstaacuteculos se recurre al muestreo por racimos En este tipo de muestreo se reducen costos tiempo y energiacutea al considerar que muchas veces las unidades de anaacutelisis se encuentran encapsuladas o encerradas en determinados lugares fiacutesicos o geograacuteficos a los que se denomina racimosMuestrear por racimos implica diferenciar entre la unidad de anaacutelisis y la unidad muestral La unidad de anaacutelisis indica quieacutenes van a ser medidos o sea el sujeto o sujetos a quienes en uacuteltima instancia vamos a aplicar el instrumento de medicioacuten La unidad muestral (en este tipo de muestra) se refiere al racimo a traveacutes del cual se logra el acceso a la unidad de anaacutelisis El muestreo por racimos supone una seleccioacuten en dos etapas ambas con procedimientos probabiliacutesticos En la primera se seleccionan los racimos siguiendo los ya sentildealados pasos de una muestra probabiliacutestica simple o estratificada En la segunda y dentro de estos racimos se seleccionan a los sujetos u objetos que van a ser medidos Para ello se hace una seleccioacuten que asegure que todos los elementos del racimo tienen la misma probabilidad de ser elegidos

iquestCOacuteMO SE LLEVA A CABO EL PROCEDIMIENTO DE SELECCIOacuteNCuando iniciamos nuestra discusioacuten de la muestra probabiliacutestica sentildealamos que los tipos de muestra dependen de dos cosas del tamantildeo de la muestra y del procedimiento de seleccioacutenDe lo primero hemos hablado con todo detalle de lo segundo hablaremos ahora Se determina el tamantildeo de la muestra n pero iquestcoacutemo seleccionar los elementos muestrales Se precisa el nuacutemero de racimos necesario y iquestcoacutemo se seleccionan los sujetos dentro de cada racimo Hasta el momento soacutelo hemos dicho que los elementos se eligen aleatoriamente pero iquestcoacutemo se hace esto Las unidades de anaacutelisis o los elementos muestrales se eligen siempre aleatoriamente para aseguramos de que cada elemento tenga la misma probabilidad de ser elegido Pueden usarse 3 procedimientos de seleccioacuten

ToacutembolaMuy simple y no muy raacutepido consiste en numerar todos los elementos muestrales del 1 al n Hacer fichas una por cada elemento revolverlas en una caja e ir sacando n fichas seguacuten el tamantildeo de la muestra Los nuacutemeros elegidos al azar conformaraacuten la muestra

Nuacutemeros random o nuacutemeros aleatoriosEl uso de nuacutemeros random no significa la seleccioacuten azarosa o fortuita sino la utilizacioacuten de una tabla de nuacutemeros que implica un mecanismo de probabilidad muy bien disentildeado Los nuacutemeros random de la Corporacioacuten Rand fueron generados con una especie de ruleta electroacutenica Existe una tabla de un milloacuten de diacutegitos publicada por esta corporacioacuten partes de dicha tabla se encuentran en los apeacutendices de muchos libros de estadiacutestica

Seleccioacuten sistemaacutetica de elementos muestralesEste procedimiento de seleccioacuten es muy uacutetil y faacutecil de aplicar e implica seleccionar dentro de una poblacioacuten N un nuacutemero n de elementos a partir de un intervalo KK es un intervalo que va a estar determinado por el tamantildeo de la poblacioacuten y el tamantildeo de la muestra De manera que tenemos que K = Nn en donde K = es un intervalo de seleccioacuten sistemaacutetica N = es la poblacioacuten n = es la muestraSupongamos que se quiere hacer un estudio sobre varios aspectos de la publicidad en Meacutexico Especiacuteficamente se pretende medir queacute nuacutemero de mensajes informativos y queacute nuacutemero de mensajes motivacionales tienen los comerciales en la televisioacuten mexicana Para tal efecto supongamos que los investigadores consiguen videocasetes con todos los comerciales que han pasado al aire en los diferentes canales de televisioacuten durante un periodo de tres antildeos Quitando los comerciales repetidos se tiene una poblacioacuten de N = 1 548 comerciales Se procede con este dato a determinar queacute nuacutemero de comerciales necesitamos analizar para generalizar a toda la poblacioacuten nuestros resultados con un error estaacutendar no mayor de 015 Con la foacutermula que ya hemos dado tenemos que si p = 5 entonces S2 = p(l - p) = 5 - (5) = 25

n= S2V2Si necesitamos una muestra de n = 647 comerciales podemos utilizar para la seleccioacuten al intervalo K dondeK = N = 1 548 = 239 = 3 (redondeando)n 647El intervalo 1K = 3 indica que cada tercer comercial 1K seraacute seleccionado hasta completar n = 647 239 se redondea para que sea un iacutentegro Veacutease Kish (1969) pp 115117La seleccioacuten sistemaacutetica de elementos muestrales 1K se puede utilizar al elegir los elementos de n para cada estrato yo para cada racimo La regla de probabilidad seguacuten la cual cada elemento de la poblacioacuten debe tener la misma probabilidad de ser elegido se cumple empezando la seleccioacuten de 1K al azarSiguiendo nuestro ejemplo no empezamos a elegir de los 1 548 comerciales grabados el 1 3 6 9 sino que procuramos que el empiezo sea determinado por el azar Asiacute en este caso podemos tirar unos dados y si en sus caras muestran 1 6 9 empezaremos en el comercial 169 y seguiremos 169 172 175 1K volver a empezar por los primeros si es necesario Este procedimiento de seleccioacuten es poco complicado y tiene varias ventajas cualquier tipo de estratos en una poblacioacuten X se veraacuten reflejados en la muestra Asimismo la seleccioacuten sistemaacutetica logra una muestra proporcionada pues por ejemplo tenemos que el procedimiento de seleccioacuten 1K nos daraacute una muestra con nombres que inician con las letras del abecedario en forma proporcional a la letra inicial de los nombres de la poblacioacuten

LOS LISTADOS Y OTROS MARCOS MUESTRALESLas muestras probabiliacutesticas requieren la determinacioacuten del tamantildeo de la muestra y de un proceso de seleccioacuten aleatoria que asegure que todos los elementos de la poblacioacuten tengan la misma probabilidad de ser elegidos Todo esto lo hemos visto pero nos falta discutir sobre algo esencial que procede a la seleccioacuten de una muestra el listado el marco muestral El listado se refiere a una lista existente o a una lista que es necesario confeccionar ad hoc con los elementos de la poblacioacuten y a partir de la cual se seleccionaraacuten los elementos muestrales El segundo teacutermino se refiere a un marco de referencia que nos permita identificar fiacutesicamente los elementos de la poblacioacuten la posibilidad de enumerarlos y por ende proceder a la seleccioacuten de los elementos muestrales Los listados con base en listas existentes sobre una poblacioacuten pueden ser variados el directorio telefoacutenico la lista de miembros de una asociacioacuten directorios especializados las listas oficiales de escuelas de la zona las listas de las canciones de eacutexito publicadas por una revista la lista de alumnos de una universidad etceacutetera En todo caso hay que tener en cuenta lo completo de una lista su exactitud veracidad su calidad y su nivel de cobertura en relacioacuten con el problema a investigar y la poblacioacuten que va a medirse ya que todos estos aspectos influyen en la seleccioacuten de la muestraPor ejemplo para algunas encuestas se considera que el directorio telefoacutenico es muy uacutetil Sin embargo hay que tomar en cuenta que muchos teleacutefonos no apareceraacuten porque son privados o que hay hogares que no tienen teleacutefono La lista de socios de una asociacioacuten como Canacintra (Caacutemara Nacional de la industria de la Transformacioacuten) puede servimos si el propoacutesito del estudio es por ejemplo conocer la opinioacuten de los asociados con respecto a una medida gubernamental Pero si el objetivo de la investigacioacuten es el anaacutelisis de opinioacuten del sector patronal del paiacutes el listado de una asociacioacuten no seraacute adecuado por varias razones como hay otras asociaciones patronales la Canacintra representa solamente el sector de la Industria de Transformacioacuten las asociaciones son voluntarias y no todo patroacuten o empresa pertenece a ellas Lo correcto en este caso seria construir una nueva lista con base en los listados existentes de las asociaciones patronales eliminando de dicha lista los casos duplicados suponiendo que una o maacutes empresas pudieran pertenecer a dos asociaciones al mismo tiempo como director a la Coparmex (Confederacioacuten Patronal de la Repuacuteblica Mexicana) y como empresa a la ANIQ (AsociacioacutenNacional de Ingenieros Quiacutemicos)Hay listas que proporcionan una gran ayuda al investigador Pensamos en directorios especializados como el lndustridata que enlista a las empresas mexicanas medianas y grandes

el directorio de la ciudad de Meacutexico por calles el directorio de medios que enlista casas productoras estaciones de radio y televisioacuten perioacutedicos y revistas Este tipo de directorios realizados por profesionales son uacutetiles al investigador pues representan una compilacioacuten (sujetos empresas instituciones) resultado de horas de trabajo e inversioacuten de recursos Recomendamos pues utilizarIos cuando sea pertinente tomando en cuenta las consideraciones que estos directorios hacen en su introduccioacuten y que revelan a queacute antildeo pertenecen los datos coacutemo los obtuvieron (exhaustivamente por cuestionarios por voluntarios) y muy importante quieacutenes y por queacute quedan excluidos del directorioEn Meacutexico se cuenta tambieacuten con directorios de anunciantes en publicidad y mercadotecnia como el publicado por Mercameacutetrica Ediciones S A Frecuentemente es necesario construir listas ad hoc a partir de las cuales se seleccionaraacuten los elementos que constituiraacuten las unidades de anaacutelisis en una determinada investigacioacuten Por ejemplo en la investigacioacuten de La televisioacuten y el nintildeo (Fernaacutendez Collado et al 1986) se hizo una muestra probabiliacutestica estratificada por racimo donde en una primera etapa se relacionaron escuelas para en uacuteltima instancia llegar a los nintildeos Pues bien para tal efecto se consiguioacute una lista de las escuelas primarias del Distrito Federal Cada escuela teniacutea un coacutedigo identificable por medio del cual se eliminaron las escuelas para nintildeos atiacutepicos Este listado conteniacutea ademaacutes informacioacuten sobre cada escuela sobre su ubicacioacuten (calle y colonia) sobre su propiedad (puacuteblica o privada)Con ayuda de otro estudio que catalogaba en diferentes estratos socioeconoacutemicos a las colonias del Distrito Federal con base en el ingreso promedio de la zona se hicieron 8 listas1 escuela puacuteblica clase A2 escuelas privadas clase A3 escuelas puacuteblicas clase B4 escuelas privadas clase B5 escuelas puacuteblicas clase C6 escuelas privadas clase C7 escuelas puacuteblicas clase D8 escuelas privadas clase DCada lista representaba un estrato de la poblacioacuten y de cada una de ellas se seleccionoacute una muestra de escuelas No siempre existen listas que permitan identificar nuestra poblacioacuten Seraacute necesario recurrir a otros marcos de referencia que contengan descripciones del material organizaciones o sujetos que seraacuten seleccionados como unidades de anaacutelisis Algunos de estos marcos de referencia son los archivos los mapas voluacutemenes de perioacutedicos empastados en una biblioteca o las horas de transmisioacuten de varios canales de televisioacuten De cada una de estas instancias daremos ejemplos con maacutes detalles

ArchivosUn jefe de reclutamiento y seleccioacuten de una institucioacuten quiere precisar si algunos datos que se dan en una solicitud de trabajo estaacuten correlacionados con el ausentismo del empleado Es decir si a partir de datos como edad sexo estado civil y duracioacuten en otro trabajo puede predecirse que alguien tenderaacute a ausentarse Para establecer correlaciones se consideraraacuten como poblacioacuten a todos los sujetos contratados durante 10 antildeos Se relacionan sus datos en la solicitud de empleo con los registros de faltas Como no hay una lista elaborada de estos sujetos el investigador decide acudir a los archivos de las solicitudes de empleo Estos archivos constituyen su marco muestral a partir del cual obtendraacute la muestra Calcula el tamantildeo de la poblacioacuten obtiene el tamantildeo de la muestra y selecciona sistemaacuteticamente cada elemento 1K cada solicitud que seraacute analizada Aqui el problema que surge es que en el archivo hay solicitudes de gente que no fue contratada y por tanto no pueden ser consideradas en el estudioEn este caso y en otros donde no todos los elementos del marco de referencia o de una lista (por ejemplo nombres en el directorio que no corresponden a una persona fiacutesica) los especialistas en muestreo (Kish 1965 Sutman 1976) no aconsejan el reemplazo con el siguiente elemento sino simplemente no tomar en cuenta ese elemento es decir como si no existiera continuaacutendose con el intervalo de seleccioacuten sistemaacutetica

MapasLos mapas son muy uacutetiles como marco de referencia en muestras de racimoPor ejemplo un investigador quiere saber queacute motiva a los compradores en una determinada tienda de autoservicio A partir de una lista de tiendas de cada cadena competidora marca sobre un mapa de la ciudad todas las tiendas de autoservicios las cuales constituyen una poblacioacuten de racimos pues en cada tienda seleccionada entrevistaraacute a un nuacutemero n de clientes El mapa le permite ver la poblacioacuten (tiendas autoservicio) y su situacioacuten geograacutefica de manera que eligioacute zonas donde coexistan tiendas de la competencia para asegurarse de que el consumidor de la zona tenga todas las posibles alternativas

VoluacutemenesEn este ejemplo supongamos que un estudioso del periodismo quiere hacer un anaacutelisis de contenido de los editoriales de los tres principales diarios de la ciudad durante el porfiriato El investigador va a la Hemeroteca Nacional y encuentra que los diarios son encuadernados por trimestre y antildeo lo cual le proporciona un marco de referencia ideal a partir del cual seleccionaraacuten voluacutemenes para su anaacutelisis Supongamos sin embargo que encuentra que el volumen X que contiene el perioacutedico El Hijo del Ahuizote (enero-marzo 1899) falta en la Hemeroteca iquestQueacute hace Pues redefine la poblacioacuten manifestando expliacutecitamente que de N voluacutemenes tiene 99 de los elementos y a partir de este nuevo nuacutemero de N calculoacute su muestra n y la seleccionoacute

Horas de transmisioacutenEn un estudio de Portilla y Soloacuterzano (1982) los investigadores queriacutean hacer un anaacutelisis de anuncios en la televisioacuten mexicana Las emisoras no proporcionan una lista de anuncios ni sus horas de transmisioacuten Por otra parte saldriacutea muy caro grabar todos los anuncios a todas horas y seriacutea imposible estar frente al televisor para hacerloAnte la imposibilidad de tener un listado de comerciales se hicieron listados que identificaron cada media hora de transmisioacuten televisiva en cada canal 2 4 5 9 y 13 de las 7 a las 24 horas durante siete diacuteas de una semana de octubre de 1982 La poblacioacuten estaba constituida del nuacutemero total de medias horas de transmisioacuten televisiva N = 1 190 horas Esta poblacioacuten se dividioacute en estratos mantildeana mediodiacutea tarde y noche y se procedioacute a calcular el tamantildeo de la muestra tomando en consideracioacuten que por cada media hora de transmisioacuten hay 6 minutos de comerciales (De Noriega 1979)Se calculoacute el nuacutemero de medias horas que se seleccionariacutean para obtener una muestra n Una vez obtenido el tamantildeo de la muestra se seleccionaron aleatoriamente n medias horas y por uacuteltimo se grabaron y analizaron uacutenicamente aquellos comerciales contenidos en las medias horas seleccionadas al azar y que representaron diferentes canales y segmentos del diacutea El punto en este ejemplo es la construccioacuten concreta de un marco muestral que permitiera el anaacutelisis de una muestra probabiliacutestica de comerciales

TAMANtildeO OacutePTIMO DE UNA MUESTRA Y EL TEOREMA DEL LIacuteMITE CENTRALLas muestras probabiliacutesticas requieren dos procedimientos baacutesicos 1 La determinacioacuten del tamantildeo de la muestra y 2 la seleccioacuten aleatoria de los elementos muestrales El primer procedimiento lo hemos descrito en su modalidad maacutes simple en este capiacutetulo Precisar adecuadamente el tamantildeo de la muestra puede tornarse muy complejo dependiendo del problema de investigacioacuten y la poblacioacuten a estudiar Para el alumno seraacute muy uacutetil comparar que tamantildeo de muestra han utilizado otros investigadores en ciencias sociales

iquestCOacuteMO SON LAS MUESTRAS NO PROBABILIacuteSTICASLas muestras no probabiliacutesticas tambieacuten llamadas muestras dirigidas suponen un procedimiento de seleccioacuten informal y un poco arbitrario Auacuten asiacute se utilizan en muchas investigaciones y a partir de ellas se hacen inferencias sobre la poblacioacuten Es como si juzgaacutesemos el sabor de un cargamento de limones solamente probando alguno como si para muestra bastase un botoacuten La muestra dirigida selecciona sujetos tiacutepicos con la vaga esperanza de que seraacuten casos representativos de una poblacioacuten determinada

La verdad es que las muestras dirigidas tienen muchas desventajas La primera es que al no ser probabiliacutesticas no podemos calcular con precisioacuten el error estaacutendar es decir no podemos calcular con queacute nivel de confianza hacemos una estimacioacuten Esto es un grave inconveniente si consideramos que la estadiacutestica inferencial se basa en teoriacutea de la probabilidad por lo que pruebas estadiacutesticas en muestras no probabiliacutesticas tienen un valor limitado y relativo ala muestra en siacute mas no a la poblacioacuten Es decir los datos no pueden generalizarse a una poblacioacuten que no se consideroacute ni en sus paraacutemetros ni en sus elementos para obtener la muestra Recordemos que en las muestras de este tipo la eleccioacuten de los sujetos no depende de que todos tengan la misma probabilidad de ser elegidos sino de la decisioacuten de un investigador o grupo de encuestadoresLa ventaja de una muestra no probabiliacutestica es su utilidad para determinado disentildeo de estudio que requiere no tanto una representatividad de elementos de una poblacioacuten sino una cuidadosa y controlada eleccioacuten de sujetos con ciertas caracteriacutesticas especificadas previamente en el planteamiento del problemaHay variacuteas clases de muestras dirigidas y se definiraacuten a continuacioacuten

La muestra de sujetos voluntariosLas muestras de sujetos voluntarios son frecuentes en ciencias sociales y ciencias de la conducta Se trata de muestras fortuitas utilizadas tambieacuten en la medicina y la arqueologiacutea donde el investigador elabora conclusiones sobre especiacutemenes que llegan a sus manos de manera casual Pensemos por ejemplo en los sujetos que voluntariamente acceden a participar en un estudio que monitorea los efectos de un medicamento o en el investigador que anuncia en una clase que estaacute haciendo un estudio sobre motivacioacuten en el universitario e invita a aquellos que acepten someterse a una prueba proyectiva TAT En estos casos la eleccioacuten de los individuos que seraacuten sujetos a anaacutelisis depende de circunstancias fortuitas Este tipo de muestra se usa en estudios de laboratorio donde se procura que los sujetos sean homogeacuteneos en variables tales como edad sexo inteligencia de manera que los resultados o efectos no obedezcan a diferencias individuales sino a las condiciones a las que fueron sometidos

La muestra de expertosEn ciertos estudios es necesaria la opinioacuten de sujetos expertos en un temaEstas muestras son frecuentes en estudios cualitativos y exploratorios que para generar hipoacutetesis maacutes precisas o la materia prima del disentildeo de cuestionarios Por ejemplo en un estudio sobre el perfil de la mujer periodista en Meacutexico (Barrera et al 1989) se recurrioacute a una muestra de TI = 227 mujeres periodistas pues se consideroacute que eran los sujetos idoacuteneos para hablar de contratacioacuten sueldos y desempentildeo de las mujeres periodistas Estas muestras son vaacutelidas y uacutetiles cuando los objetivos del estudio asiacute lo requieren

Los sujetos-tipoTambieacuten esta muestra se utiliza en estudios exploratorios y en investigaciones de tipo cualitativo donde el objetivo es la riqueza profundidad y calidad de la informacioacuten no la cantidad ni la estandarizacioacuten En estudios de perspectiva fenomenoloacutegica donde el objetivo es analizar los valores ritos y significados de un determinado grupo social el uso tanto de expertos como de sujetos-tipo es frecuente Por ejemplo pensamos en los trabajos de Howard Becker (El muacutesica de jazz Las muchachas de blanco) que se basan en grupos de tiacutepicos muacutesicos de jazz y tiacutepicos estudiantes de medicina para adentrarse en el anaacutelisis de los patrones de identificacioacuten y socializacioacuten de estas dos profesiones la de muacutesico y la de meacutedicoLos estudios motivacionales los cuales se hacen para el anaacutelisis de las actitudes y conductas del consumidor tambieacuten utilizan muestras de sujeto-tipoAquiacute se definen los grupos a los que va dirigido un determinado producto (por ejemplo joacutevenes clase socio econoacutemica A y B amas de casa clase B ejecutivos clase A-B) y se construyen grupos de 8 o 10 personas cuyos integrantes tengan las caracteriacutesticas sociales y demograacuteficas de dicho sub grupo

Con ese grupo se efectuacutea una sesioacuten un facilitador o moderador dirigiraacute una conversacioacuten donde los miembros del grupo expresen sus actitudes valores medios expectativas motivaciones hacia las caracteriacutesticas de determinado producto o servicio

La muestra por cuotasEste tipo de muestra se utiliza mucho en estudios de opinioacuten y de mercadotecnia Los encuestadores reciben instrucciones de administrar cuestionarios con sujetos en la calle y al hacerla van conformando o llenando cuotas de acuerdo con la proporcioacuten de ciertas variables demograacuteficas en la poblacioacuten Asiacute en un estudio sobre la actitud de la poblacioacuten hacia un candidato poliacutetico se dice a los encuestadores que vayan a determinada colonia y entrevisten a 150 sujetos Que el 25 sean hombres mayores de 30 antildeos 25 mujeres mayores de 30 antildeos 25 hombres menores de 25 antildeos y 25 mujeres menores de 25 antildeos Asiacute se construyen estas muestras que como vemos dependen en cierta medida del juicio del entrevistadorPara el caso de los infectados con el VIH se realizoacute una muestra no probabiliacutestica (porque se encuestoacute y se analizoacute a cuantas personas se pudieron localizar lo que representoacute un 18 de los receptores de sangre o derivados provenientes del laboratorio Transfusiones y Hematologiacutea SA que habiacutean sido atendidos en los servicios meacutedicos de Petroacuteleos Mexicanos y no se analizoacute a posibles portadores del VIH que hubieran adquirido el virus de otra manera) La muestra se obtuvo de tres fuentes baacutesicas a) presentacioacuten espontaacutenea por siacutentomas b) captado por exaacutemenes de rutina o contractuales y e) tras la aplicacioacuten de una encuesta seroloacutegica a 482 receptores de sangre y plasma provenientes del laboratorio de referencia Dicho de otra manera no se pudo detectar a todos los infectados con el VIH contenido en la sangre o derivados provenientes del laboratorio aludido pero con el 18 de eacutestos se pudo establecer que 17 de cada 100 casos habriacutean sido infectados con el VIH

RESUMENEn este capiacutetulo describimos coacutemo seleccionar una muestra Lo primero que se debe plantear es quieacutenes van a ser medidos lo que corresponde a definir la unidad de anaacutelisis Se procede despueacutes a delimitar claramente la poblacioacuten con base en los objetivos del estudio y en cuanto a caracteriacutesticas de contenido de lugar y en el tiempoLa muestra es un subgrupo de la poblacioacuten y puede ser probabiliacutestica o no probabiliacutesticaElegir queacute tipo de muestra se requiere depende de los objetivos del estudio y del esquema de investigacioacutenLas muestras probabiliacutesticas son esenciales en los disentildeos de investigacioacuten por encuestas donde se pretenden generalizar los resultados a una poblacioacuten La caracteriacutestica de este tipo de muestra es que todos los elementos de la poblacioacuten tienen al inicio la misma probabilidad de ser elegidos de esta manera los elementos muestrales tendraacuten valores muy aproximados a los valores de la poblacioacuten ya que las mediciones del subconjunto seraacuten estimaciones muy precisas del conjunto mayor Esta precisioacuten depende del error de muestreo llamado tambieacuten error estaacutendarPara una muestra probabiliacutestica necesitamos dos cosas determinar el tamantildeo de la muestra y seleccionar los elementos muestrales en forma aleatoriaEl tamantildeo de la muestra se calcula con base en la varianza de la poblacioacuten y la varianza de la muestra Esta uacuteltima expresada en teacuterminos de probabilidad de ocurrencia La varianza de la poblacioacuten se calcula con el cuadrado del error estaacutendar el cual determinamos Entre menor sea el error estaacutendar mayor seraacute el tamantildeo de la muestraLas muestras probabiliacutesticas pueden ser simples estratificadas y por racimosLa estratificacioacuten aumenta la precisioacuten de la muestra e implica el uso deliberado de sub-muestras para cada estrato o categoriacutea que sea relevante en la poblacioacuten Muestrear por racimos implica diferencias entre la unidad de anaacutelisis y la unidad muestral En este tipo de muestreo hay una seleccioacuten en dos etapas ambas con procedimientos probabiliacutesticos En la primera se seleccionan los racimos escuelas organizaciones salones de clase en la segunda y dentro de los racimos a los sujetos que van a ser medidos

Los elementos muestrales de una muestra probabiliacutestica siempre se eligen aleatoriamente para aseguramos de que cada elemento tenga la misma probabilidad de ser elegido Pueden usarse tres procedimientos de seleccioacuten1 Toacutembola 2 Tabla de nuacutemeros random y 3 Seleccioacuten sistemaacutetica Todo procedimiento de seleccioacuten depende de listados ya sea existentes o construidos ad hoc Listados pueden ser el directorio telefoacutenico listas de asociaciones listas de escuelas oficiales etceacutetera Cuando no existen listas de elementos de la poblacioacuten se recurren a otros marcos de referencia que contengan descripciones del material organizaciones o sujetos seleccionados como unidades de anaacutelisis Algunos de eacutestos pueden ser los archivos hemerotecas y los mapasLas muestras no-probabiliacutesticas pueden tambieacuten llamarse muestras dirigidas pues la eleccioacuten de sujetos u objetos de estudio depende del criterio del investigador Las muestras dirigidas pueden ser de varias clases 1 Muestra de sujetos voluntarios frecuentemente utilizados con disentildeos experimentales y situaciones de laboratorio 2 Muestra de expertos frecuentemente utilizados en estudios exploratorios 3 Muestra de sujetos tipo o estudios de casos utilizados en estudios cualitativos y motivacionales y 4 muestreo por cuotas frecuentes en estudios de opinioacuten y de mercadotecnia Las muestras dirigidas son vaacutelidas en cuanto a que un determinado disentildeo de investigacioacuten asiacute los requiere sin embargo los resultados son generalizables a la muestra en siacute o a muestras similares No son generalizables a una poblacioacutenEn el teorema de liacutemite central se sentildeala que una muestra de maacutes de cien casos seraacute una muestra con una distribucioacuten normal en sus caracteriacutesticas sin embargo la normalidad no debe conjuntarse con probabilidad Mientras lo primero es necesario para efectuar pruebas estadiacutesticas lo segundo es requisito indispensable para hacer inferencias correctas sobre una poblacioacuten

Page 4: CAPÍTULO 8 muestra y población

un capital social superior a 30 millones de pesos con ventas superiores a los 100 millones de pesos yo con maacutes de 300 personas empleadas Con estas caracteriacutesticas se precisoacute que la poblacioacuten era de N = 1176 directores generales ya que 1176 empresas reuniacutean las mencionadas caracteriacutesticas iquestCuaacutel es entonces el nuacutemero de directores generales n que se tiene que entrevistar para tener un error estaacutendar menor de 015 y dado que la poblacioacuten total es de 1176N = tamantildeo de la poblacioacuten de 1176 empresasy = valor promedio de una variable = 1 un director general por empresaSe = error estaacutendar = 015 determinado por nosotrosV2 = varianza de la poblacioacuten Su definicioacuten (Se) cuadrado del error estaacutendarS2 = varianza de la muestra expresada como la probabilidad de ocurrencia de yn = tamantildeo de la muestra sin ajustarn = tamantildeo de la muestraSustituyendo tenemos quen= S2V2S2 = p(1 - p) = 9(1 - 9) = 09V = (015)2 = 000225nrsquo = 09 - = 400000225n = nrsquo - = 400 -1 + nN 1 + 4001176n = 298Es decir para nuestra investigacioacuten necesitaremos una muestra de 298 directores generalesEsto es el primer procedimiento para obtener la muestra probabiliacutestica determinar su tamantildeo con base en estimados de la poblacioacuten El segundo procedimiento estriba en coacutemo y de doacutende seleccionar a esos 298 sujetos

Muestra probabiliacutestica estratificadaEl ejemplo anterior corresponde a una muestra probabiliacutestica simpleDeterminamos en este caso que el tamantildeo de la muestra seriacutea de n = 298 directivos de empresa Pero supongamos que la situacioacuten se complica y que deberemos estratificar esta n a fin de que los elementos muestrales o unidades de anaacutelisis posean un determinado atributo En nuestro ejemplo este atributo es el giro de la empresa Es decir cuando no basta que cada uno de los elementos muestrales tengan la misma probabilidad de ser escogidos sino que ademaacutes es necesario estratificar la muestra en relacioacuten a estratos o categoriacuteas que se presentan en la poblacioacuten y que aparte son relevantes para los objetivos del estudio se disentildea una muestra probabiliacutestica estratificada Lo que aquiacute se hace es dividir a la poblacioacuten en sub-poblaciones o estratos y se selecciona una muestra para cada estratoLa estratificacioacuten aumenta la precisioacuten de la muestra e implica el uso deliberado de diferentes tamantildeos de muestra para cada estrato ldquoa fin de lograr reducir la varianza de cada unidad de la media muestral (Kish 1965) Dice Kish (p 92) en su libro de muestreo que en un nuacutemero determinado de elementos muestrales n = l n h la varianza de la media muestral y puede reducirse al miacutenimo si el tamantildeo de la muestra para cada estrato es proporcional a la desviacioacuten estaacutendar dentro del estratoSiguiendo con nuestro ejemplo de los directores de empresa la poblacioacuten es de 1176 directores de empresa y el tamantildeo de muestra es n = 298 iquestQueacute muestra necesitaremos para cada estraton 298kSh=- = = 2534N 1176De manera que el total de la subpoblacioacuten se multiplicaraacute por esta fraccioacuten constante a fin de obtener el tamantildeo de muestra para el estrato

Muestreo probabiliacutestico por racimosEn algunos casos donde el investigador se ve limitado por recursos financieros por tiempo por distancias geograacuteficas o por una combinacioacuten de eacutestos y otros obstaacuteculos se recurre al muestreo por racimos En este tipo de muestreo se reducen costos tiempo y energiacutea al considerar que muchas veces las unidades de anaacutelisis se encuentran encapsuladas o encerradas en determinados lugares fiacutesicos o geograacuteficos a los que se denomina racimosMuestrear por racimos implica diferenciar entre la unidad de anaacutelisis y la unidad muestral La unidad de anaacutelisis indica quieacutenes van a ser medidos o sea el sujeto o sujetos a quienes en uacuteltima instancia vamos a aplicar el instrumento de medicioacuten La unidad muestral (en este tipo de muestra) se refiere al racimo a traveacutes del cual se logra el acceso a la unidad de anaacutelisis El muestreo por racimos supone una seleccioacuten en dos etapas ambas con procedimientos probabiliacutesticos En la primera se seleccionan los racimos siguiendo los ya sentildealados pasos de una muestra probabiliacutestica simple o estratificada En la segunda y dentro de estos racimos se seleccionan a los sujetos u objetos que van a ser medidos Para ello se hace una seleccioacuten que asegure que todos los elementos del racimo tienen la misma probabilidad de ser elegidos

iquestCOacuteMO SE LLEVA A CABO EL PROCEDIMIENTO DE SELECCIOacuteNCuando iniciamos nuestra discusioacuten de la muestra probabiliacutestica sentildealamos que los tipos de muestra dependen de dos cosas del tamantildeo de la muestra y del procedimiento de seleccioacutenDe lo primero hemos hablado con todo detalle de lo segundo hablaremos ahora Se determina el tamantildeo de la muestra n pero iquestcoacutemo seleccionar los elementos muestrales Se precisa el nuacutemero de racimos necesario y iquestcoacutemo se seleccionan los sujetos dentro de cada racimo Hasta el momento soacutelo hemos dicho que los elementos se eligen aleatoriamente pero iquestcoacutemo se hace esto Las unidades de anaacutelisis o los elementos muestrales se eligen siempre aleatoriamente para aseguramos de que cada elemento tenga la misma probabilidad de ser elegido Pueden usarse 3 procedimientos de seleccioacuten

ToacutembolaMuy simple y no muy raacutepido consiste en numerar todos los elementos muestrales del 1 al n Hacer fichas una por cada elemento revolverlas en una caja e ir sacando n fichas seguacuten el tamantildeo de la muestra Los nuacutemeros elegidos al azar conformaraacuten la muestra

Nuacutemeros random o nuacutemeros aleatoriosEl uso de nuacutemeros random no significa la seleccioacuten azarosa o fortuita sino la utilizacioacuten de una tabla de nuacutemeros que implica un mecanismo de probabilidad muy bien disentildeado Los nuacutemeros random de la Corporacioacuten Rand fueron generados con una especie de ruleta electroacutenica Existe una tabla de un milloacuten de diacutegitos publicada por esta corporacioacuten partes de dicha tabla se encuentran en los apeacutendices de muchos libros de estadiacutestica

Seleccioacuten sistemaacutetica de elementos muestralesEste procedimiento de seleccioacuten es muy uacutetil y faacutecil de aplicar e implica seleccionar dentro de una poblacioacuten N un nuacutemero n de elementos a partir de un intervalo KK es un intervalo que va a estar determinado por el tamantildeo de la poblacioacuten y el tamantildeo de la muestra De manera que tenemos que K = Nn en donde K = es un intervalo de seleccioacuten sistemaacutetica N = es la poblacioacuten n = es la muestraSupongamos que se quiere hacer un estudio sobre varios aspectos de la publicidad en Meacutexico Especiacuteficamente se pretende medir queacute nuacutemero de mensajes informativos y queacute nuacutemero de mensajes motivacionales tienen los comerciales en la televisioacuten mexicana Para tal efecto supongamos que los investigadores consiguen videocasetes con todos los comerciales que han pasado al aire en los diferentes canales de televisioacuten durante un periodo de tres antildeos Quitando los comerciales repetidos se tiene una poblacioacuten de N = 1 548 comerciales Se procede con este dato a determinar queacute nuacutemero de comerciales necesitamos analizar para generalizar a toda la poblacioacuten nuestros resultados con un error estaacutendar no mayor de 015 Con la foacutermula que ya hemos dado tenemos que si p = 5 entonces S2 = p(l - p) = 5 - (5) = 25

n= S2V2Si necesitamos una muestra de n = 647 comerciales podemos utilizar para la seleccioacuten al intervalo K dondeK = N = 1 548 = 239 = 3 (redondeando)n 647El intervalo 1K = 3 indica que cada tercer comercial 1K seraacute seleccionado hasta completar n = 647 239 se redondea para que sea un iacutentegro Veacutease Kish (1969) pp 115117La seleccioacuten sistemaacutetica de elementos muestrales 1K se puede utilizar al elegir los elementos de n para cada estrato yo para cada racimo La regla de probabilidad seguacuten la cual cada elemento de la poblacioacuten debe tener la misma probabilidad de ser elegido se cumple empezando la seleccioacuten de 1K al azarSiguiendo nuestro ejemplo no empezamos a elegir de los 1 548 comerciales grabados el 1 3 6 9 sino que procuramos que el empiezo sea determinado por el azar Asiacute en este caso podemos tirar unos dados y si en sus caras muestran 1 6 9 empezaremos en el comercial 169 y seguiremos 169 172 175 1K volver a empezar por los primeros si es necesario Este procedimiento de seleccioacuten es poco complicado y tiene varias ventajas cualquier tipo de estratos en una poblacioacuten X se veraacuten reflejados en la muestra Asimismo la seleccioacuten sistemaacutetica logra una muestra proporcionada pues por ejemplo tenemos que el procedimiento de seleccioacuten 1K nos daraacute una muestra con nombres que inician con las letras del abecedario en forma proporcional a la letra inicial de los nombres de la poblacioacuten

LOS LISTADOS Y OTROS MARCOS MUESTRALESLas muestras probabiliacutesticas requieren la determinacioacuten del tamantildeo de la muestra y de un proceso de seleccioacuten aleatoria que asegure que todos los elementos de la poblacioacuten tengan la misma probabilidad de ser elegidos Todo esto lo hemos visto pero nos falta discutir sobre algo esencial que procede a la seleccioacuten de una muestra el listado el marco muestral El listado se refiere a una lista existente o a una lista que es necesario confeccionar ad hoc con los elementos de la poblacioacuten y a partir de la cual se seleccionaraacuten los elementos muestrales El segundo teacutermino se refiere a un marco de referencia que nos permita identificar fiacutesicamente los elementos de la poblacioacuten la posibilidad de enumerarlos y por ende proceder a la seleccioacuten de los elementos muestrales Los listados con base en listas existentes sobre una poblacioacuten pueden ser variados el directorio telefoacutenico la lista de miembros de una asociacioacuten directorios especializados las listas oficiales de escuelas de la zona las listas de las canciones de eacutexito publicadas por una revista la lista de alumnos de una universidad etceacutetera En todo caso hay que tener en cuenta lo completo de una lista su exactitud veracidad su calidad y su nivel de cobertura en relacioacuten con el problema a investigar y la poblacioacuten que va a medirse ya que todos estos aspectos influyen en la seleccioacuten de la muestraPor ejemplo para algunas encuestas se considera que el directorio telefoacutenico es muy uacutetil Sin embargo hay que tomar en cuenta que muchos teleacutefonos no apareceraacuten porque son privados o que hay hogares que no tienen teleacutefono La lista de socios de una asociacioacuten como Canacintra (Caacutemara Nacional de la industria de la Transformacioacuten) puede servimos si el propoacutesito del estudio es por ejemplo conocer la opinioacuten de los asociados con respecto a una medida gubernamental Pero si el objetivo de la investigacioacuten es el anaacutelisis de opinioacuten del sector patronal del paiacutes el listado de una asociacioacuten no seraacute adecuado por varias razones como hay otras asociaciones patronales la Canacintra representa solamente el sector de la Industria de Transformacioacuten las asociaciones son voluntarias y no todo patroacuten o empresa pertenece a ellas Lo correcto en este caso seria construir una nueva lista con base en los listados existentes de las asociaciones patronales eliminando de dicha lista los casos duplicados suponiendo que una o maacutes empresas pudieran pertenecer a dos asociaciones al mismo tiempo como director a la Coparmex (Confederacioacuten Patronal de la Repuacuteblica Mexicana) y como empresa a la ANIQ (AsociacioacutenNacional de Ingenieros Quiacutemicos)Hay listas que proporcionan una gran ayuda al investigador Pensamos en directorios especializados como el lndustridata que enlista a las empresas mexicanas medianas y grandes

el directorio de la ciudad de Meacutexico por calles el directorio de medios que enlista casas productoras estaciones de radio y televisioacuten perioacutedicos y revistas Este tipo de directorios realizados por profesionales son uacutetiles al investigador pues representan una compilacioacuten (sujetos empresas instituciones) resultado de horas de trabajo e inversioacuten de recursos Recomendamos pues utilizarIos cuando sea pertinente tomando en cuenta las consideraciones que estos directorios hacen en su introduccioacuten y que revelan a queacute antildeo pertenecen los datos coacutemo los obtuvieron (exhaustivamente por cuestionarios por voluntarios) y muy importante quieacutenes y por queacute quedan excluidos del directorioEn Meacutexico se cuenta tambieacuten con directorios de anunciantes en publicidad y mercadotecnia como el publicado por Mercameacutetrica Ediciones S A Frecuentemente es necesario construir listas ad hoc a partir de las cuales se seleccionaraacuten los elementos que constituiraacuten las unidades de anaacutelisis en una determinada investigacioacuten Por ejemplo en la investigacioacuten de La televisioacuten y el nintildeo (Fernaacutendez Collado et al 1986) se hizo una muestra probabiliacutestica estratificada por racimo donde en una primera etapa se relacionaron escuelas para en uacuteltima instancia llegar a los nintildeos Pues bien para tal efecto se consiguioacute una lista de las escuelas primarias del Distrito Federal Cada escuela teniacutea un coacutedigo identificable por medio del cual se eliminaron las escuelas para nintildeos atiacutepicos Este listado conteniacutea ademaacutes informacioacuten sobre cada escuela sobre su ubicacioacuten (calle y colonia) sobre su propiedad (puacuteblica o privada)Con ayuda de otro estudio que catalogaba en diferentes estratos socioeconoacutemicos a las colonias del Distrito Federal con base en el ingreso promedio de la zona se hicieron 8 listas1 escuela puacuteblica clase A2 escuelas privadas clase A3 escuelas puacuteblicas clase B4 escuelas privadas clase B5 escuelas puacuteblicas clase C6 escuelas privadas clase C7 escuelas puacuteblicas clase D8 escuelas privadas clase DCada lista representaba un estrato de la poblacioacuten y de cada una de ellas se seleccionoacute una muestra de escuelas No siempre existen listas que permitan identificar nuestra poblacioacuten Seraacute necesario recurrir a otros marcos de referencia que contengan descripciones del material organizaciones o sujetos que seraacuten seleccionados como unidades de anaacutelisis Algunos de estos marcos de referencia son los archivos los mapas voluacutemenes de perioacutedicos empastados en una biblioteca o las horas de transmisioacuten de varios canales de televisioacuten De cada una de estas instancias daremos ejemplos con maacutes detalles

ArchivosUn jefe de reclutamiento y seleccioacuten de una institucioacuten quiere precisar si algunos datos que se dan en una solicitud de trabajo estaacuten correlacionados con el ausentismo del empleado Es decir si a partir de datos como edad sexo estado civil y duracioacuten en otro trabajo puede predecirse que alguien tenderaacute a ausentarse Para establecer correlaciones se consideraraacuten como poblacioacuten a todos los sujetos contratados durante 10 antildeos Se relacionan sus datos en la solicitud de empleo con los registros de faltas Como no hay una lista elaborada de estos sujetos el investigador decide acudir a los archivos de las solicitudes de empleo Estos archivos constituyen su marco muestral a partir del cual obtendraacute la muestra Calcula el tamantildeo de la poblacioacuten obtiene el tamantildeo de la muestra y selecciona sistemaacuteticamente cada elemento 1K cada solicitud que seraacute analizada Aqui el problema que surge es que en el archivo hay solicitudes de gente que no fue contratada y por tanto no pueden ser consideradas en el estudioEn este caso y en otros donde no todos los elementos del marco de referencia o de una lista (por ejemplo nombres en el directorio que no corresponden a una persona fiacutesica) los especialistas en muestreo (Kish 1965 Sutman 1976) no aconsejan el reemplazo con el siguiente elemento sino simplemente no tomar en cuenta ese elemento es decir como si no existiera continuaacutendose con el intervalo de seleccioacuten sistemaacutetica

MapasLos mapas son muy uacutetiles como marco de referencia en muestras de racimoPor ejemplo un investigador quiere saber queacute motiva a los compradores en una determinada tienda de autoservicio A partir de una lista de tiendas de cada cadena competidora marca sobre un mapa de la ciudad todas las tiendas de autoservicios las cuales constituyen una poblacioacuten de racimos pues en cada tienda seleccionada entrevistaraacute a un nuacutemero n de clientes El mapa le permite ver la poblacioacuten (tiendas autoservicio) y su situacioacuten geograacutefica de manera que eligioacute zonas donde coexistan tiendas de la competencia para asegurarse de que el consumidor de la zona tenga todas las posibles alternativas

VoluacutemenesEn este ejemplo supongamos que un estudioso del periodismo quiere hacer un anaacutelisis de contenido de los editoriales de los tres principales diarios de la ciudad durante el porfiriato El investigador va a la Hemeroteca Nacional y encuentra que los diarios son encuadernados por trimestre y antildeo lo cual le proporciona un marco de referencia ideal a partir del cual seleccionaraacuten voluacutemenes para su anaacutelisis Supongamos sin embargo que encuentra que el volumen X que contiene el perioacutedico El Hijo del Ahuizote (enero-marzo 1899) falta en la Hemeroteca iquestQueacute hace Pues redefine la poblacioacuten manifestando expliacutecitamente que de N voluacutemenes tiene 99 de los elementos y a partir de este nuevo nuacutemero de N calculoacute su muestra n y la seleccionoacute

Horas de transmisioacutenEn un estudio de Portilla y Soloacuterzano (1982) los investigadores queriacutean hacer un anaacutelisis de anuncios en la televisioacuten mexicana Las emisoras no proporcionan una lista de anuncios ni sus horas de transmisioacuten Por otra parte saldriacutea muy caro grabar todos los anuncios a todas horas y seriacutea imposible estar frente al televisor para hacerloAnte la imposibilidad de tener un listado de comerciales se hicieron listados que identificaron cada media hora de transmisioacuten televisiva en cada canal 2 4 5 9 y 13 de las 7 a las 24 horas durante siete diacuteas de una semana de octubre de 1982 La poblacioacuten estaba constituida del nuacutemero total de medias horas de transmisioacuten televisiva N = 1 190 horas Esta poblacioacuten se dividioacute en estratos mantildeana mediodiacutea tarde y noche y se procedioacute a calcular el tamantildeo de la muestra tomando en consideracioacuten que por cada media hora de transmisioacuten hay 6 minutos de comerciales (De Noriega 1979)Se calculoacute el nuacutemero de medias horas que se seleccionariacutean para obtener una muestra n Una vez obtenido el tamantildeo de la muestra se seleccionaron aleatoriamente n medias horas y por uacuteltimo se grabaron y analizaron uacutenicamente aquellos comerciales contenidos en las medias horas seleccionadas al azar y que representaron diferentes canales y segmentos del diacutea El punto en este ejemplo es la construccioacuten concreta de un marco muestral que permitiera el anaacutelisis de una muestra probabiliacutestica de comerciales

TAMANtildeO OacutePTIMO DE UNA MUESTRA Y EL TEOREMA DEL LIacuteMITE CENTRALLas muestras probabiliacutesticas requieren dos procedimientos baacutesicos 1 La determinacioacuten del tamantildeo de la muestra y 2 la seleccioacuten aleatoria de los elementos muestrales El primer procedimiento lo hemos descrito en su modalidad maacutes simple en este capiacutetulo Precisar adecuadamente el tamantildeo de la muestra puede tornarse muy complejo dependiendo del problema de investigacioacuten y la poblacioacuten a estudiar Para el alumno seraacute muy uacutetil comparar que tamantildeo de muestra han utilizado otros investigadores en ciencias sociales

iquestCOacuteMO SON LAS MUESTRAS NO PROBABILIacuteSTICASLas muestras no probabiliacutesticas tambieacuten llamadas muestras dirigidas suponen un procedimiento de seleccioacuten informal y un poco arbitrario Auacuten asiacute se utilizan en muchas investigaciones y a partir de ellas se hacen inferencias sobre la poblacioacuten Es como si juzgaacutesemos el sabor de un cargamento de limones solamente probando alguno como si para muestra bastase un botoacuten La muestra dirigida selecciona sujetos tiacutepicos con la vaga esperanza de que seraacuten casos representativos de una poblacioacuten determinada

La verdad es que las muestras dirigidas tienen muchas desventajas La primera es que al no ser probabiliacutesticas no podemos calcular con precisioacuten el error estaacutendar es decir no podemos calcular con queacute nivel de confianza hacemos una estimacioacuten Esto es un grave inconveniente si consideramos que la estadiacutestica inferencial se basa en teoriacutea de la probabilidad por lo que pruebas estadiacutesticas en muestras no probabiliacutesticas tienen un valor limitado y relativo ala muestra en siacute mas no a la poblacioacuten Es decir los datos no pueden generalizarse a una poblacioacuten que no se consideroacute ni en sus paraacutemetros ni en sus elementos para obtener la muestra Recordemos que en las muestras de este tipo la eleccioacuten de los sujetos no depende de que todos tengan la misma probabilidad de ser elegidos sino de la decisioacuten de un investigador o grupo de encuestadoresLa ventaja de una muestra no probabiliacutestica es su utilidad para determinado disentildeo de estudio que requiere no tanto una representatividad de elementos de una poblacioacuten sino una cuidadosa y controlada eleccioacuten de sujetos con ciertas caracteriacutesticas especificadas previamente en el planteamiento del problemaHay variacuteas clases de muestras dirigidas y se definiraacuten a continuacioacuten

La muestra de sujetos voluntariosLas muestras de sujetos voluntarios son frecuentes en ciencias sociales y ciencias de la conducta Se trata de muestras fortuitas utilizadas tambieacuten en la medicina y la arqueologiacutea donde el investigador elabora conclusiones sobre especiacutemenes que llegan a sus manos de manera casual Pensemos por ejemplo en los sujetos que voluntariamente acceden a participar en un estudio que monitorea los efectos de un medicamento o en el investigador que anuncia en una clase que estaacute haciendo un estudio sobre motivacioacuten en el universitario e invita a aquellos que acepten someterse a una prueba proyectiva TAT En estos casos la eleccioacuten de los individuos que seraacuten sujetos a anaacutelisis depende de circunstancias fortuitas Este tipo de muestra se usa en estudios de laboratorio donde se procura que los sujetos sean homogeacuteneos en variables tales como edad sexo inteligencia de manera que los resultados o efectos no obedezcan a diferencias individuales sino a las condiciones a las que fueron sometidos

La muestra de expertosEn ciertos estudios es necesaria la opinioacuten de sujetos expertos en un temaEstas muestras son frecuentes en estudios cualitativos y exploratorios que para generar hipoacutetesis maacutes precisas o la materia prima del disentildeo de cuestionarios Por ejemplo en un estudio sobre el perfil de la mujer periodista en Meacutexico (Barrera et al 1989) se recurrioacute a una muestra de TI = 227 mujeres periodistas pues se consideroacute que eran los sujetos idoacuteneos para hablar de contratacioacuten sueldos y desempentildeo de las mujeres periodistas Estas muestras son vaacutelidas y uacutetiles cuando los objetivos del estudio asiacute lo requieren

Los sujetos-tipoTambieacuten esta muestra se utiliza en estudios exploratorios y en investigaciones de tipo cualitativo donde el objetivo es la riqueza profundidad y calidad de la informacioacuten no la cantidad ni la estandarizacioacuten En estudios de perspectiva fenomenoloacutegica donde el objetivo es analizar los valores ritos y significados de un determinado grupo social el uso tanto de expertos como de sujetos-tipo es frecuente Por ejemplo pensamos en los trabajos de Howard Becker (El muacutesica de jazz Las muchachas de blanco) que se basan en grupos de tiacutepicos muacutesicos de jazz y tiacutepicos estudiantes de medicina para adentrarse en el anaacutelisis de los patrones de identificacioacuten y socializacioacuten de estas dos profesiones la de muacutesico y la de meacutedicoLos estudios motivacionales los cuales se hacen para el anaacutelisis de las actitudes y conductas del consumidor tambieacuten utilizan muestras de sujeto-tipoAquiacute se definen los grupos a los que va dirigido un determinado producto (por ejemplo joacutevenes clase socio econoacutemica A y B amas de casa clase B ejecutivos clase A-B) y se construyen grupos de 8 o 10 personas cuyos integrantes tengan las caracteriacutesticas sociales y demograacuteficas de dicho sub grupo

Con ese grupo se efectuacutea una sesioacuten un facilitador o moderador dirigiraacute una conversacioacuten donde los miembros del grupo expresen sus actitudes valores medios expectativas motivaciones hacia las caracteriacutesticas de determinado producto o servicio

La muestra por cuotasEste tipo de muestra se utiliza mucho en estudios de opinioacuten y de mercadotecnia Los encuestadores reciben instrucciones de administrar cuestionarios con sujetos en la calle y al hacerla van conformando o llenando cuotas de acuerdo con la proporcioacuten de ciertas variables demograacuteficas en la poblacioacuten Asiacute en un estudio sobre la actitud de la poblacioacuten hacia un candidato poliacutetico se dice a los encuestadores que vayan a determinada colonia y entrevisten a 150 sujetos Que el 25 sean hombres mayores de 30 antildeos 25 mujeres mayores de 30 antildeos 25 hombres menores de 25 antildeos y 25 mujeres menores de 25 antildeos Asiacute se construyen estas muestras que como vemos dependen en cierta medida del juicio del entrevistadorPara el caso de los infectados con el VIH se realizoacute una muestra no probabiliacutestica (porque se encuestoacute y se analizoacute a cuantas personas se pudieron localizar lo que representoacute un 18 de los receptores de sangre o derivados provenientes del laboratorio Transfusiones y Hematologiacutea SA que habiacutean sido atendidos en los servicios meacutedicos de Petroacuteleos Mexicanos y no se analizoacute a posibles portadores del VIH que hubieran adquirido el virus de otra manera) La muestra se obtuvo de tres fuentes baacutesicas a) presentacioacuten espontaacutenea por siacutentomas b) captado por exaacutemenes de rutina o contractuales y e) tras la aplicacioacuten de una encuesta seroloacutegica a 482 receptores de sangre y plasma provenientes del laboratorio de referencia Dicho de otra manera no se pudo detectar a todos los infectados con el VIH contenido en la sangre o derivados provenientes del laboratorio aludido pero con el 18 de eacutestos se pudo establecer que 17 de cada 100 casos habriacutean sido infectados con el VIH

RESUMENEn este capiacutetulo describimos coacutemo seleccionar una muestra Lo primero que se debe plantear es quieacutenes van a ser medidos lo que corresponde a definir la unidad de anaacutelisis Se procede despueacutes a delimitar claramente la poblacioacuten con base en los objetivos del estudio y en cuanto a caracteriacutesticas de contenido de lugar y en el tiempoLa muestra es un subgrupo de la poblacioacuten y puede ser probabiliacutestica o no probabiliacutesticaElegir queacute tipo de muestra se requiere depende de los objetivos del estudio y del esquema de investigacioacutenLas muestras probabiliacutesticas son esenciales en los disentildeos de investigacioacuten por encuestas donde se pretenden generalizar los resultados a una poblacioacuten La caracteriacutestica de este tipo de muestra es que todos los elementos de la poblacioacuten tienen al inicio la misma probabilidad de ser elegidos de esta manera los elementos muestrales tendraacuten valores muy aproximados a los valores de la poblacioacuten ya que las mediciones del subconjunto seraacuten estimaciones muy precisas del conjunto mayor Esta precisioacuten depende del error de muestreo llamado tambieacuten error estaacutendarPara una muestra probabiliacutestica necesitamos dos cosas determinar el tamantildeo de la muestra y seleccionar los elementos muestrales en forma aleatoriaEl tamantildeo de la muestra se calcula con base en la varianza de la poblacioacuten y la varianza de la muestra Esta uacuteltima expresada en teacuterminos de probabilidad de ocurrencia La varianza de la poblacioacuten se calcula con el cuadrado del error estaacutendar el cual determinamos Entre menor sea el error estaacutendar mayor seraacute el tamantildeo de la muestraLas muestras probabiliacutesticas pueden ser simples estratificadas y por racimosLa estratificacioacuten aumenta la precisioacuten de la muestra e implica el uso deliberado de sub-muestras para cada estrato o categoriacutea que sea relevante en la poblacioacuten Muestrear por racimos implica diferencias entre la unidad de anaacutelisis y la unidad muestral En este tipo de muestreo hay una seleccioacuten en dos etapas ambas con procedimientos probabiliacutesticos En la primera se seleccionan los racimos escuelas organizaciones salones de clase en la segunda y dentro de los racimos a los sujetos que van a ser medidos

Los elementos muestrales de una muestra probabiliacutestica siempre se eligen aleatoriamente para aseguramos de que cada elemento tenga la misma probabilidad de ser elegido Pueden usarse tres procedimientos de seleccioacuten1 Toacutembola 2 Tabla de nuacutemeros random y 3 Seleccioacuten sistemaacutetica Todo procedimiento de seleccioacuten depende de listados ya sea existentes o construidos ad hoc Listados pueden ser el directorio telefoacutenico listas de asociaciones listas de escuelas oficiales etceacutetera Cuando no existen listas de elementos de la poblacioacuten se recurren a otros marcos de referencia que contengan descripciones del material organizaciones o sujetos seleccionados como unidades de anaacutelisis Algunos de eacutestos pueden ser los archivos hemerotecas y los mapasLas muestras no-probabiliacutesticas pueden tambieacuten llamarse muestras dirigidas pues la eleccioacuten de sujetos u objetos de estudio depende del criterio del investigador Las muestras dirigidas pueden ser de varias clases 1 Muestra de sujetos voluntarios frecuentemente utilizados con disentildeos experimentales y situaciones de laboratorio 2 Muestra de expertos frecuentemente utilizados en estudios exploratorios 3 Muestra de sujetos tipo o estudios de casos utilizados en estudios cualitativos y motivacionales y 4 muestreo por cuotas frecuentes en estudios de opinioacuten y de mercadotecnia Las muestras dirigidas son vaacutelidas en cuanto a que un determinado disentildeo de investigacioacuten asiacute los requiere sin embargo los resultados son generalizables a la muestra en siacute o a muestras similares No son generalizables a una poblacioacutenEn el teorema de liacutemite central se sentildeala que una muestra de maacutes de cien casos seraacute una muestra con una distribucioacuten normal en sus caracteriacutesticas sin embargo la normalidad no debe conjuntarse con probabilidad Mientras lo primero es necesario para efectuar pruebas estadiacutesticas lo segundo es requisito indispensable para hacer inferencias correctas sobre una poblacioacuten

Page 5: CAPÍTULO 8 muestra y población

Muestreo probabiliacutestico por racimosEn algunos casos donde el investigador se ve limitado por recursos financieros por tiempo por distancias geograacuteficas o por una combinacioacuten de eacutestos y otros obstaacuteculos se recurre al muestreo por racimos En este tipo de muestreo se reducen costos tiempo y energiacutea al considerar que muchas veces las unidades de anaacutelisis se encuentran encapsuladas o encerradas en determinados lugares fiacutesicos o geograacuteficos a los que se denomina racimosMuestrear por racimos implica diferenciar entre la unidad de anaacutelisis y la unidad muestral La unidad de anaacutelisis indica quieacutenes van a ser medidos o sea el sujeto o sujetos a quienes en uacuteltima instancia vamos a aplicar el instrumento de medicioacuten La unidad muestral (en este tipo de muestra) se refiere al racimo a traveacutes del cual se logra el acceso a la unidad de anaacutelisis El muestreo por racimos supone una seleccioacuten en dos etapas ambas con procedimientos probabiliacutesticos En la primera se seleccionan los racimos siguiendo los ya sentildealados pasos de una muestra probabiliacutestica simple o estratificada En la segunda y dentro de estos racimos se seleccionan a los sujetos u objetos que van a ser medidos Para ello se hace una seleccioacuten que asegure que todos los elementos del racimo tienen la misma probabilidad de ser elegidos

iquestCOacuteMO SE LLEVA A CABO EL PROCEDIMIENTO DE SELECCIOacuteNCuando iniciamos nuestra discusioacuten de la muestra probabiliacutestica sentildealamos que los tipos de muestra dependen de dos cosas del tamantildeo de la muestra y del procedimiento de seleccioacutenDe lo primero hemos hablado con todo detalle de lo segundo hablaremos ahora Se determina el tamantildeo de la muestra n pero iquestcoacutemo seleccionar los elementos muestrales Se precisa el nuacutemero de racimos necesario y iquestcoacutemo se seleccionan los sujetos dentro de cada racimo Hasta el momento soacutelo hemos dicho que los elementos se eligen aleatoriamente pero iquestcoacutemo se hace esto Las unidades de anaacutelisis o los elementos muestrales se eligen siempre aleatoriamente para aseguramos de que cada elemento tenga la misma probabilidad de ser elegido Pueden usarse 3 procedimientos de seleccioacuten

ToacutembolaMuy simple y no muy raacutepido consiste en numerar todos los elementos muestrales del 1 al n Hacer fichas una por cada elemento revolverlas en una caja e ir sacando n fichas seguacuten el tamantildeo de la muestra Los nuacutemeros elegidos al azar conformaraacuten la muestra

Nuacutemeros random o nuacutemeros aleatoriosEl uso de nuacutemeros random no significa la seleccioacuten azarosa o fortuita sino la utilizacioacuten de una tabla de nuacutemeros que implica un mecanismo de probabilidad muy bien disentildeado Los nuacutemeros random de la Corporacioacuten Rand fueron generados con una especie de ruleta electroacutenica Existe una tabla de un milloacuten de diacutegitos publicada por esta corporacioacuten partes de dicha tabla se encuentran en los apeacutendices de muchos libros de estadiacutestica

Seleccioacuten sistemaacutetica de elementos muestralesEste procedimiento de seleccioacuten es muy uacutetil y faacutecil de aplicar e implica seleccionar dentro de una poblacioacuten N un nuacutemero n de elementos a partir de un intervalo KK es un intervalo que va a estar determinado por el tamantildeo de la poblacioacuten y el tamantildeo de la muestra De manera que tenemos que K = Nn en donde K = es un intervalo de seleccioacuten sistemaacutetica N = es la poblacioacuten n = es la muestraSupongamos que se quiere hacer un estudio sobre varios aspectos de la publicidad en Meacutexico Especiacuteficamente se pretende medir queacute nuacutemero de mensajes informativos y queacute nuacutemero de mensajes motivacionales tienen los comerciales en la televisioacuten mexicana Para tal efecto supongamos que los investigadores consiguen videocasetes con todos los comerciales que han pasado al aire en los diferentes canales de televisioacuten durante un periodo de tres antildeos Quitando los comerciales repetidos se tiene una poblacioacuten de N = 1 548 comerciales Se procede con este dato a determinar queacute nuacutemero de comerciales necesitamos analizar para generalizar a toda la poblacioacuten nuestros resultados con un error estaacutendar no mayor de 015 Con la foacutermula que ya hemos dado tenemos que si p = 5 entonces S2 = p(l - p) = 5 - (5) = 25

n= S2V2Si necesitamos una muestra de n = 647 comerciales podemos utilizar para la seleccioacuten al intervalo K dondeK = N = 1 548 = 239 = 3 (redondeando)n 647El intervalo 1K = 3 indica que cada tercer comercial 1K seraacute seleccionado hasta completar n = 647 239 se redondea para que sea un iacutentegro Veacutease Kish (1969) pp 115117La seleccioacuten sistemaacutetica de elementos muestrales 1K se puede utilizar al elegir los elementos de n para cada estrato yo para cada racimo La regla de probabilidad seguacuten la cual cada elemento de la poblacioacuten debe tener la misma probabilidad de ser elegido se cumple empezando la seleccioacuten de 1K al azarSiguiendo nuestro ejemplo no empezamos a elegir de los 1 548 comerciales grabados el 1 3 6 9 sino que procuramos que el empiezo sea determinado por el azar Asiacute en este caso podemos tirar unos dados y si en sus caras muestran 1 6 9 empezaremos en el comercial 169 y seguiremos 169 172 175 1K volver a empezar por los primeros si es necesario Este procedimiento de seleccioacuten es poco complicado y tiene varias ventajas cualquier tipo de estratos en una poblacioacuten X se veraacuten reflejados en la muestra Asimismo la seleccioacuten sistemaacutetica logra una muestra proporcionada pues por ejemplo tenemos que el procedimiento de seleccioacuten 1K nos daraacute una muestra con nombres que inician con las letras del abecedario en forma proporcional a la letra inicial de los nombres de la poblacioacuten

LOS LISTADOS Y OTROS MARCOS MUESTRALESLas muestras probabiliacutesticas requieren la determinacioacuten del tamantildeo de la muestra y de un proceso de seleccioacuten aleatoria que asegure que todos los elementos de la poblacioacuten tengan la misma probabilidad de ser elegidos Todo esto lo hemos visto pero nos falta discutir sobre algo esencial que procede a la seleccioacuten de una muestra el listado el marco muestral El listado se refiere a una lista existente o a una lista que es necesario confeccionar ad hoc con los elementos de la poblacioacuten y a partir de la cual se seleccionaraacuten los elementos muestrales El segundo teacutermino se refiere a un marco de referencia que nos permita identificar fiacutesicamente los elementos de la poblacioacuten la posibilidad de enumerarlos y por ende proceder a la seleccioacuten de los elementos muestrales Los listados con base en listas existentes sobre una poblacioacuten pueden ser variados el directorio telefoacutenico la lista de miembros de una asociacioacuten directorios especializados las listas oficiales de escuelas de la zona las listas de las canciones de eacutexito publicadas por una revista la lista de alumnos de una universidad etceacutetera En todo caso hay que tener en cuenta lo completo de una lista su exactitud veracidad su calidad y su nivel de cobertura en relacioacuten con el problema a investigar y la poblacioacuten que va a medirse ya que todos estos aspectos influyen en la seleccioacuten de la muestraPor ejemplo para algunas encuestas se considera que el directorio telefoacutenico es muy uacutetil Sin embargo hay que tomar en cuenta que muchos teleacutefonos no apareceraacuten porque son privados o que hay hogares que no tienen teleacutefono La lista de socios de una asociacioacuten como Canacintra (Caacutemara Nacional de la industria de la Transformacioacuten) puede servimos si el propoacutesito del estudio es por ejemplo conocer la opinioacuten de los asociados con respecto a una medida gubernamental Pero si el objetivo de la investigacioacuten es el anaacutelisis de opinioacuten del sector patronal del paiacutes el listado de una asociacioacuten no seraacute adecuado por varias razones como hay otras asociaciones patronales la Canacintra representa solamente el sector de la Industria de Transformacioacuten las asociaciones son voluntarias y no todo patroacuten o empresa pertenece a ellas Lo correcto en este caso seria construir una nueva lista con base en los listados existentes de las asociaciones patronales eliminando de dicha lista los casos duplicados suponiendo que una o maacutes empresas pudieran pertenecer a dos asociaciones al mismo tiempo como director a la Coparmex (Confederacioacuten Patronal de la Repuacuteblica Mexicana) y como empresa a la ANIQ (AsociacioacutenNacional de Ingenieros Quiacutemicos)Hay listas que proporcionan una gran ayuda al investigador Pensamos en directorios especializados como el lndustridata que enlista a las empresas mexicanas medianas y grandes

el directorio de la ciudad de Meacutexico por calles el directorio de medios que enlista casas productoras estaciones de radio y televisioacuten perioacutedicos y revistas Este tipo de directorios realizados por profesionales son uacutetiles al investigador pues representan una compilacioacuten (sujetos empresas instituciones) resultado de horas de trabajo e inversioacuten de recursos Recomendamos pues utilizarIos cuando sea pertinente tomando en cuenta las consideraciones que estos directorios hacen en su introduccioacuten y que revelan a queacute antildeo pertenecen los datos coacutemo los obtuvieron (exhaustivamente por cuestionarios por voluntarios) y muy importante quieacutenes y por queacute quedan excluidos del directorioEn Meacutexico se cuenta tambieacuten con directorios de anunciantes en publicidad y mercadotecnia como el publicado por Mercameacutetrica Ediciones S A Frecuentemente es necesario construir listas ad hoc a partir de las cuales se seleccionaraacuten los elementos que constituiraacuten las unidades de anaacutelisis en una determinada investigacioacuten Por ejemplo en la investigacioacuten de La televisioacuten y el nintildeo (Fernaacutendez Collado et al 1986) se hizo una muestra probabiliacutestica estratificada por racimo donde en una primera etapa se relacionaron escuelas para en uacuteltima instancia llegar a los nintildeos Pues bien para tal efecto se consiguioacute una lista de las escuelas primarias del Distrito Federal Cada escuela teniacutea un coacutedigo identificable por medio del cual se eliminaron las escuelas para nintildeos atiacutepicos Este listado conteniacutea ademaacutes informacioacuten sobre cada escuela sobre su ubicacioacuten (calle y colonia) sobre su propiedad (puacuteblica o privada)Con ayuda de otro estudio que catalogaba en diferentes estratos socioeconoacutemicos a las colonias del Distrito Federal con base en el ingreso promedio de la zona se hicieron 8 listas1 escuela puacuteblica clase A2 escuelas privadas clase A3 escuelas puacuteblicas clase B4 escuelas privadas clase B5 escuelas puacuteblicas clase C6 escuelas privadas clase C7 escuelas puacuteblicas clase D8 escuelas privadas clase DCada lista representaba un estrato de la poblacioacuten y de cada una de ellas se seleccionoacute una muestra de escuelas No siempre existen listas que permitan identificar nuestra poblacioacuten Seraacute necesario recurrir a otros marcos de referencia que contengan descripciones del material organizaciones o sujetos que seraacuten seleccionados como unidades de anaacutelisis Algunos de estos marcos de referencia son los archivos los mapas voluacutemenes de perioacutedicos empastados en una biblioteca o las horas de transmisioacuten de varios canales de televisioacuten De cada una de estas instancias daremos ejemplos con maacutes detalles

ArchivosUn jefe de reclutamiento y seleccioacuten de una institucioacuten quiere precisar si algunos datos que se dan en una solicitud de trabajo estaacuten correlacionados con el ausentismo del empleado Es decir si a partir de datos como edad sexo estado civil y duracioacuten en otro trabajo puede predecirse que alguien tenderaacute a ausentarse Para establecer correlaciones se consideraraacuten como poblacioacuten a todos los sujetos contratados durante 10 antildeos Se relacionan sus datos en la solicitud de empleo con los registros de faltas Como no hay una lista elaborada de estos sujetos el investigador decide acudir a los archivos de las solicitudes de empleo Estos archivos constituyen su marco muestral a partir del cual obtendraacute la muestra Calcula el tamantildeo de la poblacioacuten obtiene el tamantildeo de la muestra y selecciona sistemaacuteticamente cada elemento 1K cada solicitud que seraacute analizada Aqui el problema que surge es que en el archivo hay solicitudes de gente que no fue contratada y por tanto no pueden ser consideradas en el estudioEn este caso y en otros donde no todos los elementos del marco de referencia o de una lista (por ejemplo nombres en el directorio que no corresponden a una persona fiacutesica) los especialistas en muestreo (Kish 1965 Sutman 1976) no aconsejan el reemplazo con el siguiente elemento sino simplemente no tomar en cuenta ese elemento es decir como si no existiera continuaacutendose con el intervalo de seleccioacuten sistemaacutetica

MapasLos mapas son muy uacutetiles como marco de referencia en muestras de racimoPor ejemplo un investigador quiere saber queacute motiva a los compradores en una determinada tienda de autoservicio A partir de una lista de tiendas de cada cadena competidora marca sobre un mapa de la ciudad todas las tiendas de autoservicios las cuales constituyen una poblacioacuten de racimos pues en cada tienda seleccionada entrevistaraacute a un nuacutemero n de clientes El mapa le permite ver la poblacioacuten (tiendas autoservicio) y su situacioacuten geograacutefica de manera que eligioacute zonas donde coexistan tiendas de la competencia para asegurarse de que el consumidor de la zona tenga todas las posibles alternativas

VoluacutemenesEn este ejemplo supongamos que un estudioso del periodismo quiere hacer un anaacutelisis de contenido de los editoriales de los tres principales diarios de la ciudad durante el porfiriato El investigador va a la Hemeroteca Nacional y encuentra que los diarios son encuadernados por trimestre y antildeo lo cual le proporciona un marco de referencia ideal a partir del cual seleccionaraacuten voluacutemenes para su anaacutelisis Supongamos sin embargo que encuentra que el volumen X que contiene el perioacutedico El Hijo del Ahuizote (enero-marzo 1899) falta en la Hemeroteca iquestQueacute hace Pues redefine la poblacioacuten manifestando expliacutecitamente que de N voluacutemenes tiene 99 de los elementos y a partir de este nuevo nuacutemero de N calculoacute su muestra n y la seleccionoacute

Horas de transmisioacutenEn un estudio de Portilla y Soloacuterzano (1982) los investigadores queriacutean hacer un anaacutelisis de anuncios en la televisioacuten mexicana Las emisoras no proporcionan una lista de anuncios ni sus horas de transmisioacuten Por otra parte saldriacutea muy caro grabar todos los anuncios a todas horas y seriacutea imposible estar frente al televisor para hacerloAnte la imposibilidad de tener un listado de comerciales se hicieron listados que identificaron cada media hora de transmisioacuten televisiva en cada canal 2 4 5 9 y 13 de las 7 a las 24 horas durante siete diacuteas de una semana de octubre de 1982 La poblacioacuten estaba constituida del nuacutemero total de medias horas de transmisioacuten televisiva N = 1 190 horas Esta poblacioacuten se dividioacute en estratos mantildeana mediodiacutea tarde y noche y se procedioacute a calcular el tamantildeo de la muestra tomando en consideracioacuten que por cada media hora de transmisioacuten hay 6 minutos de comerciales (De Noriega 1979)Se calculoacute el nuacutemero de medias horas que se seleccionariacutean para obtener una muestra n Una vez obtenido el tamantildeo de la muestra se seleccionaron aleatoriamente n medias horas y por uacuteltimo se grabaron y analizaron uacutenicamente aquellos comerciales contenidos en las medias horas seleccionadas al azar y que representaron diferentes canales y segmentos del diacutea El punto en este ejemplo es la construccioacuten concreta de un marco muestral que permitiera el anaacutelisis de una muestra probabiliacutestica de comerciales

TAMANtildeO OacutePTIMO DE UNA MUESTRA Y EL TEOREMA DEL LIacuteMITE CENTRALLas muestras probabiliacutesticas requieren dos procedimientos baacutesicos 1 La determinacioacuten del tamantildeo de la muestra y 2 la seleccioacuten aleatoria de los elementos muestrales El primer procedimiento lo hemos descrito en su modalidad maacutes simple en este capiacutetulo Precisar adecuadamente el tamantildeo de la muestra puede tornarse muy complejo dependiendo del problema de investigacioacuten y la poblacioacuten a estudiar Para el alumno seraacute muy uacutetil comparar que tamantildeo de muestra han utilizado otros investigadores en ciencias sociales

iquestCOacuteMO SON LAS MUESTRAS NO PROBABILIacuteSTICASLas muestras no probabiliacutesticas tambieacuten llamadas muestras dirigidas suponen un procedimiento de seleccioacuten informal y un poco arbitrario Auacuten asiacute se utilizan en muchas investigaciones y a partir de ellas se hacen inferencias sobre la poblacioacuten Es como si juzgaacutesemos el sabor de un cargamento de limones solamente probando alguno como si para muestra bastase un botoacuten La muestra dirigida selecciona sujetos tiacutepicos con la vaga esperanza de que seraacuten casos representativos de una poblacioacuten determinada

La verdad es que las muestras dirigidas tienen muchas desventajas La primera es que al no ser probabiliacutesticas no podemos calcular con precisioacuten el error estaacutendar es decir no podemos calcular con queacute nivel de confianza hacemos una estimacioacuten Esto es un grave inconveniente si consideramos que la estadiacutestica inferencial se basa en teoriacutea de la probabilidad por lo que pruebas estadiacutesticas en muestras no probabiliacutesticas tienen un valor limitado y relativo ala muestra en siacute mas no a la poblacioacuten Es decir los datos no pueden generalizarse a una poblacioacuten que no se consideroacute ni en sus paraacutemetros ni en sus elementos para obtener la muestra Recordemos que en las muestras de este tipo la eleccioacuten de los sujetos no depende de que todos tengan la misma probabilidad de ser elegidos sino de la decisioacuten de un investigador o grupo de encuestadoresLa ventaja de una muestra no probabiliacutestica es su utilidad para determinado disentildeo de estudio que requiere no tanto una representatividad de elementos de una poblacioacuten sino una cuidadosa y controlada eleccioacuten de sujetos con ciertas caracteriacutesticas especificadas previamente en el planteamiento del problemaHay variacuteas clases de muestras dirigidas y se definiraacuten a continuacioacuten

La muestra de sujetos voluntariosLas muestras de sujetos voluntarios son frecuentes en ciencias sociales y ciencias de la conducta Se trata de muestras fortuitas utilizadas tambieacuten en la medicina y la arqueologiacutea donde el investigador elabora conclusiones sobre especiacutemenes que llegan a sus manos de manera casual Pensemos por ejemplo en los sujetos que voluntariamente acceden a participar en un estudio que monitorea los efectos de un medicamento o en el investigador que anuncia en una clase que estaacute haciendo un estudio sobre motivacioacuten en el universitario e invita a aquellos que acepten someterse a una prueba proyectiva TAT En estos casos la eleccioacuten de los individuos que seraacuten sujetos a anaacutelisis depende de circunstancias fortuitas Este tipo de muestra se usa en estudios de laboratorio donde se procura que los sujetos sean homogeacuteneos en variables tales como edad sexo inteligencia de manera que los resultados o efectos no obedezcan a diferencias individuales sino a las condiciones a las que fueron sometidos

La muestra de expertosEn ciertos estudios es necesaria la opinioacuten de sujetos expertos en un temaEstas muestras son frecuentes en estudios cualitativos y exploratorios que para generar hipoacutetesis maacutes precisas o la materia prima del disentildeo de cuestionarios Por ejemplo en un estudio sobre el perfil de la mujer periodista en Meacutexico (Barrera et al 1989) se recurrioacute a una muestra de TI = 227 mujeres periodistas pues se consideroacute que eran los sujetos idoacuteneos para hablar de contratacioacuten sueldos y desempentildeo de las mujeres periodistas Estas muestras son vaacutelidas y uacutetiles cuando los objetivos del estudio asiacute lo requieren

Los sujetos-tipoTambieacuten esta muestra se utiliza en estudios exploratorios y en investigaciones de tipo cualitativo donde el objetivo es la riqueza profundidad y calidad de la informacioacuten no la cantidad ni la estandarizacioacuten En estudios de perspectiva fenomenoloacutegica donde el objetivo es analizar los valores ritos y significados de un determinado grupo social el uso tanto de expertos como de sujetos-tipo es frecuente Por ejemplo pensamos en los trabajos de Howard Becker (El muacutesica de jazz Las muchachas de blanco) que se basan en grupos de tiacutepicos muacutesicos de jazz y tiacutepicos estudiantes de medicina para adentrarse en el anaacutelisis de los patrones de identificacioacuten y socializacioacuten de estas dos profesiones la de muacutesico y la de meacutedicoLos estudios motivacionales los cuales se hacen para el anaacutelisis de las actitudes y conductas del consumidor tambieacuten utilizan muestras de sujeto-tipoAquiacute se definen los grupos a los que va dirigido un determinado producto (por ejemplo joacutevenes clase socio econoacutemica A y B amas de casa clase B ejecutivos clase A-B) y se construyen grupos de 8 o 10 personas cuyos integrantes tengan las caracteriacutesticas sociales y demograacuteficas de dicho sub grupo

Con ese grupo se efectuacutea una sesioacuten un facilitador o moderador dirigiraacute una conversacioacuten donde los miembros del grupo expresen sus actitudes valores medios expectativas motivaciones hacia las caracteriacutesticas de determinado producto o servicio

La muestra por cuotasEste tipo de muestra se utiliza mucho en estudios de opinioacuten y de mercadotecnia Los encuestadores reciben instrucciones de administrar cuestionarios con sujetos en la calle y al hacerla van conformando o llenando cuotas de acuerdo con la proporcioacuten de ciertas variables demograacuteficas en la poblacioacuten Asiacute en un estudio sobre la actitud de la poblacioacuten hacia un candidato poliacutetico se dice a los encuestadores que vayan a determinada colonia y entrevisten a 150 sujetos Que el 25 sean hombres mayores de 30 antildeos 25 mujeres mayores de 30 antildeos 25 hombres menores de 25 antildeos y 25 mujeres menores de 25 antildeos Asiacute se construyen estas muestras que como vemos dependen en cierta medida del juicio del entrevistadorPara el caso de los infectados con el VIH se realizoacute una muestra no probabiliacutestica (porque se encuestoacute y se analizoacute a cuantas personas se pudieron localizar lo que representoacute un 18 de los receptores de sangre o derivados provenientes del laboratorio Transfusiones y Hematologiacutea SA que habiacutean sido atendidos en los servicios meacutedicos de Petroacuteleos Mexicanos y no se analizoacute a posibles portadores del VIH que hubieran adquirido el virus de otra manera) La muestra se obtuvo de tres fuentes baacutesicas a) presentacioacuten espontaacutenea por siacutentomas b) captado por exaacutemenes de rutina o contractuales y e) tras la aplicacioacuten de una encuesta seroloacutegica a 482 receptores de sangre y plasma provenientes del laboratorio de referencia Dicho de otra manera no se pudo detectar a todos los infectados con el VIH contenido en la sangre o derivados provenientes del laboratorio aludido pero con el 18 de eacutestos se pudo establecer que 17 de cada 100 casos habriacutean sido infectados con el VIH

RESUMENEn este capiacutetulo describimos coacutemo seleccionar una muestra Lo primero que se debe plantear es quieacutenes van a ser medidos lo que corresponde a definir la unidad de anaacutelisis Se procede despueacutes a delimitar claramente la poblacioacuten con base en los objetivos del estudio y en cuanto a caracteriacutesticas de contenido de lugar y en el tiempoLa muestra es un subgrupo de la poblacioacuten y puede ser probabiliacutestica o no probabiliacutesticaElegir queacute tipo de muestra se requiere depende de los objetivos del estudio y del esquema de investigacioacutenLas muestras probabiliacutesticas son esenciales en los disentildeos de investigacioacuten por encuestas donde se pretenden generalizar los resultados a una poblacioacuten La caracteriacutestica de este tipo de muestra es que todos los elementos de la poblacioacuten tienen al inicio la misma probabilidad de ser elegidos de esta manera los elementos muestrales tendraacuten valores muy aproximados a los valores de la poblacioacuten ya que las mediciones del subconjunto seraacuten estimaciones muy precisas del conjunto mayor Esta precisioacuten depende del error de muestreo llamado tambieacuten error estaacutendarPara una muestra probabiliacutestica necesitamos dos cosas determinar el tamantildeo de la muestra y seleccionar los elementos muestrales en forma aleatoriaEl tamantildeo de la muestra se calcula con base en la varianza de la poblacioacuten y la varianza de la muestra Esta uacuteltima expresada en teacuterminos de probabilidad de ocurrencia La varianza de la poblacioacuten se calcula con el cuadrado del error estaacutendar el cual determinamos Entre menor sea el error estaacutendar mayor seraacute el tamantildeo de la muestraLas muestras probabiliacutesticas pueden ser simples estratificadas y por racimosLa estratificacioacuten aumenta la precisioacuten de la muestra e implica el uso deliberado de sub-muestras para cada estrato o categoriacutea que sea relevante en la poblacioacuten Muestrear por racimos implica diferencias entre la unidad de anaacutelisis y la unidad muestral En este tipo de muestreo hay una seleccioacuten en dos etapas ambas con procedimientos probabiliacutesticos En la primera se seleccionan los racimos escuelas organizaciones salones de clase en la segunda y dentro de los racimos a los sujetos que van a ser medidos

Los elementos muestrales de una muestra probabiliacutestica siempre se eligen aleatoriamente para aseguramos de que cada elemento tenga la misma probabilidad de ser elegido Pueden usarse tres procedimientos de seleccioacuten1 Toacutembola 2 Tabla de nuacutemeros random y 3 Seleccioacuten sistemaacutetica Todo procedimiento de seleccioacuten depende de listados ya sea existentes o construidos ad hoc Listados pueden ser el directorio telefoacutenico listas de asociaciones listas de escuelas oficiales etceacutetera Cuando no existen listas de elementos de la poblacioacuten se recurren a otros marcos de referencia que contengan descripciones del material organizaciones o sujetos seleccionados como unidades de anaacutelisis Algunos de eacutestos pueden ser los archivos hemerotecas y los mapasLas muestras no-probabiliacutesticas pueden tambieacuten llamarse muestras dirigidas pues la eleccioacuten de sujetos u objetos de estudio depende del criterio del investigador Las muestras dirigidas pueden ser de varias clases 1 Muestra de sujetos voluntarios frecuentemente utilizados con disentildeos experimentales y situaciones de laboratorio 2 Muestra de expertos frecuentemente utilizados en estudios exploratorios 3 Muestra de sujetos tipo o estudios de casos utilizados en estudios cualitativos y motivacionales y 4 muestreo por cuotas frecuentes en estudios de opinioacuten y de mercadotecnia Las muestras dirigidas son vaacutelidas en cuanto a que un determinado disentildeo de investigacioacuten asiacute los requiere sin embargo los resultados son generalizables a la muestra en siacute o a muestras similares No son generalizables a una poblacioacutenEn el teorema de liacutemite central se sentildeala que una muestra de maacutes de cien casos seraacute una muestra con una distribucioacuten normal en sus caracteriacutesticas sin embargo la normalidad no debe conjuntarse con probabilidad Mientras lo primero es necesario para efectuar pruebas estadiacutesticas lo segundo es requisito indispensable para hacer inferencias correctas sobre una poblacioacuten

Page 6: CAPÍTULO 8 muestra y población

n= S2V2Si necesitamos una muestra de n = 647 comerciales podemos utilizar para la seleccioacuten al intervalo K dondeK = N = 1 548 = 239 = 3 (redondeando)n 647El intervalo 1K = 3 indica que cada tercer comercial 1K seraacute seleccionado hasta completar n = 647 239 se redondea para que sea un iacutentegro Veacutease Kish (1969) pp 115117La seleccioacuten sistemaacutetica de elementos muestrales 1K se puede utilizar al elegir los elementos de n para cada estrato yo para cada racimo La regla de probabilidad seguacuten la cual cada elemento de la poblacioacuten debe tener la misma probabilidad de ser elegido se cumple empezando la seleccioacuten de 1K al azarSiguiendo nuestro ejemplo no empezamos a elegir de los 1 548 comerciales grabados el 1 3 6 9 sino que procuramos que el empiezo sea determinado por el azar Asiacute en este caso podemos tirar unos dados y si en sus caras muestran 1 6 9 empezaremos en el comercial 169 y seguiremos 169 172 175 1K volver a empezar por los primeros si es necesario Este procedimiento de seleccioacuten es poco complicado y tiene varias ventajas cualquier tipo de estratos en una poblacioacuten X se veraacuten reflejados en la muestra Asimismo la seleccioacuten sistemaacutetica logra una muestra proporcionada pues por ejemplo tenemos que el procedimiento de seleccioacuten 1K nos daraacute una muestra con nombres que inician con las letras del abecedario en forma proporcional a la letra inicial de los nombres de la poblacioacuten

LOS LISTADOS Y OTROS MARCOS MUESTRALESLas muestras probabiliacutesticas requieren la determinacioacuten del tamantildeo de la muestra y de un proceso de seleccioacuten aleatoria que asegure que todos los elementos de la poblacioacuten tengan la misma probabilidad de ser elegidos Todo esto lo hemos visto pero nos falta discutir sobre algo esencial que procede a la seleccioacuten de una muestra el listado el marco muestral El listado se refiere a una lista existente o a una lista que es necesario confeccionar ad hoc con los elementos de la poblacioacuten y a partir de la cual se seleccionaraacuten los elementos muestrales El segundo teacutermino se refiere a un marco de referencia que nos permita identificar fiacutesicamente los elementos de la poblacioacuten la posibilidad de enumerarlos y por ende proceder a la seleccioacuten de los elementos muestrales Los listados con base en listas existentes sobre una poblacioacuten pueden ser variados el directorio telefoacutenico la lista de miembros de una asociacioacuten directorios especializados las listas oficiales de escuelas de la zona las listas de las canciones de eacutexito publicadas por una revista la lista de alumnos de una universidad etceacutetera En todo caso hay que tener en cuenta lo completo de una lista su exactitud veracidad su calidad y su nivel de cobertura en relacioacuten con el problema a investigar y la poblacioacuten que va a medirse ya que todos estos aspectos influyen en la seleccioacuten de la muestraPor ejemplo para algunas encuestas se considera que el directorio telefoacutenico es muy uacutetil Sin embargo hay que tomar en cuenta que muchos teleacutefonos no apareceraacuten porque son privados o que hay hogares que no tienen teleacutefono La lista de socios de una asociacioacuten como Canacintra (Caacutemara Nacional de la industria de la Transformacioacuten) puede servimos si el propoacutesito del estudio es por ejemplo conocer la opinioacuten de los asociados con respecto a una medida gubernamental Pero si el objetivo de la investigacioacuten es el anaacutelisis de opinioacuten del sector patronal del paiacutes el listado de una asociacioacuten no seraacute adecuado por varias razones como hay otras asociaciones patronales la Canacintra representa solamente el sector de la Industria de Transformacioacuten las asociaciones son voluntarias y no todo patroacuten o empresa pertenece a ellas Lo correcto en este caso seria construir una nueva lista con base en los listados existentes de las asociaciones patronales eliminando de dicha lista los casos duplicados suponiendo que una o maacutes empresas pudieran pertenecer a dos asociaciones al mismo tiempo como director a la Coparmex (Confederacioacuten Patronal de la Repuacuteblica Mexicana) y como empresa a la ANIQ (AsociacioacutenNacional de Ingenieros Quiacutemicos)Hay listas que proporcionan una gran ayuda al investigador Pensamos en directorios especializados como el lndustridata que enlista a las empresas mexicanas medianas y grandes

el directorio de la ciudad de Meacutexico por calles el directorio de medios que enlista casas productoras estaciones de radio y televisioacuten perioacutedicos y revistas Este tipo de directorios realizados por profesionales son uacutetiles al investigador pues representan una compilacioacuten (sujetos empresas instituciones) resultado de horas de trabajo e inversioacuten de recursos Recomendamos pues utilizarIos cuando sea pertinente tomando en cuenta las consideraciones que estos directorios hacen en su introduccioacuten y que revelan a queacute antildeo pertenecen los datos coacutemo los obtuvieron (exhaustivamente por cuestionarios por voluntarios) y muy importante quieacutenes y por queacute quedan excluidos del directorioEn Meacutexico se cuenta tambieacuten con directorios de anunciantes en publicidad y mercadotecnia como el publicado por Mercameacutetrica Ediciones S A Frecuentemente es necesario construir listas ad hoc a partir de las cuales se seleccionaraacuten los elementos que constituiraacuten las unidades de anaacutelisis en una determinada investigacioacuten Por ejemplo en la investigacioacuten de La televisioacuten y el nintildeo (Fernaacutendez Collado et al 1986) se hizo una muestra probabiliacutestica estratificada por racimo donde en una primera etapa se relacionaron escuelas para en uacuteltima instancia llegar a los nintildeos Pues bien para tal efecto se consiguioacute una lista de las escuelas primarias del Distrito Federal Cada escuela teniacutea un coacutedigo identificable por medio del cual se eliminaron las escuelas para nintildeos atiacutepicos Este listado conteniacutea ademaacutes informacioacuten sobre cada escuela sobre su ubicacioacuten (calle y colonia) sobre su propiedad (puacuteblica o privada)Con ayuda de otro estudio que catalogaba en diferentes estratos socioeconoacutemicos a las colonias del Distrito Federal con base en el ingreso promedio de la zona se hicieron 8 listas1 escuela puacuteblica clase A2 escuelas privadas clase A3 escuelas puacuteblicas clase B4 escuelas privadas clase B5 escuelas puacuteblicas clase C6 escuelas privadas clase C7 escuelas puacuteblicas clase D8 escuelas privadas clase DCada lista representaba un estrato de la poblacioacuten y de cada una de ellas se seleccionoacute una muestra de escuelas No siempre existen listas que permitan identificar nuestra poblacioacuten Seraacute necesario recurrir a otros marcos de referencia que contengan descripciones del material organizaciones o sujetos que seraacuten seleccionados como unidades de anaacutelisis Algunos de estos marcos de referencia son los archivos los mapas voluacutemenes de perioacutedicos empastados en una biblioteca o las horas de transmisioacuten de varios canales de televisioacuten De cada una de estas instancias daremos ejemplos con maacutes detalles

ArchivosUn jefe de reclutamiento y seleccioacuten de una institucioacuten quiere precisar si algunos datos que se dan en una solicitud de trabajo estaacuten correlacionados con el ausentismo del empleado Es decir si a partir de datos como edad sexo estado civil y duracioacuten en otro trabajo puede predecirse que alguien tenderaacute a ausentarse Para establecer correlaciones se consideraraacuten como poblacioacuten a todos los sujetos contratados durante 10 antildeos Se relacionan sus datos en la solicitud de empleo con los registros de faltas Como no hay una lista elaborada de estos sujetos el investigador decide acudir a los archivos de las solicitudes de empleo Estos archivos constituyen su marco muestral a partir del cual obtendraacute la muestra Calcula el tamantildeo de la poblacioacuten obtiene el tamantildeo de la muestra y selecciona sistemaacuteticamente cada elemento 1K cada solicitud que seraacute analizada Aqui el problema que surge es que en el archivo hay solicitudes de gente que no fue contratada y por tanto no pueden ser consideradas en el estudioEn este caso y en otros donde no todos los elementos del marco de referencia o de una lista (por ejemplo nombres en el directorio que no corresponden a una persona fiacutesica) los especialistas en muestreo (Kish 1965 Sutman 1976) no aconsejan el reemplazo con el siguiente elemento sino simplemente no tomar en cuenta ese elemento es decir como si no existiera continuaacutendose con el intervalo de seleccioacuten sistemaacutetica

MapasLos mapas son muy uacutetiles como marco de referencia en muestras de racimoPor ejemplo un investigador quiere saber queacute motiva a los compradores en una determinada tienda de autoservicio A partir de una lista de tiendas de cada cadena competidora marca sobre un mapa de la ciudad todas las tiendas de autoservicios las cuales constituyen una poblacioacuten de racimos pues en cada tienda seleccionada entrevistaraacute a un nuacutemero n de clientes El mapa le permite ver la poblacioacuten (tiendas autoservicio) y su situacioacuten geograacutefica de manera que eligioacute zonas donde coexistan tiendas de la competencia para asegurarse de que el consumidor de la zona tenga todas las posibles alternativas

VoluacutemenesEn este ejemplo supongamos que un estudioso del periodismo quiere hacer un anaacutelisis de contenido de los editoriales de los tres principales diarios de la ciudad durante el porfiriato El investigador va a la Hemeroteca Nacional y encuentra que los diarios son encuadernados por trimestre y antildeo lo cual le proporciona un marco de referencia ideal a partir del cual seleccionaraacuten voluacutemenes para su anaacutelisis Supongamos sin embargo que encuentra que el volumen X que contiene el perioacutedico El Hijo del Ahuizote (enero-marzo 1899) falta en la Hemeroteca iquestQueacute hace Pues redefine la poblacioacuten manifestando expliacutecitamente que de N voluacutemenes tiene 99 de los elementos y a partir de este nuevo nuacutemero de N calculoacute su muestra n y la seleccionoacute

Horas de transmisioacutenEn un estudio de Portilla y Soloacuterzano (1982) los investigadores queriacutean hacer un anaacutelisis de anuncios en la televisioacuten mexicana Las emisoras no proporcionan una lista de anuncios ni sus horas de transmisioacuten Por otra parte saldriacutea muy caro grabar todos los anuncios a todas horas y seriacutea imposible estar frente al televisor para hacerloAnte la imposibilidad de tener un listado de comerciales se hicieron listados que identificaron cada media hora de transmisioacuten televisiva en cada canal 2 4 5 9 y 13 de las 7 a las 24 horas durante siete diacuteas de una semana de octubre de 1982 La poblacioacuten estaba constituida del nuacutemero total de medias horas de transmisioacuten televisiva N = 1 190 horas Esta poblacioacuten se dividioacute en estratos mantildeana mediodiacutea tarde y noche y se procedioacute a calcular el tamantildeo de la muestra tomando en consideracioacuten que por cada media hora de transmisioacuten hay 6 minutos de comerciales (De Noriega 1979)Se calculoacute el nuacutemero de medias horas que se seleccionariacutean para obtener una muestra n Una vez obtenido el tamantildeo de la muestra se seleccionaron aleatoriamente n medias horas y por uacuteltimo se grabaron y analizaron uacutenicamente aquellos comerciales contenidos en las medias horas seleccionadas al azar y que representaron diferentes canales y segmentos del diacutea El punto en este ejemplo es la construccioacuten concreta de un marco muestral que permitiera el anaacutelisis de una muestra probabiliacutestica de comerciales

TAMANtildeO OacutePTIMO DE UNA MUESTRA Y EL TEOREMA DEL LIacuteMITE CENTRALLas muestras probabiliacutesticas requieren dos procedimientos baacutesicos 1 La determinacioacuten del tamantildeo de la muestra y 2 la seleccioacuten aleatoria de los elementos muestrales El primer procedimiento lo hemos descrito en su modalidad maacutes simple en este capiacutetulo Precisar adecuadamente el tamantildeo de la muestra puede tornarse muy complejo dependiendo del problema de investigacioacuten y la poblacioacuten a estudiar Para el alumno seraacute muy uacutetil comparar que tamantildeo de muestra han utilizado otros investigadores en ciencias sociales

iquestCOacuteMO SON LAS MUESTRAS NO PROBABILIacuteSTICASLas muestras no probabiliacutesticas tambieacuten llamadas muestras dirigidas suponen un procedimiento de seleccioacuten informal y un poco arbitrario Auacuten asiacute se utilizan en muchas investigaciones y a partir de ellas se hacen inferencias sobre la poblacioacuten Es como si juzgaacutesemos el sabor de un cargamento de limones solamente probando alguno como si para muestra bastase un botoacuten La muestra dirigida selecciona sujetos tiacutepicos con la vaga esperanza de que seraacuten casos representativos de una poblacioacuten determinada

La verdad es que las muestras dirigidas tienen muchas desventajas La primera es que al no ser probabiliacutesticas no podemos calcular con precisioacuten el error estaacutendar es decir no podemos calcular con queacute nivel de confianza hacemos una estimacioacuten Esto es un grave inconveniente si consideramos que la estadiacutestica inferencial se basa en teoriacutea de la probabilidad por lo que pruebas estadiacutesticas en muestras no probabiliacutesticas tienen un valor limitado y relativo ala muestra en siacute mas no a la poblacioacuten Es decir los datos no pueden generalizarse a una poblacioacuten que no se consideroacute ni en sus paraacutemetros ni en sus elementos para obtener la muestra Recordemos que en las muestras de este tipo la eleccioacuten de los sujetos no depende de que todos tengan la misma probabilidad de ser elegidos sino de la decisioacuten de un investigador o grupo de encuestadoresLa ventaja de una muestra no probabiliacutestica es su utilidad para determinado disentildeo de estudio que requiere no tanto una representatividad de elementos de una poblacioacuten sino una cuidadosa y controlada eleccioacuten de sujetos con ciertas caracteriacutesticas especificadas previamente en el planteamiento del problemaHay variacuteas clases de muestras dirigidas y se definiraacuten a continuacioacuten

La muestra de sujetos voluntariosLas muestras de sujetos voluntarios son frecuentes en ciencias sociales y ciencias de la conducta Se trata de muestras fortuitas utilizadas tambieacuten en la medicina y la arqueologiacutea donde el investigador elabora conclusiones sobre especiacutemenes que llegan a sus manos de manera casual Pensemos por ejemplo en los sujetos que voluntariamente acceden a participar en un estudio que monitorea los efectos de un medicamento o en el investigador que anuncia en una clase que estaacute haciendo un estudio sobre motivacioacuten en el universitario e invita a aquellos que acepten someterse a una prueba proyectiva TAT En estos casos la eleccioacuten de los individuos que seraacuten sujetos a anaacutelisis depende de circunstancias fortuitas Este tipo de muestra se usa en estudios de laboratorio donde se procura que los sujetos sean homogeacuteneos en variables tales como edad sexo inteligencia de manera que los resultados o efectos no obedezcan a diferencias individuales sino a las condiciones a las que fueron sometidos

La muestra de expertosEn ciertos estudios es necesaria la opinioacuten de sujetos expertos en un temaEstas muestras son frecuentes en estudios cualitativos y exploratorios que para generar hipoacutetesis maacutes precisas o la materia prima del disentildeo de cuestionarios Por ejemplo en un estudio sobre el perfil de la mujer periodista en Meacutexico (Barrera et al 1989) se recurrioacute a una muestra de TI = 227 mujeres periodistas pues se consideroacute que eran los sujetos idoacuteneos para hablar de contratacioacuten sueldos y desempentildeo de las mujeres periodistas Estas muestras son vaacutelidas y uacutetiles cuando los objetivos del estudio asiacute lo requieren

Los sujetos-tipoTambieacuten esta muestra se utiliza en estudios exploratorios y en investigaciones de tipo cualitativo donde el objetivo es la riqueza profundidad y calidad de la informacioacuten no la cantidad ni la estandarizacioacuten En estudios de perspectiva fenomenoloacutegica donde el objetivo es analizar los valores ritos y significados de un determinado grupo social el uso tanto de expertos como de sujetos-tipo es frecuente Por ejemplo pensamos en los trabajos de Howard Becker (El muacutesica de jazz Las muchachas de blanco) que se basan en grupos de tiacutepicos muacutesicos de jazz y tiacutepicos estudiantes de medicina para adentrarse en el anaacutelisis de los patrones de identificacioacuten y socializacioacuten de estas dos profesiones la de muacutesico y la de meacutedicoLos estudios motivacionales los cuales se hacen para el anaacutelisis de las actitudes y conductas del consumidor tambieacuten utilizan muestras de sujeto-tipoAquiacute se definen los grupos a los que va dirigido un determinado producto (por ejemplo joacutevenes clase socio econoacutemica A y B amas de casa clase B ejecutivos clase A-B) y se construyen grupos de 8 o 10 personas cuyos integrantes tengan las caracteriacutesticas sociales y demograacuteficas de dicho sub grupo

Con ese grupo se efectuacutea una sesioacuten un facilitador o moderador dirigiraacute una conversacioacuten donde los miembros del grupo expresen sus actitudes valores medios expectativas motivaciones hacia las caracteriacutesticas de determinado producto o servicio

La muestra por cuotasEste tipo de muestra se utiliza mucho en estudios de opinioacuten y de mercadotecnia Los encuestadores reciben instrucciones de administrar cuestionarios con sujetos en la calle y al hacerla van conformando o llenando cuotas de acuerdo con la proporcioacuten de ciertas variables demograacuteficas en la poblacioacuten Asiacute en un estudio sobre la actitud de la poblacioacuten hacia un candidato poliacutetico se dice a los encuestadores que vayan a determinada colonia y entrevisten a 150 sujetos Que el 25 sean hombres mayores de 30 antildeos 25 mujeres mayores de 30 antildeos 25 hombres menores de 25 antildeos y 25 mujeres menores de 25 antildeos Asiacute se construyen estas muestras que como vemos dependen en cierta medida del juicio del entrevistadorPara el caso de los infectados con el VIH se realizoacute una muestra no probabiliacutestica (porque se encuestoacute y se analizoacute a cuantas personas se pudieron localizar lo que representoacute un 18 de los receptores de sangre o derivados provenientes del laboratorio Transfusiones y Hematologiacutea SA que habiacutean sido atendidos en los servicios meacutedicos de Petroacuteleos Mexicanos y no se analizoacute a posibles portadores del VIH que hubieran adquirido el virus de otra manera) La muestra se obtuvo de tres fuentes baacutesicas a) presentacioacuten espontaacutenea por siacutentomas b) captado por exaacutemenes de rutina o contractuales y e) tras la aplicacioacuten de una encuesta seroloacutegica a 482 receptores de sangre y plasma provenientes del laboratorio de referencia Dicho de otra manera no se pudo detectar a todos los infectados con el VIH contenido en la sangre o derivados provenientes del laboratorio aludido pero con el 18 de eacutestos se pudo establecer que 17 de cada 100 casos habriacutean sido infectados con el VIH

RESUMENEn este capiacutetulo describimos coacutemo seleccionar una muestra Lo primero que se debe plantear es quieacutenes van a ser medidos lo que corresponde a definir la unidad de anaacutelisis Se procede despueacutes a delimitar claramente la poblacioacuten con base en los objetivos del estudio y en cuanto a caracteriacutesticas de contenido de lugar y en el tiempoLa muestra es un subgrupo de la poblacioacuten y puede ser probabiliacutestica o no probabiliacutesticaElegir queacute tipo de muestra se requiere depende de los objetivos del estudio y del esquema de investigacioacutenLas muestras probabiliacutesticas son esenciales en los disentildeos de investigacioacuten por encuestas donde se pretenden generalizar los resultados a una poblacioacuten La caracteriacutestica de este tipo de muestra es que todos los elementos de la poblacioacuten tienen al inicio la misma probabilidad de ser elegidos de esta manera los elementos muestrales tendraacuten valores muy aproximados a los valores de la poblacioacuten ya que las mediciones del subconjunto seraacuten estimaciones muy precisas del conjunto mayor Esta precisioacuten depende del error de muestreo llamado tambieacuten error estaacutendarPara una muestra probabiliacutestica necesitamos dos cosas determinar el tamantildeo de la muestra y seleccionar los elementos muestrales en forma aleatoriaEl tamantildeo de la muestra se calcula con base en la varianza de la poblacioacuten y la varianza de la muestra Esta uacuteltima expresada en teacuterminos de probabilidad de ocurrencia La varianza de la poblacioacuten se calcula con el cuadrado del error estaacutendar el cual determinamos Entre menor sea el error estaacutendar mayor seraacute el tamantildeo de la muestraLas muestras probabiliacutesticas pueden ser simples estratificadas y por racimosLa estratificacioacuten aumenta la precisioacuten de la muestra e implica el uso deliberado de sub-muestras para cada estrato o categoriacutea que sea relevante en la poblacioacuten Muestrear por racimos implica diferencias entre la unidad de anaacutelisis y la unidad muestral En este tipo de muestreo hay una seleccioacuten en dos etapas ambas con procedimientos probabiliacutesticos En la primera se seleccionan los racimos escuelas organizaciones salones de clase en la segunda y dentro de los racimos a los sujetos que van a ser medidos

Los elementos muestrales de una muestra probabiliacutestica siempre se eligen aleatoriamente para aseguramos de que cada elemento tenga la misma probabilidad de ser elegido Pueden usarse tres procedimientos de seleccioacuten1 Toacutembola 2 Tabla de nuacutemeros random y 3 Seleccioacuten sistemaacutetica Todo procedimiento de seleccioacuten depende de listados ya sea existentes o construidos ad hoc Listados pueden ser el directorio telefoacutenico listas de asociaciones listas de escuelas oficiales etceacutetera Cuando no existen listas de elementos de la poblacioacuten se recurren a otros marcos de referencia que contengan descripciones del material organizaciones o sujetos seleccionados como unidades de anaacutelisis Algunos de eacutestos pueden ser los archivos hemerotecas y los mapasLas muestras no-probabiliacutesticas pueden tambieacuten llamarse muestras dirigidas pues la eleccioacuten de sujetos u objetos de estudio depende del criterio del investigador Las muestras dirigidas pueden ser de varias clases 1 Muestra de sujetos voluntarios frecuentemente utilizados con disentildeos experimentales y situaciones de laboratorio 2 Muestra de expertos frecuentemente utilizados en estudios exploratorios 3 Muestra de sujetos tipo o estudios de casos utilizados en estudios cualitativos y motivacionales y 4 muestreo por cuotas frecuentes en estudios de opinioacuten y de mercadotecnia Las muestras dirigidas son vaacutelidas en cuanto a que un determinado disentildeo de investigacioacuten asiacute los requiere sin embargo los resultados son generalizables a la muestra en siacute o a muestras similares No son generalizables a una poblacioacutenEn el teorema de liacutemite central se sentildeala que una muestra de maacutes de cien casos seraacute una muestra con una distribucioacuten normal en sus caracteriacutesticas sin embargo la normalidad no debe conjuntarse con probabilidad Mientras lo primero es necesario para efectuar pruebas estadiacutesticas lo segundo es requisito indispensable para hacer inferencias correctas sobre una poblacioacuten

Page 7: CAPÍTULO 8 muestra y población

el directorio de la ciudad de Meacutexico por calles el directorio de medios que enlista casas productoras estaciones de radio y televisioacuten perioacutedicos y revistas Este tipo de directorios realizados por profesionales son uacutetiles al investigador pues representan una compilacioacuten (sujetos empresas instituciones) resultado de horas de trabajo e inversioacuten de recursos Recomendamos pues utilizarIos cuando sea pertinente tomando en cuenta las consideraciones que estos directorios hacen en su introduccioacuten y que revelan a queacute antildeo pertenecen los datos coacutemo los obtuvieron (exhaustivamente por cuestionarios por voluntarios) y muy importante quieacutenes y por queacute quedan excluidos del directorioEn Meacutexico se cuenta tambieacuten con directorios de anunciantes en publicidad y mercadotecnia como el publicado por Mercameacutetrica Ediciones S A Frecuentemente es necesario construir listas ad hoc a partir de las cuales se seleccionaraacuten los elementos que constituiraacuten las unidades de anaacutelisis en una determinada investigacioacuten Por ejemplo en la investigacioacuten de La televisioacuten y el nintildeo (Fernaacutendez Collado et al 1986) se hizo una muestra probabiliacutestica estratificada por racimo donde en una primera etapa se relacionaron escuelas para en uacuteltima instancia llegar a los nintildeos Pues bien para tal efecto se consiguioacute una lista de las escuelas primarias del Distrito Federal Cada escuela teniacutea un coacutedigo identificable por medio del cual se eliminaron las escuelas para nintildeos atiacutepicos Este listado conteniacutea ademaacutes informacioacuten sobre cada escuela sobre su ubicacioacuten (calle y colonia) sobre su propiedad (puacuteblica o privada)Con ayuda de otro estudio que catalogaba en diferentes estratos socioeconoacutemicos a las colonias del Distrito Federal con base en el ingreso promedio de la zona se hicieron 8 listas1 escuela puacuteblica clase A2 escuelas privadas clase A3 escuelas puacuteblicas clase B4 escuelas privadas clase B5 escuelas puacuteblicas clase C6 escuelas privadas clase C7 escuelas puacuteblicas clase D8 escuelas privadas clase DCada lista representaba un estrato de la poblacioacuten y de cada una de ellas se seleccionoacute una muestra de escuelas No siempre existen listas que permitan identificar nuestra poblacioacuten Seraacute necesario recurrir a otros marcos de referencia que contengan descripciones del material organizaciones o sujetos que seraacuten seleccionados como unidades de anaacutelisis Algunos de estos marcos de referencia son los archivos los mapas voluacutemenes de perioacutedicos empastados en una biblioteca o las horas de transmisioacuten de varios canales de televisioacuten De cada una de estas instancias daremos ejemplos con maacutes detalles

ArchivosUn jefe de reclutamiento y seleccioacuten de una institucioacuten quiere precisar si algunos datos que se dan en una solicitud de trabajo estaacuten correlacionados con el ausentismo del empleado Es decir si a partir de datos como edad sexo estado civil y duracioacuten en otro trabajo puede predecirse que alguien tenderaacute a ausentarse Para establecer correlaciones se consideraraacuten como poblacioacuten a todos los sujetos contratados durante 10 antildeos Se relacionan sus datos en la solicitud de empleo con los registros de faltas Como no hay una lista elaborada de estos sujetos el investigador decide acudir a los archivos de las solicitudes de empleo Estos archivos constituyen su marco muestral a partir del cual obtendraacute la muestra Calcula el tamantildeo de la poblacioacuten obtiene el tamantildeo de la muestra y selecciona sistemaacuteticamente cada elemento 1K cada solicitud que seraacute analizada Aqui el problema que surge es que en el archivo hay solicitudes de gente que no fue contratada y por tanto no pueden ser consideradas en el estudioEn este caso y en otros donde no todos los elementos del marco de referencia o de una lista (por ejemplo nombres en el directorio que no corresponden a una persona fiacutesica) los especialistas en muestreo (Kish 1965 Sutman 1976) no aconsejan el reemplazo con el siguiente elemento sino simplemente no tomar en cuenta ese elemento es decir como si no existiera continuaacutendose con el intervalo de seleccioacuten sistemaacutetica

MapasLos mapas son muy uacutetiles como marco de referencia en muestras de racimoPor ejemplo un investigador quiere saber queacute motiva a los compradores en una determinada tienda de autoservicio A partir de una lista de tiendas de cada cadena competidora marca sobre un mapa de la ciudad todas las tiendas de autoservicios las cuales constituyen una poblacioacuten de racimos pues en cada tienda seleccionada entrevistaraacute a un nuacutemero n de clientes El mapa le permite ver la poblacioacuten (tiendas autoservicio) y su situacioacuten geograacutefica de manera que eligioacute zonas donde coexistan tiendas de la competencia para asegurarse de que el consumidor de la zona tenga todas las posibles alternativas

VoluacutemenesEn este ejemplo supongamos que un estudioso del periodismo quiere hacer un anaacutelisis de contenido de los editoriales de los tres principales diarios de la ciudad durante el porfiriato El investigador va a la Hemeroteca Nacional y encuentra que los diarios son encuadernados por trimestre y antildeo lo cual le proporciona un marco de referencia ideal a partir del cual seleccionaraacuten voluacutemenes para su anaacutelisis Supongamos sin embargo que encuentra que el volumen X que contiene el perioacutedico El Hijo del Ahuizote (enero-marzo 1899) falta en la Hemeroteca iquestQueacute hace Pues redefine la poblacioacuten manifestando expliacutecitamente que de N voluacutemenes tiene 99 de los elementos y a partir de este nuevo nuacutemero de N calculoacute su muestra n y la seleccionoacute

Horas de transmisioacutenEn un estudio de Portilla y Soloacuterzano (1982) los investigadores queriacutean hacer un anaacutelisis de anuncios en la televisioacuten mexicana Las emisoras no proporcionan una lista de anuncios ni sus horas de transmisioacuten Por otra parte saldriacutea muy caro grabar todos los anuncios a todas horas y seriacutea imposible estar frente al televisor para hacerloAnte la imposibilidad de tener un listado de comerciales se hicieron listados que identificaron cada media hora de transmisioacuten televisiva en cada canal 2 4 5 9 y 13 de las 7 a las 24 horas durante siete diacuteas de una semana de octubre de 1982 La poblacioacuten estaba constituida del nuacutemero total de medias horas de transmisioacuten televisiva N = 1 190 horas Esta poblacioacuten se dividioacute en estratos mantildeana mediodiacutea tarde y noche y se procedioacute a calcular el tamantildeo de la muestra tomando en consideracioacuten que por cada media hora de transmisioacuten hay 6 minutos de comerciales (De Noriega 1979)Se calculoacute el nuacutemero de medias horas que se seleccionariacutean para obtener una muestra n Una vez obtenido el tamantildeo de la muestra se seleccionaron aleatoriamente n medias horas y por uacuteltimo se grabaron y analizaron uacutenicamente aquellos comerciales contenidos en las medias horas seleccionadas al azar y que representaron diferentes canales y segmentos del diacutea El punto en este ejemplo es la construccioacuten concreta de un marco muestral que permitiera el anaacutelisis de una muestra probabiliacutestica de comerciales

TAMANtildeO OacutePTIMO DE UNA MUESTRA Y EL TEOREMA DEL LIacuteMITE CENTRALLas muestras probabiliacutesticas requieren dos procedimientos baacutesicos 1 La determinacioacuten del tamantildeo de la muestra y 2 la seleccioacuten aleatoria de los elementos muestrales El primer procedimiento lo hemos descrito en su modalidad maacutes simple en este capiacutetulo Precisar adecuadamente el tamantildeo de la muestra puede tornarse muy complejo dependiendo del problema de investigacioacuten y la poblacioacuten a estudiar Para el alumno seraacute muy uacutetil comparar que tamantildeo de muestra han utilizado otros investigadores en ciencias sociales

iquestCOacuteMO SON LAS MUESTRAS NO PROBABILIacuteSTICASLas muestras no probabiliacutesticas tambieacuten llamadas muestras dirigidas suponen un procedimiento de seleccioacuten informal y un poco arbitrario Auacuten asiacute se utilizan en muchas investigaciones y a partir de ellas se hacen inferencias sobre la poblacioacuten Es como si juzgaacutesemos el sabor de un cargamento de limones solamente probando alguno como si para muestra bastase un botoacuten La muestra dirigida selecciona sujetos tiacutepicos con la vaga esperanza de que seraacuten casos representativos de una poblacioacuten determinada

La verdad es que las muestras dirigidas tienen muchas desventajas La primera es que al no ser probabiliacutesticas no podemos calcular con precisioacuten el error estaacutendar es decir no podemos calcular con queacute nivel de confianza hacemos una estimacioacuten Esto es un grave inconveniente si consideramos que la estadiacutestica inferencial se basa en teoriacutea de la probabilidad por lo que pruebas estadiacutesticas en muestras no probabiliacutesticas tienen un valor limitado y relativo ala muestra en siacute mas no a la poblacioacuten Es decir los datos no pueden generalizarse a una poblacioacuten que no se consideroacute ni en sus paraacutemetros ni en sus elementos para obtener la muestra Recordemos que en las muestras de este tipo la eleccioacuten de los sujetos no depende de que todos tengan la misma probabilidad de ser elegidos sino de la decisioacuten de un investigador o grupo de encuestadoresLa ventaja de una muestra no probabiliacutestica es su utilidad para determinado disentildeo de estudio que requiere no tanto una representatividad de elementos de una poblacioacuten sino una cuidadosa y controlada eleccioacuten de sujetos con ciertas caracteriacutesticas especificadas previamente en el planteamiento del problemaHay variacuteas clases de muestras dirigidas y se definiraacuten a continuacioacuten

La muestra de sujetos voluntariosLas muestras de sujetos voluntarios son frecuentes en ciencias sociales y ciencias de la conducta Se trata de muestras fortuitas utilizadas tambieacuten en la medicina y la arqueologiacutea donde el investigador elabora conclusiones sobre especiacutemenes que llegan a sus manos de manera casual Pensemos por ejemplo en los sujetos que voluntariamente acceden a participar en un estudio que monitorea los efectos de un medicamento o en el investigador que anuncia en una clase que estaacute haciendo un estudio sobre motivacioacuten en el universitario e invita a aquellos que acepten someterse a una prueba proyectiva TAT En estos casos la eleccioacuten de los individuos que seraacuten sujetos a anaacutelisis depende de circunstancias fortuitas Este tipo de muestra se usa en estudios de laboratorio donde se procura que los sujetos sean homogeacuteneos en variables tales como edad sexo inteligencia de manera que los resultados o efectos no obedezcan a diferencias individuales sino a las condiciones a las que fueron sometidos

La muestra de expertosEn ciertos estudios es necesaria la opinioacuten de sujetos expertos en un temaEstas muestras son frecuentes en estudios cualitativos y exploratorios que para generar hipoacutetesis maacutes precisas o la materia prima del disentildeo de cuestionarios Por ejemplo en un estudio sobre el perfil de la mujer periodista en Meacutexico (Barrera et al 1989) se recurrioacute a una muestra de TI = 227 mujeres periodistas pues se consideroacute que eran los sujetos idoacuteneos para hablar de contratacioacuten sueldos y desempentildeo de las mujeres periodistas Estas muestras son vaacutelidas y uacutetiles cuando los objetivos del estudio asiacute lo requieren

Los sujetos-tipoTambieacuten esta muestra se utiliza en estudios exploratorios y en investigaciones de tipo cualitativo donde el objetivo es la riqueza profundidad y calidad de la informacioacuten no la cantidad ni la estandarizacioacuten En estudios de perspectiva fenomenoloacutegica donde el objetivo es analizar los valores ritos y significados de un determinado grupo social el uso tanto de expertos como de sujetos-tipo es frecuente Por ejemplo pensamos en los trabajos de Howard Becker (El muacutesica de jazz Las muchachas de blanco) que se basan en grupos de tiacutepicos muacutesicos de jazz y tiacutepicos estudiantes de medicina para adentrarse en el anaacutelisis de los patrones de identificacioacuten y socializacioacuten de estas dos profesiones la de muacutesico y la de meacutedicoLos estudios motivacionales los cuales se hacen para el anaacutelisis de las actitudes y conductas del consumidor tambieacuten utilizan muestras de sujeto-tipoAquiacute se definen los grupos a los que va dirigido un determinado producto (por ejemplo joacutevenes clase socio econoacutemica A y B amas de casa clase B ejecutivos clase A-B) y se construyen grupos de 8 o 10 personas cuyos integrantes tengan las caracteriacutesticas sociales y demograacuteficas de dicho sub grupo

Con ese grupo se efectuacutea una sesioacuten un facilitador o moderador dirigiraacute una conversacioacuten donde los miembros del grupo expresen sus actitudes valores medios expectativas motivaciones hacia las caracteriacutesticas de determinado producto o servicio

La muestra por cuotasEste tipo de muestra se utiliza mucho en estudios de opinioacuten y de mercadotecnia Los encuestadores reciben instrucciones de administrar cuestionarios con sujetos en la calle y al hacerla van conformando o llenando cuotas de acuerdo con la proporcioacuten de ciertas variables demograacuteficas en la poblacioacuten Asiacute en un estudio sobre la actitud de la poblacioacuten hacia un candidato poliacutetico se dice a los encuestadores que vayan a determinada colonia y entrevisten a 150 sujetos Que el 25 sean hombres mayores de 30 antildeos 25 mujeres mayores de 30 antildeos 25 hombres menores de 25 antildeos y 25 mujeres menores de 25 antildeos Asiacute se construyen estas muestras que como vemos dependen en cierta medida del juicio del entrevistadorPara el caso de los infectados con el VIH se realizoacute una muestra no probabiliacutestica (porque se encuestoacute y se analizoacute a cuantas personas se pudieron localizar lo que representoacute un 18 de los receptores de sangre o derivados provenientes del laboratorio Transfusiones y Hematologiacutea SA que habiacutean sido atendidos en los servicios meacutedicos de Petroacuteleos Mexicanos y no se analizoacute a posibles portadores del VIH que hubieran adquirido el virus de otra manera) La muestra se obtuvo de tres fuentes baacutesicas a) presentacioacuten espontaacutenea por siacutentomas b) captado por exaacutemenes de rutina o contractuales y e) tras la aplicacioacuten de una encuesta seroloacutegica a 482 receptores de sangre y plasma provenientes del laboratorio de referencia Dicho de otra manera no se pudo detectar a todos los infectados con el VIH contenido en la sangre o derivados provenientes del laboratorio aludido pero con el 18 de eacutestos se pudo establecer que 17 de cada 100 casos habriacutean sido infectados con el VIH

RESUMENEn este capiacutetulo describimos coacutemo seleccionar una muestra Lo primero que se debe plantear es quieacutenes van a ser medidos lo que corresponde a definir la unidad de anaacutelisis Se procede despueacutes a delimitar claramente la poblacioacuten con base en los objetivos del estudio y en cuanto a caracteriacutesticas de contenido de lugar y en el tiempoLa muestra es un subgrupo de la poblacioacuten y puede ser probabiliacutestica o no probabiliacutesticaElegir queacute tipo de muestra se requiere depende de los objetivos del estudio y del esquema de investigacioacutenLas muestras probabiliacutesticas son esenciales en los disentildeos de investigacioacuten por encuestas donde se pretenden generalizar los resultados a una poblacioacuten La caracteriacutestica de este tipo de muestra es que todos los elementos de la poblacioacuten tienen al inicio la misma probabilidad de ser elegidos de esta manera los elementos muestrales tendraacuten valores muy aproximados a los valores de la poblacioacuten ya que las mediciones del subconjunto seraacuten estimaciones muy precisas del conjunto mayor Esta precisioacuten depende del error de muestreo llamado tambieacuten error estaacutendarPara una muestra probabiliacutestica necesitamos dos cosas determinar el tamantildeo de la muestra y seleccionar los elementos muestrales en forma aleatoriaEl tamantildeo de la muestra se calcula con base en la varianza de la poblacioacuten y la varianza de la muestra Esta uacuteltima expresada en teacuterminos de probabilidad de ocurrencia La varianza de la poblacioacuten se calcula con el cuadrado del error estaacutendar el cual determinamos Entre menor sea el error estaacutendar mayor seraacute el tamantildeo de la muestraLas muestras probabiliacutesticas pueden ser simples estratificadas y por racimosLa estratificacioacuten aumenta la precisioacuten de la muestra e implica el uso deliberado de sub-muestras para cada estrato o categoriacutea que sea relevante en la poblacioacuten Muestrear por racimos implica diferencias entre la unidad de anaacutelisis y la unidad muestral En este tipo de muestreo hay una seleccioacuten en dos etapas ambas con procedimientos probabiliacutesticos En la primera se seleccionan los racimos escuelas organizaciones salones de clase en la segunda y dentro de los racimos a los sujetos que van a ser medidos

Los elementos muestrales de una muestra probabiliacutestica siempre se eligen aleatoriamente para aseguramos de que cada elemento tenga la misma probabilidad de ser elegido Pueden usarse tres procedimientos de seleccioacuten1 Toacutembola 2 Tabla de nuacutemeros random y 3 Seleccioacuten sistemaacutetica Todo procedimiento de seleccioacuten depende de listados ya sea existentes o construidos ad hoc Listados pueden ser el directorio telefoacutenico listas de asociaciones listas de escuelas oficiales etceacutetera Cuando no existen listas de elementos de la poblacioacuten se recurren a otros marcos de referencia que contengan descripciones del material organizaciones o sujetos seleccionados como unidades de anaacutelisis Algunos de eacutestos pueden ser los archivos hemerotecas y los mapasLas muestras no-probabiliacutesticas pueden tambieacuten llamarse muestras dirigidas pues la eleccioacuten de sujetos u objetos de estudio depende del criterio del investigador Las muestras dirigidas pueden ser de varias clases 1 Muestra de sujetos voluntarios frecuentemente utilizados con disentildeos experimentales y situaciones de laboratorio 2 Muestra de expertos frecuentemente utilizados en estudios exploratorios 3 Muestra de sujetos tipo o estudios de casos utilizados en estudios cualitativos y motivacionales y 4 muestreo por cuotas frecuentes en estudios de opinioacuten y de mercadotecnia Las muestras dirigidas son vaacutelidas en cuanto a que un determinado disentildeo de investigacioacuten asiacute los requiere sin embargo los resultados son generalizables a la muestra en siacute o a muestras similares No son generalizables a una poblacioacutenEn el teorema de liacutemite central se sentildeala que una muestra de maacutes de cien casos seraacute una muestra con una distribucioacuten normal en sus caracteriacutesticas sin embargo la normalidad no debe conjuntarse con probabilidad Mientras lo primero es necesario para efectuar pruebas estadiacutesticas lo segundo es requisito indispensable para hacer inferencias correctas sobre una poblacioacuten

Page 8: CAPÍTULO 8 muestra y población

MapasLos mapas son muy uacutetiles como marco de referencia en muestras de racimoPor ejemplo un investigador quiere saber queacute motiva a los compradores en una determinada tienda de autoservicio A partir de una lista de tiendas de cada cadena competidora marca sobre un mapa de la ciudad todas las tiendas de autoservicios las cuales constituyen una poblacioacuten de racimos pues en cada tienda seleccionada entrevistaraacute a un nuacutemero n de clientes El mapa le permite ver la poblacioacuten (tiendas autoservicio) y su situacioacuten geograacutefica de manera que eligioacute zonas donde coexistan tiendas de la competencia para asegurarse de que el consumidor de la zona tenga todas las posibles alternativas

VoluacutemenesEn este ejemplo supongamos que un estudioso del periodismo quiere hacer un anaacutelisis de contenido de los editoriales de los tres principales diarios de la ciudad durante el porfiriato El investigador va a la Hemeroteca Nacional y encuentra que los diarios son encuadernados por trimestre y antildeo lo cual le proporciona un marco de referencia ideal a partir del cual seleccionaraacuten voluacutemenes para su anaacutelisis Supongamos sin embargo que encuentra que el volumen X que contiene el perioacutedico El Hijo del Ahuizote (enero-marzo 1899) falta en la Hemeroteca iquestQueacute hace Pues redefine la poblacioacuten manifestando expliacutecitamente que de N voluacutemenes tiene 99 de los elementos y a partir de este nuevo nuacutemero de N calculoacute su muestra n y la seleccionoacute

Horas de transmisioacutenEn un estudio de Portilla y Soloacuterzano (1982) los investigadores queriacutean hacer un anaacutelisis de anuncios en la televisioacuten mexicana Las emisoras no proporcionan una lista de anuncios ni sus horas de transmisioacuten Por otra parte saldriacutea muy caro grabar todos los anuncios a todas horas y seriacutea imposible estar frente al televisor para hacerloAnte la imposibilidad de tener un listado de comerciales se hicieron listados que identificaron cada media hora de transmisioacuten televisiva en cada canal 2 4 5 9 y 13 de las 7 a las 24 horas durante siete diacuteas de una semana de octubre de 1982 La poblacioacuten estaba constituida del nuacutemero total de medias horas de transmisioacuten televisiva N = 1 190 horas Esta poblacioacuten se dividioacute en estratos mantildeana mediodiacutea tarde y noche y se procedioacute a calcular el tamantildeo de la muestra tomando en consideracioacuten que por cada media hora de transmisioacuten hay 6 minutos de comerciales (De Noriega 1979)Se calculoacute el nuacutemero de medias horas que se seleccionariacutean para obtener una muestra n Una vez obtenido el tamantildeo de la muestra se seleccionaron aleatoriamente n medias horas y por uacuteltimo se grabaron y analizaron uacutenicamente aquellos comerciales contenidos en las medias horas seleccionadas al azar y que representaron diferentes canales y segmentos del diacutea El punto en este ejemplo es la construccioacuten concreta de un marco muestral que permitiera el anaacutelisis de una muestra probabiliacutestica de comerciales

TAMANtildeO OacutePTIMO DE UNA MUESTRA Y EL TEOREMA DEL LIacuteMITE CENTRALLas muestras probabiliacutesticas requieren dos procedimientos baacutesicos 1 La determinacioacuten del tamantildeo de la muestra y 2 la seleccioacuten aleatoria de los elementos muestrales El primer procedimiento lo hemos descrito en su modalidad maacutes simple en este capiacutetulo Precisar adecuadamente el tamantildeo de la muestra puede tornarse muy complejo dependiendo del problema de investigacioacuten y la poblacioacuten a estudiar Para el alumno seraacute muy uacutetil comparar que tamantildeo de muestra han utilizado otros investigadores en ciencias sociales

iquestCOacuteMO SON LAS MUESTRAS NO PROBABILIacuteSTICASLas muestras no probabiliacutesticas tambieacuten llamadas muestras dirigidas suponen un procedimiento de seleccioacuten informal y un poco arbitrario Auacuten asiacute se utilizan en muchas investigaciones y a partir de ellas se hacen inferencias sobre la poblacioacuten Es como si juzgaacutesemos el sabor de un cargamento de limones solamente probando alguno como si para muestra bastase un botoacuten La muestra dirigida selecciona sujetos tiacutepicos con la vaga esperanza de que seraacuten casos representativos de una poblacioacuten determinada

La verdad es que las muestras dirigidas tienen muchas desventajas La primera es que al no ser probabiliacutesticas no podemos calcular con precisioacuten el error estaacutendar es decir no podemos calcular con queacute nivel de confianza hacemos una estimacioacuten Esto es un grave inconveniente si consideramos que la estadiacutestica inferencial se basa en teoriacutea de la probabilidad por lo que pruebas estadiacutesticas en muestras no probabiliacutesticas tienen un valor limitado y relativo ala muestra en siacute mas no a la poblacioacuten Es decir los datos no pueden generalizarse a una poblacioacuten que no se consideroacute ni en sus paraacutemetros ni en sus elementos para obtener la muestra Recordemos que en las muestras de este tipo la eleccioacuten de los sujetos no depende de que todos tengan la misma probabilidad de ser elegidos sino de la decisioacuten de un investigador o grupo de encuestadoresLa ventaja de una muestra no probabiliacutestica es su utilidad para determinado disentildeo de estudio que requiere no tanto una representatividad de elementos de una poblacioacuten sino una cuidadosa y controlada eleccioacuten de sujetos con ciertas caracteriacutesticas especificadas previamente en el planteamiento del problemaHay variacuteas clases de muestras dirigidas y se definiraacuten a continuacioacuten

La muestra de sujetos voluntariosLas muestras de sujetos voluntarios son frecuentes en ciencias sociales y ciencias de la conducta Se trata de muestras fortuitas utilizadas tambieacuten en la medicina y la arqueologiacutea donde el investigador elabora conclusiones sobre especiacutemenes que llegan a sus manos de manera casual Pensemos por ejemplo en los sujetos que voluntariamente acceden a participar en un estudio que monitorea los efectos de un medicamento o en el investigador que anuncia en una clase que estaacute haciendo un estudio sobre motivacioacuten en el universitario e invita a aquellos que acepten someterse a una prueba proyectiva TAT En estos casos la eleccioacuten de los individuos que seraacuten sujetos a anaacutelisis depende de circunstancias fortuitas Este tipo de muestra se usa en estudios de laboratorio donde se procura que los sujetos sean homogeacuteneos en variables tales como edad sexo inteligencia de manera que los resultados o efectos no obedezcan a diferencias individuales sino a las condiciones a las que fueron sometidos

La muestra de expertosEn ciertos estudios es necesaria la opinioacuten de sujetos expertos en un temaEstas muestras son frecuentes en estudios cualitativos y exploratorios que para generar hipoacutetesis maacutes precisas o la materia prima del disentildeo de cuestionarios Por ejemplo en un estudio sobre el perfil de la mujer periodista en Meacutexico (Barrera et al 1989) se recurrioacute a una muestra de TI = 227 mujeres periodistas pues se consideroacute que eran los sujetos idoacuteneos para hablar de contratacioacuten sueldos y desempentildeo de las mujeres periodistas Estas muestras son vaacutelidas y uacutetiles cuando los objetivos del estudio asiacute lo requieren

Los sujetos-tipoTambieacuten esta muestra se utiliza en estudios exploratorios y en investigaciones de tipo cualitativo donde el objetivo es la riqueza profundidad y calidad de la informacioacuten no la cantidad ni la estandarizacioacuten En estudios de perspectiva fenomenoloacutegica donde el objetivo es analizar los valores ritos y significados de un determinado grupo social el uso tanto de expertos como de sujetos-tipo es frecuente Por ejemplo pensamos en los trabajos de Howard Becker (El muacutesica de jazz Las muchachas de blanco) que se basan en grupos de tiacutepicos muacutesicos de jazz y tiacutepicos estudiantes de medicina para adentrarse en el anaacutelisis de los patrones de identificacioacuten y socializacioacuten de estas dos profesiones la de muacutesico y la de meacutedicoLos estudios motivacionales los cuales se hacen para el anaacutelisis de las actitudes y conductas del consumidor tambieacuten utilizan muestras de sujeto-tipoAquiacute se definen los grupos a los que va dirigido un determinado producto (por ejemplo joacutevenes clase socio econoacutemica A y B amas de casa clase B ejecutivos clase A-B) y se construyen grupos de 8 o 10 personas cuyos integrantes tengan las caracteriacutesticas sociales y demograacuteficas de dicho sub grupo

Con ese grupo se efectuacutea una sesioacuten un facilitador o moderador dirigiraacute una conversacioacuten donde los miembros del grupo expresen sus actitudes valores medios expectativas motivaciones hacia las caracteriacutesticas de determinado producto o servicio

La muestra por cuotasEste tipo de muestra se utiliza mucho en estudios de opinioacuten y de mercadotecnia Los encuestadores reciben instrucciones de administrar cuestionarios con sujetos en la calle y al hacerla van conformando o llenando cuotas de acuerdo con la proporcioacuten de ciertas variables demograacuteficas en la poblacioacuten Asiacute en un estudio sobre la actitud de la poblacioacuten hacia un candidato poliacutetico se dice a los encuestadores que vayan a determinada colonia y entrevisten a 150 sujetos Que el 25 sean hombres mayores de 30 antildeos 25 mujeres mayores de 30 antildeos 25 hombres menores de 25 antildeos y 25 mujeres menores de 25 antildeos Asiacute se construyen estas muestras que como vemos dependen en cierta medida del juicio del entrevistadorPara el caso de los infectados con el VIH se realizoacute una muestra no probabiliacutestica (porque se encuestoacute y se analizoacute a cuantas personas se pudieron localizar lo que representoacute un 18 de los receptores de sangre o derivados provenientes del laboratorio Transfusiones y Hematologiacutea SA que habiacutean sido atendidos en los servicios meacutedicos de Petroacuteleos Mexicanos y no se analizoacute a posibles portadores del VIH que hubieran adquirido el virus de otra manera) La muestra se obtuvo de tres fuentes baacutesicas a) presentacioacuten espontaacutenea por siacutentomas b) captado por exaacutemenes de rutina o contractuales y e) tras la aplicacioacuten de una encuesta seroloacutegica a 482 receptores de sangre y plasma provenientes del laboratorio de referencia Dicho de otra manera no se pudo detectar a todos los infectados con el VIH contenido en la sangre o derivados provenientes del laboratorio aludido pero con el 18 de eacutestos se pudo establecer que 17 de cada 100 casos habriacutean sido infectados con el VIH

RESUMENEn este capiacutetulo describimos coacutemo seleccionar una muestra Lo primero que se debe plantear es quieacutenes van a ser medidos lo que corresponde a definir la unidad de anaacutelisis Se procede despueacutes a delimitar claramente la poblacioacuten con base en los objetivos del estudio y en cuanto a caracteriacutesticas de contenido de lugar y en el tiempoLa muestra es un subgrupo de la poblacioacuten y puede ser probabiliacutestica o no probabiliacutesticaElegir queacute tipo de muestra se requiere depende de los objetivos del estudio y del esquema de investigacioacutenLas muestras probabiliacutesticas son esenciales en los disentildeos de investigacioacuten por encuestas donde se pretenden generalizar los resultados a una poblacioacuten La caracteriacutestica de este tipo de muestra es que todos los elementos de la poblacioacuten tienen al inicio la misma probabilidad de ser elegidos de esta manera los elementos muestrales tendraacuten valores muy aproximados a los valores de la poblacioacuten ya que las mediciones del subconjunto seraacuten estimaciones muy precisas del conjunto mayor Esta precisioacuten depende del error de muestreo llamado tambieacuten error estaacutendarPara una muestra probabiliacutestica necesitamos dos cosas determinar el tamantildeo de la muestra y seleccionar los elementos muestrales en forma aleatoriaEl tamantildeo de la muestra se calcula con base en la varianza de la poblacioacuten y la varianza de la muestra Esta uacuteltima expresada en teacuterminos de probabilidad de ocurrencia La varianza de la poblacioacuten se calcula con el cuadrado del error estaacutendar el cual determinamos Entre menor sea el error estaacutendar mayor seraacute el tamantildeo de la muestraLas muestras probabiliacutesticas pueden ser simples estratificadas y por racimosLa estratificacioacuten aumenta la precisioacuten de la muestra e implica el uso deliberado de sub-muestras para cada estrato o categoriacutea que sea relevante en la poblacioacuten Muestrear por racimos implica diferencias entre la unidad de anaacutelisis y la unidad muestral En este tipo de muestreo hay una seleccioacuten en dos etapas ambas con procedimientos probabiliacutesticos En la primera se seleccionan los racimos escuelas organizaciones salones de clase en la segunda y dentro de los racimos a los sujetos que van a ser medidos

Los elementos muestrales de una muestra probabiliacutestica siempre se eligen aleatoriamente para aseguramos de que cada elemento tenga la misma probabilidad de ser elegido Pueden usarse tres procedimientos de seleccioacuten1 Toacutembola 2 Tabla de nuacutemeros random y 3 Seleccioacuten sistemaacutetica Todo procedimiento de seleccioacuten depende de listados ya sea existentes o construidos ad hoc Listados pueden ser el directorio telefoacutenico listas de asociaciones listas de escuelas oficiales etceacutetera Cuando no existen listas de elementos de la poblacioacuten se recurren a otros marcos de referencia que contengan descripciones del material organizaciones o sujetos seleccionados como unidades de anaacutelisis Algunos de eacutestos pueden ser los archivos hemerotecas y los mapasLas muestras no-probabiliacutesticas pueden tambieacuten llamarse muestras dirigidas pues la eleccioacuten de sujetos u objetos de estudio depende del criterio del investigador Las muestras dirigidas pueden ser de varias clases 1 Muestra de sujetos voluntarios frecuentemente utilizados con disentildeos experimentales y situaciones de laboratorio 2 Muestra de expertos frecuentemente utilizados en estudios exploratorios 3 Muestra de sujetos tipo o estudios de casos utilizados en estudios cualitativos y motivacionales y 4 muestreo por cuotas frecuentes en estudios de opinioacuten y de mercadotecnia Las muestras dirigidas son vaacutelidas en cuanto a que un determinado disentildeo de investigacioacuten asiacute los requiere sin embargo los resultados son generalizables a la muestra en siacute o a muestras similares No son generalizables a una poblacioacutenEn el teorema de liacutemite central se sentildeala que una muestra de maacutes de cien casos seraacute una muestra con una distribucioacuten normal en sus caracteriacutesticas sin embargo la normalidad no debe conjuntarse con probabilidad Mientras lo primero es necesario para efectuar pruebas estadiacutesticas lo segundo es requisito indispensable para hacer inferencias correctas sobre una poblacioacuten

Page 9: CAPÍTULO 8 muestra y población

La verdad es que las muestras dirigidas tienen muchas desventajas La primera es que al no ser probabiliacutesticas no podemos calcular con precisioacuten el error estaacutendar es decir no podemos calcular con queacute nivel de confianza hacemos una estimacioacuten Esto es un grave inconveniente si consideramos que la estadiacutestica inferencial se basa en teoriacutea de la probabilidad por lo que pruebas estadiacutesticas en muestras no probabiliacutesticas tienen un valor limitado y relativo ala muestra en siacute mas no a la poblacioacuten Es decir los datos no pueden generalizarse a una poblacioacuten que no se consideroacute ni en sus paraacutemetros ni en sus elementos para obtener la muestra Recordemos que en las muestras de este tipo la eleccioacuten de los sujetos no depende de que todos tengan la misma probabilidad de ser elegidos sino de la decisioacuten de un investigador o grupo de encuestadoresLa ventaja de una muestra no probabiliacutestica es su utilidad para determinado disentildeo de estudio que requiere no tanto una representatividad de elementos de una poblacioacuten sino una cuidadosa y controlada eleccioacuten de sujetos con ciertas caracteriacutesticas especificadas previamente en el planteamiento del problemaHay variacuteas clases de muestras dirigidas y se definiraacuten a continuacioacuten

La muestra de sujetos voluntariosLas muestras de sujetos voluntarios son frecuentes en ciencias sociales y ciencias de la conducta Se trata de muestras fortuitas utilizadas tambieacuten en la medicina y la arqueologiacutea donde el investigador elabora conclusiones sobre especiacutemenes que llegan a sus manos de manera casual Pensemos por ejemplo en los sujetos que voluntariamente acceden a participar en un estudio que monitorea los efectos de un medicamento o en el investigador que anuncia en una clase que estaacute haciendo un estudio sobre motivacioacuten en el universitario e invita a aquellos que acepten someterse a una prueba proyectiva TAT En estos casos la eleccioacuten de los individuos que seraacuten sujetos a anaacutelisis depende de circunstancias fortuitas Este tipo de muestra se usa en estudios de laboratorio donde se procura que los sujetos sean homogeacuteneos en variables tales como edad sexo inteligencia de manera que los resultados o efectos no obedezcan a diferencias individuales sino a las condiciones a las que fueron sometidos

La muestra de expertosEn ciertos estudios es necesaria la opinioacuten de sujetos expertos en un temaEstas muestras son frecuentes en estudios cualitativos y exploratorios que para generar hipoacutetesis maacutes precisas o la materia prima del disentildeo de cuestionarios Por ejemplo en un estudio sobre el perfil de la mujer periodista en Meacutexico (Barrera et al 1989) se recurrioacute a una muestra de TI = 227 mujeres periodistas pues se consideroacute que eran los sujetos idoacuteneos para hablar de contratacioacuten sueldos y desempentildeo de las mujeres periodistas Estas muestras son vaacutelidas y uacutetiles cuando los objetivos del estudio asiacute lo requieren

Los sujetos-tipoTambieacuten esta muestra se utiliza en estudios exploratorios y en investigaciones de tipo cualitativo donde el objetivo es la riqueza profundidad y calidad de la informacioacuten no la cantidad ni la estandarizacioacuten En estudios de perspectiva fenomenoloacutegica donde el objetivo es analizar los valores ritos y significados de un determinado grupo social el uso tanto de expertos como de sujetos-tipo es frecuente Por ejemplo pensamos en los trabajos de Howard Becker (El muacutesica de jazz Las muchachas de blanco) que se basan en grupos de tiacutepicos muacutesicos de jazz y tiacutepicos estudiantes de medicina para adentrarse en el anaacutelisis de los patrones de identificacioacuten y socializacioacuten de estas dos profesiones la de muacutesico y la de meacutedicoLos estudios motivacionales los cuales se hacen para el anaacutelisis de las actitudes y conductas del consumidor tambieacuten utilizan muestras de sujeto-tipoAquiacute se definen los grupos a los que va dirigido un determinado producto (por ejemplo joacutevenes clase socio econoacutemica A y B amas de casa clase B ejecutivos clase A-B) y se construyen grupos de 8 o 10 personas cuyos integrantes tengan las caracteriacutesticas sociales y demograacuteficas de dicho sub grupo

Con ese grupo se efectuacutea una sesioacuten un facilitador o moderador dirigiraacute una conversacioacuten donde los miembros del grupo expresen sus actitudes valores medios expectativas motivaciones hacia las caracteriacutesticas de determinado producto o servicio

La muestra por cuotasEste tipo de muestra se utiliza mucho en estudios de opinioacuten y de mercadotecnia Los encuestadores reciben instrucciones de administrar cuestionarios con sujetos en la calle y al hacerla van conformando o llenando cuotas de acuerdo con la proporcioacuten de ciertas variables demograacuteficas en la poblacioacuten Asiacute en un estudio sobre la actitud de la poblacioacuten hacia un candidato poliacutetico se dice a los encuestadores que vayan a determinada colonia y entrevisten a 150 sujetos Que el 25 sean hombres mayores de 30 antildeos 25 mujeres mayores de 30 antildeos 25 hombres menores de 25 antildeos y 25 mujeres menores de 25 antildeos Asiacute se construyen estas muestras que como vemos dependen en cierta medida del juicio del entrevistadorPara el caso de los infectados con el VIH se realizoacute una muestra no probabiliacutestica (porque se encuestoacute y se analizoacute a cuantas personas se pudieron localizar lo que representoacute un 18 de los receptores de sangre o derivados provenientes del laboratorio Transfusiones y Hematologiacutea SA que habiacutean sido atendidos en los servicios meacutedicos de Petroacuteleos Mexicanos y no se analizoacute a posibles portadores del VIH que hubieran adquirido el virus de otra manera) La muestra se obtuvo de tres fuentes baacutesicas a) presentacioacuten espontaacutenea por siacutentomas b) captado por exaacutemenes de rutina o contractuales y e) tras la aplicacioacuten de una encuesta seroloacutegica a 482 receptores de sangre y plasma provenientes del laboratorio de referencia Dicho de otra manera no se pudo detectar a todos los infectados con el VIH contenido en la sangre o derivados provenientes del laboratorio aludido pero con el 18 de eacutestos se pudo establecer que 17 de cada 100 casos habriacutean sido infectados con el VIH

RESUMENEn este capiacutetulo describimos coacutemo seleccionar una muestra Lo primero que se debe plantear es quieacutenes van a ser medidos lo que corresponde a definir la unidad de anaacutelisis Se procede despueacutes a delimitar claramente la poblacioacuten con base en los objetivos del estudio y en cuanto a caracteriacutesticas de contenido de lugar y en el tiempoLa muestra es un subgrupo de la poblacioacuten y puede ser probabiliacutestica o no probabiliacutesticaElegir queacute tipo de muestra se requiere depende de los objetivos del estudio y del esquema de investigacioacutenLas muestras probabiliacutesticas son esenciales en los disentildeos de investigacioacuten por encuestas donde se pretenden generalizar los resultados a una poblacioacuten La caracteriacutestica de este tipo de muestra es que todos los elementos de la poblacioacuten tienen al inicio la misma probabilidad de ser elegidos de esta manera los elementos muestrales tendraacuten valores muy aproximados a los valores de la poblacioacuten ya que las mediciones del subconjunto seraacuten estimaciones muy precisas del conjunto mayor Esta precisioacuten depende del error de muestreo llamado tambieacuten error estaacutendarPara una muestra probabiliacutestica necesitamos dos cosas determinar el tamantildeo de la muestra y seleccionar los elementos muestrales en forma aleatoriaEl tamantildeo de la muestra se calcula con base en la varianza de la poblacioacuten y la varianza de la muestra Esta uacuteltima expresada en teacuterminos de probabilidad de ocurrencia La varianza de la poblacioacuten se calcula con el cuadrado del error estaacutendar el cual determinamos Entre menor sea el error estaacutendar mayor seraacute el tamantildeo de la muestraLas muestras probabiliacutesticas pueden ser simples estratificadas y por racimosLa estratificacioacuten aumenta la precisioacuten de la muestra e implica el uso deliberado de sub-muestras para cada estrato o categoriacutea que sea relevante en la poblacioacuten Muestrear por racimos implica diferencias entre la unidad de anaacutelisis y la unidad muestral En este tipo de muestreo hay una seleccioacuten en dos etapas ambas con procedimientos probabiliacutesticos En la primera se seleccionan los racimos escuelas organizaciones salones de clase en la segunda y dentro de los racimos a los sujetos que van a ser medidos

Los elementos muestrales de una muestra probabiliacutestica siempre se eligen aleatoriamente para aseguramos de que cada elemento tenga la misma probabilidad de ser elegido Pueden usarse tres procedimientos de seleccioacuten1 Toacutembola 2 Tabla de nuacutemeros random y 3 Seleccioacuten sistemaacutetica Todo procedimiento de seleccioacuten depende de listados ya sea existentes o construidos ad hoc Listados pueden ser el directorio telefoacutenico listas de asociaciones listas de escuelas oficiales etceacutetera Cuando no existen listas de elementos de la poblacioacuten se recurren a otros marcos de referencia que contengan descripciones del material organizaciones o sujetos seleccionados como unidades de anaacutelisis Algunos de eacutestos pueden ser los archivos hemerotecas y los mapasLas muestras no-probabiliacutesticas pueden tambieacuten llamarse muestras dirigidas pues la eleccioacuten de sujetos u objetos de estudio depende del criterio del investigador Las muestras dirigidas pueden ser de varias clases 1 Muestra de sujetos voluntarios frecuentemente utilizados con disentildeos experimentales y situaciones de laboratorio 2 Muestra de expertos frecuentemente utilizados en estudios exploratorios 3 Muestra de sujetos tipo o estudios de casos utilizados en estudios cualitativos y motivacionales y 4 muestreo por cuotas frecuentes en estudios de opinioacuten y de mercadotecnia Las muestras dirigidas son vaacutelidas en cuanto a que un determinado disentildeo de investigacioacuten asiacute los requiere sin embargo los resultados son generalizables a la muestra en siacute o a muestras similares No son generalizables a una poblacioacutenEn el teorema de liacutemite central se sentildeala que una muestra de maacutes de cien casos seraacute una muestra con una distribucioacuten normal en sus caracteriacutesticas sin embargo la normalidad no debe conjuntarse con probabilidad Mientras lo primero es necesario para efectuar pruebas estadiacutesticas lo segundo es requisito indispensable para hacer inferencias correctas sobre una poblacioacuten

Page 10: CAPÍTULO 8 muestra y población

Con ese grupo se efectuacutea una sesioacuten un facilitador o moderador dirigiraacute una conversacioacuten donde los miembros del grupo expresen sus actitudes valores medios expectativas motivaciones hacia las caracteriacutesticas de determinado producto o servicio

La muestra por cuotasEste tipo de muestra se utiliza mucho en estudios de opinioacuten y de mercadotecnia Los encuestadores reciben instrucciones de administrar cuestionarios con sujetos en la calle y al hacerla van conformando o llenando cuotas de acuerdo con la proporcioacuten de ciertas variables demograacuteficas en la poblacioacuten Asiacute en un estudio sobre la actitud de la poblacioacuten hacia un candidato poliacutetico se dice a los encuestadores que vayan a determinada colonia y entrevisten a 150 sujetos Que el 25 sean hombres mayores de 30 antildeos 25 mujeres mayores de 30 antildeos 25 hombres menores de 25 antildeos y 25 mujeres menores de 25 antildeos Asiacute se construyen estas muestras que como vemos dependen en cierta medida del juicio del entrevistadorPara el caso de los infectados con el VIH se realizoacute una muestra no probabiliacutestica (porque se encuestoacute y se analizoacute a cuantas personas se pudieron localizar lo que representoacute un 18 de los receptores de sangre o derivados provenientes del laboratorio Transfusiones y Hematologiacutea SA que habiacutean sido atendidos en los servicios meacutedicos de Petroacuteleos Mexicanos y no se analizoacute a posibles portadores del VIH que hubieran adquirido el virus de otra manera) La muestra se obtuvo de tres fuentes baacutesicas a) presentacioacuten espontaacutenea por siacutentomas b) captado por exaacutemenes de rutina o contractuales y e) tras la aplicacioacuten de una encuesta seroloacutegica a 482 receptores de sangre y plasma provenientes del laboratorio de referencia Dicho de otra manera no se pudo detectar a todos los infectados con el VIH contenido en la sangre o derivados provenientes del laboratorio aludido pero con el 18 de eacutestos se pudo establecer que 17 de cada 100 casos habriacutean sido infectados con el VIH

RESUMENEn este capiacutetulo describimos coacutemo seleccionar una muestra Lo primero que se debe plantear es quieacutenes van a ser medidos lo que corresponde a definir la unidad de anaacutelisis Se procede despueacutes a delimitar claramente la poblacioacuten con base en los objetivos del estudio y en cuanto a caracteriacutesticas de contenido de lugar y en el tiempoLa muestra es un subgrupo de la poblacioacuten y puede ser probabiliacutestica o no probabiliacutesticaElegir queacute tipo de muestra se requiere depende de los objetivos del estudio y del esquema de investigacioacutenLas muestras probabiliacutesticas son esenciales en los disentildeos de investigacioacuten por encuestas donde se pretenden generalizar los resultados a una poblacioacuten La caracteriacutestica de este tipo de muestra es que todos los elementos de la poblacioacuten tienen al inicio la misma probabilidad de ser elegidos de esta manera los elementos muestrales tendraacuten valores muy aproximados a los valores de la poblacioacuten ya que las mediciones del subconjunto seraacuten estimaciones muy precisas del conjunto mayor Esta precisioacuten depende del error de muestreo llamado tambieacuten error estaacutendarPara una muestra probabiliacutestica necesitamos dos cosas determinar el tamantildeo de la muestra y seleccionar los elementos muestrales en forma aleatoriaEl tamantildeo de la muestra se calcula con base en la varianza de la poblacioacuten y la varianza de la muestra Esta uacuteltima expresada en teacuterminos de probabilidad de ocurrencia La varianza de la poblacioacuten se calcula con el cuadrado del error estaacutendar el cual determinamos Entre menor sea el error estaacutendar mayor seraacute el tamantildeo de la muestraLas muestras probabiliacutesticas pueden ser simples estratificadas y por racimosLa estratificacioacuten aumenta la precisioacuten de la muestra e implica el uso deliberado de sub-muestras para cada estrato o categoriacutea que sea relevante en la poblacioacuten Muestrear por racimos implica diferencias entre la unidad de anaacutelisis y la unidad muestral En este tipo de muestreo hay una seleccioacuten en dos etapas ambas con procedimientos probabiliacutesticos En la primera se seleccionan los racimos escuelas organizaciones salones de clase en la segunda y dentro de los racimos a los sujetos que van a ser medidos

Los elementos muestrales de una muestra probabiliacutestica siempre se eligen aleatoriamente para aseguramos de que cada elemento tenga la misma probabilidad de ser elegido Pueden usarse tres procedimientos de seleccioacuten1 Toacutembola 2 Tabla de nuacutemeros random y 3 Seleccioacuten sistemaacutetica Todo procedimiento de seleccioacuten depende de listados ya sea existentes o construidos ad hoc Listados pueden ser el directorio telefoacutenico listas de asociaciones listas de escuelas oficiales etceacutetera Cuando no existen listas de elementos de la poblacioacuten se recurren a otros marcos de referencia que contengan descripciones del material organizaciones o sujetos seleccionados como unidades de anaacutelisis Algunos de eacutestos pueden ser los archivos hemerotecas y los mapasLas muestras no-probabiliacutesticas pueden tambieacuten llamarse muestras dirigidas pues la eleccioacuten de sujetos u objetos de estudio depende del criterio del investigador Las muestras dirigidas pueden ser de varias clases 1 Muestra de sujetos voluntarios frecuentemente utilizados con disentildeos experimentales y situaciones de laboratorio 2 Muestra de expertos frecuentemente utilizados en estudios exploratorios 3 Muestra de sujetos tipo o estudios de casos utilizados en estudios cualitativos y motivacionales y 4 muestreo por cuotas frecuentes en estudios de opinioacuten y de mercadotecnia Las muestras dirigidas son vaacutelidas en cuanto a que un determinado disentildeo de investigacioacuten asiacute los requiere sin embargo los resultados son generalizables a la muestra en siacute o a muestras similares No son generalizables a una poblacioacutenEn el teorema de liacutemite central se sentildeala que una muestra de maacutes de cien casos seraacute una muestra con una distribucioacuten normal en sus caracteriacutesticas sin embargo la normalidad no debe conjuntarse con probabilidad Mientras lo primero es necesario para efectuar pruebas estadiacutesticas lo segundo es requisito indispensable para hacer inferencias correctas sobre una poblacioacuten

Page 11: CAPÍTULO 8 muestra y población

Los elementos muestrales de una muestra probabiliacutestica siempre se eligen aleatoriamente para aseguramos de que cada elemento tenga la misma probabilidad de ser elegido Pueden usarse tres procedimientos de seleccioacuten1 Toacutembola 2 Tabla de nuacutemeros random y 3 Seleccioacuten sistemaacutetica Todo procedimiento de seleccioacuten depende de listados ya sea existentes o construidos ad hoc Listados pueden ser el directorio telefoacutenico listas de asociaciones listas de escuelas oficiales etceacutetera Cuando no existen listas de elementos de la poblacioacuten se recurren a otros marcos de referencia que contengan descripciones del material organizaciones o sujetos seleccionados como unidades de anaacutelisis Algunos de eacutestos pueden ser los archivos hemerotecas y los mapasLas muestras no-probabiliacutesticas pueden tambieacuten llamarse muestras dirigidas pues la eleccioacuten de sujetos u objetos de estudio depende del criterio del investigador Las muestras dirigidas pueden ser de varias clases 1 Muestra de sujetos voluntarios frecuentemente utilizados con disentildeos experimentales y situaciones de laboratorio 2 Muestra de expertos frecuentemente utilizados en estudios exploratorios 3 Muestra de sujetos tipo o estudios de casos utilizados en estudios cualitativos y motivacionales y 4 muestreo por cuotas frecuentes en estudios de opinioacuten y de mercadotecnia Las muestras dirigidas son vaacutelidas en cuanto a que un determinado disentildeo de investigacioacuten asiacute los requiere sin embargo los resultados son generalizables a la muestra en siacute o a muestras similares No son generalizables a una poblacioacutenEn el teorema de liacutemite central se sentildeala que una muestra de maacutes de cien casos seraacute una muestra con una distribucioacuten normal en sus caracteriacutesticas sin embargo la normalidad no debe conjuntarse con probabilidad Mientras lo primero es necesario para efectuar pruebas estadiacutesticas lo segundo es requisito indispensable para hacer inferencias correctas sobre una poblacioacuten