MUESTRA. DEFINICIÓN, CLASIFICACIÓN Y EJEMPLOS.
MUESTRA. DEFINICIÓN, CLASIFICACIÓN Y EJEMPLOS.
"Se llama muestra a una parte de la población a estudiar qué sirve para representarla". Murray R. Spiegel (1991).
Podemos decir que una muestra es un subconjunto de elementos de la población. Hay, sin embargo, distintas formas o métodos de seleccionar una muestra, que dependen, en general, de las características de la población que se va a estudiar, pueden ser realizados de forma probabilista o aleatoria (al azar), o no probabilista.
Los autores proponen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en general pueden dividirse en dos grandes grupos: métodos de muestreo probabilistas y métodos de muestreo no probabilistas.
Muestreo probabilista. Forman parte de este tipo de muestreo todos aquellos métodos para los que puede calcularse la probabilidad de extracción de cualquiera de las muestras posibles. Este conjunto de técnicas de muestreo es el más aconsejable.
El muestreo aleatorio simple puede ser de dos tipos:
Sin reposición de los elementos: cada elemento extraído se descarta para la subsiguiente extracción. Por ejemplo, si se extrae una muestra de una "población" de bombillas para estimar la vida media de las bombillas que la integran, no será posible medir más que una vez la bombilla seleccionada.
Con reposición de los elementos: las observaciones se realizan con reemplazamiento de los individuos, de forma que la población es idéntica en todas las extracciones. En poblaciones muy grandes, la probabilidad de repetir una extracción es tan pequeña que el muestreo puede considerarse sin reposición aunque, realmente, no lo sea.
Para realizar este tipo de muestreo, y en determinadas situaciones, es muy útil la extracción de números aleatorios mediante ordenadores, calculadoras o tablas construidas al efecto.
Muestreo estratificado: Se realiza una la división de la población de estudio en grupos o estratos homogéneos (o que se suponen homogéneos) respecto a la variable de interés. A cada estrato se le asignaría una cantidad o cuota que representa el número de miembros o elementos del mismo que deben componer la muestra. Dentro de cada estrato el muestreo se realizaría mediante un muestreo aleatorio simple.
Por ejemplo, para un estudio por estratos mediante asignación proporcional sería: Se está realizando un estudio de opinión de hombres y mujeres; se estima que, dentro de cada uno de estos grupos, hay cierta homogeneidad (la variabilidad de opiniones es la misma). La población se compone de un 55% de mujeres y un 45% de hombres, por lo tanto conviene un muestreo estratificado con asignación proporcional, ya que se tomaría una muestra que contenga también esa misma proporción.
Muestreo sistemático: Se usa cuando el universo es muy grande o éste se extiende en el tiempo. Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda). Luego hay que calcular una constante, que se denomina coeficiente de elevación K= N/n; donde N es el tamaño del universo y n el tamaño de la muestra. Determinar en qué fecha se producirá la primera extracción, para ello hay que elegir al azar un número entre 1 y K; de ahí en adelante tomar uno de cada K a intervalos regulares. Si es posible, es conveniente tener en cuenta la periodicidad del fenómeno.
Muestreo por conglomerados: Cuando la población se encuentra dividida, de manera natural, en grupos que se suponen que contienen toda la variabilidad de la población, es decir, la representan fielmente respecto a la característica a elegir, pueden seleccionarse sólo algunos de estos grupos o conglomerados para la realización del estudio.
Dentro de los grupos seleccionados se ubicarán las unidades elementales, por ejemplo, las personas a encuestar, y podría aplicársele el instrumento de medición a todas las unidades, es decir, los miembros del grupo, o sólo se les podría aplicar a algunos de ellos, seleccionados al azar. Este método tiene la ventaja de simplificar el levantamiento de datos sobre la información muestral.
Ejemplos: Una ganadería tiene 3 000 vacas. Se quiere extraer una muestra de 120. Explica cómo se obtiene la muestra: a) Mediante muestreo aleatorio simple. b) Mediante muestreo aleatorio sistemático.
a) Se numeran las vacas del 1 al 3 000. Se sortean 120 números de entre los 3 000. La muestra estará formada por las 120 vacas a las que correspondan los números obtenidos.
b) Coeficiente de elevación: h=25. Se sortea un número del 1 al 25. Supongamos que sale el 9. Las vacas seleccionadas para la muestra serían las que correspondieran a los números 9, 34, 59, 84, 109, …, 2 984.
En cada uno de los casos que se mencionan a continuación, el colectivo ¿es población o es muestra? Explica por qué.
a) Un campesino tiene 87 gallinas. Para probar la eficacia de un nuevo tipo de alimentación, las pesa a todas antes y después de los 30 días que dura el tratamiento.
b) Un granjero prueba con 100 de sus gallinas la eficacia de un nuevo tipo de alimentación.
a) Es población, porque pesa a todas las gallinas.
b) Es muestra, porque no pesa a todas las gallinas, sino solo a una parte de ellas.
Muestreo no probabilísticos: A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones, pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la misma probabilidad de ser elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea representativa. Los métodos de muestreo no probabilísticos no garantizan la representatividad de la muestra y por lo tanto no permiten realizar estimaciones inferenciales sobre la población.
(En algunas circunstancias los métodos estadísticos y epidemiológicos permiten resolver los problemas de representatividad aun en situaciones de muestreo no probabilístico, por ejemplo los estudios de caso-control, donde los casos no son seleccionados aleatoriamente de la población.)
Muestreo por cuotas: También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél. En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.
Muestreo opinático o intencional: Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto.
Muestreo casual o incidental: Se trata de un proceso en el que el investigador selecciona directa e intencionadamente los individuos de la población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos).
Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.
3.3.- VARIABLE. DEFINICIÓN, CLASIFICACIÓN Y EJEMPLOS.
Una variable es una característica que al ser medida en diferentes individuos es susceptible de adoptar diferentes valores. (www.wikipedia.com)
Al conjunto de los distintos valores numéricos que adopta un carácter cuantitativo se llama variable estadística.
Variables cualitativas: Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. No se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo). Las variables cualitativas pueden ser ordinales y nominales.
- Variable cualitativa ordinal: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo, leve, moderado, grave.
- Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores o el lugar de residencia.
Variables cuantitativas: Son las variables que se expresan mediante cantidades numéricas, es decir, tienen valor numérico (edad, precio de un producto, ingresos anuales). Las variables cuantitativas además pueden ser:
- Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podrá ser 3.45).
- Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo el peso o la altura, que solamente limitado por la precisión del aparato medidor, en teoría permiten que siempre exista un valor entre dos cualesquiera. Pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 90.4 km/h, 94.57 km/h...etc.
3.4.- ESCALA. DEFINICIÓN, CLASIFICACIÓN Y EJEMPLOS.
Una escala es un patrón convencional de medición, y básicamente consiste en un instrumento capaz de representar con gran fidelidad verbal, gráfica o simbólicamente el estado de una variable. La medición de las variables puede realizarse por medio de cuatro escalas de medición. Dos de las escalas miden variables categóricas y las otras dos miden variables numéricas. Los niveles de medición son las escalas nominal, ordinal, de intervalo y de razón. Se utilizan para ayudar en la clasificación de las variables, el diseño de las preguntas para medir variables, e incluso indican el tipo de análisis estadístico apropiado para el tratamiento de los datos.
- Escala nominal: Utiliza los números para identificar que un dato pertenece a un grupo o a una categoría. Es aquella escala que no presenta un orden o dimensión particular, son observaciones que pueden clasificarse o contarse. En el análisis de datos resulta más sencillo asignar a ciertos atributos "etiquetas" numéricas en lugar de utilizar datos complejos. Por ello podemos utilizar un "1" para designar a las mujeres y un "2" para designar a los hombres, sin que ninguno de los números represente más o menos, solamente con el objetivo de distinguir y organizar datos. En esta escala cada persona u objeto debe pertenecer a una y solamente una de las categorías que tienen y el conjunto de estas categorías debe ser exhaustivo; es decir, tiene que contener a todos los casos posibles.
- Escala ordinal: En esta escala los números representan una clasificación (mayor que o menor que), sin que represente una unidad de medida, quedando implícito que un número de mayor cantidad tiene más alto grado de atributo medido en comparación de un número menor. Se establece una gradación u orden natural para las categorías, cada uno de los datos puede localizarse dentro de alguna de las categorías disponibles.
- Escala de intervalo: En esta escala además del "mayor que" y el "menor que" también se establece una unidad de medida que nos permite precisar cuánto se es mayor o menor. La unidad de medición es arbitraria, el cero es convencional y pueden existir cantidades negativas; la medición de la temperatura y del coeficiente intelectual son ejemplos de este tipo de escala. En esta escala se pueden hacer comparaciones por medio de diferencias o de sumas, sin embargo no se admiten comparaciones por medio de multiplicaciones, divisiones o porcentajes pues carecen de sentido.
- Escala de razón: Similar a la escala de intervalo, pero tiene un cero absoluto y por ello los múltiplos de los valores de la escala serán significativos; el nivel de votos en una elección sería un buen ejemplo de una escala de medición de razón.
3.5.- DATOS. DEFINICIÓN Y EJEMPLOS.
Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Ejemplo: Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz. (www.ditutor.com)
3.6.- PARÁMETROS Y ESTADÍSTICOS. DEFINICIÓN Y DIFERENCIAS.
Estadístico: valor numérico que describe una característica de la muestra y se obtiene mediante la manipulación algebraica de sus datos. (Pardo Merino). Ejemplo: Suponga se tomó una muestra representativa de los estudiantes regulares de La Universidad del Zulia. Para esta muestra se calculó: edad promedio, rendimiento promedio, porcentaje de estudiantes que fuman.
Parámetro: valor numérico que describe una característica de la población (Pardo Merino). Los parámetros se estiman a partir de la información aportada por una muestra de la población. Ejemplo: Si se considera como universos a todos los estudiantes regulares de La Universidad del Zulia, la edad promedio de estos, el porcentaje de estudiantes de sexo masculino que fuman, el ingreso medio todos los estudiantes, son valores que describen a este conjunto.
La diferencia es que el estadístico es la cantidad que caracteriza a una muestra, y que sirve para aproximar el valor de un parámetro desconocido y un parámetro es un valor fijo que caracteriza a una población.
Es una actividad que tiene como fruto descubrir las esencias de una realidad empleando para ello técnicas estadísticas. (Quesada Ibarguen, Víctor Manuel y Vergara Schmalbach, Juan Carlos). Etapas de la investigación estadística:
- Selección y determinación de la población o muestra y las características contenidas que se desean estudiar. En el caso de que se desee tomar una muestra, es necesario determinar el tamaño de la misma y el tipo de muestreo a realizar (probabilístico o no probabilístico).
- Obtención de los datos. Esta puede ser realizada mediante la observación directa de los elementos, la aplicación de encuestas y entrevistas, y la realización de experimentos.
- Clasificación, tabulación y organización de los datos. La clasificación incluye el tratamiento de los datos considerados anómalos que pueden en un momento dado, falsear un análisis de los indicadores estadísticos. La tabulación implica el resumen de los datos en tablas y gráficos estadísticos.
- Análisis descriptivo de los datos. El análisis se complementa con la obtención de indicadores estadísticos como las medidas: de tendencia central, dispersión, posición y forma.
- Análisis inferencial de los datos. Se aplican técnicas de tratamiento de datos que involucran elementos probabilísticos que permiten inferir conclusiones de una muestra hacia la población (opcional).
- Elaboración de conclusiones. Se construye el informe final.
Después de haber brindado algunas nociones básicas de la estadística, su definición, clasificación y las diferentes técnicas que la misma utiliza para estudiar una determinada población, podemos sintetizar lo siguiente: la estadística es una ciencia, debido a que utiliza métodos de investigación científica y a la vez es una serie de herramientas, instrumentos y estrategia para estudiar a una población.
Por otra parte, la estadística se califica en descriptiva e inferencial. Donde la primera estudia los métodos de recolección y descripción de los fenómenos en estudios; mientras que la otra se dedica a la generación de los métodos, inferencias y predicciones asociados a los fenómenos en cuestión, teniendo en cuenta lo aleatorio e incertidumbre en las observaciones.
Comentarios
Publicar un comentario