Página PrecedenteÍndicePágina Sucesiva

Anexo 2. Protocolos de muestreo

Helène Dessard

Principios generales

El objetivo de este anexo es recordar algunas definiciones y principios generales básicos sobre la teoría del muestreo. Permitirán al usuario comprender mejor los fundamentos de las diferentes técnicas de sondeo y, como consecuencia, escoger una clase de planes de muestreo adecuada para responder al objetivo perseguido, apoyándose más en consideraciones estadísticas que en intuiciones que dependen de proyecciones personales.

El objetivo del muestreo es conocer las propiedades de una población a partir del análisis de una fracción de ésta. Esta práctica ha surgido de la imposibilidad de realizar, por razones de coste y de tiempo, inventarios exhaustivos de las características de una población, ¡comenzando por su tamaño! No se pretende conocer, en general, los valores de la(s) característica(s) de todos los elementos de la población, sino más bien deducir (en términos estadísticos) o "predecir" y "extrapolar" (en términos corrientes) una función de estos valores, a partir de una muestra y, por tanto, de un subconjunto de estos valores. Como se examina sólo una parte de la población, es evidente que la predicción estará afectada por un error propio de todo muestreo. Este error se llama error de muestreo, y es el que se pretende reducir al mínimo escogiendo el plan de sondeo más conveniente para obtener la mejor predicción posible.

Definiciones

Población finita U: es un conjunto de N unidades en las que se mide uno (o varios3 ) caracteres Y = (Y1, Y2,...YN). Se trata de conocer ciertas características de una población finita4 , marcadas con un q ,denominadas también parámetros. Este conjunto posee tantas dimensiones como características haya que estimar. Si interesa el total del número de árboles y la altura media de una población, entonces q es un vector de longitud 2.

Muestra5 : es un subconjunto, de tamaño n W N, de la población a partir del cual se van a "estimar" ciertos caracteres de la población. La forma en que está constituida define igualmente sus propiedades, como la presencia múltiple de una misma unidad (cuando se efectúa una extracción con reposición), el orden de las unidades, etc.

Estimador: es simplemente una función de los datos Φ (s), por ejemplo, una suma ponderada, cuando se calcula una media. El estimador es una variable aleatoria y, por esta razón, esta caracterizado también por su distribución de probabilidad en el conjunto de las muestras (se habla entonces de su distribución de muestreo). Posee, pues, una esperanza y una varianza. Para estimar un parámetro, se tienen disponibles a veces varios estimadores, y un criterio práctico de elección es el error cuadrático medio: la esperanza del cuadrado de la desviación entre el estimador y el valor real del parámetro, o sea E [(Φ (s) - q )2 ]. En efecto, cuanto más pequeño es éste, mayor es la precisión de la estimación.

Plan de muestreo6 : desde el punto de vista estadístico, el plan diseña en realidad la ley de probabilidad definida sobre el conjunto de muestras posibles, es decir, la probabilidad de selección de una muestra. Por ejemplo, si la población está constituida por tres elementos Ì1,2,3ý, el conjunto de muestras no ordenadas sin reposición de tamaño 2 es ζ = {{1,2},{1,3},{2,3}}.

Para cada muestra s de ζ, se define P(s) 0, con

Por ejemplo: P({1,2}) = 0,6; P({2,3}) = 0,3; P({1,3}) = 0,1. Se está en el marco de un plan de probabilidades desiguales.

Estrategia de muestreo: combinación de la elección del plan de muestreo y del estimador.

Probabilidad de inclusión; probabilidad de pertenencia a la muestra de una unidad i (probabilidad simple πi) o de dos unidades i y j simultáneamente (probabilidad doble o conjunta πij) (Cochran, 1977). Se calculan de la siguiente forma:

Volviendo al ejemplo anterior, se tiene π1 = 0,7; π2 = 0,9; π3 = 0,4.

Variable de interés: variable medida sobre las unidades de la muestra, de la que se pretende estimar una función, es decir, un total, una media, un ratio, etc.

Variable auxiliar7 : variable correlacionada con la variable de interés conocida en todas las unidades de la población antes de realizar el inventario.

Representatividad: Una muestra se dice que es "representativa" cuando ninguna de las probabilidades de inclusión es nula. En otros términos, toda unidad tiene una probabilidad no nula de pertenecer a la muestra. El plan de muestreo es el que define estas probabilidades. Si se desea obtener una estimación precisa, es necesario aumentar la intensidad de muestreo en las zonas de mayor variabilidad, y al contrario en las zonas más homogéneas.

Modelo de superpoblación: el enfoque clásico considera que los caracteres medidos son fijos, y el procedimiento de muestreo forma entonces por sí solo la base de la inferencia8 . El enfoque modelo considera que los caracteres observados son de hecho realizaciones de variables aleatorias. La población en la que se interesa es una muestra aleatoria de una superpoblación (o varias). La muestra proviene entonces de una doble extracción: la primera consiste en extraer los N valores observados de la población, y la segunda está constituida por el plan de muestreo, condicionado a estos valores. La inferencia se realiza igualmente apoyándose en el modelo. Este enfoque puede ser sumamente útil para escoger un plan de sondeo.

Solidez: este concepto muy general significa que un procedimiento o un sistema sometido a una perturbación produce resultados similares a los obtenidos sin perturbaciones.

Informaciones a priori, a posteriori: aun cuando esta noción haya sido tratada via la definición de una variable auxiliar, se atribuirá a la información auxiliar un alcance más general. Cuando se incorpora la información a priori, las estrategias de muestreo son más numerosas y el usuario tiene quizá más probabilidad de escoger bien su plan (¡al precio de una evaluación más costosa!). Cuando la información se utiliza a posteriori, sirve para "reorientar los estimadores", como el estimador post-estratificado, pero a menudo la información sigue subutilizada. En todos los casos, si se dispone de una o varias variables auxiliares, es preferible utilizarlas a priori, cuando sea posible.

Limitaciones: costo, tiempo, terreno y evaluación de los riesgos

Las propiedades teóricas de los planes de muestreo no son, sin embargo, suficientes para determinar cuál es de mejor resultado. En efecto, las campañas de levantamientos tienen costes (financieros, de tiempo, son pesados), que varían según los sitios. Ahora bien, estos costes son factores que limitan la realización correcta de un plan de muestreo, especialmente en lo referente al tamaño de la muestra. Recordemos que, in fine, se quiere estimar ciertas característica de la población con una precisión que se fija a priori. El alcanzar esta precisión, para una estrategia dada, depende de la variabilidad de la característica en el seno de la población. Si ésta es elevada, es evidente que el tamaño de la muestra deberá ser importante. Entre todas las estrategias factibles, la precisión deseada no se obtendrá al mismo coste. Así, en situaciones de limitación, es indispensable evaluar las estrategias de muestreo mediante una relación entre la precisión y el coste, llamada eficiencia.

Incluso si se está forzado a elegir el plan de muestreo que parece más pertinente, esta elección es siempre una apuesta. No es nada sencillo evaluar los riesgos inherentes a tal o cual plan, aun descomponiendo el error cuadrático medio en función de los diferentes parámetros que caracterizan a un plan de sondeo (índice de sondeo, número de parcelas, superficie y forma de las parcelas, etc.), ya que estos parámetros no son independientes entre sí. Por ejemplo, cuando el tamaño de las parcelas aumenta, el coeficiente de variación entre los rodales disminuye según una relación del tipo

siendo cv el coeficiente de variación de Y, la desviación-tipo de Y, es la media de Yi, k y b coeficientes positivos, y S la superficie de la parcela. En general, b < 0,5, y por ello, para una tipo de sondeo superficial, la precisión disminuye con el tamaño de las parcelas, pero en cambio la eficiencia se puede mejorar.

Ardilly (1994) explica también que "aunque se trate de un parámetro tan simple como una media, se demuestra que no existe un plan de sondeo óptimo, es decir, no hay ninguna combinación "milagro" entre el método de muestreo y el método de estimación que dé lugar, cualesquiera que sean los valores Yi tomados para los N individuos de la población, a un error cuadrático medio menor que el que se puede obtener con cualquier otro plan de sondeo".

Descripción de los planes de muestreo

Recordaremos de momento las ventajas e inconvenientes de los planes convencionales, los planes según un modelo, y después discutiremos los nuevos enfoques que parecen más apropiados para la evaluación de un recurso escaso y disperso, como el de los árboles fuera del bosque.

Planes convencionales. Se denominan así todos los planes de muestreo cuya inferencia se basa en la distribución de probabilidad definida sobre el conjunto de las muestras. Se excluyen los planes llamados secuenciales, en los que se busca la recogida de datos mientras las propiedades del estimador no hayan cumplido con un cierto criterio. Estos planes tradicionales son descritos de forma general por Cochran (1977), y en un marco forestal por De Vries (1986) y FAO (1973). Sus propiedades son muy conocidas y estos planes son aplicables más bien para evaluar el recurso forestal "en el bosque". Dicho esto, pueden ser convenientes también para la evaluación de los árboles fuera del bosque, a condición de que éstos no estén demasiado aislados y demasiado dispersos. Es, pues, deseable tener una idea de la dispersión y densidad del recurso a estimar. Nos contentaremos aquí con dar el principio básico de los principales planes convencionales, y algunos elementos que permitan evaluar la aptitud de los planes para responder a la cuestión.

Planes aleatorios de un nivel:

Planes aleatorios de varios niveles:

El plan aleatorio simple es universal, no requiere ninguna información previa sobre la población y permite aplicar todos los métodos estadísticos clásicos. Como contrapartida, las precisiones de los estimadores serán con frecuencia más fiables que las de los otros planes.

El plan sistemático, muy utilizado en ecología, es interesante por su facilidad de ejecución y por el recubrimiento regular de una zona de estudio. Es más ventajoso que el plan aleatorio simple cuando la población presenta una autocorrelación positiva o una tendencia lineal, pero puede ser catastrófica si la variable presenta una periodicidad que coincide con el paso de la malla.

Los otros planes se basan en la disponibilidad de una información estructural.

El plan de probabilidades desiguales se basa en una probabilidad de selección de una unidad dependiente del valor de la variable auxiliar asociada. Se distingue aquí la probabilidad de selección de la probabilidad de inclusión: la probabilidad de selección es la probabilidad de que se extraiga una unidad durante la constitución de la muestra, mientras que la probabilidad de inclusión representa la probabilidad de que una unidad se encuentre en la muestra, una vez formada ésta. Este plan se recomienda cuando la variable de interés es más o menos proporcional a la variable auxiliar, cuando ésta varía mucho de una a otra unidad y cuando el coste unitario de medida es independiente de la unidad.

El plan estratificado ofrece siempre ventajas de precisión apreciables cuando la estratificación se hace correctamente, sobre la base de un criterio lo más relacionado posible con la variable de interés. En cambio, si los límites de los estratos están mal establecidos, la precisión puede llegar a ser muy escasa. En principio, el número de estratos aumenta la precisión, hasta cierto punto. Se pueden utilizar métodos de clasificación para determinar el número de estratos y sus límites.

El plan en racimos se basa en la misma idea que el plan estratificado, pero sus campos de aplicación respectivos son los siguientes: cuando la varianza intraclases es fuerte y la varianza interclases es débil, se emplea el plan en racimos, y cuando el nivel de las varianzas es inverso, se emplea el plan estratificado.

Finalmente, el plan con varios grados es muy adecuado para las poblaciones naturalmente jerarquizadas, o si se desea estimar los parámetros de interés para diferentes niveles de población.

Muestreo adaptativo en racimos. Este plan comprende dos etapas. La primera consiste en escoger una primera muestra de unidades según un plan clásico. La segunda etapa es equivalente a la segunda fase de un sondeo en racimos, pero según un procedimiento adaptativo: la continuación del muestreo es función del valor de la variable medida. La población está constituida por el conjunto de unidades procedentes de la partición9 del campo de estudio. En primer lugar, se selecciona un subconjunto de unidades mediante un plan convencional para un nivel de sondeo dado. Después, en cada unidad u, se mide el carácter y: si y cumple con una condición previamente definida, se miden igualmente todas las unidades próximas a u. El proceso continúa mientras la variable y observada en cada unidad próxima cumpla con la condición.

Por ejemplo, imaginemos pequeños bosquetes dispersos con escasa densidad sobre una superficie bastante grande. Es evidente que en esta situación el plan aleatorio simple es muy poco eficiente. El parámetro a estimar es el número total de árboles en la región. La región se divide en subunidades u (cuadradas o rectangulares) sobre las cuales se mide la variable y y el número de árboles contenido en u. La condición impuesta es la presencia de un árbol (al menos). La vecindad de una unidad está formada por ocho celdas que la rodean de forma inmediata. En primer lugar, se saca la muestra de partida mediante una extracción aleatoria simple, y después se mide y para cada una de las unidades de la muestra.

Si y 1, entonces se observan las ocho unidades de la vecindad, y después, para cada una, se examinan de nuevo las unidades de su vecindad si y 1, si no es así, se detienen las medidas. Si la unidad de la muestra de partida no cumple la condición, no se visita su vecindad.

En definitiva, todas las unidades pertenecientes a la muestra de partida, y todas las que son objeto de una medida (incluidas las celdas vecinas en las que y = 0), forman parte de la muestra final. Se ve, por tanto, que se ha realizado un plan de muestreo en racimos de tamaños variables.

Esta técnica está particularmente adaptada para la evaluación de un recurso escaso, reagrupado en agregados que están bastante dispersos en la región de estudio. Este tipo de inventario se ha aplicado muy pocas veces, en el estado actual de la bibliografía, y por tanto ha sido poco contrastado en la situación real. En cambio, Thompson (1992) comparó sistemáticamente los planes convencionales con su versión adaptativa, lo que implica el mismo tipo de plan en la primera fase. Sobre la base de estos estudios, la eficiencia del ASC es tanto más alta, en relación con los demás planes, cuanto más importante es el tamaño de la muestra y cuanto más fuertemente agregada esté la población.

Muestreo en transecto dirigido. Es de nuevo un plan en dos fases que necesita una variable auxiliar en la segunda fase. Esta técnica, propuesta por Stahl et al. (2000), no ha sido nunca empleada sobre el terreno, y sólo ha sido objeto de una comparación (por simulación) con un muestreo sistemático en transectos continuos. Sin embargo, se presenta aquí, porque podría ser muy prometedora en ciertos casos.

Se divide el campo de estudio en transectos compuestos por varias bandas contiguas divididas en cuadrados. A cada cuadrado se le asocia un valor de la variable auxiliar. Se comienza por constituir una muestra de transecto según un determinado plan. Después se define un camino de paso de un cuadrado a otro, en función de una estrategia de selección dependiente de la variable auxiliar.

Por ejemplo, una muestra de transecto está constituida por una extracción aleatoria simple, o bien por una extracción con probabilidades desiguales proporcionales a la suma de la variable auxiliar sobre el transecto. Los autores han examinado tres estrategias de selección de los cuadrados en la segunda fase:

Los autores comparan el muestreo por transecto dirigido (GTS) con el plan tradicional por transectos continuos (TCS), para un nivel de muestreo idéntico y seis tipos de bosques clasificados según la abundancia y dispersión del recurso. Llegan a la conclusión de que el GTS es más eficaz que el TCS cuando la población es escasa, y que se obtiene la mejor precisión con la estrategia 2. Señalan igualmente que este método debe ser estudiado más profundamente antes de ser aplicado sobre el terreno.

Muestreo por conjuntos clasificados. Este método se utiliza poco, aunque puede resultar interesante en el caso en que la variable de interés sea difícilmente observable o demasiado costosa de medir. El procedimiento tiene dos fases y se basa en la existencia de una variable concomitante. En primer lugar, se constituye una muestra aleatoria simple de tamaño m x m, que se divide de forma aleatoria en m muestras de tamaño m. Las unidades de cada muestra se clasifican después en orden creciente sobre la base de la observación de la variable concomitante. Esta "observación" cubre todos los medios de evaluación poco costosos, como una clasificación visual (por tamaño, color...) o la opinión de expertos, etc. Durante la segunda fase, se mide la variable de interés sobre m unidades seleccionadas de la forma siguiente: la unidad de clase 1 en la primera muestra, la unidad de clase 2 en la segunda, y así sucesivamente hasta la m-sima en la última. Esta segunda fase se repite r veces, a partir de r nuevas divisiones aleatorias de las m2 unidades. En total, se efectúan mr medidas. Este método es una alternativa al inventario estratificado aleatorio, mucho más eficaz cuando los costes de la estratificación son elevados en comparación con los de la clasificación, y cuando la variable auxiliar está escasamente correlacionada con la variable de interés. También es una de las técnicas raras capaz de integrar informaciones no cuantitativas (que sirven de base de clasificación), como las opiniones de expertos.

Enfoque modelo

Frente a la aparición del concepto de información auxiliar, por una parte, y a la dificultad de definir una estrategia de muestreo óptimo, por otra, ciertos estadísticos como Basu (1971), Brewer (1963) y Royal (1971) propusieron, en los años 70, estructurar los valores de la variable de interés: consideraron simplemente que los valores de Yi no son cantidades fijas, sino variables aleatorias reales. La población observada no es, pues, más que una realización de la colección de variables aleatorias. Se habla con frecuencia de modelo de superpoblación. La ventaja matemática es inmediata, la información total contenida por el parámetro de tamaño N, es decir, por Y1, Y2,... Yn), se puede resumir enteramente en el caso más sencillo por un número, y se puede pensar que las variables Yi están idénticamente e independientemente distribuidas según una ley de Poisson (definida por un solo parámetro λ). Se puede demostrar entonces que este nuevo enfoque permite definir planes óptimos en ciertas familias de planes de muestreo. Los cálculos de los errores se simplifican por la reducción del tamaño del parámetro del que dependen, y se pueden comparar los planes. Otra consecuencia de este enfoque es que la elección del estimador se hace completamente independiente del plan de muestreo; en otras palabras, se puede constituir la muestra a su modo. Evidentemente, este método lleva consigo algunos riesgos ligados a la adecuación del modelo a la distribución real de la variable. Si el modelo está muy alejado de la realidad, la inferencia puede dar resultados muy malos, es decir, estimadores muy sesgados o de varianza muy elevada.

Dos corrientes destacan en la bibliografía: los planes cuya inferencia depende totalmente del modelo y aquéllos que se basan en un modelo que permanece siempre sólido (Särndal et al., 1992).

Planes complejos

En muchos casos, será particularmente interesante mezclar varias estrategias de sondeo: por ejemplo, se podrá comenzar por estratificar el espacio, y después adoptar en cada una de las subregiones un plan que parezca adaptado a la subpoblación sondeada (un muestreo sistemático, con probabilidad desigual, etc.; una muestra que dependa de las informaciones de que se dispone sobre cada una de ellas).

Las expresiones de los estimadores y sus características estadísticas se hacen entonces complicadas, incluso no se pueden tratar analíticamente, aunque la comparación entre planes complejos no se considera, incluso con planes "sencillos". La utilización de este tipo de plan se basa en una apuesta: se supondrá que la eficacia será superior, si se ha optado por varios planes que se piensa que están adaptados a las formas de variabilidad de las subpoblaciones a que se aplican.

Elección del plan: una decisión con limitaciones

En esta última parte, resumimos las etapas del análisis que debería ayudar al usuario a escoger la categoría de planes que responda mejor a su objetivo (Recuadro 49).

Incorporar la información. Como se ha subrayado en los párrafos anteriores, es esencial examinar si existen variables auxiliares. Si éstas están disponibles antes del muestreo, hay que elegir entre dos estrategias: o se incorporan en el plan, o en la fase de estimación. En realidad, la elección está dirigida por la naturaleza de la variable y el grado de relación, supuesto o conocido, con la variable de interés. Si no se dispone de variables auxiliares, es evidente que el sondeador intentará medir las menos costosas y las más informativas.

Modelizar las limitaciones. Las varianzas de los estimadores son funciones decrecientes del tamaño de la muestra; para un plan dado, es suficiente incrementar el tamaño de la muestra para aumentar la precisión del estimador y, por consiguiente, el coste del inventario (así como el tiempo de su realización). Un buen criterio de elección del plan de muestreo es la relación entre precisión y costes, llamada también eficiencia. El cálculo de este ratio implica que se pueda cuantificar (o estimar) los costes de observación de las unidades de la población, que comprenden: la medición de la variable de interés, de las variables auxiliares y los costes fijos (salarios, material de medición, tratamiento de los datos, etc.). En principio, se busca a continuación la estrategia que consigue el máximo de eficiencia.

Recuadro 49 .

Métodos de evaluación de los productos forestales no leñosos

En los años 90, los productos forestales no leñosos, salidos de su situación de productos secundarios, han sido objeto de un interés creciente. Se ha planteado entonces la cuestión de la evaluación e inventario de estos productos. Las investigaciones en este campo constituyen una experiencia previa, que debe contribuir a la reflexión sobre el inventario de los árboles fuera del bosque. Wong (2000) ha analizado los métodos de evaluación de los productos forestales no leñosos y sus límites desde el punto de vista biométrico y estadístico. La calidad biométrica de los estudios se ha juzgado según dos criterios: los sesgos en la concepción de la muestra (aleatoria o sistemática) y el tamaño de la muestra. Según Wong (2000), sólo el 38 por ciento de los estudios analizados se pueden considerar rigurosos en sentido biométrico; el 35 por ciento de los estudios han utilizado un muestreo subjetivo, y la mayoría de las veces la elección de parcelas se ha hecho en sitios denominados "representativos". Los estudios con muestra restringida (el 49 por ciento de los estudios utilizan menos de veinte unidades) han sido realizados por personas procedentes del campo del desarrollo social o de la etnobotánica. Parecería que el recurso a una muestra restringida se ha hecho corriente en los trabajos recientes. Los inventarios de productos forestales no leñosos han utilizado esencialmente protocolos de silvicultura. Wong (2000) deplora que las metodologías de otras disciplinas no se hayan tenido en cuenta ni se hayan adaptado. El autor subraya la falta casi total de investigaciones interdisciplinares. Los principales obstáculos para el desarrollo de protocolos biométricamente fiables para los productos forestales no leñosos son su diversidad, por una parte, y por otra su distribución particular en agregados raros y dispersos. La ausencia de metodologías adaptadas a estas limitaciones de distribución es un desafío que hay que aceptar, tanto para los productos forestales no leñosos como para los árboles fuera del bosque.

Evaluar la eficiencia del plan. En la mayoría de los casos, el cálculo analítico no permitirá comparar la eficiencia de cada plan considerado. Se procede por simulaciones: hay que comenzar por modelizar la distribución de los valores de la variable de interés sobre el conjunto de las unidades de la población, la de las variables auxiliares, de los costes, y después, para cada estrategia, constituir un conjunto de muestras a partir de las cuales se evaluarán el sesgo y la varianza de los estimadores. Comparar varias estrategias resulta enseguida pesado, por lo que se recomienda vivamente proceder a un muestreo previo. Se trata de recoger las observaciones sobre algunas unidades (escogidas según un plan probabilístico o no), que permitan hacerse una idea de la varibilidad del fenómeno estudiado. Esta información permite reducir el campo de posibilidades tanto en materia de distribución de las variables como en tipos de planes. También permite evaluar el grado de correlación entre las variables de interés y auxiliar. Incluso sin realizar este estudio, el muestreo previo sirve para fijar el nivel de sondeo (para un plan dado). Es, por tanto, interesante, aunque sólo sea por esta razón, efectuarlo antes de la realización del inventario. Pensar en el muestreo previo implica también pensar de nuevo en la evaluación de la eficiencia: hay que incluir el coste de este muestreo previo en el del inventario, y ¡de nuevo se plantea la cuestión de estrategia en términos de eficiencia! ¿Qué tamaño debe tener la muestra previa y según qué plan debe estar constituida? Nos parece esencial poseer una información de calidad (no demasiado imprecisa) antes de proceder al inventario y, por consiguiente, calcular su precio. Si se decide mantener el mismo plan, una parte del inventario estará ya efectuada. Si no es así, se debería lograr una precisión igual o superior para costes similares, puesto que el plan considerado será en principio más eficiente, y por tanto menos costoso, y compensará el coste del inventario previo.

¿Pasar de una a otra escala? Se podría plantear de nuevo la pregunta en términos más estadísticos: ¿cómo pasar de una estimación local a una estimación global? Aunque la geoestadística responde bien a este problema, no es seguro, en cambio, que los planes de sondeo puedan por sí solos responder a esta pregunta. El método más sencillo consiste en hacer una regla de tres para pasar de un campo pequeño a un campo más amplio. Se supone entonces implícitamente que la distribución de las variables es la misma en los dos campos. Muchos estudios geoestadísticos (Cressie, 1991) han demostrado, por el contrario, que la variabilidad aumenta con la extensión del campo y, por consiguiente, este procedimiento corre el grave riesgo de producir estimaciones tachadas de un sesgo elevado y de subestimar las varianzas. Se puede también utilizar un modelo (modelos en las subregiones) de la población para la zona considerada: los parámetros se estiman a partir de la muestra(s). Con esta óptica, el muestreo se puede optimizar entonces con el fin de suministrar estimaciones precisas de los parámetros del (de los) modelo(s). El plan de sondeo que respondería mejor a esta preocupación sería el muestreo con varios grados o en varias fases, incluso el muestreo sistemático, cuando se esté seguro de la falta de periodicidad de la variable.

Validación: un trámite necesario. En general, no se sabe si el plan de muestreo y el tamaño de la muestra son los convenientes. A pesar de todo, sería interesante poder medir realmente la adecuación del plan de sondeo al objetivo perseguido. Para ello, podemos imaginar varios procedimientos. Se puede aumentar el tamaño de la muestra con el fin de cubrir una mayor variabilidad (eventual) y utilizar a continuación métodos estadísticos de remuestreo (Davison y Hinklet, 1997), o métodos de validación cruzada (Droesbeke et al., 1987). Se puede elegir también una muestra en la que ciertas submuestras podrían proceder de otros planes de sondeo, sin perjuicio de añadir después algunas unidades sensatamente escogidas. Por ejemplo, podemos realizar un sondeo estratificado aleatorio que permita también un sondeo en racimos.

Tamaño y forma de las unidades de sondeo

Por una parte, para obtener la mejor precisión con un mismo tipo de sondeo, es mejor en teoría numerosas parcelas pequeñas (unidad de sondeo) que pocas parcelas grandes; pero la eficiencia no sigue este principio (Figura 6). Existe un tamaño de parcela óptimo que dependerá especialmente de los costos locales de desplazamiento y de personal.


Figura 6. Evolución de la eficiencia en función del tamaño de las parcelas.

Por otra parte, es preciso que la muestra observada en cada parcela sea representativa de la población estudiada. Por ejemplo, ¿puede un solo árbol representar a un parque arbolado?

Esta limitación tiene dos implicaciones:

En cuanto a la forma de las unidades de sondeo, la teoría recomienda las parcelas circulares, que tienen menos árboles de linde con relación a otras formas de igual superficie. Sin embargo, es evidente que esta forma circular no es la más adecuada para los tipos de árboles fuera del bosque que tienen una geometría lineal (setos, cortavientos, árboles de alineación), para los cuales serán preferibles parcelas rectangulares alargadas. Además, en la práctica, las grandes parcelas circulares no son siempre fáciles de instalar.


3 O varios, para simplificar, se seguirá dentro del marco de la medición de un carácter. En el caso de que se estimen varios parámetros a partir de varias variables, se tendrá presente que es difícil, incluso imposible, escoger un plan de muestreo óptimo para todos los parámetros a estimar.

4 Nos situamos únicamente en el marco de poblaciones finitas (compuestas de un conjunto enumerable de elementos), pero no hay que olvidar que existen poblaciones infinitas. Éstas son de tamaño muy grande (el número total de moscas de la tierra, etc.), o sea, innumerables por naturaleza, por ejemplo, la concentración química de nitratos en el suelo. Pero desglosando esta población (dividiendo el suelo en bloques), se puede volver al caso finito, para el que se han desarrollado esencialmente las herramientas estadísticas.

5 Se ha escogido un vocabulario apropiado para el campo estadístico, por tanto más general: así, la muestra sería calificada como encuesta o sondeo en el campo socioeconómico, y como inventario en el campo de las ciencias naturales. Como para nuestro propósito nos valemos de diversas fuentes, encontraremos diferentes formulaciones, pero siempre que sea posible volveremos a los términos empleados en el medio forestal.

6 En relación con la nota precedente, se utilizará también el término de plan de sondeo.

7 O también llamada covariable o variable concomitante: en realidad estos términos son menos estrictos, ya que indican variables que no son medidas necesariamente en el conjunto de la población.

8 Inferencia o estimación.

9 Partition: découpage d'une surface en unités contiguës, non chevauchantes et dont la réunion forme la surface totale.

Página PrecedenteTop Of PagePágina Sucesiva