Página precedente Indice Página siguiente


Capítulo 1 - Diseño experimental


Objetivos
Aspectos prácticos
Evitar experimentos "antes y después"
Estadísticas
Resultados anómalos y extrapolación
Conclusión

Objetivos

Como se explica en el prólogo, el presente Boletín no está destinado a la investigación pura o a la adquisición de conocimientos teóricos, sino a la búsqueda de respuestas prácticas a preguntas prácticas. Por ello, el punto de partida de todo programa debe consistir en determinar con exactitud y precisión qué es lo que se desea conocer y cómo se van a utilizar los conocimientos. Sir Charles Pereira, edafólogo experimentado, sugiere lo siguiente:

"Es preciso hacer una clara distinción entre dos tipos de mediciones experimentales:

· una estimación auténtica de la media aritmética de una cantidad altamente variable, como las precipitaciones, la cual será utilizada en una estimación cuantitativa, y

· una ilustración de la amplitud y el orden de magnitud de una variable respecto de la cual no se puede hacer una estimación válida de la media aritmética a partir de un número razonable de mediciones como la pérdida de suelo por hectárea/año, dado que este concepto abarca las variaciones del tipo de suelo, el drenaje, la cubierta vegetal, las alteraciones mecánicas, la pendiente, el aspecto y la exposición a las corrientes descendentes de las colinas.

Existe más peligro de una utilización poco científica en la medición de segundo tipo, expresada en toneladas/km2, como si tuviera la base lógica y estadística del primer tipo".

Es una precaución razonable comprobar si ya existe la información que se necesita. Es poco probable que el técnico de campo del proyecto tenga el tiempo y los medios necesarios para hacer una revisión bibliográfica, pero el personal de apoyo técnico de la sede si está en condiciones de utilizar los sistemas de almacenamiento y recuperación de datos de que actualmente se dispone. Un problema importante radica en que los experimentos sencillos y prácticos de campo que se proponen no suelen estar adecuadamente definidos o están incluidos en documentos sobre proyectos difíciles de encontrar.

En las regiones tropicales los daños causados por eventos extremos, que si bien ocurren raramente, pueden ser mucho más graves que en climas menos agresivos. Esto es particularmente cierto en lo que respecta a la pérdida de tierras de cultivo y a la expansión de las cárcavas. Es preciso, por tanto, buscar un equilibrio entre la instalación de un canal de aforo que pueda medir inundaciones extremas en un período de 20 años, aunque sea poco probable que se produzcan durante el experimento, o la instalación de un canal de aforo que pueda medir inundaciones con una frecuencia probable de cinco años y correr el riesgo de que sea sumergido por inundaciones mayores.

Aspectos prácticos

Pocos datos válidos son más útiles que una gran cantidad de información que no se puede utilizar porque no es confiable. Por consiguiente, las evaluaciones de campo deben ser lo más sencillas posibles y estar orientadas a objetivos limitados y alcanzables. Existe siempre una gran tentación de tratar de obtener una gran cantidad de información incluyendo un número excesivo de variables o de niveles dentro de cada variable. Al planificar un programa de experimentos se ha de tener presente los recursos disponibles, teniendo en cuenta los gastos iniciales y de funcionamiento y el personal requerido para llevar a cabo los experimentos.

Debe rechazarse la idea de que cualquier información es mejor que ninguna. Esto se utiliza a veces para justificar ensayos "rápidos y de poca calidad" o como una excusa para no efectuarlos de manera adecuada. Sin embargo, está totalmente reñido con la disciplina científica. El empleo de datos inexactos o poco confiables es muy probable que cause problemas, en lugar de mejorar la situación.

¿Cuánto tiempo durarán los experimentos? Debido a la variabilidad de la escorrentía de un año a otro, la duración debe ser lo más larga posible; sin embargo, se tropieza con dificultades prácticas. ¿Cuánto va a durar el proyecto y qué va a suceder al final? ¿Qué posibilidades existen de que pueda continuar después de la primera fase? ¿Podrá proseguir el proyecto si el personal que inició los experimentos es transferido o sustituido? La solución práctica consiste en iniciar únicamente las actividades que se puedan completar en el tiempo y con los recursos de que se dispone. A veces puede ser posible programar un componente adicional que pueda ponerse en funcionamiento si el proyecto se prolonga, pero esto sólo es prudente si se trata de una opción adicional y no si su ausencia reducirá el valor del plan básico.

Puede ser que resulte posible extrapolar a corto plazo los datos de las precipitaciones si se dispone de registros a más largo plazo; por ejemplo, en el caso de una pérdida anual de suelos que se midió durante dos años, cuando en un año las precipitaciones fueron inferiores a la media y en el otro superiores a la misma. Los registros de las precipitaciones a largo plazo pueden dar ciertas indicaciones de la frecuencia con que cabe prever que se produzcan esas pérdidas, pero únicamente si existe una relación directa entre lo que se mide - la pérdida anual de suelo - y el registro a largo plazo - las precipitaciones anuales totales. Existirá una asociación, por supuesto, porque cuanto mayores sean las lluvias, mayor será la erosión; sin embargo esta relación es tan imperfecta que tiene escaso valor debido a que ignora factores importantes como la cantidad de lluvia caída en el suelo desnudo y la cantidad caída sobre los cultivos. Un principio básico de toda ciencia consiste en evitar la extrapolación más allá de los límites de los resultados medidos.

En el trabajo experimental es importante establecer una relación entre causa y efecto. Si se mide algún cambio o diferencia, hace falta saber cual es la causa, y no es suficiente saber que pueden existir una o más causas. En los ensayos realizados en los centros de investigaciones este problema se evita cambiando un sólo factor cada vez, o sea, se aíslan las variables con el fin de que si se mide un cambio quede claro cuál es su causa. Esto no siempre es posible o necesario en los ensayos de campo. Puede ser útil saber que un conjunto de prácticas agrícolas da mejor resultado que otro, pero es preferible saber cuáles de los componentes del conjunto son las más importantes para producir el cambio.

El problema de la investigación en el campo del agricultor es que difícilmente las variables se pueden separar y controlar. Sirvan de ejemplo los estudios realizados en Kenya concebidos para verificar si el programa global de conservación podía mostrar un aumento del rendimiento del maíz en los campos donde se había aplicado el programa. Se analizaron datos de los campos de los agricultores y los resultados sugirieron que hubo un aumento. Sin embargo, el paquete de medidas aplicadas para la conservación de suelos, incluía construir terrazas de tierra, utilizar semillas mejoradas, más fertilizantes y prácticas de cultivo perfeccionadas; el efecto de cada uno de esos factores no se pudo evaluar por separado, por lo que la información obtenida tuvo una aplicación muy limitada. Es posible que las semillas mejoradas hubieran producido el aumento sin el uso de fertilizantes adicionales, o que el mayor empleo de fertilizantes hubiera producido el mejoramiento del rendimiento de las variedades tradicionales del maíz y, si la construcción de terrazas mejoraba la humedad del suelo, esto también hubiera podido conseguirse con métodos más sencillos.

Evitar experimentos "antes y después"

Un método que a veces se emplea para evaluar el efecto de algún cambio consiste en efectuar una serie de mediciones antes del mismo y compararlas con una serie similar realizada después. Esto es sencillo pero fundamentalmente incorrecto debido a que no hay forma de identificar si la diferencia ha sido causada directamente por el tratamiento o procede de alguna otra causa o cambio entre los dos conjuntos de mediciones. La Figura 1 muestra un ejemplo de ello. Se realiza un experimento para calcular el efecto del cambio de la intensidad del pastoreo en la escorrentía en una pequeña cuenca hidrográfica; las mediciones de la escorrentía semanal total se trazan en comparación con las precipitaciones semanales, y al final de la temporada entre 20 y 30 puntos parecen indicar una correlación estrecha. En la temporada siguiente se aplica el tratamiento, consistente en duplicar el número de animales en pastoreo, y al analizar los resultados al final de la misma se encuentra que la relación es considerablemente diferente. El problema radica en que no es posible asegurar que la diferencia haya sido causada por el tratamiento y no refleje el hecho de que las precipitaciones durante la segunda temporada fueron diferentes. Si las precipitaciones son mucho más intensas, esto podría por sí solo explicar el caudal superior de la escorrentía. No existen medios de análisis estadístico que permitan superar esta dificultad y en las observaciones se ha permitido que una variable incontrolable e inmensurable se introdujera y creara confusión; no hay manera de suprimir este efecto.

La técnica que se utiliza para evitar este problema es la de parcelas apareadas. Se eligen dos parcelas lo más similares posible (dos parcelas no podrán ser nunca idénticas), y se calibran, es decir, se mide la diferencia entre ellas indicando los valores de algunos parámetros adecuados de una parcela en comparación con la otra, como en la Figura 2. Pasado cierto tiempo, la relación entre las dos parcelas resulta evidente; este tiempo depende de la frecuencia de las observaciones. La representación gráfica de los valores diarios evidenciarán más rápidamente la relación entre estos datos que la representación gráfica semanal o mensual de los mismos. Si las dos parcelas fueran idénticas, la representación gráfica sería una línea recta a 45° desde el origen. El tratamiento se aplica a continuación a una parcela y se repite la serie de mediciones. Si existe ahora alguna variación en las precipitaciones o en algún otro aspecto del clima, esta afectará por igual a ambas parcelas y, en consecuencia, una nueva relación sólo podrá deberse al tratamiento elegido que es la única variable.

FIGURA 1 - Con los experimentos "antes y después" el efecto del tratamiento no se puede separar del efecto del cambio de las precipitaciones

FIGURA 2 - Calibración de parcelas apareadas antes del tratamiento

La conclusión es que se han de evitar los ensayos "antes y después" de procesos que pueden ser influidos por el clima, en particular por las precipitaciones.

Estadísticas

Los detalles del diseño experimental y del análisis estadístico de los resultados quedan fuera del alcance del presente Boletín, pero es conveniente revisar rápidamente algunos puntos importantes. Si se están examinando las relaciones entre causa y efecto, la clave del diseño experimental consiste en aislar y en medir el efecto de las variables. El problema radica en que en todos los procesos biológicos existe un vasto número de variables que pueden influir en el proceso, cada una de las cuales presenta una amplia gama de valores, y que es difícil separarlas.

Muestreo

El método de muestreo y el tamaño de la muestra son importantes. Para que una muestra resulte representativa de toda la población, debe ser lo suficientemente grande como para reflejar la variación dentro de la misma. Por ejemplo, para evaluar el rendimiento de un campo de maíz, se podría medir el rendimiento de una planta y multiplicarlo por el número de plantas del campo. Sin embargo, las plantas difieren considerablemente en su rendimiento; sin duda se obtendrá una estimación más exacta midiendo, por ejemplo, 20 plantas y obteniendo un resultado, sin duda más verosímil y más cercano al que se obtendría con la medición de todas las plantas.

Diferencias

Normalmente el objetivo consiste en estimar las diferencias antes que los valores absolutos. Por ejemplo, los ensayos muestran que una variedad produce 1,5 t/ha y otra variedad 1,6 t/ha. Es posible calcular si la diferencia es estadísticamente significativa a diversos niveles de probabilidad; pero esto es irrelevante puesto que ningún agricultor va a cambiar de variedad sobre la base de esa pequeña diferencia en el rendimiento cuando existen otros factores que se han de tomar en consideración como el gusto, el mantenimiento de la calidad, la resistencia a las enfermedades, etc.

Se ha de tener cuidado al expresar las diferencias como porcentajes, ya que ello puede resultar erróneo o engañoso. Por ejemplo, el resumen de un informe de investigación señala que la pérdida anual de suelo de una parcela con el tratamiento A fue del 80% menos que la pérdida de una parcela con el tratamiento B. Esto puede parecer impresionante hasta que se encuentra que las cifras eran de 100 kg/ha y de 20 kg/ha, o sea que la pérdida de suelo fue insignificante en ambos casos.

Se debe evitar asimismo informar sobre los resultados en forma confusa. Por ejemplo, se efectuó una comparación entre cinco parámetros diferentes para calcular la erosividad de las precipitaciones y el resultado indicó que el No 4 era "el mejor estimador". Sin embargo, el informe completo revelaba que el coeficiente de correlación era superior al 0,9% para los cinco parámetros, y que el "mejor" se situaba a 0,955. Una conclusión más razonable habría sido, en cambio, decir que los cinco parámetros eran eficaces y que se debería recomendar el más sencillo y fácil de utilizar.

Repeticiones

Volviendo a la cifra de rendimiento de los ensayos de variedades de 1,5 t/ha, es necesario saber qué grado de exactitud tiene. ¿Significa esta cifra que es bastante seguro decir que se encuentra entre 1,0 y 2,0 t/ha, es decir, 1,5 ± 0,5, o entre 1,4 y 1,6 t/ha, es decir, 1,5 ± 0,1? A esto sólo se puede responder haciendo uso de repeticiones; con una única observación no hay forma de saberlo.

Hace muchos años, cuando la aplicación de las estadísticas a la investigación agrícola daba sus primeros pasos y se estaba estableciendo un amplio programa de investigaciones en Africa, dijo: "Sólo estamos tratando de obtener resultados que los agricultores puedan entender y aplicar; no interesan las cifras que hace falta explicar con estadísticas". En consecuencia, todos sus experimentos tuvieron muchos tratamientos y ninguna repetición; craso error que después se lamentó por mucho tiempo.

Tratamientos

Repeticiones de cada tratamiento

12

1

6

2

4

3

3

4

2

6

1

12

Siempre habrá alguna variación natural en lo que se está midiendo y también algún error en la medición. Se utilizan las repeticiones, es decir, en teoría situaciones absolutamente idénticas, para dar una evaluación que sea aceptablemente confiable y segura. La dimensión del experimento siempre tiene limitaciones como los costos, la mano de obra o la superficie, por lo que hay que buscar una solución de transacción entre el número de tratamientos y el número de repeticiones. Si se pueden financiar 12 parcelas en un experimento de campo, se podrían distribuir como se indica en el recuadro.

Los dos extremos son a todas luces no recomendables, pero ¿cómo elegir entre las otras cuatro posibilidades? Para un experimento a largo plazo importante podría valer la pena realizar un ensayo experimental. Habría que tomar mediciones de 10 o 12 repeticiones y estudiar la variación; por otra parte, es posible calcular cuál es el número mínimo de repeticiones que darán una precisión aceptable. Como esto es inadecuado para experimentos de campo sencillos, habrá que recurrir a algunas reglas simples. Si la pérdida de suelo de dos repeticiones es de 2 kg y 8 kg, una media de 5 kg es un dato bastante impreciso. Si tres repeticiones arrojan 2 kg, 8 kg y 7 kg, podría tenerse algo más de confianza en una media de 6,5 kg, pero seguirán existiendo dudas acerca del resultado de 2 kg. ¿Se trata de una medición defectuosa o es la única correcta mientras que las otras dos son erróneas?

En general cuanto mayor es la diferencia entre las mediciones, mayor es el número de repeticiones necesario; sin embargo la dificultad consiste en que, cuando se inicia el experimento, no se sabe cuál será la diferencia probable, por lo que se requiere aplicar algunos criterios arbitrarios.

· La calibración de las parcelas se debe efectuar siempre en las parcelas repetidas antes de aplicar los tratamientos.

· Un número excesivo de repeticiones puede limitar el número de tratamientos que se pueden aplicar, pero los resultados son confiables y, por tanto, útiles. Es preferible un exceso de repeticiones a un número insuficiente de ellas que dará un resultado en el que no se puede confiar.

· Cuanto mayor es el campo de variación de lo que se está midiendo, se necesitarán más repeticiones. Las parcelas para medir la escorrentía ofrecen muchas veces resultados ilógicos debido a que hubo algún procedimiento equivocado (esta cuestión se examina en detalle en el Capítulo 3); en general, un gran número de repeticiones reduce el efecto de una deficiencia mecánica, por ejemplo, que un grifo hubiera quedado, por descuido, abierto.

· Los resultados del mismo experimento en años sucesivos no son repeticiones debido a la variabilidad anual.

A título de juicio subjetivo basado en la experiencia, se sugiere que para el trabajo en las parcelas se cuenta siempre con un mínimo de tres repeticiones y, mejor aún, de cuatro o cinco. Los estudios sobre la varianza y las técnicas de muestreo se enumeran en la sección Otras obras de consulta.

Resultados anómalos y extrapolación

A este respecto, es posible sacar lecciones que ilustren dos aspectos: el peligro de descartar resultados anómalos y el peligro de la extrapolación, es decir, de predecir lo que podría suceder más allá de los límites de las mediciones.

Supongamos que las mediciones de cuatro repeticiones son 1,6, 1,8, 1,7 y 4,5. ¿Se debe suponer que 4,5 es un error y hay que descartar esa cifra, dada una media evidente de 1,7? ¡No! Existe un 25% de posibilidades de que sea la única cifra correcta y que las otras tres sean erróneas. Con sólo tres repeticiones un resultado aparentemente anómalo tiene un 33% de posibilidades de ser correcto, y con sólo dos repeticiones y dos resultados diferentes, cada uno tiene un 50% de posibilidades de ser correcto o erróneo. Otro motivo para efectuar el mayor número posible de repeticiones es que si el número de éstas es elevado, una cifra altamente desviada sólo tendrá un pequeño efecto en la media.

En la ciencia existen pocas anomalías. Cuando un dato obtenido parece sospechoso, ello se debe a una razón que no se conoce todavía - en cuyo caso hay que tratar de entenderla -o a que es un dato falso debido a un error experimental desconocido, por lo que habrá que repetir el experimento hasta que se descubra el error.

A continuación se ofrecen dos ejemplos de anomalías, de las cuales una se resolvió y otra no.

Un estudiante graduado analizaba la relación entre la densidad de la cubierta vegetal y el impacto de las gotas de lluvia en el suelo; los resultados presentaron una curva suave con una extraña cresta como se indica en la Figura 3. El efecto era real debido a que esa cresta apareció también cuando el experimento se repitió de manera independiente; sin embargo, no había razones aparentes para ello. Podría ser una deficiencia desconocida de la técnica, la que tras muchos esfuerzos fue identificada. Se habían utilizado mallas de plástico para dar diferentes niveles de cobertura y la densidad se midió en fotografías de cada malla. Sin embargo, en un lugar la malla era más espesa que en otros por lo que hubo más salpicado alrededor suyo dentro de la malla y menos energía disponible para provocar el salpicado. No se tuvo en cuenta que no es lo mismo la luz que atraviesa una malla que el pasaje de gotas de lluvia.

FIGURA 3 - Anomalía no explicada en la relación entre el salpicado y la cobertura

FIGURA 4 - Calibración de relación de masa de Laws y Parsons (Laws y Parsons 1943)

La segunda anomalía en los resultados experimentales fue la situación opuesta: se suprimieron unos resultados aparentemente falsos por contener un error experimental aunque más tarde la investigación mostró que eran verdaderos. La medición del tamaño de las gotas de lluvia se solía realizar recogiendo las gotas en bandejas con harina y pesando la bolita formada en la harina por cada gota. Una calibración efectuada anteriormente en laboratorio daba la relación entre el peso de la bolita y el peso de la gota de agua, y esta relación se expresaba como una relación de masa. Cuando Laws y Parsons utilizaron este método en 1943, los resultados obtenidos fueron los indicados en la Figura 4 y asumieron que una bolita de harina no podía pesar menos que la gota que la constituía, por lo que ignoraron el punto A; sin embargo, ahora se sabe que, de hecho, esto puede suceder y sucede. Los otros puntos se acercaban a una línea recta, salvo la gota mayor, por lo que ignoraron asimismo el punto B. Se sabe actualmente que ese resultado también era auténtico y que una curva suave a lo largo de todos los resultados es mejor que la relación de línea recta que suponían.

El error en la calibración de Laws y Parsons no alteró el hecho de que fue una investigación brillante y original. Lamentablemente, las ideas originales a veces son tan exitosas que su utilización se extiende más allá de lo que es justificable. La mayoría de las muestras de Laws y Parsons correspondían a intensidades inferiores a 50 mm/h con un número muy reducido de hasta 100 mm/h, y dieron una curva del tipo indicado en la figura 5 que se puede representar por una ecuación de la forma siguiente:

D = aIb

donde D es el diámetro de la gota, I es la intensidad y a y b son constantes.

No obstante, esta ecuación hace pensar que la dimensión mediana de la gota seguirá aumentando a medida que aumente la intensidad y, aunque esto es cierto dentro de los límites de los valores de las mediciones de Laws y Parsons, las investigaciones posteriores, a intensidades superiores, han mostrado que esto no es válido para las intensidades elevadas que se producen en las tormentas de lluvias tropicales. En realidad, existe una explicación física de este fenómeno. Hay un límite al tamaño de las gotas de lluvia que caen debido a que por encima de ese límite pasan a ser inestables y se rompen en gotas más pequeñas; de hecho, ahora se sabe que el diámetro medio de una gota alcanza un máximo y luego disminuye como se indica en la Figura 6. Cuando fue necesario calcular la energía de la lluvia para calcular el factor de erosividad de la Ecuación Universal de la Pérdida de Suelo, la relación de Laws y Parsons entre el tamaño de la gota y la intensidad se extrapoló hasta intensidades de 250 mm, con el resultado de que la energía cinética de las precipitaciones tropicales resultó considerablemente exagerada. Recién en 1987 se revisó el Manual de Agricultura del Departamento de Agricultura de los Estados Unidos para elevar los límites de la energía de las precipitaciones; lamentablemente, hasta entonces muchos estudios sobre las precipitaciones tropicales resultaron confusos o incorrectos a consecuencia de este error básico.

FIGURA 5 - Datos de Laws y Parsons sobre el tamaño y la intensidad de la gota (Laws y Parsons 1943)

FIGURA 6 - Últimos estudios sobre el diámetro de la gota a altas intensidades (Carter et al. 1974 y Hudson 1981b)

La enseñanza es clara: hay que ser prudentes al aceptar o rechazar resultados sospechosos e igualmente cautelosos al efectuar una extrapolación más allá de los límites de los datos medidos. Un libro útil sobre el manejo de los datos experimentales es el de Pentz y Shott (1988).

Conclusión

El mensaje que se debe transmitir es que siempre hay que mantener la máxima sencillez en el diseño experimental y solicitar el asesoramiento de un experto en biometría antes de iniciar los experimentos. A menudo sucede que el experimentador se dirige al estadístico con una caja llena de archivos de datos a fin de que le ayude a analizar los resultados, y luego se siente descorazonado cuando se le dice que el diseño era erróneo y que los resultados tenían escaso valor. Los defectos más probables son, en el caso de estudios sobre cuencas hidrográficas, la precipitación en la aplicación de los tratamientos antes de efectuar una calibración adecuada, o en el caso de un trabajo con parcelas pequeñas, la falta de repeticiones suficientes o la incorporación de variables incontroladas.


Página precedente Inicìo de página Página siguiente