A Procedure for Making Optimal Selection of Input Variables for Multivariate Environmental Classifications

Authors


‡email snelder@lyon.cemagref.fr

Abstract

Abstract: Multivariate classifications of environmental factors are used as frameworks for conservation management. Although classification performance is likely to be sensitive to choice of input variables, these choices have been subjective in most previous studies. We used the Mantel test on a limited set of sites for which biological data were available to iteratively seek a definition of environmental space (i.e., intersite distances calculated with a set of appropriately transformed and weighted environmental variables) that had maximal correlation with the same sites described in a biological space. The procedure was used to select input variables for a classification of New Zealand's rivers that discriminates variation in fish communities for biodiversity management. The classification performed (i.e., discriminated biological variation) better than classifications with subjectively chosen variables. The inherently linear measures of environmental distance that underlie multivariate environmental classifications mean that they will perform best if they are defined based on variables for which there is a linear variation in the biological community throughout the entire range of the variable. Classification performance will therefore be improved when variables that have nonlinear relationships with biological variation are transformed to make their relationship with biological turnover more linear and when the contributions of environmental factors that have particularly strong relationships with biological variation are increased by weighting. Our results indicate that attention to the manner in which environmental space is defined improves the efficacy of multivariate classification and other techniques in which the environment is used as a surrogate for biological variation.

Abstract

Resumen: Las clasificaciones ambientales multivariadas son utilizadas como marcos de referencia para la gestión de la conservación. Aunque el funcionamiento de la clasificación posiblemente es sensible a la selección de variables de entrada, estas selecciones han sido subjetivas en la mayoría de los estudios previos. Utilizamos la prueba de Mantel en un conjunto limitado de sitios para los que había datos biológicos disponibles para buscar una definición de espacio ambiental (i.e., distancias intersitio calculadas con un conjunto de variables ambientales adecuadamente transformadas) que tuviera la máxima correlación con los mismos sitios descritos en un espacio biológico. El procedimiento fue utilizado para seleccionar variables de entrada para una clasificación de ríos de Nueva Zelanda que discrimina la variación en las comunidades de peces para la gestión de biodiversidad. La clasificación funcionó (i.e., discriminó la variación biológica) mejor que clasificaciones con variables seleccionadas subjetivamente. Las medidas inherentemente lineales de la distancia ambiental que subyacen en las clasificaciones ambientales multivariadas significan que funcionarán mejor si son definidas con base en variables que tienen variación lineal en la comunidad biológica en todo el rango de la variable. Por lo tanto, el funcionamiento de la clasificación será mejor cuando las variables que no tienen relaciones lineales con la variación biológica sean transformadas para que su relación con el cambio biológico sea más lineal y cuando la contribución de los factores ambientales que tienen relaciones particularmente estrechas con la variación biológica se incrementa mediante ponderación. Nuestros resultados indican que la atención a la forma en que se define el espacio ambiental mejora la eficacia de la clasificación multivariada y otras técnicas que utilizan al ambiente como un sustituto de la variación biológica.

Ancillary