ESTADÍSTICA MULTIVARIANTE
La estadística multivariante se aplica con menor frecuencia al diagnóstico médico que a la investigación clínica. Los paquetes estadísticos utilizados más corrientemente en investigación clínica, el BMDP, el SAS y el SPSS, incorporan procedimientos como la regresión logística, el análisis discriminan-te y otros que permiten un análisis riguroso. Los puntos que se han de considerar en el contexto del diagnóstico médico son el análisis de la causalidad, los métodos de selección de variables y la teoría del reconocimiento de patrones, cuyo conocimiento es un paso previo a la comprensión de los métodos de la inteligencia artificial.
El análisis de la causalidad se basa en que la demostración de la determinación en medicina se fundamenta en cuatro puntos:
1. Una secuencia temporal razonable, la cual implica que la causa haya actuado antes de producirse el efecto, y no después. 2. El concepto de causa suficiente, el cual implica que cuando la hipotética causa está presente se produce siempre el efecto. 3. El concepto de causa necesaria, que implica que para que se produzca el efecto, la causa ha de estar presente y, si no lo está, el efecto no se produce. 4. Causa necesaria y suficiente, situación que significa que la causa ha de estar presente y siempre que lo está, además, se produce el efecto. La existencia de excepciones a esta lógica de la determinación es origen de incertidumbre y se debe a que en medicina los agentes causales suelen ser necesarios, raras veces suficientes, a menudo muestran relaciones temporales variables y coexisten causas de todo tipo para un mismo efecto. Se acepta una asociación de causalidad si la actuación del factor considerado aumenta la frecuencia o la incidencia de una enfermedad.
El problema de la selección de variables es una consecuencia del análisis de la causalidad cuando son varios los posibles factores concurrentes. La aproximación estadística a los límites de la lógica no es sencilla y se suele acudir a la modelización matemática. Los modelos lineales, de tipo cartesiano, son los más sencillos y el efecto esperado puede representarse por una ecuación de regresión múltiple o discriminante del tipo:
y = a + b1X1 + b2X2+ ... + bnXn
Las condiciones de aplicación de estos modelos no se dan siempre y las relaciones pueden, además, no ser lineales. La función de regresión logística se adapta mejor a este otro tipo de problemas, con una fórmula general similar a:
1Y= ---------------------------- exp (a + b1X1 + ... + bnXn)
permitiendo también una selección de variables. Hay, además, otros procedimientos estadísticos que el lector encontrará en manuales especializados.
El reconocimiento de patrones es el resultado de la aplicación de un conjunto de variables agrupadas según una función (función discriminante, logística, etc.), al que se denomina "clasificador". Se trata, pues, de analizar estadísticamente las agrupaciones naturales de signos y síntomas en torno a diagnósticos. Es posible que el "clasificador estadístico" que se construya sea distinto del "clasificador clínico" que elaboraría un médico. Cada uno de ellos representa un bloque evaluable con los mismos criterios de sensibilidad, especificidad y predictividad que se han citado para un síntoma único. Si el resultado de la función de regresión, logística u otra, es una magnitud continua, se pueden utilizar las curvas ROC o de rendimiento diagnóstico para comparar resultados. Los clasificadores pueden ser fijos o variables. En el caso de los clasificadores variables el sistema es capaz de ir modificando la matriz de probabilidades originaria, con lo que puede decirse que es capaz de actualización o aprendizaje