MÉTODOS DE REGRESIÓN
Los métodos de regresión permiten establecer cuál es la influencia de cada una de las exposiciones estudiadas (variables "independientes") sobre la variable de interés, habitualmente la enfermedad (variable "dependiente"). Aunque existen varios métodos de regresión, todos ellos son casos particulares de un tipo más general de métodos estadísticos denominados modelos lineales generalizados. Estos métodos de regresión permiten estimar el efecto de una exposición, ajustado por el efecto de varias variables de confusión. Así, en el estudio de cohortes de Framingham se quería determinar la magnitud de la asociación entre niveles aumentados de colesterol y enfermedad coronaria. Sin embargo, existían otros factores de riesgo que podían actuar como factores de confusión en la asociación entre el colesterol y la enfermedad coronaria, al poder estar asociados a niveles aumentados de colesterol: edad, hipertensión arterial, obesidad, concentración de hemoglobina, consumo de tabaco y alteraciones del ECG (signos de hipertrofia ventricular izquierda). Se utilizó el método de regresión logística, para estimar el efecto de niveles aumentados de colesterol sobre el riesgo de presentar enfermedad coronaria, ajustado por el efecto de la edad, la presión sistólica, la obesidad, la hemoglobina, el consumo de tabaco y las alteraciones del ECG (TRUETT et al, 1967). Los métodos de regresión permiten estimar el efecto de cada una de las variables citadas, ajustado por el efecto de las demás. En otras palabras, permiten estimar el efecto "independiente" de cada una de las variables sobre el riesgo de presentar enfermedad coronaria. En este caso, la regresión permitió estimar el efecto de la hipertensión arterial sobre la probabilidad de presentar una enfermedad coronaria, ajustado por el efecto de los niveles de colesterol y de las restantes variables. Esto puede formularse de la manera siguiente:
Enfermedad = b 0+ b 1 (colesterol) + b 2 (edad) +
+ b 3 (presión arterial sistólica) + b 4 (peso relativo) + [6] + b 5 (hemoglobina) + b 6 (cigarrillos/día) + b 7 (ECG) es decir, la enfermedad (variable dependiente) es función de una serie de factores de riesgo (variables independientes).
Los métodos de análisis que se han presentado son útiles cuando el individuo sólo aporta un único conjunto de medidas (p. ej., una sola determinación de linfocitos CD4). Sin embargo, en los estudios de cohorte cada individuo es medido repetidas veces (p. ej., se determinan los CD4 cada 6 meses). Estas medidas repetidas están intrínsecamente correlacionadas y no pueden ser analizadas mediante los métodos expuestos. En la tabla 1.4 se presentan de forma esquemática algunos métodos para ese tipo de situaciones