1. Introducción: el desafío de la caja negra
En el artículo anterior exploramos las soluciones de análisis predictivo y su potencial para transformar la investigación Naturopática. Sin embargo, surge una pregunta crucial: si un modelo de machine learning predice con precisión qué Salutantes responderán mejor a una intervención con apitoxina, ¿cómo sabemos por qué lo predice?
Esta es la cuestión central de la explicabilidad (o explainability)
en inteligencia artificial. Los modelos más potentes —como las redes neuronales
profundas o los ensembles de gradient boosting— son a menudo «cajas
negras»: generan predicciones muy precisas, pero sus procesos internos son
opacos, incluso para sus creadores.
Para la investigación Naturopática, esta opacidad es inaceptable.
No basta con que un modelo «funcione»; necesitamos entender por qué funciona, qué
variables son las más relevantes y cómo interactúan
entre ellas. Sin esta comprensión, el modelo es una herramienta útil pero no
genera conocimiento —y la generación de conocimiento es el
corazón de la investigación.
Aquí es donde entran las técnicas de explicabilidad como SHAP y LIME.
Estas herramientas nos permiten «abrir la caja negra» y comprender qué está
haciendo realmente el modelo, transformando una predicción opaca en una explicación
comprensible que puede ser validada, cuestionada y, sobre todo, integrada
en el marco conceptual Naturopático.
Este artículo ofrece una guía didáctica y práctica para
que los investigadores Naturópatas comprendan qué son SHAP y LIME, cómo
funcionan, en qué se diferencian y cómo pueden aplicarse en el marco de
la Naturopatía Basada en la Evidencia (NBE), la Metodología
de la Intervención Naturopática (MIN) y la Coordinación
Praxiológica Naturopática (COPRANA) .
2. ¿Qué es la IA Explicable (XAI)?
La Inteligencia Artificial Explicable (Explainable
AI o XAI) es un campo de la inteligencia artificial que tiene como
objetivo hacer comprensibles los resultados y los procesos de toma de
decisión de los modelos de machine learning.
Su propósito es doble:
- Para
el investigador: Permite validar que el modelo está aprendiendo
patrones realmente relevantes y no artefactos espurios de
los datos.
- Para
el Salutante y la comunidad: Genera confianza en
las recomendaciones basadas en modelos predictivos, al poder explicar por
qué se sugiere una determinada intervención.
En el contexto de la investigación Naturopática, la XAI no
es un lujo, sino una exigencia epistemológica. La Naturopatía se
fundamenta en la comprensión del terreno del Salutante y
en la transparencia de la relación salutogénica. Un modelo que
predice, pero no explica es incompatible con estos principios.
3. SHAP (SHapley Additive exPlanations)
3.1. Origen y fundamento teórico
SHAP es una técnica de explicabilidad basada en la
teoría de juegos. Su nombre proviene de SHapley Additive
exPlanations y se inspira en los valores de Shapley, un
concepto de la teoría de juegos cooperativos desarrollado por Lloyd Shapley
(Premio Nobel de Economía 2012).
En la teoría de juegos, el valor de Shapley determina cómo
debe repartirse el «pago» total de un juego entre los jugadores, en función
de la contribución marginal de cada uno. SHAP aplica esta misma lógica a los
modelos de machine learning:
- El
«juego»: La predicción del modelo para una instancia concreta.
- Los
«jugadores»: Cada una de las características (variables) del modelo.
- El
«pago»: La diferencia entre la predicción del modelo y la predicción
promedio (línea base).
SHAP calcula la contribución de cada característica a
la predicción, considerando todas las posibles combinaciones de
características. El resultado es un valor SHAP para cada
característica en cada predicción.
3.2. Características clave de SHAP
|
Característica |
Descripción |
|
Fundamento teórico sólido |
Basado en la teoría de juegos, con propiedades matemáticas
demostradas (consistencia, precisión local, etc.) |
|
Consistencia |
Si un modelo cambia y una característica se vuelve más
importante, su valor SHAP no disminuye |
|
Aditividad |
La suma de los valores SHAP de todas las características
es igual a la diferencia entre la predicción y la línea base |
|
Explicaciones globales y locales |
Permite tanto entender una predicción individual como la
importancia global de las características |
|
Model-agnostic |
Puede aplicarse a cualquier tipo de modelo (árboles, redes
neuronales, etc.) |
3.3. Tipos de visualizaciones SHAP
SHAP ofrece múltiples formas de visualizar las
explicaciones:
|
Visualización |
Qué muestra |
Utilidad |
|
Summary plot |
Importancia global de las características, ordenadas de
mayor a menor |
Identificar qué variables son más relevantes en general |
|
Beeswarm plot |
Distribución de los valores SHAP para cada característica,
coloreada por el valor de la característica |
Ver cómo el valor de una característica afecta a su
contribución (positiva o negativa) |
|
Force plot |
Explicación de una predicción individual, mostrando cómo
cada característica «empuja» la predicción hacia arriba o hacia abajo |
Entender por qué el modelo hizo una predicción concreta
para un Salutante específico |
|
Dependence plot |
Relación entre el valor de una característica y su impacto
en la predicción |
Identificar relaciones no lineales y puntos de inflexión |
3.4. Ventajas y limitaciones de SHAP
Ventajas:
- Base
teórica sólida: Sus propiedades matemáticas están bien fundamentadas.
- Explicaciones
consistentes: Una característica más importante siempre tendrá un
valor SHAP mayor o igual.
- Interpretabilidad
global y local: Proporciona una visión completa del modelo.
- Ampliamente
adoptado: Existen librerías en Python (shap) y R que facilitan su
implementación.
Limitaciones:
- Coste
computacional: Calcular los valores SHAP exactos puede ser muy costoso
para modelos con muchas características, aunque existen aproximaciones
(TreeSHAP para árboles).
- Complejidad
conceptual: El fundamento teórico puede resultar difícil de explicar a
audiencias no técnicas.
4. LIME (Local Interpretable Model-agnostic Explanations)
4.1. Origen y fundamento teórico
LIME, que significa Local Interpretable
Model-agnostic Explanations, adopta un enfoque diferente al de SHAP. En
lugar de basarse en la teoría de juegos, LIME se centra en aproximar el
comportamiento del modelo de forma local.
La idea es sencilla pero poderosa:
- Para
una predicción concreta que queremos explicar (una instancia), LIME genera
perturbaciones de esa instancia: crea versiones ligeramente
modificadas de los datos.
- Consulta
el modelo con esas perturbaciones y obtiene sus predicciones.
- Ajusta
un modelo interpretable (generalmente una regresión lineal o un
árbol de decisión simple) a estos datos perturbados, ponderando las
instancias según su cercanía a la instancia original.
- El
modelo interpretable resultante nos dice qué características
fueron más importantes para la predicción en esa zona local del
espacio de datos.
4.2. Características clave de LIME
|
Característica |
Descripción |
|
Enfoque local |
Explica predicciones individuales, no el modelo global |
|
Model-agnostic |
Puede aplicarse a cualquier modelo |
|
Intuitivo |
El concepto de «perturbar y aproximar» es fácil de
entender |
|
Flexible |
Permite elegir el modelo interpretable que se ajusta
localmente |
|
Relativamente rápido |
Más rápido que SHAP para modelos complejos |
4.3. Visualizaciones típicas de LIME
LIME suele presentar las explicaciones de forma tabular o gráfica,
mostrando:
- Las
características que más contribuyen a la predicción, con su peso (positivo
o negativo).
- El
valor de cada característica en la instancia explicada.
- La
predicción del modelo y la predicción del modelo interpretable local.
4.4. Ventajas y limitaciones de LIME
Ventajas:
- Intuitivo
y fácil de entender: El concepto de «explicación local» es accesible.
- Rápido:
Generalmente más rápido que SHAP para modelos complejos.
- Flexible:
Permite adaptar el modelo interpretable al problema.
- Bueno
para explicaciones individuales: Ideal para entender casos concretos.
Limitaciones:
- Inestabilidad:
Pequeños cambios en la instancia pueden producir explicaciones muy
diferentes.
- No
consistente: No garantiza que la importancia de las características
sea consistente entre explicaciones.
- Solo
local: No proporciona una visión global del modelo.
- Sensibilidad
a parámetros: Los resultados pueden variar según cómo se generen las
perturbaciones y se ponderen.
5. SHAP vs LIME: comparativa y criterios de elección
|
Criterio |
SHAP |
LIME |
|
Fundamento |
Teoría de juegos (valores de Shapley) |
Aproximación local con modelo interpretable |
|
Alcance |
Global y local |
Local principalmente |
|
Consistencia |
Alta (propiedades matemáticas) |
Baja (puede variar con pequeñas perturbaciones) |
|
Estabilidad |
Alta |
Media-baja |
|
Velocidad |
Lenta (especialmente en modelos complejos) |
Rápida |
|
Interpretabilidad |
Requiere comprensión de la teoría de juegos |
Intuitiva y accesible |
|
Implementación |
Librería shap en Python |
Librería lime en Python |
|
Mejor para |
Análisis globales, explicaciones consistentes,
publicaciones científicas |
Explicaciones rápidas de casos individuales, exploración
inicial |
Recomendación para investigadores naturópatas:
- Utilizar
SHAP cuando se busque una comprensión profunda y rigurosa del
modelo, especialmente para publicaciones científicas y análisis globales.
SHAP proporciona una base teórica sólida que da credibilidad a los
hallazgos.
- Utilizar
LIME para exploración inicial, para explicar
rápidamente casos individuales a Salutantes o para cuando
el coste computacional de SHAP sea prohibitivo.
- Idealmente,
combinar ambos: Utilizar SHAP para el análisis global y LIME para
explicaciones locales rápidas y accesibles.
6. Aplicaciones prácticas en investigación Naturopática
6.1. Identificación de factores predictivos en
intervenciones personalizadas
Problema: Hemos entrenado un modelo que predice
la respuesta a una intervención con apitoxina en Salutantes oncológicos.
Queremos saber qué factores son los más importantes para esa
predicción.
Aplicación de SHAP: El summary plot de
SHAP nos mostrará, de forma global, qué variables (estado inmunológico,
marcadores inflamatorios, perfil de terreno, adherencia previa,
etc.) son las más relevantes. El dependence plot nos permitirá
ver cómo el valor de cada variable afecta a su contribución.
Valor para la NBE: Identificar los factores
predictivos permite diseñar estudios más precisos,, seleccionar
mejor a los participantes y generar hipótesis sobre
los mecanismos de acción.
6.2. Explicación de predicciones individuales para la
personalización del PPS
Problema: El modelo predice que un Salutante concreto
tiene una baja probabilidad de adherencia a un programa de cambios de hábitos.
Necesitamos entender por qué para poder intervenir de forma
proactiva.
Aplicación de LIME: El force plot de
LIME (o su equivalente tabular) nos mostrará, para es Salutante concreto,
qué características están «empujando» la predicción hacia la baja adherencia
(ej., baja motivación inicial, alto estrés, falta de apoyo social).
Valor para la MIN y la COPRANA: Esta información
permite diseñar una intervención específica para ese Salutante:
reforzar la motivación, incorporar técnicas de manejo del estrés, o involucrar
a la red de apoyo. Es la traducción de la predicción en acción
personalizada.
6.3. Validación de la coherencia del modelo con el marco
conceptual Naturopático
Problema: Hemos entrenado un modelo predictivo y
queremos asegurarnos de que sus patrones son coherentes con los
principios Naturopáticos y no con artefactos espurios.
Aplicación de SHAP: Al analizar las
contribuciones de las variables, podemos verificar que el modelo «aprende»
patrones esperados desde la teoría Naturopática. Por ejemplo, que una mejor
calidad del sueño contribuya positivamente a la predicción de mejora
del terreno, o que el apoyo social sea un factor
relevante en la adherencia.
Valor para la NBE y la COPRANA: Esta
validación fortalece la credibilidad del modelo y demuestra
que la IA puede aprender patrones alineados con el paradigma
naturopático, no solo con correlaciones estadísticas sin sentido clínico.
6.4. Comunicación con Salutantes y
profesionales
Problema: Queremos utilizar un modelo predictivo
para apoyar la toma de decisiones compartida con el Salutante, pero
necesitamos explicarle por qué el modelo sugiere una
determinada intervención.
Aplicación de LIME (o SHAP force plot): Podemos
mostrar al Salutante una visualización clara de los factores
que han influido en la predicción. Por ejemplo: «El modelo sugiere que la
intervención con apitoxina podría ser beneficiosa en tu caso porque tus niveles
de inflamación son elevados, tu estado inmunológico muestra ciertos patrones y
has respondido bien a intervenciones similares en el pasado».
Valor para la COPRANA: Esto empodera
al Salutante, lo involucra en el proceso y genera
confianza en la intervención propuesta, alineándose con el principio
de corresponsabilidad en la relación salutogénica.
7. Paso práctico: cómo aplicar SHAP y LIME en tu
investigación (sin Python)
A continuación, presentamos un flujo de trabajo
conceptual para aplicar SHAP y LIME en la investigación Naturopática, sin
necesidad de programar en Python. Este enfoque está diseñado para poder comprender
el proceso y, también, poder colaborar con un equipo técnico o
utilizar herramientas con interfaz gráfica.
7.1. Paso 1: Definir el problema y entrenar el modelo
Objetivo: Predecir la mejora de la
calidad de vida (puntuación > 10 puntos en el cuestionario
WHOQOL-BREF) en Salutantes con síndrome metabólico tras 6
meses de intervención Naturopática.
Variables del modelo:
- Edad,
IMC, perímetro abdominal
- Niveles
de glucosa, colesterol, triglicéridos
- Puntuación
de estrés (escala PSS-10)
- Calidad
del sueño (índice de Pittsburgh)
- Apoyo
social (escala MOS)
- Adherencia
a pautas dietéticas (cuestionario PREDIMED)
- Nivel
de actividad física (cuestionario IPAQ)
Modelo utilizado: Random Forest (o cualquier
otro modelo supervisado).
Resultado: Un modelo entrenado que predice, con
cierta precisión, la probabilidad de mejora de la calidad de vida.
7.2. Paso 2: Aplicar SHAP para el análisis global (sin
Python)
¿Qué hace SHAP? SHAP analiza el modelo completo
y calcula, para cada variable, su contribución promedio a
todas las predicciones.
Cómo se visualiza (sin Python):
- Summary
plot: Un gráfico de barras que muestra las variables ordenadas de
mayor a menor importancia. Las barras más largas indican las variables que
más influyen en la predicción.
- Beeswarm
plot: Cada punto representa una predicción. El color indica si el
valor de la variable es alto (rojo) o bajo (azul). La posición horizontal
indica si la contribución es positiva (a favor de la mejora) o negativa
(en contra).
Interpretación Naturopática:
|
Variable |
Importancia (SHAP) |
Interpretación |
|
Adherencia a pautas dietéticas |
Muy alta |
Confirma el principio Naturopático de que la alimentación
es un pilar fundamental de la salud |
|
Calidad del sueño |
Alta |
Apoya la visión holística: el sueño es un factor clave en
la regulación metabólica |
|
Nivel de actividad física |
Alta |
Valida la importancia del ejercicio en el tratamiento del
síndrome metabólico |
|
Puntuación de estrés |
Media-alta |
Refuerza el enfoque integral que considera el manejo del
estrés |
|
IMC |
Media |
Aunque relevante, menos determinante que los hábitos de
vida |
Valor para la NBE: Este análisis permite identificar
los factores más relevantes para guiar futuras investigaciones y
diseñar intervenciones más precisas.
7.3. Paso 3: Aplicar LIME para explicar un caso concreto
(sin Python)
¿Qué hace LIME? LIME toma un Salutante específico
y analiza qué variables han influido más en su predicción concreta.
Cómo se visualiza (sin Python):
LIME genera una tabla o gráfico que
muestra, para ese Salutante concreto:
- Las
características que más contribuyen a la predicción.
- El
valor de cada característica en ese Salutante.
- El
peso (positivo o negativo) de cada característica en la predicción.
Ejemplo para un Salutante concreto (caso
real):
|
Característica |
Valor del Salutante |
Contribución (LIME) |
Impacto |
|
Adherencia a pautas dietéticas |
10/14 |
+2.1 |
A favor de la mejora |
|
Calidad del sueño |
6/21 (buena) |
+1.5 |
A favor de la mejora |
|
Puntuación de estrés |
20/40 (bajo) |
+0.8 |
A favor de la mejora |
|
Nivel de actividad física |
3/10 (bajo) |
-1.2 |
En contra de la mejora |
Interpretación para este Salutante:
- La
predicción global es positiva (probabilidad de mejora del 75%).
- Los
factores que más contribuyen a esta predicción son la buena
adherencia dietética y la buena calidad del sueño.
- El bajo
nivel de actividad física es un factor que «resta» a la
predicción, sugiriendo que, aunque la mejora es probable, podría ser aún
mayor si se incrementa el ejercicio.
Acción Naturopática (MIN y COPRANA):
- Reforzar
el componente de ejercicio físico en el Programa Personal de
Salud (PPS) de este Salutante.
- Explicar
al Salutante que el modelo sugiere que la mejora es
probable, pero que el ejercicio podría potenciarla aún más.
- Ajustar
la intervención de forma dinámica, monitorizando la evolución
del terreno.
7.4. Paso 4: Interpretación y validación Naturopática
Preguntas clave para el investigador:
- ¿Son
coherentes los resultados con el marco conceptual Naturopático? En
el ejemplo, la adherencia dietética y el sueño son factores clave, lo que
confirma la importancia de la alimentación y el descanso en la salud
metabólica.
- ¿Qué
hipótesis genera este análisis? El hecho de que la adherencia
dietética sea el factor más importante sugiere que futuras investigaciones
deberían profundizar en los mecanismos de la intervención nutricional Naturopática.
- ¿Qué
implicaciones tiene para la práctica? El bajo nivel de actividad
física en este Salutante sugiere la necesidad de diseñar un
programa de ejercicio adaptado y motivador.
- ¿Qué
limitaciones tiene el modelo? El modelo se basa en datos de Salutantes de
un centro concreto. ¿Será igual de preciso en otros contextos? (Necesidad
de validación externa).
8. Herramientas sin código para SHAP y LIME
Si no dispones de conocimientos de programación, existen
alternativas con interfaz gráfica que permiten aplicar SHAP y LIME de forma
accesible:
|
Herramienta |
Descripción |
Nivel de dificultad |
|
DataRobot |
Plataforma de machine learning automatizado que incluye
explicabilidad (SHAP) |
Bajo |
|
H2O Driverless AI |
Herramienta de IA con interpretabilidad integrada |
Bajo-Medio |
|
Google Cloud AI Platform |
Incluye explicabilidad para modelos entrenados en la nube |
Medio |
|
Amazon SageMaker Clarify |
Servicio de AWS que proporciona explicaciones SHAP para
modelos |
Medio |
|
KNIME |
Plataforma de análisis de datos con nodos para SHAP y LIME
(interfaz visual) |
Medio |
|
RapidMiner |
Herramienta de minería de datos con módulos de
explicabilidad |
Bajo-Medio |
Recomendación: Si no se dispone de equipo
técnico, comenzar con DataRobot o KNIME, que
ofrecen interfaces visuales intuitivas y no requieren programación.
9. Consideraciones críticas para la investigación Naturopática
9.1. La explicabilidad no es causalidad
Es fundamental recordar que explicabilidad no es
igual a causalidad. Que una variable tenga un alto valor SHAP no significa
que cause el resultado; significa que está asociada con
él en el modelo. La distinción entre correlación y causalidad es un principio
básico de la metodología científica que debe mantenerse al interpretar
cualquier técnica de XAI.
9.2. Contexto y marco conceptual
Las explicaciones de SHAP y LIME son estadísticas y matemáticas,
no clínicas ni Naturopáticas. El investigador
debe interpretar estos resultados a la luz del marco
conceptual Naturopático. Un valor SHAP alto para una variable no es una
«verdad» absoluta, sino una señal que debe ser comprendida en
el contexto del terreno del Salutante.
9.3. Reproducibilidad y transparencia
Para que los hallazgos basados en SHAP y LIME sean creíbles,
deben ser reproducibles. Esto implica:
- Documentar todos
los parámetros utilizados (número de perturbaciones en LIME, fondo de
datos en SHAP, etc.).
- Compartir
el código (scripts de Python o R) o, si se utilizan herramientas
sin código, documentar el flujo de trabajo utilizado.
- Publicar
los resultados de forma transparente, incluyendo tanto las
explicaciones como las limitaciones.
9.4. La explicabilidad como puente entre la IA y la
praxis
SHAP y LIME no son fines en sí mismos. Son herramientas que
permiten tender un puente entre la potencia de los modelos
predictivos y la comprensión humana necesaria para la toma de
decisiones clínicas y la generación de conocimiento.
En el contexto Naturopático, este puente es especialmente
valioso porque:
- Permite integrar la
evidencia generada por IA en el razonamiento clínico del
Naturópata.
- Facilita
la transferencia de conocimiento desde la investigación a
la práctica.
- Empodera al
profesional y al Salutante al hacer transparente el
proceso de toma de decisión.
10. Conclusión: de la predicción a la comprensión
SHAP y LIME son herramientas esenciales para
cualquier investigador Naturópata que desee utilizar modelos predictivos sin
renunciar a la comprensión y la transparencia.
- SHAP proporciona
una base teórica sólida y explicaciones consistentes, ideales para
el análisis global y las publicaciones
científicas.
- LIME ofrece
explicaciones intuitivas y rápidas para casos
individuales, facilitando la comunicación con Salutantes y
la toma de decisiones clínicas.
Ambas técnicas, utilizadas de forma complementaria,
permiten abrir la caja negra de los modelos predictivos
y transformar predicciones en conocimiento accionable.
Para la Naturopatía, esto es especialmente relevante. La
disciplina se fundamenta en la comprensión del terreno del Salutante y
en la transparencia de la relación salutogénica. SHAP y LIME
no son meras herramientas técnicas: son instrumentos epistemológicos que
permiten integrar la potencia de la IA con la sabiduría de la praxis Naturopática.
Como investigadores, tenemos la responsabilidad de utilizar
estas herramientas con rigor, criterio y conciencia de sus
limitaciones. Solo así podremos generar conocimiento que sea a la vez potente
y comprensible, predictivo y explicable, innovador y
fiel a los principios de nuestra disciplina.
Naturopatía, ahora más que nunca.
Nota final. Este artículo ha sido redactado en el
marco de la línea de investigación en Metodología de la Investigación
de la Red de Investigación Naturopática (RINA) , en diálogo con las
contribuciones de Naturopatía Digital. Su objetivo es proporcionar
a los Profesionales Naturópatas una guía didáctica y rigurosa sobre las
técnicas de explicabilidad SHAP y LIME, contribuyendo así a la calidad y
credibilidad de la investigación en el marco de la NBE (Naturopatía
Basada en la Evidencia), la MIN (Metodología de la
Intervención Naturopática) y la COPRANA (Coordinación
Praxiológica Naturopática
Referencias bibliográficas
- Zhang,
C., et al. (2025). Machine learning prediction model for medical
environment... PMC.
- Ahmed,
S., et al. (2024). A Comparative Analysis of LIME and SHAP
Interpreters with Explainable ML-based Diabetes Predictions. IEEE
Access 13, 37370–37388. DOI: 10.1109/ACCESS.2024.3422319
- Givisis,
I. (2025). Comparing Explainable AI Models: SHAP, LIME, and
Their... MDPI.
- Sathyan,
A., et al. (2022). Interpretable AI for bio-medical applications.
PMC.
- Randomized
Explainable Machine Learning Models for Efficient Medical Diagnosis.
PubMed.
- Transparent
and Explainable AI for Liver Disease Diagnosis Using SHAP and LIME.
IEEE, 2025.
- Is
explainability the missing link in artificial intelligence-based diabetes
prediction? PMC, 2025.
- shap
0.50.0. PyPI.
- CLE-SH:
Comprehensive Literal Explanation package for SHapley values. arXiv.
- Improving
local interpretable classifier explanations... Springer, 2025.
- Local
Interpretable Model-Agnostic Explanations (LIME). Taylor &
Francis.
- Explainable
AI, LIME & SHAP for Model Interpretability. DataCamp.
- Técnicas
de interpretabilidad: estado del arte. Management Solutions.
No hay comentarios:
Publicar un comentario