Inteligencia artificial y plantas medicinales: hacia una producción más precisa de principios activos naturales

17/06/2026 | Dr. B. Vanaclocha, médico, director de Fitoterapia.Net

La IA está transformando el estudio de las plantas medicinales, al integrar datos genómicos, transcriptómicos, proteómicos y metabolómicos para comprender y optimizar la biosíntesis de metabolitos de interés farmacológico

Imagen: Nicolas Rougier (licencia CC)

Una nueva etapa en la investigación de plantas medicinales

Los productos naturales procedentes de plantas medicinales han sido históricamente una fuente esencial de medicamentos y compuestos bioactivos. Sin embargo, la biosíntesis de estos metabolitos secundarios depende de redes complejas de genes, enzimas, proteínas, metabolitos y factores ambientales. Comprender estas redes es fundamental para mejorar la calidad, la trazabilidad y la producción sostenible de principios activos vegetales.

La revisión de Chen y colaboradores analiza el papel de la inteligencia artificial en este campo, entendida como un conjunto de herramientas que incluye aprendizaje automático, aprendizaje profundo, procesamiento del lenguaje natural, grafos de conocimiento y análisis de redes. Estas tecnologías permiten integrar grandes volúmenes de datos biológicos heterogéneos y pasar de una investigación descriptiva a una investigación predictiva y orientada al diseño.

De los datos ómicos a las redes metabólicas

El artículo subraya que la investigación tradicional de rutas biosintéticas se ha basado con frecuencia en herramientas de correlación, como análisis de Pearson, análisis de componentes principales o redes de coexpresión génica. Aunque útiles, estos métodos tienen limitaciones para inferir causalidad, detectar interacciones combinadas o modelar procesos dinámicos.

La inteligencia artificial permite superar parte de estas limitaciones mediante un flujo de trabajo que puede resumirse en cuatro etapas:

Integración de datos: combinación de genómica, transcriptómica, proteómica, metabolómica y datos ambientales.
Descubrimiento de conocimiento: identificación de genes, enzimas, metabolitos y reguladores clave.
Diseño y optimización: predicción de condiciones de cultivo, rutas biosintéticas, factores limitantes y parámetros de extracción.
Validación experimental: confirmación en laboratorio de las hipótesis generadas por los modelos.

Este enfoque puede aplicarse tanto al estudio de metabolitos concretos como a la mejora de procesos de cultivo, selección de variedades, control de calidad y extracción de compuestos bioactivos.

Principales plantas y metabolitos estudiados

La revisión recoge diversos ejemplos en plantas medicinales de interés farmacéutico.

En regaliz chino (Glycyrrhiza uralensis), la inteligencia artificial se ha utilizado para estudiar la biosíntesis del ácido glicirrícico, un sapósido triterpénico ampliamente empleada en medicina y alimentación. La integración de datos de transcriptoma y microRNAoma permitió identificar genes estructurales de la vía biosintética y seleccionar posibles factores de transcripción reguladores. Uno de ellos, de la familia R2R3-MYB, fue validado experimentalmente como regulador de la ruta.

En tejo chino (Taxus chinensis), se aplicaron redes neuronales artificiales para modelar la producción de taxol o paclitaxel en cultivos celulares estimulados con elicitores fúngicos. El modelo utilizó como entradas el tiempo y la concentración del elicitor, y permitió simular la dinámica de especies reactivas de oxígeno y la producción final de taxol. Este caso muestra cómo la IA puede ayudar no solo a predecir rendimientos, sino también a interpretar mecanismos de regulación celular.

En ginseng (Panax ginseng), la revisión describe el uso de redes neuronales convolucionales, redes neuronales de grafos y redes profundas para estudiar la acumulación de ginsenósidos en diferentes tejidos y etapas de desarrollo. También se han aplicado modelos de aprendizaje profundo para diferenciar especies próximas de Panax, como P. ginseng, P. quinquefolius y P. notoginseng, a partir de perfiles metabolómicos obtenidos por LC-MS, con utilidad directa para el control de calidad y la autenticación.

En salvia china (Salvia miltiorrhiza), la IA se ha empleado para predecir el contenido de tanshinonas y ácidos salvianólicos a partir de datos hiperespectrales, metabolómicos, transcriptómicos y ambientales. Estos modelos pueden ayudar a seleccionar zonas de cultivo, clasificar origen geográfico y optimizar condiciones de producción.

En hipérico (Hypericum perforatum), los modelos predictivos se han aplicado al estudio de la hipericina, integrando factores ecológicos y ambientales para estimar su contenido. El artículo destaca que la ausencia de modelización dinámica sigue siendo una limitación importante para predecir el flujo metabólico en esta especie.

En Angelica biserrata, se utilizaron modelos de aprendizaje profundo combinados con optimización bayesiana para predecir la acumulación de cumarinas bajo diferentes condiciones ambientales. El modelo alcanzó una elevada capacidad predictiva e identificó factores ambientales clave para mejorar el rendimiento.

En granado (Punica granatum), se aplicaron redes neuronales artificiales combinadas con algoritmos genéticos para optimizar la extracción asistida por ultrasonidos de punicalagina a partir de la corteza del fruto. Esta estrategia permitió mejorar el rendimiento y reducir el número de experimentos necesarios frente a métodos convencionales.

En Pithecellobium dulce, la inteligencia artificial se utilizó para optimizar la extracción asistida por microondas de polifenoles, con mejor ajuste predictivo que los métodos clásicos de superficie de respuesta.

En Bryophyllum, los modelos de aprendizaje automático aplicados a metabolómica no dirigida permitieron identificar rasgos metabólicos clave relacionados con la síntesis de compuestos fenólicos.

También se citan aplicaciones en Papaver somniferum, centradas en la predicción de enzimas implicadas en rutas biosintéticas, y en especies modelo como Arabidopsis thaliana, utilizadas para desarrollar y validar métodos transferibles a plantas medicinales.

Aplicaciones prácticas

El interés de la inteligencia artificial en plantas medicinales no se limita a la investigación básica. Sus aplicaciones potenciales incluyen:

identificación de genes y enzimas clave en rutas biosintéticas;
predicción de metabolitos activos;
selección de variedades con mayor rendimiento;
optimización de condiciones de cultivo;
predicción del efecto de factores ambientales;
mejora de procesos de extracción;
autenticación de especies medicinales;
control de calidad basado en perfiles metabolómicos;
reducción de costes y tiempos experimentales;
apoyo al diseño de cultivos celulares o sistemas de producción sostenible.

El artículo presenta ejemplos cuantitativos relevantes. En Taxus chinensis, una red neuronal predijo la dinámica de especies reactivas de oxígeno con una correlación casi perfecta respecto a los datos experimentales. En Panax ginseng, los modelos de redes neuronales profundas lograron clasificar especies de Panax con elevada precisión. En Angelica biserrata, el modelo predictivo de acumulación de cumarinas alcanzó un R² de 0,977. En la extracción de punicalagina de granado, la combinación de redes neuronales y algoritmos genéticos mejoró el rendimiento y redujo el número de ensayos necesarios.

Limitaciones actuales

Pese a su potencial, la revisión señala limitaciones importantes. La primera es la heterogeneidad de los datos ómicos, procedentes de plataformas diferentes y con variaciones de escala, ruido técnico y efectos de lote. Sin una adecuada estandarización, los modelos pueden generar resultados poco reproducibles.

La segunda limitación es la escasez de genomas de referencia de alta calidad para muchas plantas medicinales, lo que dificulta la anotación funcional y la integración de datos.

La tercera es la distancia entre predicción computacional y validación experimental. Los modelos pueden generar cientos o miles de candidatos, pero la validación en plantas medicinales suele ser lenta, costosa y limitada por ciclos de crecimiento largos o por sistemas de transformación genética poco desarrollados.

Otra limitación relevante es la interpretabilidad. Algunos modelos de aprendizaje profundo funcionan como “cajas negras”: ofrecen alta precisión, pero no siempre explican de forma clara el mecanismo biológico subyacente. Para que estos modelos sean útiles en investigación farmacéutica, deben integrarse con conocimiento biológico previo, bases de datos de rutas metabólicas y validación experimental.

Valor para la fitoterapia y la investigación farmacéutica

Desde una perspectiva médica y farmacéutica, este enfoque puede contribuir a mejorar uno de los grandes retos de los productos vegetales: la variabilidad. La composición de una planta medicinal depende de especie, variedad, origen geográfico, condiciones de cultivo, momento de recolección, procesado y método de extracción. La integración de datos ómicos e inteligencia artificial puede ayudar a relacionar estas variables con el contenido real de principios activos.

Esto puede tener implicaciones directas en la calidad de los preparados vegetales, la autenticación de materias primas, la selección de quimiotipos, la optimización de cultivos y el desarrollo de productos más estandarizados y reproducibles.

Conclusión

La inteligencia artificial está abriendo una nueva etapa en la investigación de plantas medicinales. Su valor no reside únicamente en analizar grandes cantidades de datos, sino en convertir información dispersa en hipótesis verificables, modelos predictivos y estrategias de optimización.

Los ejemplos revisados en regaliz, tejo, ginseng, salvia china, hipérico, angelica, granado y otras especies muestran que la IA puede acelerar la identificación de rutas biosintéticas, mejorar la producción de metabolitos bioactivos y reforzar el control de calidad de los productos vegetales.

No obstante, su aplicación práctica exige prudencia. Los modelos deben ser interpretables, validados experimentalmente y comparados con métodos convencionales. La inteligencia artificial no sustituye al trabajo farmacognóstico, fitoquímico ni farmacológico, pero puede convertirse en una herramienta decisiva para avanzar hacia una fitoterapia más precisa, reproducible y basada en datos.

Referencia: Chen J, Cai J, To Quyen Duong H, Bunsupa S, Han R, Tong X. AI-driven integration and optimization of medicinal plant multi-omics metabolic networks. Front Plant Sci. 2026;17:1756809. Published 2026 Mar 31. doi:10.3389/fpls.2026.1756809.