PINNACLE predice funciones proteicas en células y tejidos y puede ayudar a mejorar el descubrimiento de fármacos
De un vistazo:
- En un avance notable respecto de los modelos de IA actuales, el nuevo enfoque captura cómo las proteínas actúan no de forma aislada sino en sus entornos celulares y tisulares.
- El modelo ilumina cómo las células y los tejidos circundantes influyen en los comportamientos de las proteínas implicados en el mantenimiento de la salud y el fomento de la enfermedad.
- La herramienta puede ayudar a los investigadores a identificar objetivos farmacológicos para una variedad de afecciones.
Un pez que está en la tierra sigue moviendo sus aletas, pero los resultados son marcadamente diferentes cuando está en el agua. La analogía, atribuida al reconocido científico informático Alan Kay, se utiliza para ilustrar el poder del contexto para arrojar luz sobre las cuestiones que se investigan.
Por primera vez en el campo de la inteligencia artificial (IA), una herramienta llamada PINNACLE encarna la visión de Kay a la hora de comprender el comportamiento de las proteínas en su contexto adecuado, determinado por los tejidos y las células en los que actúan estas proteínas y con los que interactúan. Cabe destacar que PINNACLE supera algunas de las limitaciones de los modelos de IA actuales, que tienden a analizar cómo funcionan y funcionan mal las proteínas, pero lo hacen de forma aislada, un tipo de célula y tejido a la vez.
El desarrollo del nuevo modelo de IA, descrito en Nature Methods , fue dirigido por investigadores de la Escuela de Medicina de Harvard.
“El mundo natural está interconectado y PINNACLE ayuda a identificar estos vínculos, que podemos utilizar para obtener un conocimiento más detallado sobre las proteínas y medicamentos más seguros y efectivos”, dijo la autora principal del estudio Marinka Zitnik , profesora adjunta de informática biomédica en el Instituto Blavatnik de la HMS. “Supera las limitaciones de los modelos actuales, libres de contexto, y sugiere la dirección futura para mejorar los análisis de las interacciones de las proteínas”.
Este avance, señalan los investigadores, podría impulsar la comprensión actual del papel de las proteínas en la salud y la enfermedad e iluminar nuevos objetivos farmacológicos para diseñar terapias más precisas y mejor adaptadas.
PINNACLE está disponible gratuitamente para científicos de todo el mundo.
Un gran paso adelante
Desentrañar las interacciones entre proteínas y los efectos de sus vecinos biológicos contiguos es complicado. Las herramientas analíticas actuales cumplen una función crucial al proporcionar información sobre las propiedades estructurales y las formas de las proteínas individuales. Sin embargo, estas herramientas no están diseñadas para abordar los matices contextuales del entorno proteico general. En cambio, producen representaciones de proteínas que no tienen contexto, lo que significa que carecen de información contextual sobre el tipo de célula y el tipo de tejido.
Sin embargo, las proteínas desempeñan diferentes funciones en los diferentes contextos celulares y tisulares en los que se encuentran y también en función de si el mismo tejido o célula está sano o enfermo. Los modelos de representación de una sola proteína no pueden identificar funciones proteínicas que varían en una multitud de contextos.
Cuando se trata del comportamiento de las proteínas, es ubicación, ubicación, ubicación.
Las proteínas, compuestas por 20 aminoácidos diferentes, forman los componentes básicos de las células y los tejidos y son indispensables para una variedad de funciones biológicas que sustentan la vida, desde transportar oxígeno por todo el cuerpo hasta contraer los músculos para respirar y caminar, permitir la digestión y combatir infecciones, entre muchas otras.
Los científicos estiman que el número de proteínas en el cuerpo humano varía entre 20.000 y cientos de miles.
Las proteínas interactúan entre sí, pero también con otras moléculas, como el ADN y el ARN. La compleja interacción entre proteínas y a través de ellas crea redes intrincadas de interacción proteica. Estas redes, situadas en otras células y entre ellas, mantienen muchas interacciones complejas con otras proteínas y redes proteicas.
La ventaja de PINNACLE radica en su capacidad de reconocer que el comportamiento de las proteínas puede variar según la célula y el tipo de tejido. La misma proteína puede tener una función diferente en una célula pulmonar sana que en una célula renal sana o en una célula del colon enferma.
PINNACLE arroja luz sobre cómo estas células y tejidos influyen de forma diferente en las mismas proteínas, algo que no es posible con los modelos actuales. Según el tipo de célula específico en el que reside una red de proteínas, PINNACLE puede determinar qué proteínas participan en determinadas conversaciones y cuáles permanecen en silencio. Esto ayuda a PINNACLE a descifrar mejor la comunicación entre proteínas y el tipo de comportamiento y, en última instancia, le permite predecir dianas farmacológicas específicas para las proteínas disfuncionales que dan lugar a enfermedades.
PINNACLE no obvia sino que complementa los modelos de representación única, señalaron los investigadores, ya que puede analizar las interacciones de proteínas dentro de varios contextos celulares.
De esta forma, PINNACLE podría permitir a los investigadores comprender y predecir mejor la función de las proteínas y ayudar a dilucidar procesos celulares vitales y mecanismos de enfermedad.
Esta capacidad puede ayudar a identificar proteínas “medicables” que sirvan como dianas para medicamentos individuales, así como a pronosticar los efectos de varios medicamentos en diferentes tipos de células . Por ese motivo, PINNACLE podría convertirse en una herramienta valiosa para que los científicos y los desarrolladores de medicamentos se centren en objetivos potenciales de forma mucho más eficiente.
Tal optimización del proceso de descubrimiento de fármacos es muy necesaria, dijo Zitnik, quien también es profesor asociado del Instituto Kempner para el Estudio de la Inteligencia Natural y Artificial de la Universidad de Harvard.
Llevar un nuevo fármaco al mercado puede llevar entre 10 y 15 años y costar hasta mil millones de dólares, y el camino desde el descubrimiento hasta el fármaco es notoriamente accidentado y el resultado final suele ser impredecible. De hecho, casi el 90 por ciento de los fármacos candidatos no se convierten en medicamentos .
Construcción y entrenamiento PINNACLE
Utilizando datos de células humanas de un atlas multiorgánico integral, combinados con múltiples redes de interacciones proteína-proteína, interacciones entre tipos de células y tejidos, los investigadores entrenaron a PINNACLE para producir representaciones gráficas panorámicas de proteínas que abarcan 156 tipos de células y 62 tejidos y órganos.
PINNACLE ha generado hasta la fecha cerca de 395.000 representaciones multidimensionales, en comparación con las 22.000 representaciones posibles con los modelos actuales de una sola proteína. Cada uno de sus 156 tipos de células incluye redes de interacción de proteínas ricas en contexto de unas 2.500 proteínas.
Las cifras actuales de tipos de células, tejidos y órganos no son los límites superiores del modelo. Los tipos de células evaluados hasta la fecha proceden de donantes humanos vivos y cubren la mayoría de los tipos de células del cuerpo humano, pero no todos. Además, muchos tipos de células aún no se han identificado, mientras que otros son raros o difíciles de investigar, como las neuronas del cerebro.
Para diversificar el repertorio celular de PINNACLE, Zitnik planea utilizar una plataforma de datos que incluye decenas de millones de células extraídas de todo el cuerpo humano.