La identificación precisa de las mutaciones impulsoras del cáncer es esencial para la oncología de precisión; sin embargo, sigue siendo un desafío importante debido a la abrumadora presencia de mutaciones pasajeras y la complejidad de los procesos mutacionales. En este estudio, presentamos ResMLP-GL, un perceptrón multicapa residual con reconocimiento de firmas, diseñado para la predicción de mutaciones impulsoras a nivel de variante, que integra explícitamente los vectores de probabilidad de contexto COSMIC SBS con más de 100 características funcionales y de secuencia. La red incorpora dos bloques residuales de proyección junto con un módulo de compuerta a nivel de característica que modula multiplicativamente las activaciones ocultas, mejorando así el flujo de gradiente y facilitando el aprendizaje de representaciones consciente del proceso. Una búsqueda guiada por Optuna optimiza parámetros como el ancho, el abandono (dropout), la tasa de aprendizaje y la regularización L2, mientras que ADASYN aborda el desequilibrio de clases.
Entrenado con exomas armonizados de TCGA GBM/COAD y reservado para pruebas, ResMLP-GL logró un AUC de 0,949 en datos no utilizados y un AUC de 0,921 en cohortes independientes de ICGC, superando a CHASMplus, OncodriveFML y MutSigCV. El análisis SHAP indicó que las puntuaciones funcionales (REVEL, AlphaMissense, CADD) y las probabilidades SBS específicas impulsan colectivamente las predicciones, ofreciendo conexiones interpretables entre los procesos mutacionales y la selección de mutaciones impulsoras. El modelo dilucida programas específicos de tejido y alineados con las firmas (por ejemplo, SBS1 y firmas relacionadas con la reparación del ADN para TP53/PTEN/EGFR en GBM y SBS1/MMR/POLE para APC/KRAS/PIK3CA en COAD), y una carga de mutaciones impulsoras derivada del modelo estratifica la supervivencia. El código, los pesos entrenados y las tablas de características procesadas se pusieron a disposición para garantizar la reproducibilidad.
En resumen, ResMLP-GL demuestra que los perceptrones multicapa residuales con compuerta y un contexto de firma cuantitativo proporcionan una predicción de mutaciones impulsoras interpretable y de última generación en diferentes tipos de cáncer. Nuestros hallazgos subrayan la importancia de incorporar explícitamente el contexto de los procesos mutacionales, lo que no solo complementa, sino que, en ciertos contextos oncológicos, supera a las metodologías que se basan exclusivamente en la frecuencia de recurrencia o las puntuaciones de impacto funcional. Este enfoque ofrece un marco sólido para abordar los desafíos específicos de cada tejido en la predicción de mutaciones impulsoras. Todo el código, los modelos entrenados y los datos procesados están disponibles en https://github.com/Zubair11122/ResMLP-GL para promover una investigación de oncología de precisión transparente y reproducible.
Inicia sesión o regístrate para acceder al texto completo
¡Aún no hay comentarios. Sé el primero en comentar!