El cáncer colorrectal (CCR), que incluye las neoplasias del colon y el recto, constituye un importante desafío para la salud mundial. Si bien existen varios fármacos que se dirigen a los genes/proteínas relacionados con el CCR, su eficacia aún no alcanza un nivel satisfactorio.
Además, su efectividad disminuye gradualmente con el tiempo y el uso prolongado, un fenómeno conocido como resistencia a los fármacos.
Por lo tanto, es necesario explorar nuevos fármacos candidatos alternativos contra el CCR. Varios estudios han recomendado el uso de fármacos candidatos guiados por genes hospedadores desregulados relacionados con el CCR.
Sin embargo, el descubrimiento de fármacos guiado por el microbioma, dirigido específicamente a los genes bacterianos clave (bKGs) dentro de la microbiota intestinal asociada al CCR, sigue siendo muy limitado. El objetivo de este estudio es identificar los bKGs como objetivos antibacterianos dentro de los taxones bacterianos asociados al CCR para explorar agentes antibacterianos. En primer lugar, analizamos un conjunto de datos de perfiles de secuenciación de ARNr 16S que contenía 24 muestras de CCR y 50 muestras de sujetos sanos, donde los resultados del análisis de diversidad beta mostraron diferencias significativas en las composiciones bacterianas entre los grupos de CCR y sujetos sanos. El análisis de abundancia diferencial con valores umbral en |log2FC| > 1,0 y valor p ajustado < 0,05 identificó 42 taxones bacterianos significativamente alterados, de los cuales Bacteroides fragilis, Bacteroides ovatus, Bacteroides uniformis y Flavonifractor plautii se priorizaron en función del tamaño del efecto y la literatura publicada que informa sobre su asociación con el CCR.
Además, se utilizó un análisis integrativo de genómica sustractiva y redes de interacción proteína-proteína (PPI) para identificar los 10 bKGs esenciales de mayor rango (ribD, ribBA, murA, alr, hisI, hisE, hisD, hisG, hisH e hisB) de estos cuatro taxones bacterianos asociados al CCR como posibles objetivos antibacterianos. Finalmente, se recomendaron tres moléculas de fármacos candidatos (sulfasalazina, aminoglutetimida y trifluridina/tipiracil) como los agentes antibacterianos candidatos preliminares guiados por bKGs para el CCR mediante el acoplamiento molecular y los análisis ADME/T. Se requiere una mayor validación experimental y clínica para establecer estos compuestos como fármacos eficaces dirigidos a los bKGs para el CCR.
Por lo tanto, estos hallazgos pueden proporcionar información para desarrollar enfoques innovadores de tratamiento antibacteriano relevantes para el CCR.
Suma de la actividad en Facebook, Twitter, Reddit y Wikipedia.
Funciones
Conceptualización,
Curación de datos,
Análisis formal,
Investigación,
Recursos,
Software,
Validación,
Metodología,
Visualización,
Redacción: borrador original.
Afiliación
Laboratorio de Bioinformática (Dry), Departamento de Estadística, Universidad de Rajshahi, Rajshahi, Bangladés.
Funciones
Conceptualización,
Curación de datos,
Metodología,
Recursos.
Afiliación
Laboratorio de Bioinformática (Dry), Departamento de Estadística, Universidad de Rajshahi, Rajshahi, Bangladés.
Afiliación
Departamento de Ciencias de la Computación e Ingeniería, Universidad de Ingeniería y Tecnología de Rajshahi, Rajshahi, Bangladés.
Afiliación
Laboratorio de Bioinformática (Dry), Departamento de Estadística, Universidad de Rajshahi, Rajshahi, Bangladés.
Funciones
Metodología,
Validación,
Software.
Afiliación
Laboratorio de Bioinformática (Dry), Departamento de Estadística, Universidad de Rajshahi, Rajshahi, Bangladés.
Afiliación
Laboratorio de Bioinformática (Dry), Departamento de Estadística, Universidad de Rajshahi, Rajshahi, Bangladés.
Afiliación
Laboratorio de Bioinformática (Dry), Departamento de Estadística, Universidad de Rajshahi, Rajshahi, Bangladés.
Afiliación
Laboratorio de Bioinformática (Dry), Departamento de Estadística, Universidad de Rajshahi, Rajshahi, Bangladés.
Afiliación
Departamento de Estadística y Ciencia de Datos, Universidad de Barishal, Barishal, Bangladés.
Afiliación
Laboratorio de Bioinformática (Dry), Departamento de Estadística, Universidad de Rajshahi, Rajshahi, Bangladés.
Afiliaciones
Laboratorio de Bioinformática (Dry), Departamento de Estadística, Universidad de Rajshahi, Rajshahi, Bangladés,
TMSS Medical College, Bogura, Bangladés.
Funciones
Conceptualización,
Investigación,
Metodología,
Administración del proyecto,
Recursos,
Supervisión,
Validación,
Redacción: revisión y edición.
Afiliación
Laboratorio de Bioinformática (Dry), Departamento de Estadística, Universidad de Rajshahi, Rajshahi, Bangladés.
El cáncer colorrectal (CCR), que incluye las neoplasias del colon y el recto, constituye un importante desafío para la salud mundial. Aunque existen varios fármacos que se dirigen a los genes/proteínas relacionados con el CCR, su rendimiento aún no alcanza un nivel satisfactorio. Además, su eficacia disminuye gradualmente con el tiempo con el uso a largo plazo, un fenómeno conocido como resistencia a los fármacos. Por lo tanto, es necesario explorar nuevos fármacos candidatos alternativos contra el CCR. Varios estudios han recomendado fármacos candidatos guiados por genes hospedadores desregulados relacionados con el CCR. Sin embargo, el descubrimiento de fármacos guiado por el microbioma, particularmente dirigido a los genes clave bacterianos (bKGs) dentro de la microbiota intestinal asociada al CCR, sigue siendo muy limitado. Este estudio tiene como objetivo identificar los bKGs como objetivos antibacterianos dentro de los taxones bacterianos asociados al CCR para explorar agentes antibacterianos. En primer lugar, analizamos un conjunto de datos de perfiles de secuenciación de ARNr 16S que contenía 24 muestras de CCR y 50 muestras de individuos sanos, donde los resultados del análisis de diversidad beta mostraron diferencias significativas en las composiciones bacterianas entre los grupos de CCR y HC. El análisis de abundancia diferencial con valores umbral en |log2FC| > 1,0 y valor p ajustado < 0,05 identificó 42 taxones bacterianos significativamente alterados, de los cuales Bacteroides fragilis, Bacteroides ovatus, Bacteroides uniformis y Flavonifractor plautii se priorizaron en función del tamaño del efecto y la literatura publicada que informa sobre su asociación con el CCR. Además, se utilizó un análisis integrativo de genómica sustractiva y redes de interacción proteína-proteína (PPI) para identificar los 10 bKGs esenciales de mayor rango (ribD, ribBA, murA, alr, hisI, hisE, hisD, hisG, hisH e hisB) de estos cuatro taxones bacterianos asociados al CCR como posibles objetivos antibacterianos. Finalmente, se recomendaron tres moléculas de fármacos candidatos (sulfasalazina, aminoglutetimida y tipiracil) como los agentes antibacterianos candidatos guiados por bKGs preliminares para el CCR a través del acoplamiento molecular y los análisis ADME/T. Se requiere una mayor validación experimental y clínica para establecer estos compuestos como fármacos eficaces que se dirijan a los bKGs para el CCR. Por lo tanto, estos hallazgos pueden proporcionar información para desarrollar un enfoque innovador de tratamiento antibacteriano relevante para el CCR.
Citación: Pal NK, Kibria MK, Noor T, Ahmed MF, Islam MS, Ahmed MF, et al. (2026) Identificación in silico de genes clave bacterianos directa o indirectamente asociados con el desarrollo y la progresión del cáncer colorrectal para explorar agentes antibacterianos. PLoS One 21(6): e0343565.
https://doi.org/10.1371/journal.pone.0343565
Editor: Filomena de Nigris, Universita degli Studi della Campania Luigi Vanvitelli, ITALIA.
Recibido: 6 de febrero de 2026; Aceptado: 4 de junio de 2026; Publicado: 26 de junio de 2026.
Derechos de autor: © 2026 Pal et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso, la distribución y la reproducción sin restricciones en cualquier medio, siempre que se cite al autor original y la fuente.
Disponibilidad de datos: El conjunto de datos de perfiles de secuencia de ARNr 16S sin procesar analizado en este estudio está disponible públicamente. Se puede descargar libremente de la base de datos en línea EBI con el número de acceso PRJEB77293. https://www.ebi.ac.uk/ena/browser/view/PRJEB77293.
Financiación: Los autores no recibieron financiación específica para este trabajo.
Conflictos de intereses: Los autores han declarado que no existen conflictos de intereses.
El cáncer colorrectal (CCR), definido como una neoplasia que se origina en el colon o el recto, es un importante problema de salud mundial y sigue siendo una de las principales causas de mortalidad relacionada con el cáncer en todo el mundo [1, 2]. A pesar de los importantes avances en la detección temprana y las intervenciones terapéuticas, la carga mundial del CCR sigue aumentando, especialmente en los países de ingresos bajos y medios [3]. En 2020, el CCR representó más de 1,9 millones de nuevos casos y aproximadamente 930 000 muertes, lo que lo convierte en el tercer cáncer más comúnmente diagnosticado y la segunda neoplasia más mortífera a nivel mundial [4, 5]. Se prevé que su incidencia mundial alcance los 3,2 millones de nuevos casos para 2040 [3]. Las estrategias de tratamiento actuales se centran principalmente en las vías moleculares impulsadas por el huésped [6]. Muchos pacientes experimentan una respuesta terapéutica limitada, recurrencia de la enfermedad o fracaso del tratamiento con el tiempo debido a la resistencia a los fármacos, la heterogeneidad tumoral y los efectos secundarios adversos [7, 8]. Aunque las alteraciones genéticas y epigenéticas acumuladas pueden contribuir al desarrollo del CCR, los mecanismos derivados del huésped por sí solos no explican completamente la iniciación y la progresión del CCR. Los estudios recientes destacan cada vez más el microbioma intestinal como un factor potencial asociado con la carcinogénesis del CCR [9]. En condiciones fisiológicas, la microbiota intestinal desempeña un papel esencial en el mantenimiento del equilibrio metabólico del huésped, la regulación inmunitaria y la integridad epitelial [10]. La alteración de este equilibrio microbiano, denominada disbiosis, se ha asociado con la expansión de taxones bacterianos potencialmente dañinos y la alteración de las interacciones huésped-microbio, que se han relacionado con el desarrollo del CCR, aunque la naturaleza causal y direccional de estas relaciones aún no se ha establecido por completo [11, 12]. Las tecnologías de secuenciación de alto rendimiento, incluido el secuenciación del gen de ARNr 16S y la secuenciación metagenómica, han mejorado significativamente nuestra comprensión de las comunidades microbianas asociadas al CCR [13]. La evidencia sugiere una asociación bidireccional entre el genoma del huésped y el metagenoma intestinal, donde los cambios en la composición microbiana se han relacionado con alteraciones en las vías moleculares del huésped y, a su vez, la variación genética del huésped se ha asociado con diferencias en la ecología microbiana [14, 15]. Las bacterias patógenas pueden desempeñar un papel adicional en la progresión de la enfermedad mediante la expresión de proteínas de virulencia que interactúan potencialmente con las proteínas del huésped, subvierten las respuestas inmunitarias, interrumpen la señalización celular y promueven la supervivencia y la replicación bacteriana, aunque aún no se ha establecido funcionalmente si estas interacciones contribuyen directamente a la progresión de la enfermedad [16-18]. Varios estudios basados en el ARNr 16S han identificado distintos taxones bacterianos asociados al CCR, lo que apoya la investigación de su contenido de genes funcionales como posibles objetivos para las estrategias terapéuticas guiadas por el microbioma [19-23]. A pesar de estos avances en la elaboración de perfiles microbianos, los determinantes genéticos funcionales, en particular los genes esenciales únicos dentro de los taxones bacterianos asociados al CCR, designados aquí como genes clave bacterianos (bKGs), y sus productos proteicos codificados funcionalmente designados como proteínas clave bacterianas (bKPs), siguen estando poco caracterizados. Si bien se han explorado ampliamente las estrategias terapéuticas guiadas por el genoma del huésped para el CCR [24, 25], el descubrimiento de fármacos guiado por el microbioma, en particular dirigido a los bKGs esenciales dentro de las bacterias asociadas al CCR, sigue siendo en gran medida inexplorado. Teniendo en cuenta el posible papel de los genes bacterianos en la mediación de las interacciones huésped-microbio, la identificación de los bKGs esenciales en las bacterias asociadas al CCR como objetivos antibacterianos representa una vía prometedora para el desarrollo de estrategias terapéuticas antibacterianas contra el CCR. Para abordar esta brecha, el presente estudio empleó un marco in silico integral que incluye la elaboración de perfiles microbianos basados en el ARNr 16S, la genómica sustractiva, el análisis de redes de interacción proteína-proteína (PPI), el acoplamiento molecular y el análisis ADME/T para identificar los bKGs como posibles objetivos antibacterianos en las especies bacterianas asociadas al CCR y para explorar los fármacos antibacterianos guiados por bKGs. Al integrar la elaboración de perfiles microbianos basada en la secuenciación del ARNr 16S con la genómica funcional y el cribado computacional de fármacos, este estudio tiene como objetivo cerrar la brecha entre la composición del microbioma asociada al CCR y el descubrimiento de fármacos antibacterianos guiados por el microbioma. Se espera que los hallazgos proporcionen nuevas perspectivas sobre las posibles estrategias de intervención antibacteriana y contribuyan al desarrollo de candidatos terapéuticos innovadores para el CCR que se dirijan a los bKGs esenciales. Todo el flujo de trabajo del estudio se muestra en la Fig. 1.
En este estudio, se analizaron datos de secuenciación del gen de ARNr 16S disponibles públicamente de heces humanas, junto con sus metadatos correspondientes. Los datos de secuencia se obtuvieron del Archivo de Nucleótidos Europeo (ENA) bajo el número de acceso del BioProyecto PRJEB77293 (https://www.ebi.ac.uk/ena/browser/view/PRJEB77293). El conjunto de datos original comprendía 148 muestras con 36 especímenes de tejido cólico y 112 muestras de heces. Los metadatos clínicos (por ejemplo, edad, IMC, dieta, uso de medicamentos y exposición a antibióticos) no estaban disponibles para el conjunto de datos de acceso público utilizado en este estudio. Para el presente análisis, solo se incluyeron los perfiles microbianos derivados de las heces de casos de CCR y controles sanos (HC) claramente definidos. Específicamente, se seleccionaron 24 muestras de heces de pacientes con CCR y 50 muestras de HC que representan a la población de Sri Lanka [26].
Las lecturas sin procesar de secuenciación de rRNA 16S se consideraron para un control de calidad y preprocesamiento adecuados antes del análisis posterior. Dado que los datos se generaron dentro de un único estudio bajo un marco experimental consistente, no se consideraron los efectos de lote. Se realizó una evaluación inicial de la calidad utilizando FastQC (v0.12.1) [27] para detectar lecturas de baja calidad, contaminación por adaptadores y secuencias sobrerrepresentadas. El procesamiento posterior se llevó a cabo utilizando QIIME 2 (amplicon-2024.10) [28]. Las secuencias de cebadores y adaptadores, junto con las bases de baja calidad, se eliminaron utilizando el complemento Cutadapt [29] integrado dentro del marco de QIIME 2, un marco comúnmente utilizado para estudios de comunidades microbianas. Este procesamiento inicial fue esencial para mantener la precisión y la fiabilidad de la evaluación del microbioma tanto en el CCR como en los controles sanos. Posteriormente, las lecturas emparejadas se sometieron a filtrado de calidad, recorte y eliminación de ruido a través del complemento DADA2 [30] dentro del entorno QIIME 2, permitiendo que solo se retengan las secuencias de alta calidad para los análisis posteriores. Las lecturas emparejadas eliminadas del ruido se fusionaron a través del flujo de trabajo DADA2, conservando la superposición y la tolerancia a las desajustes predeterminadas para garantizar una fusión de secuencias precisa. Después de la fusión, se realizó la eliminación de quimeras y la desreplicación utilizando el complemento DADA2 dentro de QIIME 2 para inferir variantes de secuencia de amplicones (ASV) exactas. La tabla ASV resultante contiene la abundancia de cada característica de secuencia única en todas las muestras. Esta tabla sirvió de base para los análisis posteriores.
La evaluación de la diversidad bacteriana se realizó utilizando el software R (v4.4.2). Para evaluar la diversidad alfa, el análisis incorporó las métricas Chao1, especies observadas, ACE y Shannon [31–33] calculadas a través del paquete R “phyloseq (v1.50.0)” [34,35]. Los índices Chao1, Observado y ACE cuantifican la riqueza bacteriana [36,37], mientras que el índice de Shannon captura tanto la riqueza de especies como la uniformidad de la comunidad [36]. Las evaluaciones de diversidad se llevaron a cabo sobre datos de recuento rarefactos estandarizados a la profundidad de secuenciación igual al recuento de lecturas mínimo, utilizando el paquete R “phyloseq”. Las comparaciones estadísticas de la diversidad alfa entre los grupos se realizaron utilizando la prueba no paramétrica de rangos de Wilcoxon [38]. Por el contrario, la diversidad beta, que refleja las diferencias en la composición microbiana entre las muestras, se evaluó utilizando la métrica de disimilitud de Bray-Curtis [39] basada en la tabla de abundancia ASV rarefactada, calculada a través del paquete “phyloseq” en R. Se empleó el Análisis de Coordenadas Principales (PCoA) para representar gráficamente las variaciones en la estructura de la comunidad microbiana entre las muestras [40]. La diversidad beta también se evaluó utilizando la disimilitud de Jaccard y se visualizó a través del Escalado Multidimensional No Métrico (NMDS) [41]. Las diferencias en la composición de la comunidad bacteriana entre el CCR y los controles sanos se evaluaron utilizando PERMANOVA basada en las métricas de distancia de Bray-Curtis y Jaccard, implementada en el paquete vegan (v2.6-10) en R con 999 permutaciones [42].
La clasificación taxonómica probabilística de los ASV se realizó utilizando un clasificador de Bayes ingenuo entrenado en QIIME 2, basado en la base de datos Greengenes-SILVA-RDP (GSR), una base de datos de referencia de genes de rRNA 16S curada y optimizada manualmente [43]. Se utilizaron secuencias de referencia y la taxonomía correspondiente para la región V4 (cebadores 515F/806R) para entrenar el modelo a través del complemento feature-classifier en QIIME 2 [44]. La clasificación taxonómica de los ASV se infirió posteriormente utilizando el método classify-sklearn, aunque la clasificación basada en amplicones V4 proporciona asignaciones taxonómicas probabilísticas en lugar de una identificación definitiva de especies, y la resolución a nivel de especie puede ser limitada, particularmente para géneros complejos. Se realizó un perfilado de abundancia relativa en los diferentes niveles taxonómicos (filo, clase, orden, familia, género y especie) utilizando QIIME 2 [45].
Los taxones bacterianos diferencialmente abundantes entre el grupo de CCR y el grupo de controles sanos se identificaron utilizando un Modelo de Mezcla Gaussiana con Inflación Cero (ZIGMM) [46] a través del paquete R “metagenomeSeq” (versión: 1.48.1) [47]. Los taxones con un valor p ajustado < 0,05 y |log2FC| > 1 se definieron como significativamente diferencialmente abundantes. La tasa de descubrimiento falso (FDR) se controló utilizando la corrección de Benjamini-Hochberg para tener en cuenta las múltiples pruebas de hipótesis [48]. Se consideraron los taxones con mayor tamaño del efecto, anotaciones taxonómicas a nivel de especie y respaldo de artículos publicados sobre sus asociaciones con el CCR para priorizarlos para una mayor investigación.
El proteoma completo de los taxones bacterianos seleccionados, junto con el proteoma de referencia humano, se recopiló de la base de datos UniProt [49]. Se utilizaron proteomas de referencia como aproximaciones funcionales, ya que las cepas bacterianas reales presentes en las muestras de los pacientes siguen sin caracterizarse y pueden diferir de las cepas de referencia analizadas. Para eliminar las secuencias paralógicas, las secuencias de proteínas se agruparon utilizando CD-HIT con un umbral de identidad de secuencia del 60% (tamaño de palabra = 4), asegurando que solo se retuvieran las proteínas no paralógicas para un análisis posterior [50]. Para excluir las proteínas con similitud con el huésped, todas las proteínas no paralógicas se analizaron en comparación con el proteoma humano utilizando BLASTp. Las proteínas que comparten una identidad de secuencia mayor del 30% y una cobertura de consulta de al menos el 70% con cualquier proteína humana a un umbral de valor E de 1 × 10⁻⁵ o inferior se consideraron homólogos humanos y se excluyeron del análisis posterior [51]. Las proteínas bacterianas esenciales se predijeron mediante búsquedas BLASTp contra la Base de datos de Genes Esenciales (DEG 10) [52], aplicando umbrales estrictos de identidad de secuencia ≥ 40%, cobertura de consulta ≥ 80%, puntuación de bits ≥ 100 y valor E ≤ 1 × 10⁻¹⁰ para seleccionar las proteínas cruciales para la supervivencia bacteriana [53–55]. Las proteínas que no cumplían ninguna de estas condiciones se excluyeron del análisis posterior. La caracterización funcional de las secuencias que cubren los números de la Comisión de Enzimas (CE) y las asignaciones de la vía KEGG se realizó con eggNOG-mapper [56]. Se empleó PSORTb (v3.0) para predecir las ubicaciones subcelulares de las proteínas candidatas, lo que permite distinguir entre las proteínas citoplasmáticas y las asociadas a la membrana para una priorización eficaz de fármacos [57–59]. Se generaron redes de interacción proteína-proteína (PPI) de las proteínas citoplasmáticas de cada taxón utilizando la base de datos STRING con una confianza de interacción media (0,4) y posteriormente se visualizaron en Cytoscape [60,61]. Se identificaron las proteínas que exhiben una alta conectividad de interacción dentro de la red como proteínas centrales basándose en la medida topológica de Grado utilizando el complemento cytoHubba en Cytoscape y se consideraron posibles objetivos terapéuticos [62].
La capacidad de unión a fármacos de los bKGs objetivo se analizó utilizando DoGSiteScorer [63], un módulo de detección y puntuación de bolsillos integrado en la plataforma ProteinPlus. La herramienta identifica posibles cavidades de unión de ligandos a través de un procedimiento de segmentación basado en la diferencia de Gaussianas, que aísla las regiones de la superficie de la proteína que probablemente admitan la interacción de moléculas pequeñas. Para cada proteína, DoGSiteScorer calcula un conjunto de características geométricas y fisicoquímicas, que incluyen el volumen y la superficie del bolsillo, la puntuación de fármaco (0-1) y la puntuación simple, que proporcionan una estimación general de la idoneidad del bolsillo para la unión de compuestos similares a fármacos. Se consideró que los bolsillos con una puntuación de fármaco ≥ 0,5 tienen una mayor probabilidad de ser modulados por una molécula similar a un fármaco [64]. Cuando múltiples bolsillos dentro de una proteína alcanzaron puntuaciones de fármaco comparables, se informó el bolsillo con el mayor volumen, superficie y puntuación simple.
Para explorar posibles agentes terapéuticos para el CCR, se extrajeron intencionalmente 121 compuestos de fármacos asociados con el CCR de la base de datos DrugBank para la perspectiva de reutilización de fármacos [65], una estrategia bien establecida y rentable en el descubrimiento de fármacos computacional [66]. Esto está respaldado además por la evidencia de que los fármacos no antibióticos pueden exhibir actividad antimicrobiana fuera del objetivo [67], lo que proporciona una base para investigar los compuestos asociados con el CCR como posibles inhibidores de los objetivos enriquecidos en la microbiota asociada con el CCR. Las estructuras 3D de las moléculas de fármacos seleccionadas se obtuvieron de la base de datos PubChem [68], mientras que los modelos estructurales de las proteínas objetivo bacterianas se obtuvieron de las bases de datos AlphaFold [69] y SWISS-MODEL [70]. Todas las estructuras moleculares se prepararon sistemáticamente antes del acoplamiento molecular. Los ligandos seleccionados se sometieron a minimización de energía, generación de árbol de torsión y asignación de carga utilizando Avogadro [71] y AutoDockTools4 [72]. Las estructuras de las proteínas se refinaron eliminando las moléculas de agua cristalográficas, los heteroátomos no esenciales y las cadenas de proteínas extrañas utilizando Discovery Studio [73,74], seguidas de la adición de hidrógeno, la asignación de carga de Kollman y la preparación de la caja de cuadrícula en AutoDockTools4 [72]. El acoplamiento molecular de los candidatos a fármacos preprocesados con las estructuras de las proteínas objetivo se realizó utilizando AutoDock Vina [75]. Se realizó un acoplamiento ciego definiendo una caja de cuadrícula que abarca toda la superficie de la proteína, lo que permite a AutoDock Vina explorar globalmente todas las posibles cavidades de unión sin suposiciones previas sobre la ubicación del sitio activo. Las puntuaciones de afinidad de unión (BAS) de cada resultado de acoplamiento se evaluaron para identificar los compuestos que muestran las interacciones predichas más fuertes con las proteínas objetivo.
Para evaluar los perfiles farmacocinéticos y de toxicidad de los diez principales compuestos candidatos, se realizaron análisis de similitud con fármacos y ADME/T utilizando Deep-PK [76] y pkCSM [77]. Las estructuras de los compuestos se enviaron en formato de especificación de entrada de línea simple simplificada (SMILES) como entrada. La similitud con fármacos se evaluó basándose en la regla de Lipinski de los cinco [78], que define límites fisicoquímicos aceptables como peso molecular ≤ 500 Da, donantes de enlaces de hidrógeno ≤ 5, aceptores de enlaces de hidrógeno ≤ 10 y lipofilicidad (logP) ≤ 5. Se predijeron las propiedades ADME/T, incluidos los parámetros de absorción, distribución, metabolismo, excreción y toxicidad, y se seleccionaron los compuestos que cumplían tanto los criterios de similitud con fármacos como los de ADME/T como posibles candidatos para una mayor consideración. Los parámetros de la actividad antibacteriana dirigida al intestino, que incluyen la estabilidad luminal intestinal, la captación por la membrana bacteriana, la disponibilidad luminal y la actividad en condiciones anaeróbicas, no se evaluaron en este estudio. Por lo tanto, los hallazgos de ADME/T son filtros preliminares para la evaluación de la similitud con fármacos y la seguridad, en lugar de indicadores definitivos de la idoneidad para la actividad antibacteriana dirigida al intestino.
Para evaluar la especificidad del acoplamiento, se generaron 40 moléculas señuelo para cada compuesto de fármaco propuesto como controles negativos utilizando el Directorio de Señuelos Útiles Mejorado (DUDE-Z) [79], que proporciona señuelos de alta calidad con propiedades coincidentes utilizando la base de datos ZINC (Tabla S15). Posteriormente, se realizó el acoplamiento molecular entre cada proteína objetivo y sus ligandos señuelo correspondientes. La fiabilidad del acoplamiento se evaluó comparando la afinidad de unión de los compuestos de fármacos propuestos con sus conjuntos de señuelos correspondientes, confirmando que los compuestos activos lograron consistentemente una mayor afinidad de unión en relación con las moléculas señuelo en todas las proteínas objetivo [80].
Para evaluar la consistencia del sitio de unión de los compuestos seleccionados finales, se realizó una evaluación posterior al acoplamiento para los ligandos seleccionados por ADME/T en complejo con las dos proteínas objetivo principales. Se identificaron las regiones de unión a fármacos potenciales (puntuación de fármaco > 0,5) dentro de las estructuras de las proteínas utilizando DoGSiteScorer. Posteriormente, se analizó el acuerdo espacial entre las poses acopladas y las cavidades predichas para evaluar la correspondencia del sitio de unión.
Para examinar el comportamiento dinámico de los complejos proteína-ligando más prometedores, se realizaron simulaciones de dinámica molecular (DM) utilizando el software YASARA [81]. Los tres ligandos, Sulfasalazina, Tipiracil y Aminoglutetamida, que demostraron puntuaciones de acoplamiento superiores, cumplieron con los criterios de la regla de Lipinski y exhibieron perfiles ADME/T favorables, y fueron seleccionados para simulaciones de 100 ns de sus respectivos complejos proteína-ligando en entornos fisiológicos. Los datos de la trayectoria se registraron en intervalos de 100 ps y se analizaron posteriormente utilizando macros de YASARA [82], junto con el paquete de software SciDAVis (http://scidavis.sourceforge.net/). Para evaluar aún más la estabilidad de las interacciones a lo largo de la simulación, se determinaron las energías libres de unión (ΔGbind) en intervalos de 100 ps utilizando el enfoque MM-PBSA implementado en YASARA [83].
Se incluyeron un total de 74 muestras de heces (24 pacientes con CRC y 50 controles sanos) en el análisis. Tras el procesamiento de la secuencia, una alta proporción de lecturas de apareamiento (81%) se fusionó con éxito, lo que resultó en una tabla de características que comprende 1.291 variantes de secuencia de amplicones (ASV) en todas las muestras. El conjunto de datos contenía un total de 1.308.541 lecturas, con una frecuencia de características mediana de 17.981 recuentos por muestra. Los recuentos de lecturas oscilaron entre 7.101 y 25.675 por muestra, lo que indica una profundidad de secuenciación adecuada en todas las muestras. Antes de los análisis posteriores, las ASV no clasificadas y no asignadas a nivel de phylum, incluidas 'Bacterias no clasificadas' y 'Arqueas no clasificadas', se eliminaron de la tabla de características utilizando el paquete "dplyr" (v1.1.4) en R. Después de eliminar estas, la tabla de características comprendió 1.276 ASV en 74 muestras, con una frecuencia de características mediana de 17.980 recuentos por muestra. El recuento de lecturas más alto en una muestra fue de 25.527, mientras que el más bajo fue de 7.101. El análisis de rarefacción mostró un aumento progresivo en la riqueza de ASV con una mayor profundidad de secuenciación, y el eventual aplastamiento de las curvas indicó que el esfuerzo de muestreo fue adecuado y capturó la mayor parte de la diversidad microbiana. En consecuencia, para el análisis de diversidad, todas las muestras se rareficaron al recuento de lecturas de muestra mínimo. Esto aseguró un esfuerzo de muestreo uniforme para las comparaciones de diversidad alfa y beta. Para el análisis de abundancia diferencial, se excluyeron las ASV con una prevalencia inferior al 5% de las muestras para minimizar el ruido y retener características biológicamente significativas. La tabla de características filtrada final se normalizó para proporcionar una base sólida para identificar los taxones significativamente asociados con el CRC.
Se realizaron análisis de diversidad alfa y beta para comparar la composición bacteriana entre las muestras de HC y CRC. La diversidad alfa se evaluó utilizando los índices Chao1, Observado, ACE y Shannon (Fig. 2A), y las diferencias de grupo se evaluaron utilizando la prueba de rango-suma de Wilcoxon. No se observaron diferencias estadísticamente significativas en la diversidad alfa entre CRC y HC en ninguno de los índices evaluados (Observado: p-value = 0,72; Shannon: p-value = 0,57; Chao1: p-value = 0,64; ACE: p-value = 0,66), lo que sugiere que la riqueza y la uniformidad bacterianas generales fueron comparables entre los grupos.
(A) Los diagramas de caja indican que no hay una diferencia significativa en los índices de diversidad alfa (ACE, Chao1, especies observadas, Shannon) entre CRC y HC. (B) y (C) resaltan la diversidad beta utilizando la distancia de Bray-Curtis y la disimilitud de Jaccard, que exhiben una composición de la comunidad microbiana significativamente distinta.
En consecuencia, se evaluó la diversidad beta utilizando la distancia de Bray-Curtis y la disimilitud de Jaccard; los resultados se visualizaron utilizando gráficos PCoA y gráficos NMDS, respectivamente (Fig. 2B-2C). Ambos métodos revelaron diferentes patrones de composición de la comunidad entre los grupos. La prueba PERMANOVA basada en ambos métodos indicó diferencias significativas en la composición de la comunidad bacteriana entre los grupos de CRC y HC (Bray-Curtis: F = 4,076, p-value = 0,0472, disimilitud de Jaccard: F = 1,622, p-value = 0,007). Aunque el resultado de PERMANOVA basado en la disimilitud de Bray-Curtis mostró una significación límite (p-value = 0,0472), las diferencias a nivel de la comunidad también fueron respaldadas por el análisis de la disimilitud de Jaccard (p-value = 0,007), proporcionando evidencia complementaria para la separación composicional del microbioma entre los grupos. Una prueba de homogeneidad de las dispersiones del grupo basada en la distancia de Bray-Curtis (Bray-Curtis: F = 0,00998, p-value = 0,92) y la disimilitud de Jaccard (Jaccard: F = 0,207, p-value = 0,65) indicó que no hubo una diferencia significativa en la varianza entre los grupos, lo que sugiere que las diferencias observadas no se debieron a la variabilidad dentro del grupo, lo que respalda la fiabilidad de los resultados de PERMANOVA.
La inferencia taxonómica del microbioma intestinal identificó 1.276 ASV distintas, con muestras que contenían un promedio de 17.568 lecturas por muestra. Estas ASV se distribuyeron en 15 phyla, 26 clases, 40 órdenes, 97 familias y 236 géneros, lo que refleja una amplia diversidad microbiana. En todas las muestras, la comunidad microbiana se compuso predominantemente de Firmicutes (39,88%), Bacteroidetes (33,55%), Proteobacteria (15,8%) y Actinobacteria (8,06%), con contribuciones más pequeñas de Verrucomicrobia (1,05%) y Fusobacteria (0,61%). En comparación con HC, los pacientes con CRC mostraron una mayor abundancia relativa de Bacteroidetes (CRC: 40,22% vs. HC: 30,36%), Proteobacteria (CRC: 17,26% vs. HC: 15,11%) y Verrucomicrobia (CRC: 1,5% vs. HC: 0,84%), junto con una disminución de la abundancia de Firmicutes (CRC: 34,38% vs. HC: 42,52%) y Actinobacteria (CRC: 5,2% vs. HC: 9,44%) (Fig. 3A) (Tabla S1).
Se muestra la proporción de los 10 phyla, familias y géneros principales.
A nivel de familia, Prevotellaceae (17,67%), Bacteroidaceae (11,74%), Enterobacteriaceae (11,69%) y Lachnospiraceae (8,10%) se identificaron como las familias más prevalentes (Tabla S2). En el grupo de CRC, se observaron abundancias relativas elevadas en Bacteroidaceae, Veillonellaceae y Succinivibrionaceae, mientras que Bifidobacteriaceae, Lactobacillaceae, Streptococcaceae y Lachnospiraceae exhibieron una reducción en la abundancia relativa (Fig. 3B). De manera consistente, el análisis a nivel de género reveló un aumento de las abundancias de Bacteroides, Phocaeicola, Succinivibrio y Alistipes (phylum Bacteroidetes y Proteobacteria) en CRC, junto con niveles reducidos de Bifidobacterium y Streptococcus (phylum Actinobacteria y Firmicutes) (Fig. 3C) (Tabla S3).
Para identificar los taxones bacterianos significativamente diferentes en abundancia, se aplicó ZIGMM utilizando umbrales de p-value ajustado < 0,05 y |log2FC| > 1. El análisis a nivel de phylum reveló un enriquecimiento significativo de Actinobacteria (log2FC = -1,744, adj.p = 0,0074) en el grupo HC, mientras que Fusobacteria (log2FC = 1,13, adj.p = 0,0411) se enriqueció significativamente en el grupo CRC (Fig. S1). A nivel de familia, 15 taxones mostraron diferencias específicas de grupo claras, incluyendo Peptostreptococcaceae, Lactobacillaceae, Streptococcaceae y Clostridiaceae, que se enriquecieron en el grupo HC, mientras que Bacteroidaceae, Rikenellaceae, Acidaminococcaceae y Odoribacteraceae fueron más abundantes en el grupo CRC (Fig. S2), lo que indica un cambio marcado en la composición microbiana intestinal asociada con el CRC (Tabla S4). A nivel de género, surgieron 28 géneros como diferencialmente abundantes, con 18 enriquecidos y 10 disminuidos (Fig. 4A) en CRC, incluyendo Romboutsia (Peptostreptococcaceae; log2FC = -4,09, adj.p = 4,68E-07), Bacteroides (Bacteroidaceae; log2FC = 3,49, adj.p = 0,00048), Clostridium (Clostridiaceae; log2FC = -3,38, adj.p = 6,66E-05), Alistipes (Rikenellaceae; log2FC = 2,54, adj.p = 0,00011), Streptococcus (Streptococcaceae; log2FC = -2,30, adj.p = 0,0309), Flavonifractor (Firmicutes; log2FC = 2,25, adj.p = 1,02E-06). Los resultados completos a nivel de género se compilan en la Tabla S5.
Para identificar las especies bacterianas diferencialmente abundantes, se utilizó ZIGMM a nivel de ASV, revelando 42 ASV diferencialmente abundantes entre los grupos de CRC y HC (Fig. 4B), que se mapearon posteriormente a las correspondientes especies bacterianas.
Entre estas 42 especies, 21 se enriquecieron en los pacientes con CRC, mientras que las 21 restantes se redujeron en comparación con los HC, incluyendo Bacteroides fragilis (Bacteroides; log2FC = 2,23, adj.p = 0,00011), Bacteroides uniformis (Bacteroides; log2FC = 2,20, adj.p = 0,0014), Bacteroides ovatus (Bacteroides; log2FC = 3,14, adj.p = 1,12E-05), Flavonifractor plautii (Flavonifractor; log2FC = 1,90, adj.p = 3,65E-07) y Clostridium celatum (Firmicutes; log2FC = -2,02, adj.p = 1,14E-05). Toda la información de las 42 especies bacterianas diferenciales se compila en la Tabla S6. Los 10 taxones bacterianos principales se consideraron inicialmente entre las 42 especies significativamente diferentes en abundancia. Entre estos 10 principales, se priorizaron para una mayor investigación los taxones que tienen un mayor tamaño del efecto, anotaciones taxonómicas a nivel de especie y apoyo de artículos publicados sobre sus asociaciones con el CRC. En consecuencia, se seleccionaron cuatro taxones bacterianos (Bacteroides fragilis, Bacteroides ovatus, Bacteroides uniformis y Flavonifractor plautii). Aunque Bacteroides uniformis y Bacteroides ovatus se consideran comensales, su asociación con el CRC se ha informado en varios estudios anteriores [19, 84-103], y su inclusión está respaldada por la evidencia de que las bacterias comensales pueden exhibir un comportamiento patógeno oportunista dependiendo del estado inmunitario del huésped y las condiciones ambientales, y pueden mejorar la virulencia de los patógenos que coexisten en infecciones mixtas [104, 105]. Los 10 taxones bacterianos más diferencialmente abundantes, clasificados por p-value ajustado y log2FC, se presentan en la Tabla 1.
Se realizó un análisis genómico sustractivo en las cuatro especies bacterianas asociadas con el CRC identificadas a través del análisis de abundancia diferencial: Bacteroides fragilis, Bacteroides uniformis, Bacteroides ovatus y Flavonifractor plautii. Los proteomas de referencia completos para estos organismos se recuperaron de la base de datos UniProt utilizando los ID de acceso UP000006731, UP000004110, UP000473905 y UP000029585, respectivamente. Estos proteomas de referencia sirvieron como aproximaciones funcionales, ya que las cepas bacterianas reales presentes en las muestras de CRC pueden diferir de las cepas de referencia. Después de recopilar los proteomas bacterianos, se eliminaron las entradas paralógicas utilizando CD-HIT con un umbral de identidad del 60%, identificando 149 paralogos en BaF, 199 en BaU, 451 en BaO y 285 en FlaP. Las proteínas no paralógicas restantes se examinaron en busca de la presencia de proteínas en el proteoma humano utilizando BLASTp, aplicando un umbral de identidad de secuencia de ≤30%, un valor E de ≤1 × 10⁻⁵ y una cobertura de consulta mínima de ≥70%, lo que resultó en 3.737 proteínas no homólogas en BaF, 4.084 en BaU, 5.240 en BaO y 4.047 en FlaP. Estas proteínas no homólogas se consideraron posteriormente como candidatas para la priorización de fármacos-objetivo.
Para determinar la esencialidad, se analizaron los conjuntos de proteínas no homólogas en la base de datos DEG10, aplicando umbrales de identidad de secuencia ≥40%, cobertura de consulta ≥80%, puntuación bit ≥100 y valor E ≤ 1 × 10⁻¹⁰, identificando 665 proteínas esenciales en BaF, 607 en BaU, 658 en BaO y 322 en FlaP. Se realizó un análisis de la vía metabólica de estas proteínas no homólogas esenciales utilizando el servidor eggNOG-mapper. Los resultados del análisis de vías mostraron el número de vías que se comparten con las vías humanas y el número de proteínas que no están asignadas a identificadores KO. Para BaF, de las 665 proteínas no homólogas esenciales, 230 proteínas carecían de asignaciones KO, 129 proteínas anotadas con KO no estaban vinculadas a ninguna vía y 166 vías se superponían con las de los humanos. En BaU, 183 proteínas carecían de identificadores KO, 129 proteínas asignadas a KO no se asignaron a ninguna vía y 166 vías se compartieron con las vías humanas. Para BaO, 213 proteínas carecían de anotación KO, 137 proteínas asignadas a KO no tenían vías asociadas y 152 vías eran comunes a las vías humanas. En el caso de FlaP, 32 proteínas carecían de identificadores KO, 87 proteínas asignadas a KO no mostraron asignación de vías y 140 vías se compartieron con las vías humanas. Después de eliminar las vías compartidas, el análisis identificó 72 vías bacterianas únicas en BaF, 66 en BaU, 62 en BaO y 68 en FlaP, y sus correspondientes proteínas de vías bacterianas únicas son 152 en BaF, 153 en BaU, 155 en BaO y 115 en FlaP. Posteriormente, estas proteínas de vías se sometieron a un análisis de localización subcelular (Tablas S7-S10). La predicción de la localización subcelular ofreció información valiosa sobre las características funcionales y el potencial terapéutico de estas proteínas.
El análisis de la localización subcelular de las proteínas de la vía reveló que en BaF, 111 eran citoplasmáticas, 21 asociadas a la membrana citoplasmática, 2 periplásmicas y 18 proteínas con localización desconocida. En BaU, 118 eran citoplasmáticas, 20 asociadas a la membrana citoplasmática, 1 periplásmica, 1 extracelular y 13 proteínas de localización desconocida. Para BaO, 119 eran citoplasmáticas, 22 asociadas a la membrana citoplasmática, 3 periplásmicas y 11 de localización desconocida. Finalmente, FlaP exhibió 90 proteínas citoplasmáticas, 18 asociadas a la membrana citoplasmática y 7 proteínas de localización desconocida (Tabla S11).
Dado que las proteínas citoplasmáticas se utilizan con frecuencia como objetivos terapéuticos [106], solo se seleccionaron para análisis posteriores las proteínas ubicadas en el citoplasma. Se generaron redes de interacción proteína-proteína para estas proteínas citoplasmáticas en cada bacteria utilizando la plataforma STRING con una confianza de interacción media (0,4). Las redes resultantes se visualizaron en Cytoscape, y se identificaron las cinco proteínas principales para cada bacteria en función de la medida topológica de grado utilizando el complemento cytoHubba en Cytoscape (Fig. 5). Las 5 proteínas principales de cada una de las cuatro bacterias arrojaron un total de 20 proteínas, de las cuales se eliminaron las entradas duplicadas que aparecen en varias especies, lo que resultó en un conjunto de proteínas únicas. Después de eliminar las proteínas superpuestas y las proteínas con información estructural no disponible, se retuvo un conjunto final de 10 proteínas (ribD, ribBA, murA, alr, hisI, hisE, hisD, hisG, hisH y hisB) como bKGs para análisis posteriores (Tabla S12). Estos bKGs son genes bacterianos esenciales conservados y se identifican aquí como posibles objetivos antibacterianos, ya que son esenciales para la supervivencia y tienen poca similitud con los homólogos humanos [107, 108].
Se evaluó la capacidad de ser objetivo de cada proteína objetivo identificando posibles sitios de unión a ligandos y clasificándolos según su idoneidad prevista para la unión de moléculas pequeñas. Se detectaron múltiples sitios de unión para todas las proteínas seleccionadas. Para cada sitio, se calcularon las propiedades estructurales y fisicoquímicas, incluido el volumen del sitio (ų), el área de la superficie (Ų), la puntuación de fármaco y la puntuación simple. Se consideró que los sitios con una puntuación de fármaco ≥ 0,5 tenían una mayor probabilidad de ser modulados por moléculas similares a fármacos. Las diez bKGs tenían al menos un sitio con puntuaciones de fármaco ≥ 0,5, lo que confirmó su capacidad de ser objetivo prevista y su idoneidad como objetivos para la unión de moléculas pequeñas. Los parámetros de capacidad de ser objetivo para los sitios seleccionados se compilan en la Tabla 3 (ver las Figuras S3-S12 para la visualización de los sitios).
Se realizaron análisis de acoplamiento molecular para evaluar la fuerza de interacción entre las proteínas objetivo priorizadas y el conjunto de ligandos seleccionados. Se obtuvieron las estructuras 3D de las 10 bKGs seleccionadas (ribD, ribBA, murA, alr, hisI, hisE, hisD, hisG, hisH y hisB) de la Base de datos de estructuras de proteínas AlphaFold y SWISS-MODEL, y estos modelos estructurales se utilizaron posteriormente para el acoplamiento molecular. Se recopilaron un total de 121 compuestos candidatos asociados con el CRC de DrugBank (Tabla S13). Tanto las estructuras de proteínas como de ligandos se prepararon de acuerdo con el procedimiento descrito en la sección de Métodos. A continuación, se ejecutó el acoplamiento molecular para todas las combinaciones proteína-ligando, generando BAS (kcal/mol). Las 25 interacciones con mayor puntuación se visualizaron en un mapa de calor de matriz. Con base en estos resultados, se seleccionaron los 10 ligandos principales Tucatinib, Sonidegib, Belumosudil, Regorafenib, Antrafenine, Sorafenib, Sulfasalazine, Estramustine, Aminoglutethimide y Tipiracil, resaltados en verde en la Fig. 6, como los candidatos a fármacos preliminares más prometedores para una investigación en profundidad contra los bKGs propuestos. Los candidatos identificados representan predicciones computacionales derivadas de una cadena de inferencia de varios pasos; por lo tanto, es esencial la validación experimental antes de que se pueda establecer cualquier relevancia terapéutica.
La matriz ilustra las fortalezas de interacción para 10 proteínas objetivo priorizadas frente a 25 moléculas analizadas. El sombreado verde identifica los 10 compuestos con las mejores puntuaciones de afinidad de unión.
Se evaluó la similitud con fármacos de los 10 candidatos a fármacos principales que mostraron la mayor afinidad de unión promedio prevista hacia los objetivos seleccionados utilizando la Regla de los Cinco de Lipinski (ROF). Esta guía considera las propiedades moleculares, como el peso molecular (90%), lo que indica una fuerte biodisponibilidad oral prevista y una absorción eficiente. Su permeabilidad a la barrera hematoencefálica fue limitada (BBB < 0,3) y no penetró en el SNC, lo cual es deseable para minimizar los posibles efectos neurotóxicos. La evaluación de la toxicidad respaldó aún más los perfiles de seguridad previstos generales de estos compuestos. En general, la combinación de las características de absorción previstas computacionalmente, la entrada restringida a la BBB y los perfiles de toxicidad aceptables subrayan su potencial como candidatos a fármacos preliminares, lo que requiere una validación experimental para establecer la relevancia terapéutica. Un resumen completo de los perfiles farmacocinéticos y de toxicidad de cada compuesto se proporciona en la Tabla S14.
Para validar el protocolo de acoplamiento molecular, se compararon las BAS de los compuestos de fármacos seleccionados con las BAS promedio de las moléculas señuelo correspondientes para cada proteína objetivo (Tabla S15). En todos los casos, los compuestos seleccionados demostraron mejores puntuaciones de afinidad de unión en comparación con las moléculas señuelo (Tabla S16), lo que confirmó que las interacciones proteína-ligando observadas no eran aleatorias. Estos resultados respaldan la confiabilidad del protocolo de acoplamiento y confirman que los compuestos seleccionados se distinguieron de las moléculas señuelo inactivas según sus puntuaciones de afinidad de unión, lo que valida la especificidad de los resultados del acoplamiento.
Las poses de acoplamiento de los complejos finales seleccionados se cruzaron con los residuos de los sitios previstos de las proteínas. Para ribBA, el ligando acoplado ocupó el sitio previsto superior, y se confirmó que todos los residuos que interactúan son miembros del sitio previsto. Para ribD, DoGSiteScorer predijo 3 sitios con puntuaciones de fármaco comparables (0,81, 0,8 y 0,82), lo que indica múltiples sitios de unión potenciales en la superficie. El ligando acoplado ocupó el segundo sitio clasificado, y todos los residuos que interactúan estaban completamente contenidos dentro de la cavidad prevista (Tabla S17). Esto refleja el acoplamiento ciego que se une de forma independiente dentro de los sitios de acoplamiento predecidos computacionalmente de las proteínas objetivo, lo que proporciona una justificación computacional de los sitios de acoplamiento identificados.
Se realizó un análisis de simulación de dinámica molecular de los tres complejos proteína-ligando seleccionados (ribBAsulfasalazine, ribDaminoglutethimide y ribDtipiracil) con las mejores puntuaciones de acoplamiento, el cumplimiento de los criterios de la Regla de los Cinco de Lipinski y los perfiles ADME/T favorables, para evaluar la estabilidad conformacional y la consistencia de la unión de cada compuesto a lo largo de la trayectoria de 100 ns. La evaluación se centró en métricas clave que incluyen RMSD, RMSF y energía libre de unión MM-PBSA. RMSD indica el desplazamiento atómico promedio a lo largo del tiempo, lo que refleja la estabilidad del complejo; como se muestra en la Fig. 7. Con valores RMSD promedio de 2,145 Å y 2,518 Å, ribDaminoglutethimide y ribDtipiracil exhibieron una mejor estabilidad que ribBAsulfasalazine (valor RMSD promedio de 5,189 Å). Aquí, ribDaminoglutethimide exhibió la menor fluctuación, lo que sugiere una mayor estabilidad (Fig. 7A). El análisis de RMSF reveló que ribD-Tipiracil exhibió la menor flexibilidad de residuos con un valor promedio de 1,980 Å, seguido de ribD-Aminoglutethimide (2,140 Å) y ribBA-Sulfasalazine (2,234 Å), lo que indica interacciones más consistentes y estables (Fig. 7B). La energía libre de unión MM-PBSA reveló una buena estabilidad con puntuaciones promedio de 56,24 kJ/mol (ribDaminoglutethimide), 18,67 kJ/mol (ribBAsalfasalazine) y 74,21 kJ/mol (ribDtipiracil). ribDaminoglutethimide demostró una buena unión, seguido de ribDtipiracil, con ribBA_salfasalazine que mostró una interacción comparativamente más débil (Fig. 7C).
El microbioma intestinal se ha asociado cada vez más con la carcinogénesis colorrectal, y los estudios sugieren su posible participación en los procesos inflamatorios y las vías de señalización celular [109]. A lo largo del desarrollo del cáncer, se ha observado una compleja interacción entre la comunidad microbiana intestinal, la microbiota asociada al tumor y el sistema inmunitario del huésped [110,111]. La patogénesis del CRC representa un proceso multifactorial asociado con alteraciones genéticas hereditarias, factores de riesgo relacionados con el estilo de vida y cambios en la composición de la microbiota intestinal. La evidencia acumulada sugiere que las alteraciones de la microbiota intestinal pueden estar asociadas con la resistencia al tratamiento y la evolución del tumor, lo que subraya la creciente necesidad de desarrollar estrategias guiadas por el microbioma para el manejo del cáncer [20,112]. Los agentes terapéuticos que actúan sobre las proteínas humanas y aquellos que se dirigen a las proteínas microbianas ofrecen dos vías complementarias de tratamiento. La modulación de las proteínas del huésped puede influir en las vías biológicas internas, mientras que la focalización de las proteínas bacterianas puede ayudar a remodelar la actividad microbiana intestinal, lo que puede afectar al metabolismo y los resultados de la enfermedad [113–115]. En este estudio, se utilizaron datos de secuenciación de ARNr 16S derivados del microbioma intestinal para identificar los bKGs como posibles dianas antibacterianas dentro de los taxones bacterianos asociados al CRC y para evaluar los compuestos farmacológicos candidatos mediante el reprocesamiento computacional de fármacos. Nuestro análisis reveló diferencias significativas en el perfil microbiano general entre los pacientes con CRC y el grupo de control sano (HC). Las alteraciones a nivel de filo observadas en el CRC, específicamente, el aumento de la abundancia de Fusobacteria (asociada previamente con la carcinogénesis colorrectal) en contraste con la reducción de Actinobacteria (conocida por producir SCFAs y poseer propiedades antiinflamatorias), representan cambios en la composición que se han notificado en estudios del microbioma asociado al CRC [116]. A nivel de familia, el alto enriquecimiento de las familias Bacteroidaceae, Rikenellaceae y Acidaminococcaceae en el CRC [91,117,118] y el alto enriquecimiento de Bifidobacteriaceae, Lactobacillaceae y Lachnospiraceae [119–121] en el grupo HC corroboran los hallazgos de otros estudios. El análisis de abundancia diferencial reveló 42 especies bacterianas que se modificaron significativamente en el CRC en comparación con los individuos del grupo HC. Las especies bacterianas, como Bacteroides fragilis, Flavonifractor plautii, Bacteroides uniformis y Bacteroides ovatus, se enriquecieron significativamente en el grupo CRC, mientras que los taxones, como Romboutsia, Bifidobacterium y Blautia, se redujeron significativamente. La disminución de Romboutsia, Bifidobacterium y Blautia es consistente con la literatura emergente sobre las alteraciones en la composición de la microbiota intestinal asociadas con el CRC [119,122,123]. La elevada abundancia de especies de Bacteroides observada en los pacientes con CRC en comparación con los sujetos del grupo HC está bien documentada en varios estudios del microbioma [124,125]. Bacteroides fragilis enterotoxigénica ha surgido como un posible biomarcador diagnóstico para el CRC y se ha asociado con un resultado pronóstico desfavorable [126]. Se ha informado que Bacteroides fragilis promueve el desarrollo del tumor a través de diversos mecanismos, incluida la modulación de la señalización de NF-κB, la inducción de daños en el ADN, la mejora del metabolismo de las poliaminas, la estimulación de las respuestas inmunitarias TH17 y la activación de las funciones de las células madre [127]. Flavonifractor plautii, una bacteria importante que degrada los flavonoides, es conocida por su elevada degradación de los flavonoides, lo que podría reducir los efectos beneficiosos y la biodisponibilidad de los flavonoides en el CRC. Además, su asociación con la vía de escisión del catecol, que procesa los catecoles producidos durante la degradación de los flavonoides, destaca aún más su papel en el metabolismo de los flavonoides intestinales [88]. Bacteroides uniformis y Bacteroides ovatus se enriquecieron en el CRC en algunos estudios [84,101] y se han asociado con bacteriemia, que se ha relacionado con un mayor riesgo de CRC [85], aunque se ha informado que están presentes como comensales intestinales o como miembros del intestino sano [128,129]. De las 42 bacterias alteradas, se seleccionaron cuatro bacterias (Bacteroides fragilis, Bacteroides ovatus, Bacteroides uniformis y Flavonifractor plautii) para una mayor investigación. Aunque Bacteroides uniformis y Bacteroides ovatus se consideran comensales, su asociación con el CRC se ha notificado en varios estudios anteriores [84–86,90–93,97,101–103], y su selección está respaldada por la evidencia de que las bacterias comensales pueden presentar un comportamiento patógeno oportunista en función del estado inmunitario del huésped y las condiciones ambientales, y pueden mejorar la virulencia de los patógenos que coexisten en las infecciones mixtas [104,105]. El análisis de las cuatro bacterias asociadas al CRC identificó 10 bKGs esenciales conservados (ribD, ribBA, murA, alr, hisI, hisE, hisD, hisG, hisH e hisB) dentro de estos taxones. Estos bKGs son fundamentales para la supervivencia bacteriana, ya que median en la biosíntesis de riboflavina, histidina y el componente de la pared celular, y pueden servir como posibles dianas antibacterianas, dada su esencialidad y baja similitud con los homólogos humanos [130]. Se ha informado que los genes esenciales bacterianos implicados en la biosíntesis de peptidoglicanos y el metabolismo de la riboflavina influyen indirectamente en la señalización inmunitaria del huésped a través de la liberación de fragmentos de la pared celular bacteriana y los intermediarios metabólicos que interactúan con el huésped [131,132]. También se ha informado que los genes esenciales implicados en la biosíntesis de histidina influyen en la interacción huésped-microbioma [133,134], lo que puede indicar su papel indirecto en el desarrollo de la enfermedad. Los genes ribD y ribBA desempeñan un papel fundamental en la biosíntesis de riboflavina bacteriana, proporcionando el precursor necesario para los cofactores FMN y FAD que sustentan los procesos redox y las funciones metabólicas básicas. Su inhibición puede ofrecer una posible estrategia para comprometer la aptitud metabólica y el crecimiento de los taxones bacterianos enriquecidos en el CRC [135–137]. Los genes his codifican colectivamente las enzimas responsables de la biosíntesis de histidina, una vía metabólica muy regulada en los sistemas bacterianos; se ha asociado la interrupción de estos genes con la auxotrofia de la histidina y la pérdida de la virulencia bacteriana, lo que respalda su candidatura como posibles dianas antibacterianas dentro de los taxones bacterianos asociados al CRC identificados en este estudio [138,139]. Los genes murA y alr codifican enzimas clave implicadas en la biosíntesis de peptidoglicanos, lo que los convierte en dianas atractivas para la intervención antibacteriana [140–142]. En conjunto, estos 10 genes representan dianas metabólicas esenciales conservadas sin homólogos humanos que pueden tener una influencia potencial en la interacción huésped-microbios, lo que los convierte en candidatos potencialmente adecuados para una intervención antibacteriana selectiva contra los taxones bacterianos asociados al CRC. Para identificar los compuestos terapéuticos capaces de dirigirse a los bKGs priorizados, un análisis exhaustivo de cribado de fármacos in silico priorizó tres compuestos (sulfasalazina, aminoglutetimida y tipiracil) como agentes antibacterianos basándose en su fuerte afinidad de unión prevista con los bKGs identificados, el cumplimiento de los criterios de similitud de fármacos de la regla de Lipinski y los perfiles favorables de farmacocinética (penetración limitada en la BBB, penetración limitada en el SNC, alta absorción intestinal) y toxicidad (no mutagénico) (véase la tabla S14). El análisis de simulación de dinámica molecular respaldó aún más la estabilidad estructural de los complejos seleccionados. La sulfasalazina es un agente antibacteriano que actúa sobre la enzima azorreductasa bacteriana del colon y se metaboliza en el metabolito antiinflamatorio y los metabolitos antibacterianos sulfapiridina [143]. La sulfasalazina es también un agente antiinflamatorio bien establecido, que ejerce efectos antitumorales al promover la apoptosis y la reducción del tumor mediante el bloqueo del transportador de cistina asociado a la membrana plasmática, el sistema xc- [144]. La sulfasalazina demostró una fuerte afinidad de unión prevista con murA, ribBA y hisE, lo que sugiere una posible interferencia con la biosíntesis de peptidoglicanos y riboflavina en los taxones bacterianos asociados al CRC. La aminoglutetimida y la tipiracil demostraron una afinidad de unión prevista favorable con ribD, murA y hisD, lo que sugiere una posible influencia en las vías de biosíntesis de riboflavina y peptidoglicanos y en el crecimiento bacteriano. En particular, la tipiracil, junto con la trifluridina, ha sido aprobada para su uso en pacientes con CRC metastásico que han fracasado o no son aptos para los tratamientos quimioterapéuticos y biológicos estándar, así como para pacientes con CRC avanzado o recurrente irresecable [145], lo que respalda aún más la relevancia traslacional de estos candidatos identificados computacionalmente. En conjunto, estos análisis de múltiples capas proporcionan un apoyo preliminar para la exploración de estrategias terapéuticas guiadas por el microbioma relevantes para el CRC y la identificación de un conjunto de posibles interacciones gen-fármaco microbianas como candidatos para una mayor investigación. Estos hallazgos representan predicciones computacionales que requieren una validación experimental para confirmar su eficacia antibacteriana, su relevancia funcional y su potencial terapéutico en el contexto del microbioma intestinal asociado al CRC.
Una de las ventajas de este estudio es el uso de una completa plataforma computacional que integra el perfilado microbiano basado en el ARNr 16S, el análisis estadístico, la genómica sustractiva, el análisis de la red de interacción proteína-proteína, el acoplamiento molecular y el análisis ADME/T para explorar los bKGs como posibles dianas antibacterianas en los taxones bacterianos asociados al CRC y priorizar los terapéuticos candidatos. En conjunto, estos enfoques ofrecen un marco sistemático e integrador para identificar posibles dianas terapéuticas. A pesar de estas ventajas, se deben reconocer varias limitaciones. Todas las conclusiones se extraen de los análisis in silico y, por lo tanto, requieren confirmación mediante experimentos de laboratorio, incluidos la validación in vitro e in vivo. Este estudio se centró exclusivamente en las dianas bacterianas y no incorporó las vías moleculares del huésped. El flujo de trabajo implica múltiples inferencias computacionales secuenciales, lo que puede introducir una incertidumbre acumulativa. Las asignaciones taxonómicas de la secuenciación de amplicones 16S V4 son probabilísticas en lugar de definitivas, y los proteomas de referencia utilizados representan aproximaciones funcionales en lugar de cepas derivadas de pacientes reales. Los compuestos farmacológicos se obtuvieron de DrugBank basándose en la asociación con el CRC para la investigación de reprocesamiento y pueden no representar la biblioteca más adecuada para la inhibición de las enzimas bacterianas. Los resultados del acoplamiento molecular reflejan las afinidades de unión previstas basadas en modelos computacionales, y la evidencia de la eficacia del fármaco necesita una confirmación experimental. Además, se empleó un enfoque de acoplamiento ciego sin establecer puntos de referencia con inhibidores conocidos debido a la ausencia de estructuras resueltas experimentalmente de las proteínas diana, y el acoplamiento se realizó utilizando un único motor (AutoDock Vina) sin replicación en plataformas alternativas. Además, los parámetros antibacterianos dirigidos al intestino, incluido la estabilidad luminal intestinal, la captación por la membrana bacteriana y la actividad en condiciones anaeróbicas, no pudieron incluirse en el análisis ADME/T, debido a las limitaciones computacionales. Por último, el conjunto de datos comprende una cohorte única relativamente modesta sin metadatos clínicos disponibles, y la influencia biológica más amplia de los bKGs identificados en los procesos metabólicos del huésped aún debe establecerse mediante estudios funcionales y longitudinales.
Este estudio empleó un marco integrativo in silico que comprendía la elaboración de perfiles microbianos basados en el ARNr 16S, la genómica sustractiva, el análisis de redes de interacción proteína-proteína (PPI), el acoplamiento molecular y el análisis ADME/T para investigar la alteración de la composición de la microbiota intestinal asociada con el CCRC y para identificar los bKGs en la microbiota intestinal asociada con el CCRC como posibles dianas para la terapia antibacteriana. El análisis de los datos de secuenciación del ARNr 16S reveló alteraciones significativas en la composición de la comunidad bacteriana entre los grupos de CCRC y HC. El análisis de abundancia diferencial identificó varias taxones bacterianos asociados con el CCRC, incluidos Bacteroides fragilis, Bacteroides uniformis, Bacteroides ovatus y Flavonifractor plautii, que se han asociado previamente con el CCRC en estudios observacionales. Utilizando un enfoque de genómica sustractiva y el análisis de redes PPI, se identificaron diez bKGs esenciales (ribD, ribBA, murA, alr, hisI, hisE, hisD, hisG, hisH e hisB) de estos taxones bacterianos asociados con el CCRC como posibles dianas antibacterianas, ya que estas proteínas son proteínas metabólicas bacterianas esenciales conservadas. Posteriormente, el cribado computacional de fármacos identificó diez compuestos candidatos, de los cuales la sulfasalazina, el aminoglutetimida y el trifluridina/tipiracil mostraron perfiles farmacocinéticos y de toxicidad in silico favorables que respaldan su posible idoneidad para su reutilización como agentes antibacterianos en el CCRC. Finalmente, este estudio propone una estrategia guiada por el microbioma que integra la identificación de bKGs con la reutilización computacional de fármacos para explorar opciones terapéuticas antibacterianas relevantes para el microbioma asociado con el CCRC. Dirigirse a las bacterias alteradas asociadas con el CCRC y a sus bKGs esenciales puede ofrecer una vía de tratamiento complementaria prometedora. Sin embargo, es necesaria la validación experimental y los estudios clínicos para confirmar la eficacia, la seguridad y el potencial de traslación de los fármacos candidatos identificados, mientras que futuros análisis funcionales y específicos del paciente del microbioma pueden respaldar aún más las intervenciones personalizadas para el CCRC.
¡Aún no hay comentarios. Sé el primero en comentar!