Caracterizar el microambiente inmunitario tumoral (TIME) es esencial para comprender las respuestas antitumorales en el cáncer de colon.
Este estudio presenta TIME Landscaper (TIMEL), un marco computacional que utiliza el aprendizaje profundo para identificar estructuras tisulares a nivel microscópico y resume su distribución en imágenes de porta completa (WSI) mediante descriptores estadísticos que reflejan la heterogeneidad intratumoral para el descubrimiento de biomarcadores pronósticos. Se evaluó el rendimiento de seis modelos de clasificación de imágenes de aprendizaje profundo (Inception V3, DenseNet-121, ViT-base, UNI, Prov-GigaPath y Virchow) para segmentar las áreas tumorales, estromales e inmunitarias a nivel microarquitectónico, utilizando casi 50.000 mini-parches. El modelo seleccionado se aplicó a las WSI de las cohortes de descubrimiento (TCGA-COAD; n = 411) y validación (Dartmouth; n = 108), segmentando estos componentes para mapear su distribución espacial. A partir de estos mapas, se calcularon 30 descriptores estadísticos que representan la abundancia, la variación, la forma, la suavidad espacial y la heterogeneidad espacial como características de TIMEL a nivel de porta.
Los análisis de regresión univariante y multivariante identificaron biomarcadores asociados a la supervivencia y relacionados con la metástasis de las cohortes de descubrimiento y validación, respectivamente. Virchow superó a otros modelos en la segmentación de los compartimentos tisulares (AUC: 0,99, 0,98, 0,98 para los componentes tumoral, estromal e inmunitario). La varianza estromal e inmunitaria a nivel de porta se correlacionó con las métricas evaluadas por el patólogo (R = 0,47 y 0,32, ambas p < 0,001). La agrupación espacial inmunitaria predijo una peor supervivencia (HR = 2,73; p < 0,001), mientras que la agrupación tumoral fue protectora (HR = 0,23; p = 0,001).
La suavidad espacial tumoral se asoció con la metástasis en los ganglios linfáticos (OR = 1,65; p = 0,02). TIMEL integra el aprendizaje profundo y la estadística para capturar la heterogeneidad histológica dentro del TIME, mejorando la evaluación pronóstica y apoyando la oncología de precisión a partir de la histología de rutina.
El cáncer colorrectal (CCR) se encuentra entre las principales causas de mortalidad relacionada con el cáncer a nivel mundial, y se observa un preocupante aumento en la incidencia en grupos de edad más jóvenes [1], lo que subraya la necesidad de estrategias pronósticas innovadoras [2]. En el centro de la investigación oncológica actual se encuentra el microambiente inmunitario tumoral (MIT) [3], una compleja matriz de células inmunitarias, estromales y tumorales que interactúan (incluidas las células T, las células B, las células NK y los monocitos), cuya distribución espacial y actividad coordinada influyen de manera crítica en las respuestas antitumorales y en los resultados del adenocarcinoma colorrectal. Comprender el MIT es fundamental para desarrollar modelos pronósticos y avanzar en las estrategias inmunoterapéuticas para mejorar la citotoxicidad tumoral.
Sin embargo, el MIT presenta una complejidad y variabilidad específicas de cada paciente, lo que plantea importantes desafíos para un análisis eficaz. Comprende una mezcla heterogénea de tipos y sublíneas de células no malignas, cada una con funciones biológicas distintas y que participan en intrincadas interacciones celulares. Descifrar estas interacciones multifacéticas sigue siendo una tarea formidable. Aunque los avances recientes en las tecnologías biomédicas, como la transcriptómica espacial, ofrecen herramientas potentes para abordar esta heterogeneidad, el compartimento tumoral permanece profundamente incrustado y funcionalmente entrelazado con los infiltrados inmunitarios y estromales circundantes. Además, la heterogeneidad espacial dentro del MIT añade otra capa de complejidad [4], ya que el microambiente difiere notablemente entre las regiones centrales y periféricas del tumor. Por lo tanto, son cruciales los métodos innovadores para separar y analizar los componentes y las interacciones espaciales del MIT. Estos enfoques podrían mejorar significativamente los esfuerzos de caracterización cuando se combinan con datos clínicos, imágenes, evaluaciones morfológicas y estudios multiómicos.
El examen histopatológico de las láminas, teñidas rutinariamente con hematoxilina y eosina (H&E), sigue siendo fundamental para el diagnóstico y la predicción del tumor. Recientemente, se ha puesto un mayor énfasis en los enfoques computacionales para obtener información de las láminas de tejido digitalizadas, conocidas como imágenes de lámina completa (ILC), lo que mejora nuestra comprensión y caracterización del MIT. La inteligencia artificial (IA), en particular a través de enfoques de aprendizaje automático (ML) y aprendizaje profundo (DL), ofrece un potencial transformador para avanzar en nuestra comprensión de la biología tumoral. Estos modelos destacan en la síntesis de asociaciones complejas a partir de datos biomédicos multidimensionales, incluidos las ILC de gigapíxeles [5].
La acumulación de millones de láminas de tejido digitalizadas ha facilitado el desarrollo de modelos de base de patología, redes neuronales con miles de millones de parámetros que capturan la variación histológica en grandes cohortes de pacientes. Si bien estos modelos han demostrado ser eficaces en la caracterización y la predicción del tumor, su interpretabilidad sigue siendo un desafío [6]. Las técnicas de interpretación actuales a menudo proporcionan atribuciones a nivel de píxel o de parche post hoc, identificando agregados celulares o regiones de tejido clave [7], [8], [9], [10], [11]. Si bien algoritmos como HoverNet [12] pueden capturar la heterogeneidad celular, no consideran las contribuciones de los elementos de la matriz extracelular circundante. Sin embargo, la interpretación significativa de las características histopatológicas requiere una comprensión integrada que combine la experiencia específica del dominio con las perspectivas computacionales.
Nuestro enfoque computacional aborda estas limitaciones al cambiar el enfoque de las características a nivel celular aisladas a lo que denominamos métricas/parámetros a nivel de paisaje: descriptores estadísticos integrales que resumen la arquitectura espacial y la composición celular/matricial del MIT. Esta perspectiva más amplia captura las propiedades emergentes de las interacciones inmunitarias-tumorales y forma la base de lo que definimos como el paisaje del microambiente inmunitario tumoral (LMIT). El desarrollo de métodos para traducir las características histopatológicas en biomarcadores clínicamente interpretables de los componentes del MIT puede complementar potencialmente la predicción y el manejo de la enfermedad. Nuestro marco anterior, TOAST (TumOr And STroma classifier), introdujo un conjunto de ocho parámetros de paisaje derivados de modelos de DL y análisis estadísticos, lo que demostró un concepto de prueba para dichos cálculos [13]. Sin embargo, este enfoque tiene sus propias limitaciones: no aborda adecuadamente el componente inmunitario, un aspecto fundamental del MIT, y carece de estadísticas espaciales, basándose únicamente en la variación composicional (es decir, no espacial) de los elementos estromales y tumorales. Además, la precisión de la extracción de información visual podría mejorarse mediante el uso de modelos de base preentrenados, que ofrecen representaciones más sólidas [14], [15], [16].
Basándonos en nuestro trabajo anterior [13], presentamos un marco híbrido, denominado LMIT, diseñado para capturar descriptores histopatológicos interpretables del LMIT. Este marco aprovecha el DL para extraer características celulares/matriciales y emplea el modelado estadístico para representar su distribución y heterogeneidad. Ampliando el marco TOAST [13], el LMIT introduce 30 parámetros de paisaje que incorporan explícitamente el compartimento inmunitario junto con los componentes tumorales y estromales. Estos parámetros incluyen siete estadísticas no espaciales/composicionales y tres estadísticas espaciales por componente, que cuantifican la abundancia, la variación, la morfología, la extrema, la localización de puntos calientes espaciales, la suavidad y la heterogeneidad dentro del MIT. Al modelar directamente la heterogeneidad a nivel de lámina de tejido intratumoral a través de estos marcadores de paisaje interpretables, en lugar de depender de la interpretación post hoc, nuestro enfoque refleja con mayor precisión la compleja organización espacial del MIT y su importancia pronóstica.
Materiales y métodos
Descripción general del método
Este estudio emplea un enfoque integral para analizar las ILC histopatológicas de pacientes con cáncer de colon utilizando el marco LMIT, que integra el DL y el análisis estadístico para evaluar la heterogeneidad del MIT. Los métodos se han resumido a continuación: 1. Recopilación de datos: La investigación utiliza dos cohortes: una cohorte de descubrimiento del conjunto de datos TCGA-COAD para el desarrollo de mapas de tipos de células espaciales y el análisis de supervivencia inicial de los descriptores de paisaje, y una cohorte de validación interna del Dartmouth–Hitchcock Medical Center (DHMC) para la validación de los resultados relacionados con la metástasis. La cohorte de descubrimiento consta de 411 ILC después de excluir las muestras subóptimas (debido a la duplicación, la mala calidad de la imagen o la ausencia de células tumorales identificables), con 10 ILC utilizadas para el entrenamiento y la validación cruzada (VC) de los modelos a nivel celular que requieren una anotación sustancial por parte de un patólogo. La cohorte de validación incluye 108 pacientes, con láminas teñidas e imágenes de alta resolución (40×; Leica Aperio GT450). Se realizan anotaciones manuales y automatizadas para identificar los tipos de tejido y las regiones tumorales, con anotaciones histológicas detalladas que cubren varios componentes celulares/matriciales. 2. Enfoques a nivel celular, a nivel de ROI y a nivel de lámina: El enfoque de DL del marco LMIT clasifica los patrones histológicos a nivel celular dentro de las ILC, mientras que el enfoque estadístico posterior resume estas clasificaciones en parámetros de paisaje a nivel de paciente que resumen la heterogeneidad del tejido. El modelo de DL se entrena utilizando miniparche y emplea redes neuronales preentrenadas para la extracción de características, seguido de la VC para garantizar un rendimiento robusto del modelo. Se derivó un conjunto de 30 parámetros de paisaje para caracterizar el MIT, que capturan tanto las propiedades no espaciales/composicionales como las espaciales. 3. Validación interna frente a mapas de TSR/TIL espaciales anotados por patólogos: Estos descriptores se correlacionaron con métricas derivadas por patólogos, como la relación tumoral-estromal local (TSR) y las estimaciones de infiltrado linfocitario tumoral (TIL), para garantizar la relevancia práctica. 4. Validación a nivel de paciente: Los análisis posteriores exploraron las interdependencias entre los parámetros de paisaje, sus correlaciones con las variables clínicas y su importancia pronóstica a través de análisis univariados, multivariados y de selección de características en ambas cohortes de descubrimiento y validación.
Muestras y cohortes
La figura 1A ilustra el diseño general del estudio.
Cohorte de desarrollo/descubrimiento: Extrajimos datos de 461 pacientes del conjunto de datos TCGA-COAD. Tras la revisión de 459 láminas de diagnóstico, se excluyeron 48 debido a la duplicación, la mala calidad de la imagen o la ausencia de células tumorales identificables. Las 411 ILC restantes formaron la base de nuestro análisis. De estas, se seleccionaron y anotaron aleatoriamente casi 50.000 miniparche de 10 ILC para su uso en el entrenamiento a nivel celular, la VC y la selección del modelo. Posteriormente, se utilizaron las 411 ILC para las tareas de inferencia. Es importante señalar que, si bien la cohorte de desarrollo incluye un pequeño número de casos de la cohorte de descubrimiento (10 de 411 ILC; 2,4%), las tareas de inferencia son metodológicamente distintas a una escala diferente (a nivel de paciente) de la fase de entrenamiento (a nivel celular). Las ILC de TCGA-COAD se obtuvieron a través del portal GDC (https://portal.gdc.cancer.gov) utilizando varios escáneres (incluidos Leica GT450/AT2/CS2 y Hamamatsu S60/S360). Los datos clínicos se obtuvieron de cBioPortal (https://www.cbioportal.org) y del portal GDC, e incluyeron los siguientes parámetros: edad, género, estadio TNM, estadio AJCC, supervivencia libre de enfermedad (SLE), supervivencia libre de progresión (SLP) y supervivencia global (SOG).
Cohorte de validación interna: Incluimos 108 pacientes con CCR de DHMC (2016-2019) con la aprobación del IRB. Algunos de esta cohorte formaron parte de nuestro estudio anterior [17], [18]. Las láminas se tiñeron con H&E y se obtuvieron imágenes a una resolución de 40× utilizando Leica Aperio AT2/GT450. Se recopilaron parámetros clinicopatológicos, incluidos la edad, el género, el estado de inestabilidad de microsatélites (MSI) y los estadios pTNM de la AJCC. La tabla 1 detalla las diferencias clinicopatológicas entre las cohortes.
Los datos individuales completos de los pacientes para ambas cohortes, incluidos nuestros parámetros de paisaje calculados, se informaron en la tabla suplementaria S1.
Anotaciones manuales, detección de tejidos automatizada y creación de parches
Se utilizaron dos tipos de anotaciones: anotaciones regionales que definen las regiones tumorales macroscópicas que establecen los límites espaciales del análisis, y anotaciones histológicas detalladas anidadas dentro de estas regiones para etiquetar los componentes celulares y microarquitectónicos microscópicos. Se extrajeron miniparche de las anotaciones detalladas para el desarrollo del modelo de DL, mientras que la distribución espacial de las áreas de tejido segmentadas se cuantificó de manera más amplia dentro de los límites de las anotaciones tumorales regionales.
Anotación histológica detallada: Se realizaron anotaciones de tejidos y células/matrices detalladas (figura 1B) por un patólogo, que abarcaron un total de 49.479 miniparche. Cada miniparche tenía una resolución de 22,4 × 22,4 μm2, equivalente a aproximadamente 90 píxeles2, y podía cubrir entre 1 y 5 células. Las clases de anotación incluyeron células tumorales (n = 10.000), estroma colágeno (n = 10.000), células inmunitarias (n = 8190), necrosis (n = 6708), sangre (n = 3434), grasa (n = 6247) y espacio en blanco (n = 4900). Estas anotaciones se realizaron en 10 ILC seleccionadas aleatoriamente de la cohorte de desarrollo. Para garantizar la precisión, las anotaciones fueron revisadas por dos patólogos certificados.
Anotación regional del cáncer: Para garantizar que el análisis se limitara a las regiones tumorales, las regiones macroarquitectónicas, como las áreas del lecho tumoral (figura 1B), se anotaron manualmente utilizando herramientas poligonales en QuPath en 411 ILC. Estas anotaciones, también realizadas por un patólogo, incluyeron múltiples polígonos para regiones tumorales espacialmente distintas y no contiguas para garantizar la precisión.
Detección de tejidos automatizada: Para mejorar la precisión de las anotaciones de la región del cáncer, integramos los polígonos dibujados manualmente con los polígonos de detección de tejidos generados automáticamente utilizando el paquete lazyslide [19] (versión 0.7.1). Este enfoque híbrido conserva el enfoque específico del cáncer de la anotación manual al tiempo que minimiza la inclusión de áreas no tisulares (espacio en blanco) mediante la detección de tejidos automatizada (figura 1C).
División automatizada en parches: Las regiones anotadas se subdividieron en parches utilizando el algoritmo lazyslide. Cada parche resultante medía 224 × 224 μm2. Estos parches se dividieron aún más en 100 miniparches no superpuestos, cada uno de 22,4 × 22,4 μm2 (Fig. 1C). Los miniparches resultantes sirvieron como entrada para el núcleo de aprendizaje profundo (DL) del marco TIMEL.
Desarrollo del marco TIMEL
El marco TIMEL consta de dos componentes secuenciales: un análisis a nivel celular basado en DL y un módulo estadístico para la caracterización a nivel del paciente. Primero, el modelo de DL procesa las imágenes de porta (WSIs) para identificar patrones histológicos clave, produciendo mapas de probabilidad para cada clase histológica. Estos mapas se introducen luego en el módulo estadístico, que agrega las probabilidades para calcular métricas a nivel de WSI, denominadas parámetros del paisaje TIMEL. En la práctica, el marco toma una WSI como entrada y genera parámetros cuantitativos que resumen la composición histológica y la heterogeneidad espacial de las regiones tumorales (ver Fig. 2A). Los parámetros TIMEL ofrecen así un resumen estructurado y cuantitativo de la heterogeneidad tisular, lo que facilita una evaluación histopatológica objetiva y reproducible.
Descripción del algoritmo de aprendizaje profundo
Arquitectura del modelo: Se utilizaron los siguientes modelos de clasificación de imágenes de DL para clasificar los miniparches según su estructura tisular asignada (tumor, estroma, inmune, necrosis, sangre, grasa y espacio en blanco): Inception V3,[20] DenseNet201,[21] ViT-base,[22] UNI[14], Prov-GigaPath,[16] y Virchow.[15] Cada modelo se complementó con una capa oculta totalmente conectada de 64 dimensiones, seguida de normalización por lotes y activación ReLU, y una capa de clasificación final. Todos los modelos se preentrenaron (es decir, inicialmente se entrenaron con otros conjuntos de datos); esto se hizo para aprovechar las representaciones de características existentes y reducir la necesidad de una gran cantidad de datos de entrenamiento específicos de la tarea. Inception V3, DenseNet201 y ViT-base se preentrenaron con el conjunto de datos ImageNet-1K, mientras que UNI, Prov-GigaPath y Virchow son modelos base de histopatología preentrenados mediante aprendizaje autosupervisado con hasta 1 millón de WSIs. Estos modelos se seleccionaron en función de su amplio uso y frecuente comparación en estudios de histopatología anteriores.
Dado que se espera que los modelos base capturen características histológicas robustas y generalizables en diferentes instituciones, se planteó la hipótesis de que superarían a los modelos preentrenados con ImageNet, que sirvieron como línea de base. En consecuencia, todos los parámetros del modelo, excepto la capa de clasificación final, se congelaron durante el entrenamiento. Esta estrategia de transferencia de aprendizaje es estándar en las aplicaciones de histopatología con datos etiquetados limitados, lo que reduce el costo computacional y los desafíos de implementación, al tiempo que mitiga el olvido catastrófico de las características histológicas generales. Los experimentos empíricos preliminares durante el desarrollo del método sugirieron que el ajuste fino de las redes base del modelo base degradaba el rendimiento en el contexto de nuestro estudio, lo que motivó la adopción de un enfoque de red base congelada. Las comparaciones exhaustivas de arquitecturas y estrategias de ajuste fino se consideraron fuera del alcance de este estudio, que se centró principalmente en la caracterización estadística posterior y la comparación de descriptores espaciales de los tejidos.
Extracción de características y protocolo de entrenamiento del modelo: Los miniparches se redimensionaron a 224 × 224 píxeles y se procesaron utilizando redes neuronales preentrenadas para la extracción de características y la clasificación. Los modelos se entrenaron utilizando el optimizador Adam con pérdida de entropía cruzada. Una búsqueda de hiperparámetros aproximada identificó un tamaño de lote de 128, una tasa de aprendizaje de 1 × 10−5 y 15 épocas de entrenamiento como óptimos. Utilizamos una validación cruzada de 5 pliegues para entrenar, seleccionar y evaluar nuestros modelos. En cada pliegue, los modelos se entrenaron con miniparches de 8 WSIs, lo que representa un total de aproximadamente 40 000 miniparches, mientras que las 2 WSIs restantes (aproximadamente 10 000 miniparches) se utilizaron para la validación. Es importante destacar que los datos de validación no influyeron en la parada temprana. Este proceso se repitió cinco veces, lo que permitió que cada pliegue sirviera como conjunto de validación una vez.
Evaluación y selección del modelo: Seleccionamos el modelo con las mejores métricas de rendimiento, como la pérdida de entropía cruzada, la precisión, las AUC específicas de la clase, la precisión, la exhaustividad y las puntuaciones F1, en todos los pliegues de validación, siendo la AUC promedio específica de la clase el criterio de decisión principal. Este modelo de mejor rendimiento se volvió a entrenar con las 10 WSIs para prepararlo para las tareas de modelado estadístico posteriores.
Desarrollo del núcleo estadístico
Generación de mapas de probabilidad de histología: Dentro de las regiones tumorales anotadas, los miniparches se clasificaron en función de los componentes celulares y microarquitectónicos predichos. Contamos el número de miniparches para cada clase dentro de un parche regional más grande de aproximadamente 224 × 224 micrómetros (aproximadamente 900 × 900 píxeles a una resolución de 40×) para formar una estimación local del área física de cada componente. Estas estimaciones se normalizaron en probabilidades a nivel de parche para las proporciones de tumor, estroma e inmune (Ptumor, Pestroma y Pinmune) (ver Fig. 2B). Ptumor está conceptualmente relacionado con la TSR regional, mientras que Pinmune está indirectamente asociado con los TIL.
Descriptores estadísticos (o parámetros del paisaje): Para caracterizar de manera integral el TIME, derivamos 10 descriptores estadísticos para cada uno de Ptumor, Pestroma y Pinmune. Estos incluyen siete características no espaciales/composicionales: media, varianza, asimetría, curtosis, parámetro de concentración de Dirichlet y los percentiles 5 y 95, así como tres características espaciales: autocorrelación espacial de Moran, escala de longitud del proceso gaussiano (GP) espacial e índice de Gini espacial. La selección de estos descriptores se basó en su capacidad para capturar tanto las propiedades de distribución como la organización espacial de cada tipo de célula/elemento de matriz estromal, lo que proporciona una visión multidimensional de la heterogeneidad del TIME. La Tabla Suplementaria S2 detalla las abreviaturas y definiciones de estos parámetros, mientras que el Archivo Suplementario 1 proporciona la motivación, las fórmulas y los algoritmos de estimación correspondientes. Al adoptar estos "parámetros del paisaje", ampliamos nuestro análisis a 30 descriptores, lo que representa un aumento sustancial con respecto a las 8 características utilizadas en nuestro trabajo anterior.[13] La justificación para la selección de estos parámetros se analiza más a fondo en la sección Interpretaciones de los parámetros del paisaje TIMEL.
Asociación de probabilidades de histología con métricas de patología estándar
Para validar y contextualizar nuestras probabilidades de histología computacional, las comparamos con métricas establecidas derivadas por patólogos: la TSR y la puntuación de TIL. Para la TSR, se seleccionaron regiones de interés (ROIs) representativas con alto contenido de estroma de acuerdo con la práctica patológica estándar, generalmente en el frente invasivo del tumor, donde el contenido de estroma es más prominente y las células tumorales están presentes en todos los lados del campo.[23] Dentro de estas ROIs, la TSR se calculó como la proporción del área tumoral en relación con las áreas combinadas de tumor, estroma y compartimentos inmunitarios, utilizando la siguiente fórmula:
Para los TIL, los patólogos evalúan solo los linfocitos y las células plasmáticas ubicadas dentro del compartimento estromal del tumor invasivo, excluyendo explícitamente los infiltrados inmunitarios fuera del borde del tumor, los agregados linfoides y los linfocitos dentro de las áreas necróticas o los nidos de células tumorales. La evaluación implica estimar el porcentaje del área estromal dentro del tumor que está ocupada por células inflamatorias mononucleares, generalmente en toda el área del tumor invasivo en lugar de centrarse en los puntos calientes.[24] Esta estimación generalmente se realiza con un aumento intermedio, como un aumento total de 200× a 400×, para garantizar una evaluación representativa y reproducible:
En este estudio, los parámetros del paisaje derivados de las probabilidades de los compartimentos de tumor (Ptumor), estroma (Pestroma) e inmune (Pinmune) sirven como sustitutos directos, aunque imperfectos, de las métricas correspondientes evaluadas tradicionalmente por los patólogos. Por ejemplo, el parámetro se asemeja estrechamente a una estimación de TSR derivada por un patólogo, que evalúa la TSR en puntos con alto contenido de estroma, mientras que es conceptualmente similar a la cuantificación de TIL. Esta metodología permite una comparación robusta y cuantitativa entre las evaluaciones digitales y manuales, lo que respalda la relevancia clínica y la interpretabilidad de nuestros parámetros del paisaje computacional.
Análisis comparativos de TSR, TIL y parámetros del paisaje
En esta sección, nuestra hipótesis es que existen asociaciones significativas entre la TSR y el TIL evaluados por humanos y los parámetros del paisaje correspondientes ( y ). Extraímos la TSR y el TIL previamente puntuados de la cohorte TCGA-COAD de estudios anteriores.[25], [26] La TSR se puntuó, se verificó y se discutió para llegar a un consenso por tres evaluadores humanos,[25] uno de los cuales es un patólogo certificado. El TIL se calculó utilizando la fracción de parches positivos para TIL dentro de todos los parches, utilizando un modelo de DL en un estudio anterior. Se utilizaron los análisis de correlación de Spearman para evaluar estas relaciones postuladas entre —porcentaje de estroma (que es prácticamente 100% – TSR) y .
Para probar nuestras hipótesis, realizamos análisis de correlación de Spearman entre: (i) y el porcentaje de estroma evaluado por humanos y (ii) y la puntuación de TIL. Estos análisis se diseñaron para evaluar la fuerza y la dirección de las relaciones entre los parámetros del paisaje evaluados por humanos y los parámetros del paisaje derivados computacionalmente.
Interpretaciones de los parámetros del paisaje TIMEL
Interpretar los parámetros del paisaje es crucial para comprender el TIME. Estos descriptores estadísticos proporcionan información sobre la distribución y las características de los diversos componentes dentro del tumor, lo que ayuda a contextualizar los fenómenos complejos observados en el TIME. Para obtener detalles específicos sobre la motivación, el proceso de cálculo, las abreviaturas y los ejemplos de cada parámetro del paisaje TIMEL, consulte el Archivo Suplementario 1 y la Tabla Suplementaria 2.
La dinámica espacial de cada componente del TIME (tumor, estroma e inmune) se puede caracterizar mediante propiedades no espaciales/composicionales y espaciales. Las propiedades no espaciales/composicionales abarcan abundancia, variación, forma y extremos. La abundancia, representada por la media (μ), refleja la prevalencia general de un componente TIME determinado en toda la WSI. La variación, cuantificada por la varianza (σ2), describe el grado de fluctuación o heterogeneidad de la característica en toda la WSI. La propiedad de forma, que incluye asimetría (γ) y parámetros de concentración (αtumor, αestroma y αinmune), proporciona información sobre la distribución de los valores de intensidad, lo que indica dónde se concentra la mayor parte del mapa de intensidad del TIME. Los extremos, caracterizados por curtosis (κ), percentil 5 (q5) y percentil 95 (q95_), miden la presencia y la magnitud de los valores atípicos en la característica del TIME, lo que destaca las regiones raras pero potencialmente significativas.
Además de estas propiedades no espaciales/composicionales, las características espaciales también son cruciales. En este estudio, evaluamos la organización espacial a través de las propiedades de agrupación, suavidad y heterogeneidad, cuantificadas por la autocorrelación espacial de Moran, la escala de longitud del GP espacial y el índice de Gini espacial, respectivamente. La agrupación espacial mide el grado en que los valores similares de una característica del TIME se agrupan espacialmente, lo que identifica las regiones de alta (puntos calientes) y baja (puntos fríos) concentración en toda la WSI. La suavidad espacial captura la rapidez con la que cambia una característica del TIME en el tejido, cuantificada por la escala de longitud, donde una escala de longitud mayor indica transiciones más suaves y graduales. La heterogeneidad espacial cuantifica la desigualdad en la distribución espacial de una característica del TIME utilizando el índice de Gini espacial, con valores más altos que indican una mayor disparidad y falta de uniformidad en toda la WSI.
En conjunto, estos parámetros del perfil tumoral proporcionan un marco completo y reproducible para resumir tanto la composición como la arquitectura espacial del microentorno tumoral (TIME), apoyando así una evaluación histopatológica objetiva y matizada.
Análisis clinicopatológicos
También realizamos análisis de correlación clínica entre los parámetros del perfil tumoral y otras variables, incluyendo edad, género, T, N, M, estadios AJCC y estado de MSI. Se utilizó la correlación de rangos de Spearman tanto para las variables continuas, como la edad, como para las variables ordinales, como T, N y los estadios AJCC, debido a su capacidad para manejar relaciones no lineales y datos basados en rangos de manera efectiva. Para las variables categóricas, se aplicó la prueba de suma de rangos de Wilcoxon al género y al estado M, ya que es adecuada para comparar dos grupos independientes. Se utilizó la prueba de Kruskal-Wallis para el estado de MSI, lo que permite la comparación de más de dos grupos cuando los datos no se distribuyen normalmente.
Parámetros del perfil tumoral con valor pronóstico
Para investigar los parámetros del perfil tumoral con valor pronóstico, realizamos un análisis en profundidad de los datos de 411 pacientes en el conjunto de datos TCGA-COAD. La cohorte se dividió aleatoriamente en conjuntos de entrenamiento y prueba en una proporción de 70:30, lo que garantiza un marco sólido para la evaluación del modelo. Empleamos modelos de regresión de riesgos de Cox de Elastic Net y modelos de regresión logística de Elastic Net para identificar los parámetros pronósticos clave y las variables clínicas, incluyendo la edad, el género y los estadios TNM. Se utilizó la validación cruzada (CV) para ajustar el equilibrio entre las penalizaciones Lasso/L1 y Ridge/L2, explorando proporciones de 0,0 a 1,0 en incrementos de 0,1.
Se calcularon puntajes de riesgo para el conjunto de prueba, y el rendimiento del modelo se evaluó utilizando la precisión para los resultados ordinales (estadios N y M) y el índice de concordancia (C-index) para los resultados censurados (SCP y SO). Para determinar la importancia de las características, extrajimos las variables con coeficientes distintos de cero y las incorporamos en modelos de regresión de Cox o logística multivariante convencionales, lo que facilita la evaluación de su impacto colectivo en los resultados clínicos. El estadio tumoral se consolidó en dos categorías: temprano (T1-T2) y avanzado (T3-T4), para tener en cuenta la disponibilidad limitada de datos en el subgrupo T1.
Realizamos análisis univariantes complementarios utilizando los análisis de Kaplan-Meier y los análisis de la curva ROC (Receiver Operating Characteristic) para evaluar la importancia pronóstica de los parámetros del perfil tumoral. Los análisis de Kaplan-Meier se realizaron para evaluar la SO y la SCP en función de cada parámetro del perfil tumoral, mientras que los análisis de la curva ROC se aplicaron para evaluar su poder predictivo para los estadios N y M. Para determinar los puntos de corte óptimos para los parámetros del perfil tumoral, utilizamos la función survcutpoint() del paquete R survminer_, que emplea estadísticas de rango seleccionadas al máximo. En nuestros análisis, utilizamos la prueba de registro logarítmica estandarizada predeterminada como métrica de clasificación. Posteriormente, se realizaron análisis de Kaplan-Meier para comparar los grupos con valores bajos y altos de cada parámetro del perfil tumoral, según lo definido por estos puntos de corte.
Validación de los parámetros del perfil tumoral con valor pronóstico en una cohorte de validación interna
Dado el diseño de casos y controles emparejados de nuestra cohorte de estudio, que se centró en los resultados de la metástasis y tuvo datos limitados de seguimiento de la mortalidad, priorizamos el estadio N y el estadio M como resultados primarios. Para minimizar la tasa de falsos descubrimientos (FDR), nuestro análisis se centró en los parámetros del perfil tumoral que previamente se demostró que eran significativos en relación con los estadios N y M dentro de la sección Parámetros del perfil tumoral con valor pronóstico. Realizamos análisis tanto univariantes como multivariantes, ajustando por covariables clínicas como la edad, el género, el estadio T y el estado de MSI. Este enfoque integral nos permitió evaluar los efectos independientes y combinados de los parámetros del perfil tumoral y los factores clínicos, proporcionando una comprensión matizada de sus funciones en la predicción de los resultados de la metástasis.
Plataformas de análisis
El proceso de entrenamiento del modelo y la predicción del modelo se realizaron en Python versión 3.8.19 (Python Software Foundation) utilizando PyTorch versión 2.4.0, Torchvision versión 0.19.0 y las bibliotecas CUDA12.1 (Meta Platforms, Inc.), ejecutadas en unidades de procesamiento de gráficos (GPU) en clúster Tesla V100 con una memoria de 32 GB. Otros análisis, incluyendo regresión, supervivencia y bioinformática, se realizaron en R versión 4.3.1 (The R Foundation, Viena, Austria).
Resumen del método
Este estudio emplea un enfoque integral para analizar las imágenes histopatológicas de alta resolución (WSI) de pacientes con cáncer de colon utilizando el marco TIME, que integra el aprendizaje profundo (DL) y el análisis estadístico para evaluar la heterogeneidad del microentorno tumoral (TIME). Los métodos se han resumido a continuación:
1. Recopilación de datos: La investigación utiliza dos cohortes: una cohorte de descubrimiento del conjunto de datos TCGA-COAD para el desarrollo de mapas de tipos de células espaciales y el análisis inicial de la supervivencia de los descriptores del perfil tumoral, y una cohorte de validación interna del Dartmouth-Hitchcock Medical Center (DHMC) para la validación de los resultados relacionados con la metástasis. La cohorte de descubrimiento consta de 411 WSI después de excluir las muestras subóptimas (debido a la duplicación, la mala calidad de la imagen o la ausencia de células tumorales identificables), con 10 WSI utilizadas para el entrenamiento y la validación cruzada (CV) de los modelos a nivel celular que requieren una anotación sustancial por parte de un patólogo. La cohorte de validación incluye 108 pacientes, con diapositivas teñidas e imágenes de alta resolución (40×; Leica Aperio GT450). Se realizan anotaciones manuales y automatizadas para identificar los tipos de tejido y las regiones tumorales, con anotaciones histológicas detalladas que cubren varios componentes celulares/de la matriz.
2. Enfoques a nivel celular, a nivel de región de interés (ROI) y a nivel de diapositiva: El enfoque de aprendizaje profundo (DL) del marco TIME clasifica los patrones histológicos a nivel celular dentro de las WSI, mientras que el enfoque estadístico posterior resume estas clasificaciones en parámetros del perfil tumoral a nivel del paciente que resumen la heterogeneidad del tejido. El modelo de DL se entrena utilizando mini-parches y emplea redes neuronales preentrenadas para la extracción de características, seguido de CV para garantizar un rendimiento robusto del modelo. Se derivó un conjunto de 30 parámetros del perfil tumoral para caracterizar el TIME, capturando tanto las propiedades no espaciales/composicionales como las espaciales.
3. Validación interna frente a mapas de TSR/TIL espaciales anotados por patólogos: Estos descriptores se correlacionaron con métricas derivadas por patólogos, como la relación tumoral-estromal local (TSR) y las estimaciones de linfocitos infiltrantes tumorales (TIL), para garantizar la relevancia práctica.
4. Validación a nivel del paciente: Los análisis posteriores exploraron las interdependencias entre los parámetros del perfil tumoral, sus correlaciones con las variables clínicas y su importancia pronóstica a través de análisis univariantes, multivariantes y de selección de características en ambas cohortes de descubrimiento y validación.
Muestras y cohortes
La figura 1A ilustra el diseño general del estudio.
Cohorte de desarrollo/descubrimiento: Extrajimos datos de 461 pacientes del conjunto de datos TCGA-COAD. Tras la revisión de 459 diapositivas de diagnóstico, se excluyeron 48 debido a la duplicación, la mala calidad de la imagen o la ausencia de células tumorales identificables. Las 411 WSI restantes formaron la base de nuestro análisis. De estas, se seleccionaron aleatoriamente y anotaron casi 50.000 mini-parches dentro de 10 WSI para su uso en el entrenamiento a nivel celular, la CV y la selección del modelo. Posteriormente, se utilizaron las 411 WSI para las tareas de inferencia. Es importante tener en cuenta que, si bien la cohorte de desarrollo incluye un pequeño número de casos de la cohorte de descubrimiento (10 de 411 WSI; 2,4%), las tareas de inferencia son metodológicamente distintas y se realizan a una escala diferente (a nivel del paciente) que la fase de entrenamiento (a nivel celular). Las WSI de H&E para TCGA-COAD se obtuvieron a través del portal GDC (https://portal.gdc.cancer.gov) utilizando varios escáneres (incluidos Leica GT450/AT2/CS2 y Hamamatsu S60/S360). Los datos clínicos se obtuvieron de cBioPortal (https://www.cbioportal.org) y del portal GDC, e incluyeron los siguientes parámetros: edad, género, estadio TNM, estadio AJCC, supervivencia libre de enfermedad (DFS), supervivencia libre de progresión (SCP) y supervivencia general (SO).
Cohorte de validación interna: Incluimos 108 pacientes con CRC de DHMC (2016-2019) con la aprobación del IRB. Algunos de esta cohorte formaron parte de nuestro estudio anterior.[17], [18] Las diapositivas se tiñeron con H&E y se obtuvieron imágenes a una resolución de 40× utilizando Leica Aperio AT2/GT450. Se recopilaron parámetros clinicopatológicos que incluyeron la edad, el género, el estado de inestabilidad de microsatélites (MSI) y los estadios pTNM AJCC. La tabla 1 detalla las diferencias clinicopatológicas entre las cohortes.
Los datos completos de cada paciente para ambas cohortes, incluidos nuestros parámetros del perfil tumoral calculados, se informaron en la Tabla S1 complementaria.
Anotaciones manuales, detección automatizada de tejidos y partición en parches
Se utilizaron dos tipos de anotaciones: anotaciones regionales que definen las regiones tumorales macroscópicas que establecen los límites espaciales del análisis, y anotaciones histológicas detalladas anidadas dentro de estas regiones para etiquetar los componentes celulares y microarquitectónicos microscópicos. Se extrajeron mini-parches de las anotaciones detalladas para el desarrollo del modelo de DL, mientras que la distribución espacial de las áreas de tejido segmentadas se cuantificó de manera más amplia dentro de los límites de las anotaciones tumorales regionales.
Anotación histológica detallada: Un patólogo realizó anotaciones detalladas de tejidos y células/matriz (figura 1B), abarcando un total de 49.479 mini-parches. Cada mini-parche tenía una resolución de 22,4 × 22,4 μm2, equivalente a aproximadamente 90 píxeles2, y podía cubrir entre 1 y 5 células. Las clases de anotación incluyeron células tumorales (n = 10.000), estroma colágeno (n = 10.000), células inmunitarias (n = 8190), necrosis (n = 6708), sangre (n = 3434), grasa (n = 6247) y espacio en blanco (n = 4900). Estas anotaciones se realizaron en 10 WSI seleccionadas aleatoriamente de la cohorte de desarrollo. Para garantizar la precisión, las anotaciones fueron revisadas por dos patólogos certificados.
Anotación regional del cáncer: Para garantizar que el análisis se limitara a las regiones tumorales, las regiones macroarquitectónicas, como las áreas del lecho tumoral (figura 1B), se anotaron manualmente utilizando herramientas poligonales en QuPath en 411 WSI. Estas anotaciones, también realizadas por un patólogo, incluyeron múltiples polígonos para regiones tumorales espacialmente distintas y no contiguas para garantizar la precisión.
Detección automatizada de tejidos: Para mejorar la precisión de las anotaciones de la región del cáncer, integramos los polígonos dibujados manualmente con los polígonos de detección de tejidos generados automáticamente utilizando el paquete lazyslide[19] (versión 0.7.1). Este enfoque híbrido preserva el enfoque específico del cáncer de la anotación manual al tiempo que minimiza la inclusión de áreas no tisulares (espacio en blanco) mediante la detección automatizada de tejidos (figura 1C).
Partición automatizada de parches: Las regiones anotadas se subdividieron en parches utilizando el algoritmo lazyslide. Cada parche resultante midió 224 × 224 μm2. Estos parches se dividieron aún más en 100 mini-parches no superpuestos, cada uno de 22,4 × 22,4 μm2 (figura 1C). Los mini-parches resultantes sirvieron como entrada para el núcleo de DL del marco TIME.
Desarrollo del marco TIME
El marco TIME consta de dos componentes secuenciales: un análisis a nivel celular basado en DL y un módulo estadístico para la caracterización a nivel del paciente. Primero, el modelo de DL procesa las WSI para identificar patrones histológicos clave, produciendo mapas de probabilidad para cada clase histológica. Estos mapas se introducen luego en el módulo estadístico, que agrega las probabilidades para calcular métricas a nivel de WSI, denominadas parámetros del perfil tumoral TIME. En la práctica, el marco toma una WSI como entrada y produce parámetros cuantitativos que resumen la composición histológica y la heterogeneidad espacial de las regiones tumorales (ver figura 2A). Los parámetros TIME ofrecen así un resumen estructurado y cuantitativo de la heterogeneidad del tejido, lo que respalda una evaluación histopatológica objetiva y reproducible.
Descripción del algoritmo de aprendizaje profundo
Arquitectura del modelo: Se utilizaron los siguientes modelos de clasificación de imágenes de aprendizaje profundo (DL) para clasificar mini-parches en función de su estructura tisular asignada (tumor, estroma, inmune, necrosis, sangre, grasa y espacio en blanco): Inception V3,[20] DenseNet201,[21] ViT-base,[22] UNI[14], Prov-GigaPath,[16] y Virchow.[15] Cada modelo se complementó con una capa oculta totalmente conectada de 64 dimensiones, seguida de la normalización por lotes y la activación ReLU, y una capa de clasificación final. Todos los modelos se preentrenaron (es decir, se entrenaron inicialmente con otros conjuntos de datos); esto se hizo para aprovechar las representaciones de características existentes y reducir la necesidad de datos de entrenamiento específicos de la tarea. Inception V3, DenseNet201 y ViT-base se preentrenaron con el conjunto de datos ImageNet-1K, mientras que UNI, Prov-GigaPath y Virchow son modelos base de histopatología preentrenados mediante aprendizaje autosupervisado con hasta 1 millón de WSIs. Estos modelos se seleccionaron en función de su amplio uso y frecuente comparación en estudios de histopatología anteriores.
Dado que se espera que los modelos base capturen características histológicas robustas y generalizables en diferentes instituciones, se planteó la hipótesis de que superarían a los modelos preentrenados con ImageNet, que sirvieron como línea de base. En consecuencia, todos los parámetros del modelo, excepto la capa de clasificación final, se congelaron durante el entrenamiento. Esta estrategia de transferencia de aprendizaje es estándar en las aplicaciones de histopatología con datos etiquetados limitados, lo que reduce el costo computacional y los desafíos de implementación, al tiempo que mitiga el olvido catastrófico de las características histológicas generales. Los experimentos empíricos preliminares durante el desarrollo del método sugirieron que el ajuste fino de las redes base del modelo base degradaba el rendimiento en el contexto de nuestro estudio, lo que motivó la adopción de un enfoque de red base congelada. Se consideró que las comparaciones exhaustivas de arquitecturas y estrategias de ajuste fino estaban fuera del alcance de este estudio, que se centró principalmente en la caracterización estadística posterior y la comparación de descriptores espaciales de los tejidos.
Protocolo de extracción de características y entrenamiento del modelo: Los mini-parches se redimensionaron a 224 × 224 píxeles y se procesaron utilizando redes neuronales preentrenadas para la extracción de características y la clasificación. Los modelos se entrenaron utilizando el optimizador Adam con pérdida de entropía cruzada. Una búsqueda de hiperparámetros aproximada identificó un tamaño de lote de 128, una tasa de aprendizaje de 1 × 10−5 y 15 épocas de entrenamiento como óptimos. Utilizamos una validación cruzada de 5 pliegues para entrenar, seleccionar y evaluar nuestros modelos. En cada pliegue, los modelos se entrenaron con mini-parches de 8 WSIs, lo que representa un total de aproximadamente 40 000 mini-parches, mientras que los 2 WSIs restantes (aproximadamente 10 000 mini-parches) se utilizaron para la validación. Es importante destacar que los datos de validación no influyeron en la parada temprana. Este proceso se repitió cinco veces, lo que permitió que cada pliegue sirviera como conjunto de validación una vez.
Evaluación y selección del modelo: Seleccionamos el modelo con las mejores métricas de rendimiento, como la pérdida de entropía cruzada, la precisión, las AUC específicas de clase, la precisión, la exhaustividad y las puntuaciones F1, en todos los pliegues de validación, siendo la AUC promedio específica de la clase el criterio de decisión principal. Este modelo de mejor rendimiento se volvió a entrenar con los 10 WSIs para preparar los modelos estadísticos posteriores.
Desarrollo del núcleo estadístico
Generación de mapas de probabilidad de histología: Dentro de las regiones tumorales anotadas, los mini-parches se clasificaron en función de los componentes celulares y microarquitectónicos predichos. Contamos el número de mini-parches para cada clase dentro de un parche regional más grande de aproximadamente 224 × 224 micrómetros[2] (aproximadamente 900 × 900 píxeles2 a una resolución de 40×) para formar una estimación local del área física de cada componente. Estas estimaciones se normalizaron en probabilidades de parche para las proporciones de tumor, estroma e inmune (Ptumor, Pestroma y Pinmune) (ver Fig. 2B). Ptumor está conceptualmente relacionado con la TSR regional, mientras que Pinmune está indirectamente asociado con los TIL.
Descriptores estadísticos (o parámetros del paisaje): Para caracterizar de manera integral el TIME, derivamos 10 descriptores estadísticos para cada uno de Ptumor, Pestroma y Pinmune. Estos incluyen siete características no espaciales/composicionales: media, varianza, asimetría, curtosis, parámetro de concentración de Dirichlet y los percentiles 5 y 95, así como tres características espaciales: autocorrelación espacial de Moran, escala de longitud del proceso gaussiano espacial (GP) e índice de Gini espacial. La selección de estos descriptores se basó en su capacidad para capturar tanto las propiedades de distribución como la organización espacial de cada tipo de célula/elemento de matriz estromal, lo que proporciona una visión multidimensional de la heterogeneidad del TIME. La Tabla Suplementaria S2 detalla las abreviaturas y definiciones de estos parámetros, mientras que el Archivo Suplementario 1 proporciona la motivación, las fórmulas y los algoritmos de estimación correspondientes. Al adoptar estos "parámetros del paisaje", ampliamos nuestro análisis a 30 descriptores, lo que representa un aumento sustancial con respecto a las 8 características utilizadas en nuestro trabajo anterior.[13] La justificación para seleccionar estos parámetros se analiza más a fondo en la sección Interpretaciones de los parámetros del paisaje del TIME.
Descripción del algoritmo de aprendizaje profundo
Arquitectura del modelo: Se utilizaron los siguientes modelos de clasificación de imágenes de aprendizaje profundo (DL) para clasificar mini-parches en función de su estructura tisular asignada (tumor, estroma, inmune, necrosis, sangre, grasa y espacio en blanco): Inception V3,[20] DenseNet201,[21] ViT-base,[22] UNI[14], Prov-GigaPath,[16] y Virchow.[15] Cada modelo se complementó con una capa oculta totalmente conectada de 64 dimensiones, seguida de la normalización por lotes y la activación ReLU, y una capa de clasificación final. Todos los modelos se preentrenaron (es decir, se entrenaron inicialmente con otros conjuntos de datos); esto se hizo para aprovechar las representaciones de características existentes y reducir la necesidad de datos de entrenamiento específicos de la tarea. Inception V3, DenseNet201 y ViT-base se preentrenaron con el conjunto de datos ImageNet-1K, mientras que UNI, Prov-GigaPath y Virchow son modelos base de histopatología preentrenados mediante aprendizaje autosupervisado con hasta 1 millón de WSIs. Estos modelos se seleccionaron en función de su amplio uso y frecuente comparación en estudios de histopatología anteriores.
Dado que se espera que los modelos base capturen características histológicas robustas y generalizables en diferentes instituciones, se planteó la hipótesis de que superarían a los modelos preentrenados con ImageNet, que sirvieron como línea de base. En consecuencia, todos los parámetros del modelo, excepto la capa de clasificación final, se congelaron durante el entrenamiento. Esta estrategia de transferencia de aprendizaje es estándar en las aplicaciones de histopatología con datos etiquetados limitados, lo que reduce el costo computacional y los desafíos de implementación, al tiempo que mitiga el olvido catastrófico de las características histológicas generales. Los experimentos empíricos preliminares durante el desarrollo del método sugirieron que el ajuste fino de las redes base del modelo base degradaba el rendimiento en el contexto de nuestro estudio, lo que motivó la adopción de un enfoque de red base congelada. Se consideró que las comparaciones exhaustivas de arquitecturas y estrategias de ajuste fino estaban fuera del alcance de este estudio, que se centró principalmente en la caracterización estadística posterior y la comparación de descriptores espaciales de los tejidos.
Protocolo de extracción de características y entrenamiento del modelo: Los mini-parches se redimensionaron a 224 × 224 píxeles y se procesaron utilizando redes neuronales preentrenadas para la extracción de características y la clasificación. Los modelos se entrenaron utilizando el optimizador Adam con pérdida de entropía cruzada. Una búsqueda de hiperparámetros aproximada identificó un tamaño de lote de 128, una tasa de aprendizaje de 1 × 10−5 y 15 épocas de entrenamiento como óptimos. Utilizamos una validación cruzada de 5 pliegues para entrenar, seleccionar y evaluar nuestros modelos. En cada pliegue, los modelos se entrenaron con mini-parches de 8 WSIs, lo que representa un total de aproximadamente 40 000 mini-parches, mientras que los 2 WSIs restantes (aproximadamente 10 000 mini-parches) se utilizaron para la validación. Es importante destacar que los datos de validación no influyeron en la parada temprana. Este proceso se repitió cinco veces, lo que permitió que cada pliegue sirviera como conjunto de validación una vez.
Evaluación y selección del modelo: Seleccionamos el modelo con las mejores métricas de rendimiento, como la pérdida de entropía cruzada, la precisión, las AUC específicas de clase, la precisión, la exhaustividad y las puntuaciones F1, en todos los pliegues de validación, siendo la AUC promedio específica de la clase el criterio de decisión principal. Este modelo de mejor rendimiento se volvió a entrenar con los 10 WSIs para preparar los modelos estadísticos posteriores.
Asociación de las probabilidades de histología con las métricas de patología estándar
Para validar y contextualizar nuestras probabilidades de histología computacional, las comparamos con las métricas derivadas por los patólogos: la TSR y la puntuación de TIL. Para la TSR, se seleccionaron regiones de interés (ROI) representativas con alto contenido de estroma de acuerdo con la práctica patológica estándar, generalmente en el frente invasivo del tumor, donde el contenido de estroma es más prominente y las células tumorales están presentes en todos los lados del campo.[23] Dentro de estas ROI, la TSR se calculó como la proporción del área tumoral en relación con las áreas combinadas de tumor, estroma y compartimentos inmunitarios, utilizando la siguiente fórmula:
Para los TIL, los patólogos evalúan solo los linfocitos y las células plasmáticas ubicadas dentro del compartimento estromal del tumor invasivo, excluyendo explícitamente los infiltrados inmunitarios fuera del borde del tumor, los agregados linfoides y los linfocitos dentro de las áreas necróticas o los nidos de células tumorales. La evaluación implica estimar el porcentaje del área estromal dentro del tumor que está ocupada por células inflamatorias mononucleares, generalmente en toda el área del tumor invasivo en lugar de centrarse en los puntos calientes.[24] Esta estimación generalmente se realiza con un aumento intermedio, como un aumento total de 200× a 400×, para garantizar una evaluación representativa y reproducible:
En este estudio, los parámetros del paisaje derivados de las probabilidades de los compartimentos tumoral (Ptumor), estromal (Pstroma) e inmunitario (Pimmune) sirven como sustitutos directos, aunque imperfectos, de las métricas correspondientes que tradicionalmente evalúan los patólogos. Por ejemplo, el parámetro se asemeja mucho a una estimación de TSR obtenida por un patólogo, que evalúa la TSR en áreas ricas en estroma, mientras que es conceptualmente similar a la cuantificación de TIL. Esta metodología permite una comparación robusta y cuantitativa entre las evaluaciones digitales y manuales, apoyando así la relevancia clínica y la interpretabilidad de nuestros parámetros computacionales del paisaje.
Análisis comparativos de TSR, TIL y parámetros del paisaje
En esta sección, nuestra hipótesis es que existen asociaciones significativas entre la evaluación humana de TSR y TIL y los correspondientes parámetros del paisaje ( y ). Extraímos las puntuaciones de TSR y TIL previamente obtenidas del grupo TCGA-COAD de estudios anteriores.[25], [26] TSR se puntuó, se verificó dos veces y se discutió para llegar a un consenso por parte de tres evaluadores humanos,[25] uno de los cuales es un patólogo certificado. TIL se calculó utilizando la fracción de parches TIL-positivos dentro de todos los parches, utilizando un modelo de aprendizaje profundo en un estudio anterior. El —porcentaje de estroma (que es prácticamente 100% – TSR) y —TIL se utilizaron análisis de correlación de Spearman para evaluar estas relaciones postuladas.
Para probar nuestras hipótesis, realizamos análisis de correlación de Spearman entre: (i) y el porcentaje de estroma evaluado por humanos y (ii) y la puntuación de TIL. Estos análisis se diseñaron para evaluar la fuerza y la dirección de las relaciones entre los parámetros del paisaje evaluados por humanos y los parámetros del paisaje derivados computacionalmente.
Interpretaciones de los parámetros del paisaje TIME
Interpretar los parámetros del paisaje es crucial para comprender el TIME. Estos descriptores estadísticos proporcionan información sobre la distribución y las características de los diversos componentes dentro del tumor, contextualizando así los fenómenos complejos observados en el TIME. Para obtener detalles específicos sobre la motivación, el proceso de cálculo, las abreviaturas y los ejemplos de cada parámetro del paisaje TIME, consulte el Archivo Suplementario 1 y la Tabla Suplementaria 2.
La dinámica espacial de cada componente TIME (tumor, estroma e inmunitario) puede caracterizarse tanto por propiedades no espaciales/composicionales como espaciales. Las propiedades no espaciales/composicionales abarcan abundancia, variación, forma y extremo. La abundancia, representada por la media (μ), refleja la prevalencia general de un componente TIME determinado en toda la imagen de la sección del tejido (WSI). La variación, cuantificada por la varianza (σ2), describe el grado de fluctuación o heterogeneidad de la característica en toda la WSI. La propiedad de la forma, que incluye asimetría (γ) y parámetros de concentración (αtumor, αstroma y αinmune), proporciona información sobre la distribución de los valores de intensidad, indicando dónde se concentra la mayor parte del mapa de intensidad TIME. El extremo, caracterizado por kurtosis (κ), cuantil 5 (q5) y cuantil 95 (q95_), mide la presencia y la magnitud de los valores atípicos en la intensidad de la característica TIME, destacando las regiones raras pero potencialmente significativas.
Además de estas propiedades no espaciales/composicionales, las características espaciales también son cruciales. En este estudio, evaluamos la organización espacial a través de las propiedades de agrupación, suavidad y heterogeneidad, cuantificadas por la autocorrelación espacial de Moran I, la escala de longitud espacial GP y el índice de Gini espacial , respectivamente. La agrupación espacial mide el grado en que los valores similares de una característica TIME se agrupan espacialmente, identificando así las regiones de alta (puntos calientes) y baja (puntos fríos) concentración en toda la WSI. La suavidad espacial captura cómo cambia una característica TIME de forma gradual o abrupta en el tejido, cuantificada por la escala de longitud , donde una escala de longitud mayor indica transiciones más suaves y graduales. La heterogeneidad espacial cuantifica la desigualdad en la distribución espacial de una característica TIME utilizando el índice de Gini espacial , con valores más altos que indican una mayor disparidad y falta de uniformidad en toda la WSI.
En conjunto, estos parámetros del paisaje proporcionan un marco completo y reproducible para resumir tanto la composición como la arquitectura espacial del TIME, apoyando así una evaluación histopatológica objetiva y matizada.
Análisis clinicopatológicos
También realizamos análisis de correlación clínica entre los parámetros del paisaje y otras variables, incluyendo la edad, el sexo, T, N, M, los estadios AJCC y el estado de MSI. Se utilizó la correlación de rango de Spearman tanto para las variables continuas, como la edad, como para las variables ordinales, como T, N y los estadios AJCC, debido a su capacidad para manejar las relaciones no lineales y los datos basados en rangos. Para las variables categóricas, se aplicó la prueba de suma de rangos de Wilcoxon al sexo y al estado de M, ya que es adecuada para comparar dos grupos independientes. Se utilizó la prueba de Kruskal-Wallis para el estado de MSI, lo que permite la comparación de más de dos grupos cuando los datos no se distribuyen normalmente.
Parámetros del paisaje pronósticos
Para investigar los parámetros del paisaje pronósticos, realizamos un análisis en profundidad de los datos de 411 pacientes del conjunto de datos TCGA-COAD. El grupo se dividió aleatoriamente en conjuntos de entrenamiento y prueba en una proporción de 70:30, lo que garantiza un marco sólido para la evaluación del modelo. Empleamos modelos de regresión de riesgos de Cox de Elastic Net y modelos de regresión logística de Elastic Net para identificar los parámetros pronósticos clave y las variables clínicas, incluyendo la edad, el sexo y los estadios TNM. Se utilizó la validación cruzada (CV) para ajustar el equilibrio entre las penalizaciones Lasso/L1 y Ridge/L2, explorando proporciones de 0,0 a 1,0 en incrementos de 0,1.
Se calcularon las puntuaciones de riesgo para el conjunto de prueba, y se evaluó el rendimiento del modelo utilizando la precisión para los resultados ordinales (estadios N y M) y el índice de concordancia (C-index) para los resultados censurados (PFS y OS). Para determinar la importancia de las características, extrajimos las variables con coeficientes distintos de cero y las incorporamos en modelos de regresión de Cox o logística multivariada convencionales, lo que facilita la evaluación de su impacto colectivo en los resultados clínicos. El estadio tumoral se consolidó en dos categorías: temprano (T1-T2) y avanzado (T3-T4) para tener en cuenta la disponibilidad limitada de datos en el subgrupo T1.
Realizamos análisis univariados complementarios utilizando los análisis de Kaplan-Meier y la curva ROC (Receiver Operating Characteristic) para evaluar la importancia pronóstica de los parámetros del paisaje. Se realizaron análisis de Kaplan-Meier para evaluar la OS y la PFS en función de cada parámetro del paisaje, mientras que se aplicaron análisis ROC para evaluar su poder predictivo para los estadios N y M. Para determinar los puntos de corte óptimos para los parámetros del paisaje, utilizamos la función survcutpoint() del paquete R survminer_, que emplea estadísticas de rango seleccionadas al máximo. En nuestros análisis, utilizamos la prueba de registro logarítmico estandarizada predeterminada como métrica de clasificación. Posteriormente, se realizaron análisis de Kaplan-Meier para comparar los grupos con valores bajos y altos de cada parámetro del paisaje, según estos puntos de corte.
Validación de los parámetros del paisaje pronósticos en el grupo de validación interno
Dado el diseño de casos y controles coincidentes de nuestro grupo de estudio, que se centró en los resultados de la metástasis y tenía datos limitados de seguimiento de la mortalidad, priorizamos el estadio N y el estadio M como resultados primarios. Para minimizar la tasa de falsos descubrimientos (FDR), nuestro análisis se centró en los parámetros del paisaje que se demostró que eran significativos en relación con los estadios N y M en la sección Parámetros del paisaje pronósticos. Realizamos análisis univariados y multivariados, ajustando por covariables clínicas como la edad, el sexo, el estadio T y el estado de MSI. Este enfoque integral nos permitió evaluar los efectos independientes y combinados de los parámetros del paisaje y los factores clínicos, proporcionando una comprensión matizada de sus funciones en la predicción de los resultados de la metástasis.
Plataformas de análisis
El proceso de entrenamiento del modelo y la predicción del modelo se realizaron en Python versión 3.8.19 (Python Software Foundation) utilizando PyTorch versión 2.4.0, Torchvision versión 0.19.0 y las bibliotecas CUDA12.1 (Meta Platforms, Inc.), que se ejecutan en unidades de procesamiento de gráficos Tesla V100 en clúster con una memoria de 32 GB. Otros análisis, incluyendo la regresión, la supervivencia y la bioinformática, se realizaron en R versión 4.3.1 (The R Foundation, Viena, Austria).
Resultados
Virchow caracteriza con precisión las características TIME a microescala
El Archivo Suplementario 2 proporciona resultados detallados de la CV para la selección del modelo. Virchow logró el mayor rendimiento en la clasificación a nivel de célula de mini-parches, con una precisión general de 0,906 (±0,020) y una pérdida de 0,386 (±0,063). Aunque los modelos preentrenados en ImageNet1K como ViT-H mostraron un rendimiento similar, con una precisión de 0,905 (±0,029) y una pérdida de 0,431 (±0,067), Virchow se destacó en la distinción entre tumor, estroma y células inmunitarias. Las curvas ROC AUC de Virchow en la predicción de varios componentes fueron impresionantes: tumor (0,99), estroma (0,98), células inmunitarias (0,98), necrosis (0,99), sangre (0,97), espacio (1,00) y grasa (0,99). La matriz de confusión reveló una ligera mala clasificación entre el estroma y las células inmunitarias, probablemente debido a la necesidad del modelo de tomar decisiones de clase definitivas. El modelo Virchow ajustado se utilizó posteriormente para estimar los descriptores estadísticos.
Análisis comparativos de TSR, TIL y parámetros del paisaje basados en parches/regiones más grandes
La Tabla 2 presenta los resultados de los análisis de correlación entre el porcentaje de estroma (calculado como 100% – TSR) y los parámetros del paisaje estromal, así como entre las puntuaciones de TIL y los parámetros del paisaje inmunitario. En particular, las varianzas de los compartimentos estromal () e inmunitario () fueron las características más fuertemente asociadas con el porcentaje de estroma (R = 0,47; p ajustada < 0,001) y las puntuaciones de TIL (R = 0,32; p ajustada < 0,001), respectivamente (Fig. 3A).
Asociaciones clínicas de los parámetros del paisaje TIME en el grupo de descubrimiento
La Tabla Suplementaria S3 presenta un análisis exhaustivo de las asociaciones entre las variables clínicas, como la edad, el sexo, la raza y la estadificación TNM, y los diversos parámetros del paisaje. Para garantizar la solidez de nuestros hallazgos, se aplicaron correcciones de Benjamini-Hochberg a todos los valores de p, lo que controla eficazmente las FDR en múltiples pruebas. Medido por , los 10 parámetros del paisaje más significativos con respecto a cada uno de los parámetros clínicos, incluyendo la edad, el sexo, la raza, T, N, M y los estadios AJCC, se muestran en la Fig. 3B. Entre los parámetros del paisaje, la suavidad espacial del estroma () mostró la correlación más fuerte con la edad del paciente, mientras que fue el más asociado con la raza. Se observaron asociaciones específicas del estadio entre distintas características del estroma y el sistema inmunitario: con el estadio T, con el estadio N, con el estadio M (p ajustada < 0,001) y con el estadio AJCC general (p ajustada < 0,001). Estos hallazgos subrayan la intrincada interacción entre las características clínicas y las características histopatológicas, ofreciendo valiosos conocimientos sobre la complejidad del microentorno tumoral.
Parámetros del paisaje pronósticos a través del análisis de supervivencia del grupo de descubrimiento
Las proporciones de penalización óptimas (valores alfa) para los modelos de Elastic Net que predicen la OS, la PFS, el estadio nodal (N) y el estadio metastásico (M) fueron 0,0, 0,0, 0,8 y 0,0, respectivamente. Los valores de rendimiento correspondientes fueron los siguientes: valores del índice C de 0,75 para la OS y 0,68 para la PFS, y precisiones de clasificación de 0,58 para el estadio N (N0/N1/N2) y 0,87 para el estadio M (M0/M1) en el grupo de prueba.
La figura 4A muestra los parámetros del perfil pronóstico con coeficientes distintos de cero identificados por los modelos de red elástica para cada resultado. Basándose en la magnitud absoluta del coeficiente, se seleccionaron los cinco parámetros principales para el análisis multivariable ajustado por covariables clínicas relevantes (figura 4B, tabla suplementaria S4). (HR = 2,73; IC del 95 % = 1,58–4,73; p < 0,001), (HR = 0,23; IC del 95 % = 0,09–0,57; p = 0,001) y (HR = 4,25; IC del 95 % = 1,64–11,04; p = 0,003) se asociaron de forma independiente con la supervivencia global (SG); (HR = 0,43; IC del 95 % = 0,22–0,84; p = 0,014), (HR = 1,61; IC del 95 % = 1,07–2,41; p = 0,021), (HR = 0,14; IC del 95 % = 0,02–0,84; p = 0,032) y (HR = 4,51; IC del 95 % = 1,08–18,78; p = 0,038) fueron significativos para la supervivencia libre de progresión (SLP); y (ORN2-N0 = 2,21; IC del 95 % = 1,26–3,88; p = 0,006) para el estadio N. No se encontró que ningún parámetro del perfil fuera significativo en los análisis multivariables para los estadios M.
Se proporcionan análisis univariables complementarios, incluidos los gráficos ROC y los gráficos de supervivencia de Kaplan-Meier, en el archivo suplementario 3. Los de mejor rendimiento también se muestran en la figura 5.
Validación externa en la cohorte de validación de Dartmouth
La tabla 3 presenta los resultados completos de los análisis de regresión logística univariables y multivariables que evalúan las variables clínicas (incluidos la edad, el sexo, el estadio T y el estado de MSI) y los parámetros del perfil pronóstico en relación con los estadios N y M. En el análisis univariable, varios parámetros del perfil se asociaron significativamente con el estadio N, incluido la suavidad espacial del tumor (OR = 1,67; IC del 95 %: 1,16–2,41; p = 0,006), la abundancia estromal (OR = 2,07; IC del 95 %: 1,39–3,07; p < 0,001), la asimetría estromal (OR = 0,47; IC del 95 %: 0,31–0,71; p < 0,001) y la variación estromal (OR = 1,50; IC del 95 %: 1,01–2,22; p = 0,042). En los modelos multivariables, la mayoría de las asociaciones se atenuaron después de ajustar por las covariables clínicas; sin embargo, un parámetro, la suavidad espacial del tumor, siguió siendo estadísticamente significativo (OR = 1,65; IC del 95 %: 1,08–2,51; p = 0,02). Si bien muchas características del perfil no mantuvieron una significación independiente, sus asociaciones iniciales sugieren una posible relevancia biológica y resaltan la necesidad de una mayor validación. Estos hallazgos respaldan el posible papel de los parámetros del perfil como marcadores complementarios que pueden integrarse con los factores clínicos en futuros modelos de estratificación de riesgo.
Discusión
Los patólogos pueden reconocer los diversos paisajes histológicos dentro del microambiente tumoral (TIME), pero traducir estas observaciones visuales en métricas cuantitativas y biológicamente significativas sigue siendo un desafío, especialmente cuando se integran los análisis moleculares. Una solución prometedora es la aplicación de modelos de visión artificial para transformar los datos histológicos en incrustaciones ocultas. Sin embargo, la interpretación de estas incrustaciones presenta sus propios desafíos, ya que cada dimensión de la incrustación codifica características de imagen complejas y abstractas que a menudo carecen de un significado biológico o morfológico directo, lo que dificulta su relación con estructuras tisulares o firmas moleculares reconocibles. Esto a menudo requiere análisis complejos de interpretabilidad post hoc. Alternativamente, la visión artificial se puede emplear para extraer características que sean interpretables por los humanos. Ejemplos notables incluyen los estudios de PathAI[27] y QuantCRC[28], [29], que han utilizado con éxito este enfoque. Otras investigaciones han adoptado metodologías espaciales[30], [31], caracterizando las características midiendo las distancias intercelulares, centrándose así en métricas granulares a nivel celular. El marco CollaTIL ejemplifica esto al evaluar el desorden de las fibras de colágeno y las características espaciales de los TIL[32]. Estos enfoques extraen características que son interpretables, pero es posible que no capturen completamente la heterogeneidad espacial o la dinámica a nivel de paisaje que influyen en el comportamiento del tumor.
En línea con estudios anteriores, aprovechamos la visión artificial para extraer métricas interpretables a nivel de paisaje tisular, pasando de las evaluaciones convencionales a nivel celular del TIME. Al aplicar el modelado estadístico y geoestadístico, derivamos resúmenes espaciales descriptivos de los compartimentos tumoral, estromal e inmunitario, denominados colectivamente parámetros del paisaje. Estas métricas ofrecen valor tanto biológico como diagnóstico, lo que permite una comprensión estructural más holística del TIME. Para validar su relevancia, realizamos un análisis comparativo entre las métricas basadas en la patología convencional (incluidos TSR y TIL) y sus correspondientes contrapartes del paisaje. En particular, nuestros hallazgos revelaron que las estimaciones de la patología convencional pueden ser más sensibles a las métricas de varianza y, por lo tanto, sesgadas hacia las regiones con alta abundancia celular o regiones localizadas de enriquecimiento inmunitario o estromal. En contraste, las métricas a nivel de paisaje, derivadas de un análisis espacialmente completo, ofrecen una caracterización más holística e imparcial del microambiente tumoral.
Nuestros hallazgos destacaron la importancia pronóstica de la dinámica espacial del TIME de una manera interpretable. Un aumento de la agrupación espacial de las células inmunitarias () se asoció con una peor SG y SLP, lo que sugiere que los puntos calientes inmunitarios localizados pueden reflejar respuestas inmunitarias ineficaces o disfuncionales. En contraste, una mayor agrupación tumoral () parecía ser protectora, lo que posiblemente indica patrones de crecimiento tumoral más confinados. Además, los pacientes con regiones tumorales escasas () presentaban un peor SLP, mientras que aquellos con regiones inmunitarias muy infiltradas () presentaban mejores resultados, lo que subraya la relevancia de las distribuciones espaciales extremas. Esto se alinea con el trabajo reciente de Wilson et al.[33], que encontraron que una alta agrupación de TIL y una baja abundancia de TIL en los tumores de ovario predecían una peor supervivencia, probablemente debido a una actividad inmunitaria ineficaz o espacialmente restringida. Para la afectación nodal, una distribución desigual de la presencia de células inmunitarias en las regiones tisulares, capturada por , se asoció con un estadio N más alto. Interesantemente, en nuestra cohorte interna, —un marcador de la suavidad espacial del tumor y la continuidad del frente— se correlacionó con la propagación nodal, lo que sugiere que una interfaz tumoral suave, que refleja patrones de mezcla gradual del tumor y el fenómeno de brotes tumorales[34], promueve la invasión regional. En conjunto, estas métricas espaciales proporcionan una interpretación histológica matizada de cómo la dinámica espacial inmune y tumoral puede dar forma a la progresión de la enfermedad y al pronóstico. La dinámica histológica se puede explicar aún más si se tiene en cuenta la interdependencia de otros parámetros del paisaje significativos.
Las asociaciones univariadas de los descriptores de TIMEL corroboran aún más su relevancia biológica en la afectación ganglionar. Es importante destacar que la suavidad espacial del tumor permaneció estadísticamente significativa después del ajuste, lo que pone de relieve el potencial de integrar las características del paisaje espacial con las variables clínicas establecidas. Estos hallazgos subrayan la necesidad de una mayor validación en cohortes más amplias e independientes y respaldan la utilidad potencial de las métricas espaciales derivadas del paisaje como herramientas complementarias para la estratificación del riesgo en el CCRC.
Si bien el marco computacional proporciona información interpretativa valiosa, tiene ciertas limitaciones. En primer lugar, se utilizaron mini-parches para segmentar las regiones microscópicas dentro del tumor. Si bien esto puede enfatizar las características extracelulares (por ejemplo, el estroma), también puede restar importancia al papel de la distribución celular o no reflejar adecuadamente la importancia del tamaño o la densidad celular en el análisis posterior. El futuro desarrollo e incorporación de métodos de detección celular de última generación[35] pueden mejorar aún más la capacidad interpretativa de nuestro enfoque. En segundo lugar, el proceso de estimación por etapas puede introducir una pérdida de información, lo que podría reducir la potencia estadística de las asociaciones clinicopatológicas. Además, la integración de métodos computacionales avanzados y fuentes de datos complementarias (por ejemplo, transcriptómica espacial[36]) podría mejorar aún más la solidez y la profundidad interpretativa de este marco al caracterizar estados tisulares y celulares más complejos. Como otra limitación, la menor capacidad de estratificación observada en la cohorte de validación puede generar preocupaciones sobre el sobreajuste, posiblemente debido a la superposición entre la cohorte de desarrollo, donde se entrenaron los modelos de aprendizaje profundo (n = 10) y la cohorte de descubrimiento (n = 411), donde se identificaron las asociaciones iniciales. Sin embargo, todos los parámetros del paisaje se derivaron únicamente de datos histológicos mediante cálculos estadísticos y geoestadísticos, independientemente de cualquier información sobre el resultado clínico. Este diseño no supervisado preserva la objetividad del proceso de generación de características y evita posibles filtraciones de información de los resultados clínicos, como la etapa N, la etapa M, la supervivencia global (SG) y la supervivencia libre de progresión (SLP). En contraste, el posterior paso de selección de características basado en Elastic Net incorporó etiquetas de resultados para identificar variables con valor pronóstico, lo que introduce una forma necesaria pero limitada de supervisión que inherentemente conlleva un modesto riesgo de selección de características sesgada.[37] Esto puede dar como resultado un sesgo de selección excesivamente optimista o la exclusión de características del paisaje biológicamente relevantes que pueden no alcanzar los umbrales estadísticos en la cohorte de entrenamiento. Es importante destacar que la superposición entre las cohortes de desarrollo y descubrimiento fue mínima (2,4%; 10/411 imágenes de portaobjetos de tejido), lo que respalda la aplicación constante de la extracción de características histológicas en todas las cohortes. Además, la validación dependiente del contexto no se investigó a fondo debido al tamaño limitado de la muestra, aunque esto se hizo teniendo en cuenta los subgrupos clínicamente relevantes, como los pacientes con CCRC en etapa II con reparación de errores de emparejamiento eficiente. Los estudios futuros pueden utilizar conjuntos de datos más amplios e independientes para reevaluar todos los parámetros del paisaje, lo que fortalecerá la potencia estadística y revelará firmas pronósticas adicionales. Finalmente, si bien estos análisis proporcionan información valiosa, la distribución observada en una sola sección de tejido puede no capturar completamente las características tridimensionales (3D) del tejido, y no está claro si las características del tejido TIMEL son consistentes en las secciones seriadas. El trabajo futuro en el modelado de la histología reconstruida en 3D perfeccionará aún más este aspecto de nuestro método.
El enfoque computacional en nuestro estudio forma parte de un esfuerzo más amplio para modelar las características histológicas en la patología. Tradicionalmente, los patólogos describen la morfología de los tejidos analizando los patrones visuales observados bajo un microscopio, conocidos como patrones histológicos o morfológicos. El proceso de evaluación histopatológica combina estos patrones con la información clínica para formar una evaluación integral. Nuestro estudio emplea métodos estadísticos para modelar los patrones y paisajes de TIME. La reciente aprobación regulatoria de diagnósticos complementarios de patología digital habilitados por IA para el pronóstico/selección de tratamiento (por ejemplo, la designación de dispositivo innovador de la FDA[38]) destaca la relevancia clínica de las firmas espaciales y cuantitativas basadas en imágenes y respalda el desarrollo y el perfeccionamiento continuos de dichos enfoques en múltiples indicaciones clínicas.
En conclusión, establecimos un panel de parámetros del paisaje interpretables combinando la caracterización estadística con las estimaciones histológicas derivadas del aprendizaje profundo para diseccionar computacionalmente la dinámica espacial de TIME en el CCRC. Estas métricas de TIME, a su vez, permiten una mayor estratificación del riesgo de los pacientes con CCRC. Los futuros esfuerzos se centrarán en la validación a gran escala en cohortes diversas y específicas del contexto para garantizar la solidez y la generalización.
Declaración sobre el uso de IA y tecnologías asistidas por IA en el proceso de preparación del manuscrito
Durante la preparación de este trabajo, los autores utilizaron Perplexity AI (perplexity.ai) para ayudar a editar, reestructurar y refinar secciones del manuscrito para mejorar la claridad y la coherencia. Después de utilizar esta herramienta, los autores revisaron y editaron el contenido según fuera necesario y asumen la total responsabilidad del contenido de la publicación.
Declaración ética y consentimiento del paciente
El Programa de Protección de la Investigación Humana del IRB de Dartmouth Health otorgó la aprobación ética para este trabajo.
Financiación
JL recibe financiación a través de subpremios del NIH P20GM130454, R24GM141194, P30CA023108 (Fondos de Desarrollo del DCC, Subvención Piloto Prouty) y P20GM104416.
Declaración de conflicto de intereses
Los autores declaran que no tienen ningún conflicto de intereses financiero o personal conocido que pueda haber influido en el trabajo presentado en este artículo.
¡Aún no hay comentarios. Sé el primero en comentar!