Revisión Sistemática de Técnicas De Inteligencia Artificial para Detección de Cáncer Pulmonar en Imágenes Médicas

Systematic Review of Artificial Intelligence Techniques for Lung Cancer Detection in Medical Images

Rolando Tueros 1*, Carlos Cánepa 2, Carmen Muñoz 3; Yudi Guzmán 4

1* Facultad de Ingeniería de Sistemas e Informática, Universidad Nacional Mayor de San Marcos rolando.tueros@unmsm.edu.pe

https://orcid.org/0009-0009-3255-4714

2 Facultad de Ingeniería de Sistemas e Informática, Universidad Nacional Mayor de San Marcos ccanepap@unmsm.edu.pe

https://orcid.org/0000-0003-4051-4164

3 Facultad de Medicina, Universidad Nacional Mayor de San Marcos

 cmunozb@unmsm.edu.pe

https://orcid.org/0000-0002-3168-8210

4 Facultad de Ingeniería de Sistemas e Informática, Universidad Nacional Mayor de San Marcos yudi.guzman@unmsm.edu.pe

https://orcid.org/0000-0001-5306-5295

Fecha de recepción: 01 noviembre 2024

Fecha de aceptación: 05 noviembre 2024

Resumen:

El cáncer de pulmón es la principal causa de muerte por cáncer en el mundo, con 2.5 millones de fallecimientos y 1.8 millones de nuevos casos en 2022, estas cifras reflejan una realidad preocupante. Las técnicas de inteligencia artificial (IA), en particular el deep learning, han mostrado gran potencial para detectar el cáncer. Esta revisión sistemática analiza las técnicas de IA aplicadas en la detección y diagnóstico de cáncer de pulmón a partir de imágenes médicas, así como los datasets empleados, las métricas de rendimiento y los métodos de preprocesamiento de imágenes. El objetivo es esclarecer el panorama a los investigadores que estén interesados en el desarrollo de herramientas de detección de cáncer de pulmón mediante IA e imágenes médicas, resaltando las principales tecnologías que se están utilizando actualmente, así como sus limitaciones. Para la revisión se ha seguido la metodología proporcionada por Kitchenham & Charters. Los artículos considerados provienen de bases de datos indexadas como Scopus, Web of Science y PubMed, publicados entre 2019 y 2023. Los resultados muestran como tecnología principal a las redes neuronales convolucionales, las cuales se utilizaron en diferentes arquitecturas, algunas de ellas se combinaron con modelos de aprendizaje automático. Los datasets más usados fueron los orientados a la detección por nódulo. La revisión concluye que la integración de modelos híbridos basados en redes neuronales convolucionales son una opción prometedora para mejorar la precisión de la detección temprana del cáncer de pulmón.

Palabras Claves: Cáncer de pulmón, deep learning, detección temprana, inteligencia artificial, redes neuronales convolucionales.

 

 

 

Abstract:

Lung cancer is the leading cause of cancer-related mortality worldwide, with 2.5 million deaths and 1.8 million new cases reported in 2022, reflecting a troubling reality. Artificial intelligence (AI) techniques, particularly deep learning, have shown great potential for cancer detection. This systematic review examines AI techniques applied to the detection and diagnosis of lung cancer using medical imaging, as well as the datasets employed, performance metrics, and image preprocessing methods. The aim is to provide a comprehensive overview for researchers interested in developing lung cancer detection tools based on AI and medical imaging, highlighting the primary technologies currently in use and their limitations. The review follows the methodology provided by Kitchenham & Charters. The articles considered were sourced from indexed databases such as Scopus, Web of Science, and PubMed, and were published between 2019 and 2023. Results identify convolutional neural networks (CNNs) as the primary technology, utilized in various architectures, some of which were combined with machine learning models to enhance diagnostic accuracy. The most frequently used datasets were those oriented towards nodule detection. The review concludes that hybrid models based on CNNs offer a promising approach to improving early lung cancer detection accuracy.

 

Keywords: Lung cancer, deep learning, early detection, artificial intelligence, convolutional neural networks.

1.    Introducción

Actualmente, el cáncer de pulmón es la neoplasia más común y agresiva en el mundo. En 2020 se registraron 1.8 millones de muertes asociadas a esta enfermedad y 2.2 millones de nuevos casos. Ese año, el cáncer de pulmón se consolidó como la principal causa de muerte por cáncer y el segundo tipo de cáncer más frecuente, detrás del cáncer de mama (Sung et al., 2021). En 2022, el número de muertes superaron los 1.8 millones y la cantidad de nuevos casos registrados aumentaron hasta aproximadamente 2.5 millones, estas cifras representan el 18.7% del total de muertes por cáncer y el 12.4% del total de nuevos casos de cáncer registrados durante ese año respectivamente (Bray et al., 2024).

Estas cifras reflejan una situación alarmante en términos de salud pública, los nuevos casos y decesos por esta enfermedad muestran una tendencia ascendente durante los últimos años (Lanjewar et al., 2023). La relevancia que ha cobrado la lucha contra el cáncer de pulmón ha originado que en los últimos años se lleven a cabo diversas investigaciones centradas en afrontar esta enfermedad desde diferentes aspectos como estrategias de prevención o tratamientos quirúrgicos. Uno de estos aspectos es la investigación de nuevos métodos para mejorar el proceso de detección del cáncer de pulmón. Por ejemplo, muchas investigaciones se centran en la detección temprana del cáncer pulmonar, la etapa en la que se encuentra el cáncer en el momento de su detección condiciona demasiado el tratamiento y el pronóstico del paciente. Según Nooreldeen & Bach (2021) los pacientes a menudo fallecen debido a que su cáncer pulmonar suele ser detectado en etapas muy avanzadas donde el tratamiento se complica. Una detección precoz no solo aumenta las tasas de supervivencia, sino que hace posible una cura. Actualmente, la comunidad médica cuenta con técnicas de cribado (screening) para detectar el cáncer pulmonar en etapas tempranas, una de las más comunes es Tomografía Axial Computarizada (TAC) de baja dosis (Asuntha & Srinivasan, 2020).

Otras investigaciones buscan mejorar el proceso de detección mediante una mejora de la eficiencia en el análisis de tomografías computarizadas (TC). La búsqueda de indicios y lesiones de un posible cáncer pulmonar en cada corte de una TC es un proceso visual que demanda concentración y expertiz. Un problema comúnmente mencionado es que la cantidad de casos a analizar es cada vez mayor. Examinar muchas TC al día por tiempos prolongados afecta el rendimiento del personal médico y esto puede resultar en errores en el análisis (Saied et al., 2023). Por otro lado, aunque el análisis visual tradicional ha demostrado ser eficaz aún presenta limitaciones, ya que puede involucrar cierto grado de subjetividad por parte de los radiólogos y por tanto, generar discrepancias entre distintos observadores (Raza et al., 2023).

Ya se trate de una detección temprana o de la mejora de la eficiencia del análisis de TC, diversas investigaciones han hecho uso de técnicas avanzadas de inteligencia artificial (IA), obteniendo resultados prometedores. La IA ha mostrado un notable potencial para constituirse en una herramienta médica esencial en el futuro cercano. Según Bhinder et al. (2021) existen ya diversas investigaciones han obtenido resultados significativos al usar IA en tareas de clasificación, predicción y diagnóstico de enfermedades. Es más, Al-Yasriy et al. (2020) menciona que la inteligencia artificial puede utilizarse en todos los campos de la ingeniería biomédica, incluyendo el diagnóstico de enfermedades cardiacas y la detección de enfermedades cancerosas.

Además del uso de IA, estas investigaciones comparten un elemento adicional: el uso de imágenes médicas como entrada para algoritmos y redes neuronales que buscan detectar el cáncer pulmonar con altas tasas de precisión. Se usan tanto algoritmos de aprendizaje automático (Machine Learning) como redes propias del aprendizaje profundo (Deep Learning). La variabilidad de métodos existentes en la literatura reciente dificulta la comparación entre estudios y la adopción de técnicas para la práctica clínica y futuros estudios. Por este motivo, se ha realizado una revisión sistemática de la literatura acerca de las técnicas de IA orientadas a detectar el cáncer de pulmón mediante el uso de imágenes médicas. El objetivo es sintetizar y destacar los hallazgos más relevantes y mencionar las brechas existentes en las investigaciones actuales. De esta manera se proporciona una visión general del estado del arte que sirve para orientar a futuras investigaciones con una orientación práctica, destinadas al desarrollo de herramientas automatizadas de detección de cáncer pulmonar. Esta revisión se ha llevado a cabo siguiendo la metodología propuesta por Kitchenham & Charters (2007) que consta de la etapa de Planificación, donde se definieron las preguntas de investigación, los criterios de selección y la estrategia de búsqueda. La etapa de Desarrollo, donde se llevó a cabo la búsqueda de artículos y la extracción de información relevante. Y la etapa de Resultados, donde se realizó el análisis y la síntesis de la información recopilada.

2.    Metodología de Investigación

A continuación, se detalla la metodología aplicada para llevar a cabo la revisión de la literatura, así como las bases de datos elegidas, los criterios de elegibilidad de artículos y las preguntas de investigación planteadas.

2.1 Metodología utilizada

La metodología para llevar a cabo la revisión sistemática se basó en el trabajo de Kitchenham & Charters (2007), cuyo conjunto de directrices guía la realización de revisiones en el ámbito de la ingeniería de software y ciencias de la computación. Se plantean las siguientes etapas:

 

      Planificación: En esta etapa se formularon preguntas de investigación relacionadas, y se identificaron las técnicas o algoritmos de IA más relevantes en la detección de cáncer de pulmón, las principales bases de datos, métricas de rendimiento y métodos de preprocesamiento usados por los investigadores. Además, se eligieron los repositorios académicos, los criterios de elegibilidad de los artículos y las estrategias de búsqueda de información

      Desarrollo: En esta etapa se llevó a cabo una búsqueda exhaustiva de la literatura utilizando bases de datos académicas, se aplicaron los criterios de inclusión/exclusión previamente definidos para seleccionar los estudios más relevantes, luego se recopilaron y organizaron los datos clave de los estudios seleccionados. Se realizó una síntesis de información y se interpretaron los resultados en el contexto de las preguntas de investigación

      Resultados: Esta etapa presenta todos los pasos del proceso de revisión, junto con los hallazgos y conclusiones.

 

2.2 Preguntas de investigación

Se planteó una serie de preguntas de investigación que tienen por objetivo esclarecer el panorama actual de la investigación sobre la detección de cáncer de pulmón mediante técnicas de IA e imágenes médicas. Cada pregunta se centra en un aspecto diferente relacionado al uso de IA en las investigaciones, cuyas respuestas son clave para orientar el desarrollo de herramientas automatizadas en la detección de cáncer pulmonar. Las preguntas de investigación son las siguientes:

      Pregunta de Investigación 1: ¿Cuáles son los métodos, algoritmos o técnicas de inteligencia artificial usados actualmente en las investigaciones de detección de cáncer de pulmón mediante el análisis de imágenes médicas?

      Pregunta de Investigación 2: ¿Cuáles son los principales datasets de imágenes médicas utilizadas en las investigaciones de detección de cáncer de pulmón con inteligencia artificial?

      Pregunta de Investigación 3: ¿Cuáles son las métricas de rendimiento más relevantes utilizadas durante la evaluación de los modelos o algoritmos de detección de cáncer de pulmón?

      Pregunta de Investigación 4: ¿Cuáles son las técnicas de preprocesamiento de imágenes médicas más comunes?

2.3 Bases de datos y proceso de búsqueda

Para la elección de bases de datos académicas se consideraron aspectos como la cobertura temática y la especialización en áreas médicas e informáticas, se consideró también la calidad del contenido de las bases de datos, su reputación y su accesibilidad. Las bases de datos elegidas fueron Scopus, Web of Science y PubMed.

 

Previo a la búsqueda de artículos se formaron cadenas de búsqueda para cada repositorio compuesta de palabras claves: lung cancer. lung carcinoma, artificial intelligence, neural network, machine learning, deep learning, algorithm, model, image classification, detection, diagnosis. La Tabla 1 muestra qué cadenas se usaron en cada repositorio.

 

Tabla 1

Cadenas de búsqueda usadas en las bases de datos.

Repositorio

Cadena de búsqueda

Scopus

(TITLE-ABS-KEY ("lung cancer") AND TITLE-ABS-KEY ( detection OR diagnosis ) AND TITLE-ABS-KEY ( "machine learning" OR "deep learning" OR "artificial intelligence" ) ) AND PUBYEAR > 2019 AND PUBYEAR < 2024 AND ( LIMIT-TO ( SRCTYPE , "j" ) ) AND ( LIMIT-TO ( DOCTYPE , "ar" ) ) AND ( LIMIT-TO ( LANGUAGE , "Spanish" ) OR LIMIT-TO ( LANGUAGE , "English" ) ) AND ( LIMIT-TO ( SUBJAREA , "COMP" ) )

 

Web of Science

"lung cancer detection" (All Fields) AND ("machine learning" OR "deep learning" OR "artificial intelligence" OR "neural network") (All Fields) AND ("diagnosis" OR "prediction") (All Fields) and Article (Document Types) and Article (Document Types)

 

PubMed

(((("lung cancer" OR "lung carcinoma") ) AND ("detection" OR "diagnosis")) AND ("machine learning" OR "deep learning" OR "artificial intelligence")) AND ("algorithm" OR "model" OR "neural network") AND (" image classification")

Fuente: Elaboración propia.

2.4 Criterios de inclusión y exclusión

La Tabla 2 presenta los criterios de inclusión y exclusión definidos en esta investigación, cuyo objetivo es optimizar la calidad de la información recopilada durante la revisión. Se dio prioridad a artículos publicados en los últimos cinco años, con el fin de identificar los métodos más recientes empleados en la detección de cáncer pulmonar.

 

 

Tabla 2

Criterios de inclusión y exclusión utilizados.

Criterios de inclusión

Criterios de exclusión

Artículo publicado entre 2019 y 2024.

Documentos que sean libros, tesis, conferencias, actas o carteles.

Orientado al diagnóstico, detección o clasificación del cáncer de pulmón.

 

El idioma de publicación no es inglés o español.

 

Propone o usa algoritmos y técnicas de machine learning o deep learning.

 

Artículos que son revisiones de la literatura.

 

Responde a una o más preguntas de investigación.

 

Artículos de comparación entre técnicas IA.

 

Contiene al menos una palabra clave en su resumen.

 

 

Fuente: Elaboración propia

2.5 Proceso de revisión sistemática

El proceso comenzó con la selección de los repositorios Scopus, Web of Science y PubMed. Se emplearon palabras clave y cadenas de búsqueda, a partir de las cuales se identificaron 461 artículos potencialmente elegibles. Posteriormente, se aplicaron los criterios de exclusión, resultando en 143 artículos. Luego, se realizó una revisión de resúmenes, discusiones y conclusiones; tras aplicar los criterios de inclusión, se seleccionaron 84 artículos. Finalmente, se llevó a cabo un análisis exhaustivo del contenido completo de cada estudio, eligiéndose 50 artículos científicos relevantes para responder a las preguntas de investigación. La Figura 1 presenta el proceso de búsqueda y selección de artículos académicos durante la revisión.

 

 

Figura 1. Proceso de revisión sistemática y selección de artículos

 

La Figura 2 muestra la distribución porcentual de los artículos según su año de publicación. La mayor parte de los estudios seleccionados fueron publicados en los años 2023 y 2022 con un 37% y 30% respectivamente.

 

Figura 2. Distribución porcentual de los artículos seleccionados

3.    Revisión de la Literatura

En esta sección se examinan las técnicas y métodos de inteligencia artificial reportados en la literatura para la detección de cáncer pulmonar a partir de imágenes médicas. Aunque existen numerosos enfoques desde los cuales analizar estas técnicas, en esta revisión se ha optado por agrupar los métodos en función de la arquitectura empleada en cada solución, de manera que proporcione a investigadores o ingenieros que deseen interesados en el desarrollo de herramientas prácticas un panorama claro de las opciones disponibles. Las soluciones se han dividido en arquitecturas estándar o convencionales, como VGG y ResNet, reconocidas por su capacidad de extracción de características, como arquitecturas híbridas que combinan redes neuronales con algoritmos de aprendizaje automático.

 

3.1 Técnicas de captura de imagen

 

Son variadas las técnicas de obtención de imágenes médicas que están involucradas en el proceso de detección de cáncer pulmonar. Sin embargo, las técnicas más usadas en la literatura fueron la Tomografía Computarizada (CT), las imágenes histopatológicas, es decir, provenientes del tejido pulmonar mediante biopsia, y las imágenes de Rayos X. Estudios llevados a cabo por Wankhade & S. (2023) o Shah et al. (2023) toman como entrada para sus modelos de IA imágenes TC preprocesadas y segmentadas en nódulos. Otro grupo de autores como Faria et al. (2023) o Al-Ameer et al. (2022) utilizan imágenes histopatológicas para entrenar la capacidad de sus algoritmos de reconocer un tipo específico de cáncer pulmonar. Son pocos los estudios que han usado imágenes de Rayos X o Resonancia Magnética. La Figura 3 muestra un ejemplo de los tipos de imágenes médicas pulmonares usados en estudios sobre detección de cáncer de pulmón usando IA.

Figura 3. Ejemplos de imágenes médicas pulmonares. (a) Imagen histopatológica de Adenocarcinoma pulmonar, (b) Imagen TC de pulmón de corte axial, (c) Imagen Rayos X de tórax

3.2 Arquitectura estándar o convencionales

Estos métodos suelen emplear arquitecturas conocidas con parámetros previamente establecidos sin incluir modelos o algoritmos externos en estructura interna. En la literatura se ha encontrado que la mayor parte de los autores usan redes neuronales convolucionales (CNN), un tipo de redes neuronales especializadas en reconocimiento de imágenes. De este grupo, una parte ha optado por usar redes CNN como VGG, ResNet y DenseNet conocidas por su estabilidad, las cuales ya han sido entrenadas en grandes conjuntos de datos, como ImageNet.

Humayun et al. (2022) aplicaron técnicas de transferencia de aprendizaje (Transfer Learning) las redes CNN VGG 16, VGG 19 y Xception con el objetivo de encontrar un modelo que mejore los sistemas de diagnóstico asistido por computadora (CAD) actuales. Saied et al. (2023) segmentaron imágenes CT para aislar nódulos pulmonares candidatos a ser cancerosos, luego ajustaron las redes DenseNet-121 y DenseNet-169 para mejorar la eficiencia de detección de nódulos malignos. Raza et al. (2023) se basaron en la arquitectura CNN EfficientNet para crear una modelo capaz de distinguir si una imagen CT puede clasificarse en los tipos de cáncer pulmonar Adenocarcinoma, Carcinoma de células escamosas o Carcinoma de células escamosas. Bhattacharjee et al. (2023) usan la CNN Xception para detectar tanto el cáncer pulmonar como la enfermedad renal crónica. Huang & Hu (2019) mejoraron la red U-Net para optimizar la detección de los nódulos pequeños. Al-Yasriy et al. (2020) utilizaron la red AlexNet con capas Dropout para clasificar imágenes CT malignas y benignas. Yu et al. (2020) usaron las CNN VGG 19 y U-Net para crear módulos reproducibles para detectar el cáncer pulmonar. Bilal et al. (2022) proponen clasificar la malignidad de los nódulos usando la red InceptionNet-V3.

Algunos estudios proponen un diseño de red propio, Asuntha & Srinivasan (2020) diseñaron una red CNN que identifica la gravedad de los nódulos pulmonares. De manera similar, Mendoza & Pedrini (2020) se centraron en la identificación de nódulos cancerosos en imágenes de rayos X de tórax, usaron técnicas de segmentación, aumento y balance de datos para alimentar una red CNN propia. Por otro lado, las redes CNN convencionales han respondido bien a imágenes de tejido pulmonar, el estudio realizado por Masud et al (2021). diseñó una Red Neuronal Convolucional (CNN) propia de 7 capas, logra reconocer el cáncer de pulmón y colon usando imágenes histopatológicas. Wadekar & Singh (2023) trabajaron con la CNN VGG 19 previamente entrenada, utilizando imágenes histopatológicas para reconocer Adenocarcinoma, Carcinoma de células escamosas. Faria et al. (2023) diseñaron una red basada en RestNet-50 especializada en el reconocimiento de imágenes de tejido pulmonar. Civit-Masot et al. (2022) entrenaron dos redes CNN especializadas en la detección de cáncer de células no pequeñas en imágenes histopatológicas.

Otras técnicas menos conocidas han sido aplicadas como el estudio llevado a cabo por Tiwari et al. (2021) diseñaron una Red Neuronal Recurrente (RNN) para poder detectar la enfermedad durante el cribado de pacientes. Shakeel et al. (2019) buscan la mejora de calidad de las imágenes médicas usando una Red Neuronal Entrenada Instantáneamente. Blessie & Ramesh (2022) identifican áreas afectadas por células cancerosas mediante una Red de Propagación Cruzada Contigua. Yan & Razmjooy (2023) buscan la optimización de diversas redes CNN. Saleem et al. (2023) diseñaron una CNN que mejora el diagnóstico de cáncer de células no pequeñas. Liu et al. (2023) usaron un Modelo de Perceptrón Multicapa que identifica el grado de infiltración de Adenocarcinoma de pulmón.

3.3 Arquitecturas híbridas

Los modelos o arquitecturas híbridas combinan dos o más técnicas de machine learning o deep learning para aprovechar las fortalezas de cada una y mejorar la precisión y la eficiencia. Estas arquitecturas buscan mejorar el desempeño al combinar, por ejemplo, redes CNN con otros modelos clásicos, como máquinas de vectores de soporte (SVM) o redes de memoria a corto y largo plazo (LSTM).

La investigación realizada por Ozdemir et al. (2020) busca acoplar la detección y el diagnóstico nodular usando una CNN propia y otra basada en V-Net. Alsheikhy et al. (2023) propone usar VGG 19 en conjunto con una Red de Memoria a Corto y Largo Plazo para diagnosticar nódulos. Wankhade & S. (2023) buscan optimizar el diagnóstico de los nódulos combinando una CNN 3D y una RNN. Behrendt et al. (2023) crearon un modelo que combina las redes Faster-R-CNN, RetinaNet, EfficientDet-D2 el cual analiza radiografías de tórax.

Shafi et al. (2022) lograron identificar cambios patológicos en la sección transversal de las lesiones de cáncer pulmonar complementando una CNN con el algoritmo SVM. Maleki & Niaki (2023) diseñaron 3 modelos híbridos basados en la combinación de una CNN con una Red Neuronal Artificial. Raju & Rao (2022) evalúan 5 tipos de tejidos de pulmón y colon usando una modificación de las redes pre entrenadas MobileNetV2 e InceptionRestNetV2. Shah et al. (2023) propone una arquitectura de tres CNN de detección nodular simultáneas donde el diagnóstico es determinado por el promedio de los resultados parciales de las redes. Yu et al. (2021) complementan la CNN U-Net con la red de clasificación 3D RestNet50, el modelo es sensible a reconocer nódulos benignos pequeños. Saleh & Chin (2023) usan una CNN propia en conjunto con el modelo estadístico ARIMA para diferenciar entre nódulos malignos y benignos en etapas tempranas. Tang et al. (2022) usan una CNN basada en la fusión de características múltiples para mejorar la segmentación nodular del tejido circundante. Naseer et al. (2023) modificaron las redes AlexNet y U-net, usan el algoritmo SVM como clasificador. Jena et al. (2021) priorizaron la detección de la enfermedad en etapas tempranas, usaron una Red Neuronal Basada en Regiones que integra elementos de deep learning. Shanid & Anitha (2023) crearon un esquema de detección de cáncer pulmonar usando una Red de Creencias Profundas y algoritmo de optimización híbrido. Lanjewar et al. (2023) complementaron la red DenseNet201 con los algoritmos SVM y Random Forest (RF). Al-Ameer et al (2022). usan el modelo Inception V3 y el algoritmo RF. Talukder et al. (2022) diseñan una arquitectura de cinco subredes CNN pre entrenadas: VGG 16, VGG 19, MobileNet, DenseNet161 y DenseNet201 las cuales transfieren su conocimiento a una red CNN de diseño propio. Sori et al. (2019) diseñaron un sistema con tres redes CNN simultáneas, los resultados de cada red se promedian para generar el diagnóstico. Ibrahim et al. (2021) usaron la red VGG 19 y una CNN propia, se aplicó Transfer Learning. Mohamed et al. (2023) diseñaron un modelo híbrido CNN más un algoritmo de optimización. Nanglia et al. (2021) proponen un modelo híbrido que combina una red neuronal artificial con el algoritmo SVM, encontraron que este algoritmo ayuda a reducir la complejidad computacional del modelo, además utilizan un algoritmo genético para segmentar imágenes TC. Huang et al. (2020) diseñaron un método de diagnóstico basado en una Red de Transferencia Profunda con Extreme Machine Learning. Sousa et al. (2022) buscaron una mejora en la segmentación nodular usando las CNN U-Net y RestNet34. De manera similar, Mothkur & B. N (2022) combinan las redes VGG 16 y RestNet50 para mejorar la segmentación nodular. Barrett & Viana (2022) diseñaron EMM-LC Fusion, un modelo basado en la CNN pre entrenada AlignedXception. Kim et al. (2022) utilizaron una arquitectura de dos redes ANN pre entrenadas con características clínicas y demográficas relevantes apoyada por una red CNN presentada con el dataset TCIA con capacidad de reconocer regiones de posibles tumores en las imágenes CT y un analizador basado en machine learning que combina los resultados de las redes para establecer una probabilidad de la presencia de cáncer pulmonar. Lalitha (2021) utilizó un modelo compuesto de técnicas de ML (Machine Learning) capaz de clasificar las tomografías en casos benignos, malignos o normales. Moragheb et al. modificaron de la CNN U-Net para clasificar nódulos pulmonares con una reducción de falsos positivos. Alamgeer et al. (2023) utilizaron un modelo que fusiona las características de las redes RestNet, DenseNet e Inception-ResNet-V2, para la detección y clasificación se usa un modelo LTSM.

4.    Resultados

4.1 Resultados de la pregunta de investigación 1

Pregunta de Investigación 1: ¿Cuáles son los métodos, algoritmos o técnicas de inteligencia artificial usados actualmente en las investigaciones de detección de cáncer de pulmón mediante el análisis de imágenes médicas?

La técnica predominante en las investigaciones revisadas son las Redes Neuronales Convolucionales (CNN). En la mayoría de los estudios, se parte de arquitecturas de CNN conocidas (como VGG 16 o AlexNet), que se modifican para adaptarse a las necesidades específicas de cada investigación. Estas modificaciones abarcan desde el ajuste de hiperparámetros (como cambios en el tamaño y cantidad de filtros, tasas de aprendizaje, y optimizadores), hasta la variación en la profundidad de la red mediante la adición o eliminación de capas convolucionales y de pooling, modificaciones de arquitectura, o la implementación de nuevas funciones de activación. Un menor número de estudios emplea redes CNN propias, diseñadas específicamente por los investigadores sin basarse en arquitecturas preestablecidas.

 

En menor medida, algunos estudios emplean algoritmos de aprendizaje automático que complementan a las CNN, actuando como clasificadores dentro de arquitecturas híbridas. Algoritmos como Random Forest, Support Vector Machine (SVM), y K-nearest neighbors (KNN) han demostrado buenos resultados en estas configuraciones (Al-Ameer et al., 2022; Naseer et al.). Cabe señalar que solo una investigación (Lalitha, 2021) realiza clasificación sin el uso de redes CNN.

 

La elección de la arquitectura y de las técnicas específicas de IA depende en gran medida de la naturaleza del problema planteado en cada estudio. La aproximación a la detección de cáncer pulmonar varía entre investigaciones; por ejemplo, la elección de la arquitectura inicial puede depender del tipo de imágenes utilizadas. Aunque la mayoría de los estudios se basan en imágenes de tomografía computarizada (TC), también existen investigaciones que utilizan imágenes histopatológicas y, en menor medida, radiografías. Otro factor determinante en la selección de arquitectura es la modalidad de clasificación de las imágenes. Una modalidad común es la clasificación de la imagen completa, utilizada principalmente para identificar patrones cancerosos de manera general y determinar la presencia o ausencia de cáncer pulmonar. Otra modalidad relevante es la clasificación focalizada en los nódulos, que resulta útil para identificar patrones de benignidad o malignidad en los nódulos y permite una detección temprana a partir de estos.

 

La Tabla 3 presenta un resumen de las redes, arquitecturas y algoritmos más frecuentemente empleados en las investigaciones revisadas.

Tabla 3

Resultados de la pregunta de investigación 1

Autores

Año

Método

Tipo de Imagen

Tipo de Clasificación

Al-Ameer et al

2022

Modelo híbrido Inception V3 - VGG 16 + Random Forest

TC

Completa

Al-Yasriy et al

2020

Arquitectura CNN AlexNet

TC

Completa

Alsheikhy et al

2023

Modelo híbrido VGG 19 + red LTSM

TC

Por nódulo

Bhattacharjee et al

2023

Modelo basado en la red Xception modificada

TC

Completa

Faria et al

2023

Modelo basado en la red CNN RestNet50

Histopatológica

Completa

Huang & Hu

2019

Modelo basado en U-Net

TC

Por nódulo

Humayun et al

2022

Modelos CNN pre entrenados (VGG16, VGG19, Xception)

TC

Completa

Ibrahim et al

2021

Modelo híbrido VGG 19 (TL) + CNN de diseño propio

RX/TC

Completa

Lalitha. S.

2021

Ensamble de clasificadores KNN, SVM y ELM

TC

Por nódulo

Lanjewar et al

2023

Modelo CNN DenseNet201 modificado

TC

Completa

Masud et al.

2021

Modelo propio: CNN de 7 capas

Histopatológica

Completa

Moragheb et al

2022

Modelo CNN U-Net

TC

Por nódulo

Naseer et al.

2023

Modelo híbrido AlexNet y SVM

TC

Por nódulo

Ozdemir et al.

2020

Red CNN basada en V-Net

TC

Por nódulo

Raza et al.

2023

CNN basada en EfficientNet

TC

Completa

Saleh & Chin

2023

Modelo híbrido CNN y ARIMA

TC

Completa

Shafi et al.

2022

Modelo híbrido basado en CNN + SVM

TC

Por nódulo

Shah et al.

2023

Ensamble de 3 redes CNN propias con predicción ponderada

TC

Por nódulo

Sousa et al.

2022

Modelo híbrido: Arquitecturas ResNet34 y U-Net ensambladas

TC

Completa

Wadekar & Singh

2023

Modificación de la red VGG-19

Histopatológica

Completa

Wankhade & S.

2023

Modelo híbrido CNN y RNN

TC

Por nódulo

Fuente: Elaboración propia

4.2 Resultados de la pregunta de investigación 2

Pregunta de Investigación 2: ¿Cuáles son los principales datasets de imágenes médicas utilizadas en las investigaciones de detección de cáncer de pulmón con inteligencia artificial?

Se identificaron como los datasets más utilizados en las investigaciones LIDC-IDRI y LUNA 16, los cuales están especialmente diseñados para la detección y clasificación de nódulos pulmonares, y se emplean ampliamente en el entrenamiento de redes para la detección temprana de cáncer pulmonar. En particular, LUNA 16 constituye un subconjunto de LIDC-IDRI, con casos seleccionados por expertos específicamente para la detección nodular. Ambos datasets incluyen anotaciones detalladas sobre las características de los nódulos.

En contraste, los datasets Chest CT-Scan e IQ-OTH/NCCD se emplearon en estudios enfocados en la clasificación de imágenes completas sin énfasis específico en nódulos pulmonares. El dataset Chest CT-Scan está diseñado para clasificar el cáncer pulmonar según su tipo (Adenocarcinoma, Carcinoma de células grandes y Carcinoma de células escamosas), mientras que IQ-OTH/NCCD clasifica sus imágenes en casos malignos, benignos y normales. Estos datasets presentan una cantidad significativamente menor de datos en comparación con los conjuntos de datos centrados en la clasificación nodular.

Para estudios basados en imágenes histopatológicas, el dataset más utilizado fue LC25000, el cual agrupa imágenes de tejido pulmonar en casos de adenocarcinoma, carcinoma de células escamosas y casos benignos. Todos los datasets mencionados anteriormente son de acceso libre. Sin embargo, algunos autores emplearon datasets menos comunes, muchos de los cuales no están actualmente disponibles, y algunos crearon conjuntos de datos propios en colaboración con entidades de salud privadas. La Tabla 4 muestra cada dataset considerado relevante y los estudios específicos que los han utilizado.

Tabla 4

Resultados de la pregunta de investigación 2

Dataset

Descripción

Estudios que lo utilizan

LIDC-IDRI

Imágenes TC de baja dosis del tórax de pacientes que pueden mostrar la presencia de nódulos pulmonares. Hay 888 pacientes y 1186 nódulos anotados.

(Saied et al., 2023), (Bilal et al., 2022) (Wankhade & S., 2023), (Shafi et al., 2022), (Yu et al., 2021),(Jena et al., 2021), (Shanid & Anitha, 2020), (Huang et al., 2020), (Mothkur & B. N, 2022)

 

National Cancer Institute Dataset

No disponible actualmente, conjuntos de TC de la etapa 1 y 2 del cáncer de pulmón con 1595 y 506 pacientes respectivamente.

(Ozdemir et al., 2020)

 

 

Chest CT-Scan Dataset

Conjunto de imágenes CT que incluye carcinoma de células grandes, carcinoma de células escamosas y adenocarcinoma. Consta de 1000 imágenes

(Raza et al., 2023), (Alsheikhy et al., 2023), (Lanjewar et al., 2023)

 

 

LUNA16

Conjunto utilizado para la detección de nódulos pulmonares en imágenes de tomografía computarizada (TC) del tórax.

(Yu et al., 2020), (Ozdemir et al., 2020), (Shafi et al., 2022), (Shah et al., 2023), (Tang et al., 2022), (Naseer et al., 2023), (Sori et al., 2019),  (Huang & Hu, 2019),  (Sousa et al., 2022)

 

LC25000

Contiene 25,000 imágenes a color de cinco tipos de tejidos de pulmón y colon: Adenocarcinoma de Colon, Tejido Colónico Benigno, Adenocarcinoma de Pulmón, Tejido Pulmonar Benigno y el Carcinoma de Células Escamosas de Pulmón.

(Masud et al., 2021), (Wadekar & Singh, 2023), (Civit-Masot et al., 2022), (Raju & Rao, 2022), (Talukder et al., 2022)

 

 

 

NLST Dataset

Conjunto de casos de cáncer de pulmón en Estados Unidos contienen imágenes de patología o de tejidos, incluye datos clínicos.

(Faria et al., 2023)

 

 

Node21 Dataset

Consta de 4882 radiografías de tórax frontal que provienen de cuatro conjuntos de datos públicos diferentes.

(Behrendt et al., 2023)

 

 

IQ-OTH/NCCD Dataset

Conjunto de datos recopilado por el Hospital de Enseñanza de Oncología de Irak / Centro Nacional de Enfermedades del Cáncer. Consta de 1097 imágenes

(Humayun et al., 2022), (Yan & Razmjooy, 2023), (Bhattacharjee et al., 2023), (Mohamed et al., 2023)

 

TCIA Dataset

Conjunto de imágenes recopilado por la entidad Cancer Imaging Archive.

(Shakeel et al., 2019), (Kim et al., 2022)

 

Fuente: Elaboración propia

4.3 Resultados de la pregunta de investigación 3

Pregunta de Investigación 3: ¿Cuáles son las métricas de rendimiento más relevantes utilizadas durante la evaluación de los modelos o algoritmos de detección de cáncer de pulmón?

Las métricas de rendimiento más utilizadas en las investigaciones fueron las métricas de clasificación estándar. Entre estas, la más empleada fue la Sensibilidad (Sensitivity o Recall), que mide la proporción de verdaderos positivos sobre el total de positivos reales, siendo especialmente relevante en contextos médicos donde se prioriza la identificación precisa de casos positivos. La Precisión Global (Accuracy), que evalúa la proporción de predicciones correctas sobre el total, también fue muy empleada. Otras métricas frecuentes incluyen la Precisión, el F1-Score, la Specificity, y los indicadores basados en la Curva ROC y el AUC (Área bajo la curva).

Además, en menor medida, se utilizaron otras métricas específicas según el tipo de análisis requerido: la Overlap Measure, para evaluar la precisión en segmentación de imágenes; el Matthew's Correlation Coefficient, útil en casos de desequilibrio de clases; y el Cohen’s Kappa Score, aplicado en estudios que requieren evaluar la concordancia entre muestras dependientes. Para problemas de regresión, métricas como el Mean Absolute Error, el Mean Squared Error y el Root Mean Squared Error fueron preferidas.

Cada métrica responde a necesidades particulares, y la elección de métricas de rendimiento depende de los objetivos específicos de los investigadores. No obstante, las métricas de clasificación estándar son las más comunes y suelen ser indispensables en la mayoría de estudios. La Figura 4 presenta las frecuencias de uso de cada métrica de rendimiento en las investigaciones analizadas.

Gráfico

Figura 4. Resultados de la pregunta de investigación 3

4.4 Resultados de la pregunta de investigación 4

Pregunta de Investigación 4: ¿Cuáles son las técnicas de preprocesamiento de imágenes médicas más comunes?

Las técnicas de preprocesamiento más empleadas en las investigaciones revisadas incluyen la Normalización, el Filtrado y el Aumento de Datos (Data Augmentation). La Normalización fue utilizada para ajustar la intensidad de los píxeles de las imágenes a un rango estándar, generalmente entre [0;1], lo que facilita el procesamiento y mejora la consistencia en el entrenamiento de los modelos de IA. Para la reducción del ruido en las imágenes, se usaron comúnmente el Filtro Gaussiano y el Filtro de la Mediana, los cuales minimizan la interferencia de píxeles atípicos, contribuyendo a una representación más precisa de las estructuras importantes en el análisis.

Otro aspecto clave fue el uso del Aumento de Datos (Data Augmentation). Ante la escasez de datos, los autores aplicaron técnicas como Data Reshaping y Data Shuffling, que permiten generar variaciones de las imágenes originales mediante rotaciones, escalados y otras transformaciones. Esto ayuda a prevenir el sobreajuste y permite que los modelos generalicen mejor al contar con un dataset ampliado y diversificado.

Para realzar el contraste en las áreas de interés de las imágenes, se utilizaron tanto el AHE (Adaptive Histogram Equalization) como su variante CLAHE (Contrast Limited Adaptive Equalization). Estas técnicas mejoran la visibilidad de estructuras importantes sin intensificar en exceso las áreas con alto contraste, lo cual es particularmente útil para destacar posibles indicios de cáncer en las imágenes médicas.

La Tabla 5 presenta una lista detallada de las técnicas de preprocesamiento de imágenes más relevantes identificadas durante la revisión sistemática.

Tabla 5

Resultados de la pregunta de investigación 4

Técnica

Descripción

Estudios que lo utilizan

Normalización de imagen

Estandarización de las propiedades de las imágenes, como la media y la varianza de los valores de píxeles.

(Raza et al., 2023), (Ozdemir et al., 2020), (Behrendt et al., 2023), (Moragheb et al., 2022), (Talukder et al., 2022), (Sori et al., 2019), (Sousa et al., 2022), (Kim et al., 2022).

 

Desenfoque gaussiano

Utilizado para suavizar una imagen al reducir el nivel de detalle, reduce el contraste y las transiciones bruscas de intensidad.

(Ozdemir et al., 2020), (Maleki & Niaki, 2023), (Jena et al., 2021), (Sori et al., 2019)

 

Unsharp Masking

Técnica de mejora de contraste, donde los detalles finos se vuelven más prominentes.

(Masud et al., 2021)

Data Shuffling

Reorganización aleatoria de datos, el propósito es eliminar cualquier sesgo.

(Raza et al., 2023),

(Wadekar & Singh, 2023)

Data Reshaping

Modifica la forma o la estructura de los datos sin cambiar su contenido.

(Wadekar & Singh, 2023)

Data Augmentation

Aumenta la cantidad de datos disponibles, previene el sobreajuste, mejora el rendimiento.

(Raza et al., 2023),

(Wadekar & Singh, 2023), (Humayun et al., 2022), (Liu et al., 2023), (Behrendt et al., 2023), (Shah et al., 2023), (Ibrahim et al., 2021), (Barrett & Viana, 2022)

 

Ecualización de histograma adaptable (AHE)

Mejorar el contraste en imágenes médicas al redistribuir los niveles de gris.

(Asuntha & Srinivasan, 2020), (Civit-Masot et al., 2022), (Lalitha, 2021),

 

Kernelized Fuzzy C-Means (KFCM)

Variante del algoritmo Fuzzy C-Means, se utiliza en la segmentación de imágenes.

(Lalitha, 2021)

Regiones de Interés (ROI)

Se usa para extraer áreas de interés de una imagen

(Shafi et al., 2022), (Kim et al., 2022)

Data Split

Dividir un conjunto de datos en partes separadas

(Raza et al., 2023), (Jena et al., 2021), (Ibrahim et al., 2021)

Contrast limited adaptive equalizations (CLAHE)

Se utiliza para mejorar el contraste y la visibilidad de detalles en imágenes con niveles de gris.

(Tiwari et al., 2021), (Saleh & Chin, 2023)

Filtro Wiener

Se utiliza en aplicaciones como restauración de imágenes, eliminación de ruido.

(Jena et al., 2021)

Filtro de la Mediana

Puede suavizar la imagen sin distorsionar las características importantes.

(Yan & Razmjooy, 2023)

Fuente: Elaboración propia

5.    Discusión

En cuanto a los métodos de inteligencia artificial empleados actualmente para la detección de cáncer pulmonar, se observa que la mayoría de los autores consideran las técnicas de deep learning, particularmente las Redes Neuronales Convolucionales (CNN) y sus variaciones, como las más adecuadas para enfrentar este problema. Estas técnicas son empleadas tanto para la extracción de características de las imágenes como para su clasificación. Un número ligeramente mayor de estudios optó por arquitecturas híbridas en lugar de modelos con arquitecturas específicas o convencionales, en función de los objetivos específicos de cada investigación. En estos enfoques híbridos, las arquitecturas combinan métodos de deep learning con algoritmos de machine learning, donde los algoritmos actúan principalmente como clasificadores después de que las imágenes pasan por una o más redes CNN. Solo un estudio propuso un algoritmo de machine learning para cubrir el proceso completo de detección y clasificación del cáncer pulmonar.

Muchos investigadores optaron por trabajar con arquitecturas de CNN reconocidas, como VGG 16, U-Net, DenseNet o ResNet, el estado preentrenado de estas redes representa una ventaja durante el entrenamiento, ya que empiezan con la capacidad de reconocimiento de patrones de imágenes variadas y es tarea del investigador orientar ese conocimiento previo para que pueda utilizarse y adaptarse a los patrones propios de las imágenes médicas. Los ajustes o modificaciones de estas redes permiten que los modelos logren objetivos específicos, como el reconocimiento de nódulos pulmonares. Es importante resaltar que el entrenamiento y el ajuste de las redes no son suficientes para garantizar resultados aceptables, casi todos los estudios han hecho usos de técnicas complementarias al entrenamiento. Algunas de ellas son el aprendizaje por transferencia, para aprovechar el conocimiento previo de las redes. Para mejorar la performance o la reducción de sesgo se emplearon métodos de aumento y balanceo de datos. Y para reducir los problemas de sobreajuste se hicieron usos de capas Dropout.

En relación con los datasets más empleados, se identificó que los estudios suelen utilizar bases de datos como LIDC-IDRI (22 %) y LUNA 16 (20 %) para la identificación de nódulos pulmonares como parte de la detección de cáncer de pulmón. Un número menor de investigadores optó por datasets que clasifiquen las imágenes en función de diferentes patologías, tales como Chest CT-Scan Dataset e IQ-OTH/NCCD Dataset. El tercer dataset más usado es LC25000 (11 %), que se distingue por contener imágenes de tejido pulmonar en lugar de imágenes de nódulos pulmonares.

En cuanto a las métricas de rendimiento utilizadas para evaluar los métodos de detección de cáncer pulmonar, más del 80 % de los estudios utilizan métricas estándar de clasificación, como Accuracy, Specificity, Precision, Recall y F1-score. Un número menor de estudios emplea la curva ROC para evaluar el desempeño de sus modelos, mientras que otras métricas se emplean en menor proporción.

En términos de técnicas de preprocesamiento de imágenes, se observó un amplio uso de normalización, filtros para la eliminación de ruido, como el desenfoque Gaussiano y el filtro de la Mediana, y técnicas de aumento de datos para mejorar la diversidad del conjunto de entrenamiento.

 

Este artículo está dirigido principalmente a investigadores, profesionales de la salud, y desarrolladores de tecnología en el ámbito de la detección de enfermedades mediante inteligencia artificial, con énfasis en la detección de cáncer pulmonar a partir de imágenes médicas. Al proporcionar un análisis actualizado de los métodos de inteligencia artificial, especialmente de técnicas basadas en redes neuronales convolucionales (CNN) y arquitecturas híbridas, el estudio ofrece una guía detallada sobre las prácticas actuales y efectivas en la identificación de cáncer pulmonar.

Asimismo, el artículo brinda un aporte valioso para estudiantes y académicos interesados en explorar aplicaciones de machine learning en la medicina, ya que ofrece una revisión de los datasets más comunes y sus características, así como las métricas y técnicas de preprocesamiento usadas en la investigación médica. Los hallazgos y análisis detallados también pueden resultar útiles para instituciones de salud y centros de investigación que buscan implementar o mejorar sus sistemas de diagnóstico asistido por IA.

6.    Conclusiones

Se realizó una revisión sistemática de las técnicas y métodos de inteligencia artificial orientados a la detección del cáncer pulmonar a partir de imágenes médicas en artículos científicos publicados entre los años 2019 y 2023. La elección de técnicas de IA depende en gran medida de los objetivos de los investigadores, a pesar de que la red neuronal convolucional ha sido la técnica más utilizada y que mejores resultados ha obtenido, no parece haber un consenso acerca de qué arquitectura es superior en términos de precisión y sensibilidad. Tanto arquitecturas híbridas como convencionales han mostrado buenos resultados, sin embargo, las arquitecturas híbridas se han mostrado como una opción más robusta durante el entrenamiento y la validación de los modelos. Se sugiere que los estudios incluyan técnicas complementarias al entrenamiento de los modelos, como Transfer Learning y Fine-Tuning, para optimizar la capacidad de reconocimiento en arquitecturas CNN definidas. Asimismo, debería considerarse el uso de técnicas de balanceo de datos en redes de clasificación para mitigar problemas de sesgo. Esta es una de las limitaciones encontradas durante la revisión, hay muchos investigadores que no se han preocupado de que sus conjuntos de entrenamiento estuviesen balanceados, por lo que, sus resultados pueden ser engañosos. Además, algunos datasets públicos como Chest Scan o IQ-OTHNCCD poseen poca cantidad de datos en comparación a datasets como LUNA 16 o LIDC-IDRI, algunos autores han intentado mitigar este problema con un aumento artificial de los datos.

Los resultados obtenidos por los investigadores deben entenderse como reflejo de tanto los logros como las limitaciones inherentes a sus modelos, los cuales constituyen una base útil para futuras investigaciones, sin representar una solución definitiva. Una fase de pruebas adicional con datos privados de centros médicos reconocidos podría aportar validación complementaria si es posible realizarla.

7.    Referencias bibliográficas

Al-Ameer, A. A. A., Hussien, G. A., & Ameri, H. A. A. (2022). Lung cancer detection using image processing and deep learning. Indonesian Journal of Electrical Engineering and Computer Science, 28(2), Article 2. https://doi.org/10.11591/ijeecs.v28.i2.pp987-993

Alamgeer, M., Alruwais, N., Alshahrani, H. M., Mohamed, A., & Assiri, M. (2023). Dung Beetle Optimization with Deep Feature Fusion Model for Lung Cancer Detection and Classification. Cancers, 15(15), Article 15. https://doi.org/10.3390/cancers15153982

Alsheikhy, A. A., Said, Y., Shawly, T., Alzahrani, A. K., & Lahza, H. (2023). A CAD System for Lung Cancer Detection Using Hybrid Deep Learning Techniques. Diagnostics, 13(6), Article 6. https://doi.org/10.3390/diagnostics13061174

Al-Yasriy, H. F., AL-Husieny, M. S., Mohsen, F. Y., Khalil, E. A., & Hassan, Z. S. (2020). Diagnosis of Lung Cancer Based on CT Scans Using CNN. IOP Conference Series: Materials Science and Engineering, 928(2), 022035. https://doi.org/10.1088/1757-899X/928/2/022035

Asuntha, A., & Srinivasan, A. (2020). Deep learning for lung Cancer detection and classification. Multimedia Tools and Applications, 79(11), 7731-7762. https://doi.org/10.1007/s11042-019-08394-3

Barrett, J., & Viana, T. (2022). EMM-LC Fusion: Enhanced Multimodal Fusion for Lung Cancer Classification. AI, 3(3), Article 3. https://doi.org/10.3390/ai3030038

Behrendt, F., Bengs, M., Bhattacharya, D., Krüger, J., Opfer, R., & Schlaefer, A. (2023). A systematic approach to deep learning-based nodule detection in chest radiographs. Scientific Reports, 13(1), Article 1. https://doi.org/10.1038/s41598-023-37270-2

Bhattacharjee, A., Rabea, S., Bhattacharjee, A., Elkaeed, E. B., Murugan, R., Selim, H. M. R. M., Sahu, R. K., Shazly, G. A., & Salem Bekhit, M. M. (2023). A multi-class deep learning model for early lung cancer and chronic kidney disease detection using computed tomography images. Frontiers in Oncology, 13. https://www.frontiersin.org/journals/oncology/articles/10.3389/fonc.2023.1193746

Bhinder, B., Gilvary, C., Madhukar, N. S., & Elemento, O. (2021). Artificial Intelligence in Cancer Research and Precision Medicine. Cancer Discovery, 11(4), 900-915. https://doi.org/10.1158/2159-8290.CD-21-0090

Bilal, A., Shafiq, M., Fang, F., Waqar, M., Ullah, I., Ghadi, Y. Y., Long, H., & Zeng, R. (2022). IGWO-IVNet3: DL-Based Automatic Diagnosis of Lung Nodules Using an Improved Gray Wolf Optimization and InceptionNet-V3. Sensors, 22(24), Article 24. https://doi.org/10.3390/s22249603

Blessie, A., & Ramesh, P. (2022). Novel Contiguous Cross Propagation Neural Network Built CAD for Lung Cancer. Computer Systems Science and Engineering, 44(2), 1467-1484. https://doi.org/10.32604/csse.2023.025399

Bray, F., Laversanne, M., Sung, H., Ferlay, J., Siegel, R. L., Soerjomataram, I., & Jemal, A. (2024). Global cancer statistics 2022: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries. CA: A Cancer Journal for Clinicians, 74(3), 229-263. https://doi.org/10.3322/caac.21834

Civit-Masot, J., Bañuls-Beaterio, A., Domínguez-Morales, M., Rivas-Pérez, M., Muñoz-Saavedra, L., & Rodríguez Corral, J. M. (2022). Non-small cell lung cancer diagnosis aid with histopathological images using Explainable Deep Learning techniques. Computer Methods and Programs in Biomedicine, 226, 107108. https://doi.org/10.1016/j.cmpb.2022.107108

Faria, N., Campelos, S., & Carvalho, V. (2023). A Novel Convolutional Neural Network Algorithm for Histopathological Lung Cancer Detection. Applied Sciences, 13(11), Article 11. https://doi.org/10.3390/app13116571

Huang, W., & Hu, L. (2019). Using a Noisy U-Net for Detecting Lung Nodule Candidates. IEEE Access, 7, 67905-67915. IEEE Access. https://doi.org/10.1109/ACCESS.2019.2918224

Huang, X., Lei, Q., Xie, T., Zhang, Y., Hu, Z., & Zhou, Q. (2020). Deep Transfer Convolutional Neural Network and Extreme Learning Machine for lung nodule diagnosis on CT images. Knowledge-Based Systems, 204, 106230. https://doi.org/10.1016/j.knosys.2020.106230

Humayun, M., Sujatha, R., Almuayqil, S. N., & Jhanjhi, N. Z. (2022). A Transfer Learning Approach with a Convolutional Neural Network for the Classification of Lung Carcinoma. Healthcare, 10(6), Article 6. https://doi.org/10.3390/healthcare10061058

Ibrahim, D. M., Elshennawy, N. M., & Sarhan, A. M. (2021). Deep-chest: Multi-classification deep learning model for diagnosing COVID-19, pneumonia, and lung cancer chest diseases. Computers in Biology and Medicine, 132, 104348. https://doi.org/10.1016/j.compbiomed.2021.104348

Jena, S. R., George, S. T., & Ponraj, D. N. (2021). Lung cancer detection and classification with DGMM-RBCNN technique. Neural Computing and Applications, 33(22), 15601-15617. https://doi.org/10.1007/s00521-021-06182-5

Kim, G., Moon, S., & Choi, J.-H. (2022). Deep Learning with Multimodal Integration for Predicting Recurrence in Patients with Non-Small Cell Lung Cancer. Sensors, 22(17), Article 17. https://doi.org/10.3390/s22176594

Kitchenham, B. and Charters, S. (2007) Guidelines for Performing Systematic Literature Reviews in Software Engineering, Technical Report EBSE 2007-001, Keele University and Durham University Joint Report.

Lalitha, S. (2021). An automated lung cancer detection system based on machine learning algorithm. JOURNAL OF INTELLIGENT & FUZZY SYSTEMS, 40(4), 6355-6364. https://doi.org/10.3233/JIFS-189476

Lanjewar, M. G., Panchbhai, K. G., & Charanarur, P. (2023). Lung cancer detection from CT scans using modified DenseNet with feature selection methods and ML classifiers. Expert Systems with Applications, 224, 119961. https://doi.org/10.1016/j.eswa.2023.119961

Liu, M., Li, L., Wang, H., Guo, X., Liu, Y., Li, Y., Song, K., Shao, Y., Wu, F., Zhang, J., Sun, N., Zhang, T., & Luan, L. (2023). A multilayer perceptron-based model applied to histopathology image classification of lung adenocarcinoma subtypes. Frontiers in Oncology, 13, 1172234. https://doi.org/10.3389/fonc.2023.1172234

Maleki, N., & Niaki, S. T. A. (2023). An intelligent algorithm for lung cancer diagnosis using extracted features from Computerized Tomography images. Healthcare Analytics, 3, 100150. https://doi.org/10.1016/j.health.2023.100150

Masud, M., Sikder, N., Nahid, A.-A., Bairagi, A. K., & AlZain, M. A. (2021). A Machine Learning Approach to Diagnosing Lung and Colon Cancer Using a Deep Learning-Based Classification Framework. Sensors, 21(3), Article 3. https://doi.org/10.3390/s21030748

Mendoza, J., & Pedrini, H. (2020). Detection and classification of lung nodules in chest X-ray images using deep convolutional neural networks. Computational Intelligence, 36(2), 370-401. https://doi.org/10.1111/coin.12241

Mohamed, T. I. A., Oyelade, O. N., & Ezugwu, A. E. (2023). Automatic detection and classification of lung cancer CT scans based on deep learning and ebola optimization search algorithm. PLOS ONE, 18(8), e0285796. https://doi.org/10.1371/journal.pone.0285796

Moragheb, M. A., Badie, A., & Noshad, A. (2022). An Effective Approach for Automated Lung Node Detection using CT Scans. Journal of Biomedical Physics & Engineering, 12(4), 377-386. https://doi.org/10.31661/jbpe.v0i0.2110-1412

Mothkur, R., & B. N, Dr. V. (2022). A Robust Approach for Segmentation and Classification of Lung Cancer using Marker Controlled Watershed Method and Deep Hybrid Learning. Indian Journal of Computer Science and Engineering, 13(5), 1366-1377. https://doi.org/10.21817/indjcse/2022/v13i5/221305003

Nanglia, P., Kumar, S., Mahajan, A. N., Singh, P., & Rathee, D. (2021). A hybrid algorithm for lung cancer classification using SVM and Neural Networks. ICT Express, 7(3), 335-341. https://doi.org/10.1016/j.icte.2020.06.007

Naseer, I., Akram, S., Masood, T., Rashid, M., & Jaffar, A. (2023). Lung Cancer Classification Using Modified U-Net Based Lobe Segmentation and Nodule Detection. IEEE Access, 11, 60279-60291. IEEE Access. https://doi.org/10.1109/ACCESS.2023.3285821

Nooreldeen, R., & Bach, H. (2021). Current and Future Development in Lung Cancer Diagnosis. International Journal of Molecular Sciences, 22(16), Article 16. https://doi.org/10.3390/ijms22168661

Ozdemir, O., Russell, R. L., & Berlin, A. A. (2020). A 3D Probabilistic Deep Learning System for Detection and Diagnosis of Lung Cancer Using Low-Dose CT Scans. IEEE Transactions on Medical Imaging, 39(5), 1419-1429. IEEE Transactions on Medical Imaging. https://doi.org/10.1109/TMI.2019.2947595

Raju, M. S. N., & Rao, B. S. (2022). Classification of Colon and Lung Cancer Through Analysis of Histopathology Images Using Deep Learning Models. Ingénierie des systèmes d information, 27(6), 967-971. https://doi.org/10.18280/isi.270613

Raza, R., Zulfiqar, F., Khan, M. O., Arif, M., Alvi, A., Iftikhar, M. A., & Alam, T. (2023). Lung-EffNet: Lung cancer classification using EfficientNet from CT-scan images. Engineering Applications of Artificial Intelligence, 126, 106902. https://doi.org/10.1016/j.engappai.2023.106902

Saied, M., Raafat, M., Yehia, S., & Khalil, M. M. (2023). Efficient pulmonary nodules classification using radiomics and different artificial intelligence strategies. Insights into Imaging, 14(1), 91. https://doi.org/10.1186/s13244-023-01441-6

Saleem, M. A., Thien Le, N., Asdornwised, W., Chaitusaney, S., Javeed, A., & Benjapolakul, W. (2023). Sooty Tern Optimization Algorithm-Based Deep Learning Model for Diagnosing NSCLC Tumours. Sensors, 23(4), Article 4. https://doi.org/10.3390/s23042147

Saleh, A. Y., & Chin, C. K. (2023). Development of hybrid convolutional neural network and autoregressive integrated moving average on computed tomography image classification. IAES International Journal of Artificial Intelligence, 12(4), 1864-1872. Scopus. https://doi.org/10.11591/ijai.v12.i4.pp1864-1872

Shafi, I., Din, S., Khan, A., Díez, I. D. L. T., Casanova, R. del J. P., Pifarre, K. T., & Ashraf, I. (2022). An Effective Method for Lung Cancer Diagnosis from CT Scan Using Deep Learning-Based Support Vector Network. Cancers, 14(21), Article 21. https://doi.org/10.3390/cancers14215457

Shah, A. A., Malik, H. A. M., Muhammad, A., Alourani, A., & Butt, Z. A. (2023). Deep learning ensemble 2D CNN approach towards the detection of lung cancer. Scientific Reports, 13(1), Article 1. https://doi.org/10.1038/s41598-023-29656-z

Shakeel, P. M., Burhanuddin, M. A., & Desa, M. I. (2019). Lung cancer detection from CT image using improved profuse clustering and deep learning instantaneously trained neural networks. Measurement, 145, 702-712. https://doi.org/10.1016/j.measurement.2019.05.027

Shanid, M., & Anitha, A. (2020). Lung Cancer Detection from Ct Images Using Salp-Elephant Optimization-Based Deep Learning. BIOMEDICAL ENGINEERING-APPLICATIONS BASIS COMMUNICATIONS, 32(1), 2050001. https://doi.org/10.4015/S1016237220500015

Sori, W. J., Feng, J., & Liu, S. (2019). Multi-path convolutional neural network for lung cancer detection. Multidimensional Systems and Signal Processing, 30(4), 1749-1768. https://doi.org/10.1007/s11045-018-0626-9

Sousa, J., Pereira, T., Silva, F., Silva, M. C., Vilares, A. T., Cunha, A., & Oliveira, H. P. (2022). Lung Segmentation in CT Images: A Residual U-Net Approach on a Cross-Cohort Dataset. Applied Sciences, 12(4), Article 4. https://doi.org/10.3390/app12041959

Sung, H., Ferlay, J., Siegel, R. L., Laversanne, M., Soerjomataram, I., Jemal, A., & Bray, F. (2021). Global Cancer Statistics 2020: GLOBOCAN Estimates of Incidence and Mortality Worldwide for 36 Cancers in 185 Countries. CA: A Cancer Journal for Clinicians, 71(3), 209-249. https://doi.org/10.3322/caac.21660

Talukder, Md. A., Islam, Md. M., Uddin, M. A., Akhter, A., Hasan, K. F., & Moni, M. A. (2022). Machine learning-based lung and colon cancer detection using deep feature extraction and ensemble learning. Expert Systems with Applications, 205, 117695. https://doi.org/10.1016/j.eswa.2022.117695

Tang, T., Li, F., Jiang, M., Xia, X., Zhang, R., & Lin, K. (2022). Improved Complementary Pulmonary Nodule Segmentation Model Based on Multi-Feature Fusion. Entropy, 24(12), Article 12. https://doi.org/10.3390/e24121755

Tiwari, L., Raja, R., Awasthi, V., Miri, R., Sinha, G. R., Alkinani, M. H., & Polat, K. (2021). Detection of lung nodule and cancer using novel Mask-3 FCM and TWEDLNN algorithms. Measurement, 172, 108882. https://doi.org/10.1016/j.measurement.2020.108882

V. R., N., & Chandra S. S., V. (2023). ExtRanFS: An Automated Lung Cancer Malignancy Detection System Using Extremely Randomized Feature Selector. Diagnostics, 13(13), 2206. https://doi.org/10.3390/diagnostics13132206

Wadekar, S., & Singh, D. K. (2023). A modified convolutional neural network framework for categorizing lung cell histopathological image based on residual network. Healthcare Analytics, 4, 100224. https://doi.org/10.1016/j.health.2023.100224

Wankhade, S., & S., V. (2023). A novel hybrid deep learning method for early detection of lung cancer using neural networks. Healthcare Analytics, 3, 100195. https://doi.org/10.1016/j.health.2023.100195

Yan, C., & Razmjooy, N. (2023). Optimal lung cancer detection based on CNN optimized and improved Snake optimization algorithm. Biomedical Signal Processing and Control, 86, 105319. https://doi.org/10.1016/j.bspc.2023.105319

Yu, H., Li, J., Zhang, L., Cao, Y., Yu, X., & Sun, J. (2021). Design of lung nodules segmentation and recognition algorithm based on deep learning. BMC Bioinformatics, 22(Suppl 5), 314. https://doi.org/10.1186/s12859-021-04234-0

Yu, K.-H., Lee, T.-L. M., Yen, M.-H., Kou, S. C., Rosen, B., Chiang, J.-H., & Kohane, I. S. (2020). Reproducible Machine Learning Methods for Lung Cancer Detection Using Computed Tomography Images: Algorithm Development and Validation. Journal of Medical Internet Research, 22(8), e16709. https://doi.org/10.2196/16709