Revisión Sistemática de Técnicas De
Inteligencia Artificial para Detección de Cáncer Pulmonar en Imágenes Médicas
Systematic Review of Artificial
Intelligence Techniques for Lung Cancer Detection in Medical Images
1* Facultad de Ingeniería de Sistemas e Informática,
Universidad Nacional Mayor de San Marcos rolando.tueros@unmsm.edu.pe
https://orcid.org/0009-0009-3255-4714
2 Facultad de Ingeniería de Sistemas e Informática,
Universidad Nacional Mayor de San Marcos ccanepap@unmsm.edu.pe
https://orcid.org/0000-0003-4051-4164
3 Facultad de Medicina, Universidad Nacional Mayor de San
Marcos
cmunozb@unmsm.edu.pe
https://orcid.org/0000-0002-3168-8210
4 Facultad de Ingeniería de Sistemas e Informática,
Universidad Nacional Mayor de San Marcos yudi.guzman@unmsm.edu.pe
https://orcid.org/0000-0001-5306-5295
Fecha de recepción: 01 noviembre
2024
Fecha de aceptación: 05 noviembre
2024
El cáncer de pulmón es la principal causa de muerte por cáncer en el
mundo, con 2.5 millones de fallecimientos y 1.8 millones de nuevos casos en
2022, estas cifras reflejan una realidad preocupante. Las técnicas de
inteligencia artificial (IA), en particular el deep learning, han mostrado gran
potencial para detectar el cáncer. Esta revisión sistemática analiza las
técnicas de IA aplicadas en la detección y diagnóstico de cáncer de pulmón a
partir de imágenes médicas, así como los datasets empleados, las métricas de
rendimiento y los métodos de preprocesamiento de imágenes. El objetivo es
esclarecer el panorama a los investigadores que estén interesados en el
desarrollo de herramientas de detección de cáncer de pulmón mediante IA e
imágenes médicas, resaltando las principales tecnologías que se están
utilizando actualmente, así como sus limitaciones. Para la revisión se ha
seguido la metodología proporcionada por Kitchenham & Charters. Los
artículos considerados provienen de bases de datos indexadas como Scopus, Web
of Science y PubMed, publicados entre 2019 y 2023. Los resultados muestran como
tecnología principal a las redes neuronales convolucionales, las cuales se
utilizaron en diferentes arquitecturas, algunas de ellas se combinaron con
modelos de aprendizaje automático. Los datasets más usados fueron los
orientados a la detección por nódulo. La revisión concluye que la integración
de modelos híbridos basados en redes neuronales convolucionales son una opción
prometedora para mejorar la precisión de la detección temprana del cáncer de
pulmón.
Palabras Claves: Cáncer de pulmón, deep
learning, detección temprana, inteligencia artificial, redes neuronales
convolucionales.
Lung cancer is the leading cause of
cancer-related mortality worldwide, with 2.5 million deaths and 1.8 million new
cases reported in 2022, reflecting a troubling reality. Artificial intelligence
(AI) techniques, particularly deep learning, have shown great potential for
cancer detection. This systematic review examines AI techniques applied to the
detection and diagnosis of lung cancer using medical imaging, as well as the
datasets employed, performance metrics, and image preprocessing methods. The
aim is to provide a comprehensive overview for researchers interested in
developing lung cancer detection tools based on AI and medical imaging,
highlighting the primary technologies currently in use and their limitations.
The review follows the methodology provided by Kitchenham
& Charters. The articles considered were sourced from indexed databases
such as Scopus, Web of Science, and PubMed, and were published between 2019 and
2023. Results identify convolutional neural networks (CNNs) as the primary
technology, utilized in various architectures, some of which were combined with
machine learning models to enhance diagnostic accuracy. The most frequently
used datasets were those oriented towards nodule detection. The review
concludes that hybrid models based on CNNs offer a promising approach to
improving early lung cancer detection accuracy.
Keywords:
Lung cancer, deep learning, early detection,
artificial intelligence, convolutional neural networks.
Actualmente, el cáncer de
pulmón es la neoplasia más común y agresiva en el mundo. En 2020 se registraron
1.8 millones de muertes asociadas a esta enfermedad y 2.2 millones de nuevos
casos. Ese año, el cáncer de pulmón se consolidó como la principal causa de
muerte por cáncer y el segundo tipo de cáncer más frecuente, detrás del cáncer
de mama (Sung et al., 2021). En 2022, el número de muertes superaron los 1.8
millones y la cantidad de nuevos casos registrados aumentaron hasta
aproximadamente 2.5 millones, estas cifras representan el 18.7% del total de
muertes por cáncer y el 12.4% del total de nuevos casos de cáncer registrados
durante ese año respectivamente (Bray et al., 2024).
Estas cifras reflejan una
situación alarmante en términos de salud pública, los nuevos casos y decesos
por esta enfermedad muestran una tendencia ascendente durante los últimos años
(Lanjewar et al., 2023). La relevancia que ha cobrado la lucha contra el cáncer
de pulmón ha originado que en los últimos años se lleven a cabo diversas
investigaciones centradas en afrontar esta enfermedad desde diferentes aspectos
como estrategias de prevención o tratamientos quirúrgicos. Uno de estos
aspectos es la investigación de nuevos métodos para mejorar el proceso de
detección del cáncer de pulmón. Por ejemplo, muchas investigaciones se centran
en la detección temprana del cáncer pulmonar, la etapa en la que se encuentra
el cáncer en el momento de su detección condiciona demasiado el tratamiento y
el pronóstico del paciente. Según Nooreldeen & Bach (2021) los pacientes a
menudo fallecen debido a que su cáncer pulmonar suele ser detectado en etapas
muy avanzadas donde el tratamiento se complica. Una detección precoz no solo
aumenta las tasas de supervivencia, sino que hace posible una cura.
Actualmente, la comunidad médica cuenta con técnicas de cribado (screening)
para detectar el cáncer pulmonar en etapas tempranas, una de las más comunes es
Tomografía Axial Computarizada (TAC) de baja dosis (Asuntha & Srinivasan,
2020).
Otras investigaciones
buscan mejorar el proceso de detección mediante una mejora de la eficiencia en
el análisis de tomografías computarizadas (TC). La búsqueda de indicios y
lesiones de un posible cáncer pulmonar en cada corte de una TC es un proceso visual
que demanda concentración y expertiz. Un problema comúnmente mencionado es que
la cantidad de casos a analizar es cada vez mayor. Examinar muchas TC al día
por tiempos prolongados afecta el rendimiento del personal médico y esto puede
resultar en errores en el análisis (Saied et al., 2023). Por otro lado, aunque
el análisis visual tradicional ha demostrado ser eficaz aún presenta
limitaciones, ya que puede involucrar cierto grado de subjetividad por parte de
los radiólogos y por tanto, generar discrepancias entre distintos observadores
(Raza et al., 2023).
Ya se trate de una
detección temprana o de la mejora de la eficiencia del análisis de TC, diversas
investigaciones han hecho uso de técnicas avanzadas de inteligencia artificial
(IA), obteniendo resultados prometedores. La IA ha mostrado un notable potencial
para constituirse en una herramienta médica esencial en el futuro cercano.
Según Bhinder et al. (2021) existen ya diversas investigaciones han obtenido
resultados significativos al usar IA en tareas de clasificación, predicción y
diagnóstico de enfermedades. Es más, Al-Yasriy et al. (2020) menciona que la
inteligencia artificial puede utilizarse en todos los campos de la ingeniería
biomédica, incluyendo el diagnóstico de enfermedades cardiacas y la detección
de enfermedades cancerosas.
Además del uso de IA, estas investigaciones comparten un elemento
adicional: el uso de imágenes médicas como entrada para algoritmos y redes
neuronales que buscan detectar el cáncer pulmonar con altas tasas de precisión.
Se usan tanto algoritmos de aprendizaje automático (Machine Learning) como
redes propias del aprendizaje profundo (Deep Learning). La variabilidad de
métodos existentes en la literatura reciente dificulta la comparación entre
estudios y la adopción de técnicas para la práctica clínica y futuros estudios.
Por este motivo, se ha realizado una revisión sistemática de la literatura
acerca de las técnicas de IA orientadas a detectar el cáncer de pulmón mediante
el uso de imágenes médicas. El objetivo es sintetizar y destacar los hallazgos
más relevantes y mencionar las brechas existentes en las investigaciones
actuales. De esta manera se proporciona una visión general del estado del arte
que sirve para orientar a futuras investigaciones con una orientación práctica,
destinadas al desarrollo de herramientas automatizadas de detección de cáncer
pulmonar. Esta revisión se ha llevado a cabo siguiendo la metodología propuesta
por Kitchenham & Charters (2007) que consta de la etapa de Planificación,
donde se definieron las preguntas de investigación, los criterios de selección
y la estrategia de búsqueda. La etapa de Desarrollo, donde se llevó a cabo la
búsqueda de artículos y la extracción de información relevante. Y la etapa de
Resultados, donde se realizó el análisis y la síntesis de la información recopilada.
A continuación, se
detalla la metodología aplicada para llevar a cabo la revisión de la
literatura, así como las bases de datos elegidas, los criterios de elegibilidad
de artículos y las preguntas de investigación planteadas.
La metodología para llevar a cabo la revisión sistemática se basó en el
trabajo de Kitchenham & Charters (2007), cuyo conjunto de directrices guía
la realización de revisiones en el ámbito de la ingeniería de software y
ciencias de la computación. Se plantean las siguientes etapas:
●
Planificación: En esta etapa se
formularon preguntas de investigación relacionadas, y se identificaron las
técnicas o algoritmos de IA más relevantes en la detección de cáncer de pulmón,
las principales bases de datos, métricas de rendimiento y métodos de
preprocesamiento usados por los investigadores. Además, se eligieron los
repositorios académicos, los criterios de elegibilidad de los artículos y las
estrategias de búsqueda de información
●
Desarrollo: En esta etapa se llevó a
cabo una búsqueda exhaustiva de la literatura utilizando bases de datos
académicas, se aplicaron los criterios de inclusión/exclusión previamente
definidos para seleccionar los estudios más relevantes, luego se recopilaron y
organizaron los datos clave de los estudios seleccionados. Se realizó una
síntesis de información y se interpretaron los resultados en el contexto de las
preguntas de investigación
●
Resultados: Esta etapa presenta
todos los pasos del proceso de revisión, junto con los hallazgos y
conclusiones.
Se planteó una serie de
preguntas de investigación que tienen por objetivo esclarecer el panorama
actual de la investigación sobre la detección de cáncer de pulmón mediante
técnicas de IA e imágenes médicas. Cada pregunta se centra en un aspecto
diferente relacionado al uso de IA en las investigaciones, cuyas respuestas son
clave para orientar el desarrollo de herramientas automatizadas en la detección
de cáncer pulmonar. Las preguntas de investigación son las siguientes:
●
Pregunta de Investigación
1:
¿Cuáles son los métodos, algoritmos o técnicas de inteligencia artificial
usados actualmente en las investigaciones de detección de cáncer de pulmón
mediante el análisis de imágenes médicas?
●
Pregunta de Investigación
2:
¿Cuáles son los principales datasets de imágenes médicas utilizadas en las
investigaciones de detección de cáncer de pulmón con inteligencia artificial?
●
Pregunta de Investigación
3:
¿Cuáles son las métricas de rendimiento más relevantes utilizadas durante la
evaluación de los modelos o algoritmos de detección de cáncer de pulmón?
●
Pregunta de Investigación
4:
¿Cuáles son las técnicas de preprocesamiento de imágenes médicas más comunes?
Para la elección de bases de datos académicas se consideraron aspectos
como la cobertura temática y la especialización en áreas médicas e
informáticas, se consideró también la calidad del contenido de las bases de
datos, su reputación y su accesibilidad. Las bases de datos elegidas fueron
Scopus, Web of Science y PubMed.
Previo a la búsqueda de artículos se formaron cadenas de búsqueda para
cada repositorio compuesta de palabras claves: lung cancer. lung carcinoma, artificial intelligence, neural network,
machine learning, deep learning, algorithm, model, image classification,
detection, diagnosis. La Tabla 1 muestra qué cadenas se usaron en cada
repositorio.
Tabla 1
Cadenas de
búsqueda usadas en las bases de datos.
Repositorio |
Cadena de búsqueda |
Scopus |
(TITLE-ABS-KEY
("lung cancer") AND TITLE-ABS-KEY ( detection OR diagnosis ) AND
TITLE-ABS-KEY ( "machine learning" OR "deep learning" OR
"artificial intelligence" ) ) AND PUBYEAR > 2019 AND PUBYEAR
< 2024 AND ( LIMIT-TO ( SRCTYPE , "j" ) ) AND ( LIMIT-TO (
DOCTYPE , "ar" ) ) AND ( LIMIT-TO (
LANGUAGE , "Spanish" ) OR LIMIT-TO ( LANGUAGE , "English"
) ) AND ( LIMIT-TO ( SUBJAREA , "COMP" ) ) |
Web of Science |
"lung
cancer detection" (All Fields) AND ("machine learning" OR
"deep learning" OR "artificial intelligence" OR
"neural network") (All Fields) AND ("diagnosis" OR
"prediction") (All Fields) and Article (Document Types) and Article
(Document Types) |
PubMed |
(((("lung
cancer" OR "lung carcinoma") ) AND ("detection" OR "diagnosis"))
AND ("machine learning" OR "deep learning" OR
"artificial intelligence")) AND ("algorithm" OR
"model" OR "neural network") AND (" image
classification") |
Fuente: Elaboración propia.
La Tabla 2 presenta los criterios de inclusión y exclusión definidos en
esta investigación, cuyo objetivo es optimizar la calidad de la información
recopilada durante la revisión. Se dio prioridad a artículos publicados en los
últimos cinco años, con el fin de identificar los métodos más recientes
empleados en la detección de cáncer pulmonar.
Tabla 2
Criterios
de inclusión y exclusión utilizados.
Criterios de inclusión |
Criterios de exclusión |
Artículo publicado
entre 2019 y 2024. |
Documentos que sean
libros, tesis, conferencias, actas o carteles. |
Orientado al
diagnóstico, detección o clasificación del cáncer de pulmón. |
El idioma de
publicación no es inglés o español. |
Propone o usa
algoritmos y técnicas de machine learning o deep learning. |
Artículos que
son revisiones de la literatura. |
Responde a una
o más preguntas de investigación. |
Artículos de
comparación entre técnicas IA. |
Contiene al
menos una palabra clave en su resumen. |
|
Fuente: Elaboración propia
El proceso comenzó con la selección de los repositorios Scopus, Web of
Science y PubMed. Se emplearon palabras clave y cadenas de búsqueda, a partir
de las cuales se identificaron 461 artículos potencialmente elegibles.
Posteriormente, se aplicaron los criterios de exclusión, resultando en 143
artículos. Luego, se realizó una revisión de resúmenes, discusiones y
conclusiones; tras aplicar los criterios de inclusión, se seleccionaron 84
artículos. Finalmente, se llevó a cabo un análisis exhaustivo del contenido
completo de cada estudio, eligiéndose 50 artículos científicos relevantes para
responder a las preguntas de investigación. La Figura 1 presenta el proceso de
búsqueda y selección de artículos académicos durante la revisión.
Figura 1. Proceso de revisión sistemática y selección de
artículos
La Figura 2 muestra la
distribución porcentual de los artículos según su año de publicación. La mayor
parte de los estudios seleccionados fueron publicados en los años 2023 y 2022
con un 37% y 30% respectivamente.
Figura 2. Distribución porcentual de los artículos
seleccionados
En esta sección se examinan las técnicas y métodos de inteligencia
artificial reportados en la literatura para la detección de cáncer pulmonar a
partir de imágenes médicas. Aunque existen numerosos enfoques desde los cuales
analizar estas técnicas, en esta revisión se ha optado por agrupar los métodos
en función de la arquitectura empleada en cada solución, de manera que
proporcione a investigadores o ingenieros que deseen interesados en el
desarrollo de herramientas prácticas un panorama claro de las opciones
disponibles. Las soluciones se han dividido en arquitecturas estándar o
convencionales, como VGG y ResNet, reconocidas por su capacidad de extracción
de características, como arquitecturas híbridas que combinan redes neuronales
con algoritmos de aprendizaje automático.
3.1 Técnicas de captura de imagen
Son variadas las técnicas de obtención de imágenes médicas que están
involucradas en el proceso de detección de cáncer pulmonar. Sin embargo, las
técnicas más usadas en la literatura fueron la Tomografía Computarizada (CT),
las imágenes histopatológicas, es decir, provenientes del tejido pulmonar
mediante biopsia, y las imágenes de Rayos X. Estudios llevados a cabo por
Wankhade & S. (2023) o Shah et al. (2023) toman como entrada para sus
modelos de IA imágenes TC preprocesadas y segmentadas en nódulos. Otro grupo de
autores como Faria et al. (2023) o Al-Ameer et al. (2022) utilizan imágenes
histopatológicas para entrenar la capacidad de sus algoritmos de reconocer un
tipo específico de cáncer pulmonar. Son pocos los estudios que han usado
imágenes de Rayos X o Resonancia Magnética. La Figura 3 muestra un ejemplo de
los tipos de imágenes médicas pulmonares usados en estudios sobre detección de
cáncer de pulmón usando IA.
Figura 3. Ejemplos de imágenes médicas pulmonares. (a) Imagen
histopatológica de Adenocarcinoma pulmonar, (b) Imagen TC de pulmón de corte
axial, (c) Imagen Rayos X de tórax
Estos métodos suelen
emplear arquitecturas conocidas con parámetros previamente establecidos sin
incluir modelos o algoritmos externos en estructura interna. En la literatura
se ha encontrado que la mayor parte de los autores usan redes neuronales convolucionales
(CNN), un tipo de redes neuronales especializadas en reconocimiento de
imágenes. De este grupo, una parte ha optado por usar redes CNN como VGG,
ResNet y DenseNet conocidas por su estabilidad, las cuales ya han sido
entrenadas en grandes conjuntos de datos, como ImageNet.
Humayun et al. (2022)
aplicaron técnicas de transferencia de aprendizaje (Transfer Learning) las
redes CNN VGG 16, VGG 19 y Xception con el objetivo de encontrar un modelo que mejore
los sistemas de diagnóstico asistido por computadora (CAD) actuales. Saied et
al. (2023) segmentaron imágenes CT para aislar nódulos pulmonares candidatos a
ser cancerosos, luego ajustaron las redes DenseNet-121 y DenseNet-169 para
mejorar la eficiencia de detección de nódulos malignos. Raza et al. (2023) se
basaron en la arquitectura CNN EfficientNet para crear una modelo capaz de
distinguir si una imagen CT puede clasificarse en los tipos de cáncer pulmonar
Adenocarcinoma, Carcinoma de células escamosas o Carcinoma de células
escamosas. Bhattacharjee et al. (2023) usan la CNN Xception para detectar tanto
el cáncer pulmonar como la enfermedad renal crónica. Huang & Hu (2019)
mejoraron la red U-Net para optimizar la detección de los nódulos pequeños.
Al-Yasriy et al. (2020) utilizaron la red AlexNet con capas Dropout para
clasificar imágenes CT malignas y benignas. Yu et al. (2020) usaron las CNN VGG
19 y U-Net para crear módulos reproducibles para detectar el cáncer pulmonar.
Bilal et al. (2022) proponen clasificar la malignidad de los nódulos usando la
red InceptionNet-V3.
Algunos estudios proponen
un diseño de red propio, Asuntha & Srinivasan (2020) diseñaron una red CNN
que identifica la gravedad de los nódulos pulmonares. De manera similar,
Mendoza & Pedrini (2020) se centraron en la identificación de nódulos cancerosos
en imágenes de rayos X de tórax, usaron técnicas de segmentación, aumento y
balance de datos para alimentar una red CNN propia. Por otro lado, las redes
CNN convencionales han respondido bien a imágenes de tejido pulmonar, el
estudio realizado por Masud et al (2021). diseñó una Red Neuronal Convolucional
(CNN) propia de 7 capas, logra reconocer el cáncer de pulmón y colon usando
imágenes histopatológicas. Wadekar & Singh (2023) trabajaron con la CNN VGG
19 previamente entrenada, utilizando imágenes histopatológicas para reconocer
Adenocarcinoma, Carcinoma de células escamosas. Faria et al. (2023) diseñaron
una red basada en RestNet-50 especializada en el reconocimiento de imágenes de
tejido pulmonar. Civit-Masot et al. (2022) entrenaron dos redes CNN especializadas
en la detección de cáncer de células no pequeñas en imágenes histopatológicas.
Otras técnicas menos
conocidas han sido aplicadas como el estudio llevado a cabo por Tiwari et al.
(2021) diseñaron una Red Neuronal Recurrente (RNN) para poder detectar la
enfermedad durante el cribado de pacientes. Shakeel et al. (2019) buscan la
mejora de calidad de las imágenes médicas usando una Red Neuronal Entrenada
Instantáneamente. Blessie & Ramesh (2022) identifican áreas afectadas por
células cancerosas mediante una Red de Propagación Cruzada Contigua. Yan &
Razmjooy (2023) buscan la optimización de diversas redes CNN. Saleem et al.
(2023) diseñaron una CNN que mejora el diagnóstico de cáncer de células no
pequeñas. Liu et al. (2023) usaron un Modelo de Perceptrón Multicapa que
identifica el grado de infiltración de Adenocarcinoma de pulmón.
Los modelos o
arquitecturas híbridas combinan dos o más técnicas de machine learning o deep
learning para aprovechar las fortalezas de cada una y mejorar la precisión y la
eficiencia. Estas arquitecturas buscan mejorar el desempeño al combinar, por
ejemplo, redes CNN con otros modelos clásicos, como máquinas de vectores de
soporte (SVM) o redes de memoria a corto y largo plazo (LSTM).
La investigación
realizada por Ozdemir et al. (2020) busca acoplar la detección y el diagnóstico
nodular usando una CNN propia y otra basada en V-Net. Alsheikhy et al. (2023)
propone usar VGG 19 en conjunto con una Red de Memoria a Corto y Largo Plazo para
diagnosticar nódulos. Wankhade & S. (2023) buscan optimizar el diagnóstico
de los nódulos combinando una CNN 3D y una RNN. Behrendt et al. (2023) crearon
un modelo que combina las redes Faster-R-CNN, RetinaNet, EfficientDet-D2 el
cual analiza radiografías de tórax.
Shafi et al. (2022) lograron identificar cambios patológicos en la
sección transversal de las lesiones de cáncer pulmonar complementando una CNN
con el algoritmo SVM. Maleki & Niaki (2023) diseñaron 3 modelos híbridos
basados en la combinación de una CNN con una Red Neuronal Artificial. Raju
& Rao (2022) evalúan 5 tipos de tejidos de pulmón y colon usando una
modificación de las redes pre entrenadas MobileNetV2 e InceptionRestNetV2. Shah
et al. (2023) propone una arquitectura de tres CNN de detección nodular
simultáneas donde el diagnóstico es determinado por el promedio de los
resultados parciales de las redes. Yu et al. (2021) complementan la CNN U-Net
con la red de clasificación 3D RestNet50, el modelo es sensible a reconocer
nódulos benignos pequeños. Saleh & Chin (2023) usan una CNN propia en
conjunto con el modelo estadístico ARIMA para diferenciar entre nódulos
malignos y benignos en etapas tempranas. Tang et al. (2022) usan una CNN basada
en la fusión de características múltiples para mejorar la segmentación nodular
del tejido circundante. Naseer et al. (2023) modificaron las redes AlexNet y
U-net, usan el algoritmo SVM como clasificador. Jena et al. (2021) priorizaron
la detección de la enfermedad en etapas tempranas, usaron una Red Neuronal
Basada en Regiones que integra elementos de deep learning. Shanid & Anitha
(2023) crearon un esquema de detección de cáncer pulmonar usando una Red de
Creencias Profundas y algoritmo de optimización híbrido. Lanjewar et al. (2023)
complementaron la red DenseNet201 con los algoritmos SVM y Random Forest (RF).
Al-Ameer et al (2022). usan el modelo Inception V3 y el algoritmo RF. Talukder
et al. (2022) diseñan una arquitectura de cinco subredes CNN pre entrenadas:
VGG 16, VGG 19, MobileNet, DenseNet161 y DenseNet201 las cuales transfieren su
conocimiento a una red CNN de diseño propio. Sori et al. (2019) diseñaron un
sistema con tres redes CNN simultáneas, los resultados de cada red se promedian
para generar el diagnóstico. Ibrahim et al. (2021) usaron la red VGG 19 y una
CNN propia, se aplicó Transfer Learning. Mohamed et al. (2023) diseñaron un
modelo híbrido CNN más un algoritmo de optimización. Nanglia et al. (2021)
proponen un modelo híbrido que combina una red neuronal artificial con el
algoritmo SVM, encontraron que este algoritmo ayuda a reducir la complejidad
computacional del modelo, además utilizan un algoritmo genético para segmentar
imágenes TC. Huang et al. (2020) diseñaron un método de diagnóstico basado en
una Red de Transferencia Profunda con Extreme Machine Learning. Sousa et al.
(2022) buscaron una mejora en la segmentación nodular usando las CNN U-Net y
RestNet34. De manera similar, Mothkur & B. N (2022) combinan las redes VGG
16 y RestNet50 para mejorar la segmentación nodular. Barrett & Viana (2022)
diseñaron EMM-LC Fusion, un modelo basado en la CNN pre entrenada
AlignedXception. Kim et al. (2022) utilizaron una arquitectura de dos redes ANN
pre entrenadas con características clínicas y demográficas relevantes apoyada
por una red CNN presentada con el dataset TCIA con capacidad de reconocer
regiones de posibles tumores en las imágenes CT y un analizador basado en
machine learning que combina los resultados de las redes para establecer una
probabilidad de la presencia de cáncer pulmonar. Lalitha (2021) utilizó un
modelo compuesto de técnicas de ML (Machine Learning) capaz de clasificar las
tomografías en casos benignos, malignos o normales. Moragheb et al. modificaron
de la CNN U-Net para clasificar nódulos pulmonares con una reducción de falsos
positivos. Alamgeer et al. (2023) utilizaron un modelo que fusiona las
características de las redes RestNet, DenseNet e Inception-ResNet-V2, para la
detección y clasificación se usa un modelo LTSM.
Pregunta de Investigación 1: ¿Cuáles son los métodos, algoritmos
o técnicas de inteligencia artificial usados actualmente en las investigaciones
de detección de cáncer de pulmón mediante el análisis de imágenes médicas?
La técnica predominante en las investigaciones revisadas son las Redes
Neuronales Convolucionales (CNN). En la mayoría de los estudios, se parte de
arquitecturas de CNN conocidas (como VGG 16 o AlexNet), que se modifican para
adaptarse a las necesidades específicas de cada investigación. Estas
modificaciones abarcan desde el ajuste de hiperparámetros (como cambios en el
tamaño y cantidad de filtros, tasas de aprendizaje, y optimizadores), hasta la
variación en la profundidad de la red mediante la adición o eliminación de
capas convolucionales y de pooling, modificaciones de arquitectura, o la
implementación de nuevas funciones de activación. Un menor número de estudios
emplea redes CNN propias, diseñadas específicamente por los investigadores sin
basarse en arquitecturas preestablecidas.
En menor medida, algunos estudios emplean algoritmos de aprendizaje
automático que complementan a las CNN, actuando como clasificadores dentro de
arquitecturas híbridas. Algoritmos como Random Forest, Support Vector Machine
(SVM), y K-nearest neighbors (KNN) han demostrado buenos resultados en estas
configuraciones (Al-Ameer et al., 2022; Naseer et al.). Cabe señalar que solo
una investigación (Lalitha, 2021) realiza clasificación sin el uso de redes
CNN.
La elección de la arquitectura y de las técnicas específicas de IA
depende en gran medida de la naturaleza del problema planteado en cada estudio.
La aproximación a la detección de cáncer pulmonar varía entre investigaciones;
por ejemplo, la elección de la arquitectura inicial puede depender del tipo de
imágenes utilizadas. Aunque la mayoría de los estudios se basan en imágenes de
tomografía computarizada (TC), también existen investigaciones que utilizan
imágenes histopatológicas y, en menor medida, radiografías. Otro factor
determinante en la selección de arquitectura es la modalidad de clasificación
de las imágenes. Una modalidad común es la clasificación de la imagen completa,
utilizada principalmente para identificar patrones cancerosos de manera general
y determinar la presencia o ausencia de cáncer pulmonar. Otra modalidad
relevante es la clasificación focalizada en los nódulos, que resulta útil para
identificar patrones de benignidad o malignidad en los nódulos y permite una
detección temprana a partir de estos.
La Tabla 3 presenta un resumen de las redes, arquitecturas y algoritmos
más frecuentemente empleados en las investigaciones revisadas.
Tabla 3
Resultados
de la pregunta de investigación 1
Autores |
Año |
Método |
Tipo de Imagen |
Tipo de Clasificación |
Al-Ameer et al |
2022 |
Modelo híbrido Inception V3 - VGG 16 + Random Forest |
TC |
Completa |
Al-Yasriy et al |
2020 |
Arquitectura CNN AlexNet |
TC |
Completa |
Alsheikhy et al |
2023 |
Modelo híbrido VGG 19 + red LTSM |
TC |
Por nódulo |
Bhattacharjee et al |
2023 |
Modelo basado en la red Xception modificada |
TC |
Completa |
Faria et al |
2023 |
Modelo basado en la red CNN RestNet50 |
Histopatológica |
Completa |
Huang & Hu |
2019 |
Modelo basado en U-Net |
TC |
Por nódulo |
Humayun et al |
2022 |
Modelos CNN pre entrenados (VGG16, VGG19, Xception) |
TC |
Completa |
Ibrahim et al |
2021 |
Modelo híbrido VGG 19 (TL) + CNN de diseño propio |
RX/TC |
Completa |
Lalitha. S. |
2021 |
Ensamble de clasificadores KNN, SVM y ELM |
TC |
Por nódulo |
Lanjewar et al |
2023 |
Modelo CNN DenseNet201 modificado |
TC |
Completa |
Masud et al. |
2021 |
Modelo propio: CNN de 7 capas |
Histopatológica |
Completa |
Moragheb et al |
2022 |
Modelo CNN U-Net |
TC |
Por nódulo |
Naseer et al. |
2023 |
Modelo híbrido AlexNet y SVM |
TC |
Por nódulo |
Ozdemir et al. |
2020 |
Red CNN basada en V-Net |
TC |
Por nódulo |
Raza et al. |
2023 |
CNN basada en EfficientNet |
TC |
Completa |
Saleh & Chin |
2023 |
Modelo híbrido CNN y ARIMA |
TC |
Completa |
Shafi et al. |
2022 |
Modelo híbrido basado en CNN + SVM |
TC |
Por nódulo |
Shah et al. |
2023 |
Ensamble de 3 redes CNN propias con predicción ponderada |
TC |
Por nódulo |
Sousa et al. |
2022 |
Modelo híbrido: Arquitecturas ResNet34 y U-Net
ensambladas |
TC |
Completa |
Wadekar & Singh |
2023 |
Modificación de la red VGG-19 |
Histopatológica |
Completa |
Wankhade & S. |
2023 |
Modelo híbrido CNN y RNN |
TC |
Por nódulo |
Fuente: Elaboración propia
Pregunta de Investigación 2: ¿Cuáles son los principales datasets
de imágenes médicas utilizadas en las investigaciones de detección de cáncer de
pulmón con inteligencia artificial?
Se identificaron como los
datasets más utilizados en las investigaciones LIDC-IDRI y LUNA 16, los cuales
están especialmente diseñados para la detección y clasificación de nódulos
pulmonares, y se emplean ampliamente en el entrenamiento de redes para la detección
temprana de cáncer pulmonar. En particular, LUNA 16 constituye un subconjunto
de LIDC-IDRI, con casos seleccionados por expertos específicamente para la
detección nodular. Ambos datasets incluyen anotaciones detalladas sobre las
características de los nódulos.
En contraste, los
datasets Chest CT-Scan e IQ-OTH/NCCD se emplearon en estudios enfocados en la
clasificación de imágenes completas sin énfasis específico en nódulos
pulmonares. El dataset Chest CT-Scan está diseñado para clasificar el cáncer
pulmonar según su tipo (Adenocarcinoma, Carcinoma de células grandes y
Carcinoma de células escamosas), mientras que IQ-OTH/NCCD clasifica sus
imágenes en casos malignos, benignos y normales. Estos datasets presentan una
cantidad significativamente menor de datos en comparación con los conjuntos de
datos centrados en la clasificación nodular.
Para estudios basados en
imágenes histopatológicas, el dataset más utilizado fue LC25000, el cual agrupa
imágenes de tejido pulmonar en casos de adenocarcinoma, carcinoma de células
escamosas y casos benignos. Todos los datasets mencionados anteriormente son de
acceso libre. Sin embargo, algunos autores emplearon datasets menos comunes,
muchos de los cuales no están actualmente disponibles, y algunos crearon
conjuntos de datos propios en colaboración con entidades de salud privadas. La
Tabla 4 muestra cada dataset considerado relevante y los estudios específicos
que los han utilizado.
Tabla 4
Resultados
de la pregunta de investigación 2
Dataset |
Descripción |
Estudios que lo utilizan |
LIDC-IDRI |
Imágenes TC de baja dosis del
tórax de pacientes que pueden mostrar la presencia de nódulos pulmonares. Hay
888 pacientes y 1186 nódulos anotados. |
(Saied et al., 2023), (Bilal et al., 2022)
(Wankhade & S., 2023), (Shafi et al., 2022), (Yu et al., 2021),(Jena et al., 2021), (Shanid
& Anitha, 2020), (Huang et al., 2020), (Mothkur & B. N, 2022) |
National Cancer Institute Dataset |
No disponible actualmente,
conjuntos de TC de la etapa 1 y 2 del cáncer de pulmón con 1595 y 506
pacientes respectivamente. |
(Ozdemir et al., 2020) |
Chest CT-Scan Dataset |
Conjunto de imágenes CT que
incluye carcinoma de células grandes, carcinoma de células escamosas y
adenocarcinoma. Consta de 1000 imágenes |
(Raza et al., 2023), (Alsheikhy et
al., 2023), (Lanjewar et al., 2023) |
LUNA16 |
Conjunto utilizado para la
detección de nódulos pulmonares en imágenes de tomografía computarizada (TC)
del tórax. |
(Yu et al., 2020), (Ozdemir et al., 2020), (Shafi et al., 2022), (Shah et
al., 2023), (Tang et al.,
2022), (Naseer et al., 2023), (Sori et al., 2019), (Huang & Hu, 2019), (Sousa et al., 2022) |
LC25000 |
Contiene 25,000 imágenes a color
de cinco tipos de tejidos de pulmón y colon: Adenocarcinoma de Colon, Tejido
Colónico Benigno, Adenocarcinoma de Pulmón, Tejido Pulmonar Benigno y el
Carcinoma de Células Escamosas de Pulmón. |
(Masud et al., 2021), (Wadekar
& Singh, 2023), (Civit-Masot
et al., 2022), (Raju & Rao, 2022), (Talukder et al., 2022) |
NLST Dataset |
Conjunto de casos de cáncer de
pulmón en Estados Unidos contienen imágenes de patología o de tejidos,
incluye datos clínicos. |
(Faria et al., 2023) |
Node21 Dataset |
Consta de 4882 radiografías de
tórax frontal que provienen de cuatro conjuntos de datos públicos diferentes. |
(Behrendt et al., 2023) |
IQ-OTH/NCCD Dataset |
Conjunto de datos recopilado por
el Hospital de Enseñanza de Oncología de Irak / Centro Nacional de
Enfermedades del Cáncer. Consta de 1097 imágenes |
(Humayun et al., 2022), (Yan &
Razmjooy, 2023), (Bhattacharjee et al., 2023), (Mohamed et al., 2023) |
TCIA Dataset |
Conjunto de imágenes recopilado
por la entidad Cancer Imaging Archive. |
(Shakeel
et al., 2019), (Kim et al., 2022) |
Fuente: Elaboración propia
Pregunta de Investigación 3: ¿Cuáles son las métricas de
rendimiento más relevantes utilizadas durante la evaluación de los modelos o
algoritmos de detección de cáncer de pulmón?
Las métricas de
rendimiento más utilizadas en las investigaciones fueron las métricas de
clasificación estándar. Entre estas, la más empleada fue la Sensibilidad
(Sensitivity o Recall), que mide la proporción de verdaderos positivos sobre el
total de positivos reales, siendo especialmente relevante en contextos médicos
donde se prioriza la identificación precisa de casos positivos. La Precisión
Global (Accuracy), que evalúa la proporción de predicciones correctas sobre el
total, también fue muy empleada. Otras métricas frecuentes incluyen la
Precisión, el F1-Score, la Specificity, y los indicadores basados en la Curva
ROC y el AUC (Área bajo la curva).
Además, en menor medida,
se utilizaron otras métricas específicas según el tipo de análisis requerido:
la Overlap Measure, para evaluar la precisión en segmentación de imágenes; el
Matthew's Correlation Coefficient, útil en casos de desequilibrio de clases; y
el Cohen’s Kappa Score, aplicado en estudios que requieren evaluar la
concordancia entre muestras dependientes. Para problemas de regresión, métricas
como el Mean Absolute Error, el Mean Squared Error y el Root Mean Squared Error
fueron preferidas.
Cada métrica responde a
necesidades particulares, y la elección de métricas de rendimiento depende de
los objetivos específicos de los investigadores. No obstante, las métricas de
clasificación estándar son las más comunes y suelen ser indispensables en la
mayoría de estudios. La Figura 4 presenta las frecuencias de uso de cada
métrica de rendimiento en las investigaciones analizadas.
Figura 4. Resultados de la pregunta de investigación 3
Pregunta de Investigación 4: ¿Cuáles son las técnicas de
preprocesamiento de imágenes médicas más comunes?
Las técnicas de
preprocesamiento más empleadas en las investigaciones revisadas incluyen la
Normalización, el Filtrado y el Aumento de Datos (Data Augmentation). La
Normalización fue utilizada para ajustar la intensidad de los píxeles de las
imágenes a un rango estándar, generalmente entre [0;1], lo que facilita el
procesamiento y mejora la consistencia en el entrenamiento de los modelos de
IA. Para la reducción del ruido en las imágenes, se usaron comúnmente el Filtro
Gaussiano y el Filtro de la Mediana, los cuales minimizan la interferencia de
píxeles atípicos, contribuyendo a una representación más precisa de las
estructuras importantes en el análisis.
Otro aspecto clave fue el
uso del Aumento de Datos (Data Augmentation). Ante la escasez de datos, los
autores aplicaron técnicas como Data Reshaping y Data Shuffling, que permiten
generar variaciones de las imágenes originales mediante rotaciones, escalados y
otras transformaciones. Esto ayuda a prevenir el sobreajuste y permite que los
modelos generalicen mejor al contar con un dataset ampliado y diversificado.
Para realzar el contraste
en las áreas de interés de las imágenes, se utilizaron tanto el AHE (Adaptive
Histogram Equalization) como su variante CLAHE (Contrast Limited Adaptive
Equalization). Estas técnicas mejoran la visibilidad de estructuras importantes
sin intensificar en exceso las áreas con alto contraste, lo cual es
particularmente útil para destacar posibles indicios de cáncer en las imágenes
médicas.
La Tabla 5 presenta una
lista detallada de las técnicas de preprocesamiento de imágenes más relevantes
identificadas durante la revisión sistemática.
Tabla 5
Resultados
de la pregunta de investigación 4
Técnica |
Descripción |
Estudios que lo utilizan |
Normalización de imagen |
Estandarización de las propiedades
de las imágenes, como la media y la varianza de los valores de píxeles. |
(Raza et al., 2023), (Ozdemir et
al., 2020), (Behrendt et al., 2023), (Moragheb et al., 2022), (Talukder et
al., 2022), (Sori et al., 2019), (Sousa et al., 2022), (Kim et al., 2022). |
Desenfoque gaussiano |
Utilizado para suavizar una imagen
al reducir el nivel de detalle, reduce el contraste y las transiciones
bruscas de intensidad. |
(Ozdemir et al., 2020), (Maleki
& Niaki, 2023), (Jena et al., 2021), (Sori et al., 2019) |
Unsharp Masking |
Técnica de mejora de contraste,
donde los detalles finos se vuelven más prominentes. |
(Masud et al., 2021) |
Data Shuffling |
Reorganización aleatoria de datos,
el propósito es eliminar cualquier sesgo. |
(Raza et al., 2023), (Wadekar & Singh, 2023) |
Data Reshaping |
Modifica la forma o la estructura
de los datos sin cambiar su contenido. |
(Wadekar & Singh, 2023) |
Data Augmentation |
Aumenta la cantidad de datos
disponibles, previene el sobreajuste, mejora el rendimiento. |
(Raza et al., 2023), (Wadekar & Singh, 2023), (Humayun
et al., 2022), (Liu et al., 2023), (Behrendt et al., 2023), (Shah et al.,
2023), (Ibrahim et al., 2021), (Barrett & Viana, 2022) |
Ecualización de histograma
adaptable (AHE) |
Mejorar el contraste en imágenes
médicas al redistribuir los niveles de gris. |
(Asuntha & Srinivasan, 2020),
(Civit-Masot et al., 2022), (Lalitha, 2021), |
Kernelized
Fuzzy C-Means (KFCM) |
Variante del algoritmo Fuzzy
C-Means, se utiliza en la segmentación de imágenes. |
(Lalitha, 2021) |
Regiones de Interés (ROI) |
Se usa para extraer áreas de
interés de una imagen |
(Shafi et al., 2022), (Kim et al.,
2022) |
Data Split |
Dividir un conjunto de datos en
partes separadas |
(Raza et al., 2023), (Jena et al.,
2021), (Ibrahim et al., 2021) |
Contrast
limited adaptive equalizations (CLAHE) |
Se utiliza para mejorar el
contraste y la visibilidad de detalles en imágenes con niveles de gris. |
(Tiwari et
al., 2021), (Saleh & Chin, 2023) |
Filtro Wiener |
Se utiliza en aplicaciones como
restauración de imágenes, eliminación de ruido. |
(Jena et al., 2021) |
Filtro de la Mediana |
Puede suavizar la imagen sin
distorsionar las características importantes. |
(Yan & Razmjooy, 2023) |
Fuente: Elaboración propia
En cuanto a los métodos
de inteligencia artificial empleados actualmente para la detección de cáncer
pulmonar, se observa que la mayoría de los autores consideran las técnicas de
deep learning, particularmente las Redes Neuronales Convolucionales (CNN) y sus
variaciones, como las más adecuadas para enfrentar este problema. Estas
técnicas son empleadas tanto para la extracción de características de las
imágenes como para su clasificación. Un número ligeramente mayor de estudios
optó por arquitecturas híbridas en lugar de modelos con arquitecturas específicas
o convencionales, en función de los objetivos específicos de cada
investigación. En estos enfoques híbridos, las arquitecturas combinan métodos
de deep learning con algoritmos de machine learning, donde los algoritmos
actúan principalmente como clasificadores después de que las imágenes pasan por
una o más redes CNN. Solo un estudio propuso un algoritmo de machine learning
para cubrir el proceso completo de detección y clasificación del cáncer
pulmonar.
Muchos investigadores
optaron por trabajar con arquitecturas de CNN reconocidas, como VGG 16, U-Net,
DenseNet o ResNet, el estado preentrenado de estas redes representa una ventaja
durante el entrenamiento, ya que empiezan con la capacidad de reconocimiento de
patrones de imágenes variadas y es tarea del investigador orientar ese
conocimiento previo para que pueda utilizarse y adaptarse a los patrones
propios de las imágenes médicas. Los ajustes o modificaciones de estas redes
permiten que los modelos logren objetivos específicos, como el reconocimiento
de nódulos pulmonares. Es importante resaltar que el entrenamiento y el ajuste
de las redes no son suficientes para garantizar resultados aceptables, casi
todos los estudios han hecho usos de técnicas complementarias al entrenamiento.
Algunas de ellas son el aprendizaje por transferencia, para aprovechar el
conocimiento previo de las redes. Para mejorar la performance o la reducción de
sesgo se emplearon métodos de aumento y balanceo de datos. Y para reducir los
problemas de sobreajuste se hicieron usos de capas Dropout.
En relación con los
datasets más empleados, se identificó que los estudios suelen utilizar bases de
datos como LIDC-IDRI (22 %) y LUNA 16 (20 %) para la identificación de nódulos
pulmonares como parte de la detección de cáncer de pulmón. Un número menor de
investigadores optó por datasets que clasifiquen las imágenes en función de
diferentes patologías, tales como Chest CT-Scan Dataset e IQ-OTH/NCCD Dataset.
El tercer dataset más usado es LC25000 (11 %), que se distingue por contener
imágenes de tejido pulmonar en lugar de imágenes de nódulos pulmonares.
En cuanto a las métricas
de rendimiento utilizadas para evaluar los métodos de detección de cáncer
pulmonar, más del 80 % de los estudios utilizan métricas estándar de
clasificación, como Accuracy, Specificity, Precision, Recall y F1-score. Un
número menor de estudios emplea la curva ROC para evaluar el desempeño de sus
modelos, mientras que otras métricas se emplean en menor proporción.
En términos de técnicas de preprocesamiento de imágenes, se observó un
amplio uso de normalización, filtros para la eliminación de ruido, como el
desenfoque Gaussiano y el filtro de la Mediana, y técnicas de aumento de datos
para mejorar la diversidad del conjunto de entrenamiento.
Este artículo está
dirigido principalmente a investigadores, profesionales de la salud, y
desarrolladores de tecnología en el ámbito de la detección de enfermedades
mediante inteligencia artificial, con énfasis en la detección de cáncer
pulmonar a partir de imágenes médicas. Al proporcionar un análisis actualizado
de los métodos de inteligencia artificial, especialmente de técnicas basadas en
redes neuronales convolucionales (CNN) y arquitecturas híbridas, el estudio
ofrece una guía detallada sobre las prácticas actuales y efectivas en la
identificación de cáncer pulmonar.
Asimismo, el artículo brinda un aporte valioso para estudiantes y
académicos interesados en explorar aplicaciones de machine learning en la
medicina, ya que ofrece una revisión de los datasets más comunes y sus
características, así como las métricas y técnicas de preprocesamiento usadas en
la investigación médica. Los hallazgos y análisis detallados también pueden
resultar útiles para instituciones de salud y centros de investigación que
buscan implementar o mejorar sus sistemas de diagnóstico asistido por IA.
Se realizó una revisión
sistemática de las técnicas y métodos de inteligencia artificial orientados a
la detección del cáncer pulmonar a partir de imágenes médicas en artículos
científicos publicados entre los años 2019 y 2023. La elección de técnicas de
IA depende en gran medida de los objetivos de los investigadores, a pesar de
que la red neuronal convolucional ha sido la técnica más utilizada y que
mejores resultados ha obtenido, no parece haber un consenso acerca de qué
arquitectura es superior en términos de precisión y sensibilidad. Tanto
arquitecturas híbridas como convencionales han mostrado buenos resultados, sin
embargo, las arquitecturas híbridas se han mostrado como una opción más robusta
durante el entrenamiento y la validación de los modelos. Se sugiere que los
estudios incluyan técnicas complementarias al entrenamiento de los modelos,
como Transfer Learning y Fine-Tuning, para optimizar la capacidad de
reconocimiento en arquitecturas CNN definidas. Asimismo, debería considerarse
el uso de técnicas de balanceo de datos en redes de clasificación para mitigar
problemas de sesgo. Esta es una de las limitaciones encontradas durante la
revisión, hay muchos investigadores que no se han preocupado de que sus
conjuntos de entrenamiento estuviesen balanceados, por lo que, sus resultados
pueden ser engañosos. Además, algunos datasets públicos como Chest Scan o
IQ-OTHNCCD poseen poca cantidad de datos en comparación a datasets como LUNA 16
o LIDC-IDRI, algunos autores han intentado mitigar este problema con un aumento
artificial de los datos.
Los resultados obtenidos
por los investigadores deben entenderse como reflejo de tanto los logros como
las limitaciones inherentes a sus modelos, los cuales constituyen una base útil
para futuras investigaciones, sin representar una solución definitiva. Una fase
de pruebas adicional con datos privados de centros médicos reconocidos podría
aportar validación complementaria si es posible realizarla.
Al-Ameer, A. A. A.,
Hussien, G. A., & Ameri, H. A. A. (2022). Lung cancer
detection using image processing and deep learning. Indonesian Journal of Electrical Engineering and Computer Science, 28(2), Article 2. https://doi.org/10.11591/ijeecs.v28.i2.pp987-993
Alamgeer, M., Alruwais, N., Alshahrani, H. M.,
Mohamed, A., & Assiri, M. (2023). Dung Beetle
Optimization with Deep Feature Fusion Model for Lung Cancer Detection and
Classification. Cancers, 15(15), Article 15. https://doi.org/10.3390/cancers15153982
Alsheikhy, A. A.,
Said, Y., Shawly, T., Alzahrani,
A. K., & Lahza, H. (2023). A CAD System for Lung
Cancer Detection Using Hybrid Deep Learning Techniques. Diagnostics, 13(6),
Article 6. https://doi.org/10.3390/diagnostics13061174
Al-Yasriy, H. F., AL-Husieny, M. S.,
Mohsen, F. Y., Khalil, E. A., & Hassan, Z. S. (2020). Diagnosis of Lung
Cancer Based on CT Scans Using CNN. IOP
Conference Series: Materials Science and Engineering, 928(2), 022035. https://doi.org/10.1088/1757-899X/928/2/022035
Asuntha, A., &
Srinivasan, A. (2020). Deep learning for lung Cancer detection and
classification. Multimedia Tools and
Applications, 79(11), 7731-7762. https://doi.org/10.1007/s11042-019-08394-3
Barrett,
J., & Viana, T. (2022). EMM-LC Fusion: Enhanced Multimodal Fusion for Lung
Cancer Classification. AI, 3(3), Article 3. https://doi.org/10.3390/ai3030038
Behrendt,
F., Bengs, M., Bhattacharya, D., Krüger,
J., Opfer, R., & Schlaefer,
A. (2023). A systematic approach to deep learning-based nodule detection in
chest radiographs. Scientific Reports,
13(1), Article 1. https://doi.org/10.1038/s41598-023-37270-2
Bhattacharjee,
A., Rabea, S., Bhattacharjee, A., Elkaeed, E. B., Murugan, R., Selim, H. M. R. M., Sahu,
R. K., Shazly, G. A., & Salem Bekhit,
M. M. (2023). A multi-class deep learning model for early lung cancer and
chronic kidney disease detection using computed tomography images. Frontiers in Oncology, 13. https://www.frontiersin.org/journals/oncology/articles/10.3389/fonc.2023.1193746
Bhinder, B., Gilvary, C., Madhukar, N. S., & Elemento,
O. (2021). Artificial Intelligence in Cancer Research and Precision Medicine. Cancer Discovery, 11(4), 900-915. https://doi.org/10.1158/2159-8290.CD-21-0090
Bilal,
A., Shafiq, M., Fang, F., Waqar, M., Ullah, I., Ghadi,
Y. Y., Long, H., & Zeng, R. (2022). IGWO-IVNet3: DL-Based Automatic
Diagnosis of Lung Nodules Using an Improved Gray Wolf Optimization and
InceptionNet-V3. Sensors, 22(24), Article 24. https://doi.org/10.3390/s22249603
Blessie, A., &
Ramesh, P. (2022). Novel Contiguous Cross Propagation Neural Network Built CAD
for Lung Cancer. Computer Systems Science
and Engineering, 44(2),
1467-1484. https://doi.org/10.32604/csse.2023.025399
Bray,
F., Laversanne, M., Sung, H., Ferlay,
J., Siegel, R. L., Soerjomataram, I., & Jemal, A.
(2024). Global cancer statistics 2022: GLOBOCAN estimates of incidence and
mortality worldwide for 36 cancers in 185 countries. CA: A Cancer Journal for Clinicians, 74(3), 229-263. https://doi.org/10.3322/caac.21834
Civit-Masot, J.,
Bañuls-Beaterio, A., Domínguez-Morales, M., Rivas-Pérez, M., Muñoz-Saavedra,
L., & Rodríguez Corral, J. M. (2022). Non-small
cell lung cancer diagnosis aid with histopathological images using Explainable
Deep Learning techniques. Computer
Methods and Programs in Biomedicine, 226,
107108. https://doi.org/10.1016/j.cmpb.2022.107108
Faria, N., Campelos, S.,
& Carvalho, V. (2023). A Novel Convolutional Neural Network
Algorithm for Histopathological Lung Cancer Detection. Applied Sciences, 13(11),
Article 11. https://doi.org/10.3390/app13116571
Huang,
W., & Hu, L. (2019). Using a Noisy U-Net for Detecting Lung Nodule
Candidates. IEEE Access, 7, 67905-67915. IEEE Access. https://doi.org/10.1109/ACCESS.2019.2918224
Huang,
X., Lei, Q., Xie, T., Zhang, Y., Hu, Z., & Zhou,
Q. (2020). Deep Transfer Convolutional Neural Network and Extreme Learning
Machine for lung nodule diagnosis on CT images. Knowledge-Based Systems, 204,
106230. https://doi.org/10.1016/j.knosys.2020.106230
Humayun,
M., Sujatha, R., Almuayqil, S. N., & Jhanjhi, N. Z. (2022). A Transfer Learning Approach with a
Convolutional Neural Network for the Classification of Lung Carcinoma. Healthcare, 10(6), Article 6. https://doi.org/10.3390/healthcare10061058
Ibrahim,
D. M., Elshennawy, N. M., & Sarhan,
A. M. (2021). Deep-chest: Multi-classification deep learning model for
diagnosing COVID-19, pneumonia, and lung cancer chest diseases. Computers in Biology and Medicine, 132, 104348. https://doi.org/10.1016/j.compbiomed.2021.104348
Jena,
S. R., George, S. T., & Ponraj, D. N. (2021).
Lung cancer detection and classification with DGMM-RBCNN technique. Neural Computing and Applications, 33(22), 15601-15617. https://doi.org/10.1007/s00521-021-06182-5
Kim,
G., Moon, S., & Choi, J.-H. (2022). Deep Learning with Multimodal
Integration for Predicting Recurrence in Patients with Non-Small Cell Lung
Cancer. Sensors, 22(17), Article 17. https://doi.org/10.3390/s22176594
Kitchenham, B. and Charters, S. (2007)
Guidelines for Performing Systematic Literature Reviews in Software
Engineering, Technical Report EBSE 2007-001, Keele
University and Durham University Joint Report.
Lalitha,
S. (2021). An automated lung cancer detection system based on machine learning
algorithm. JOURNAL OF INTELLIGENT &
FUZZY SYSTEMS, 40(4), 6355-6364. https://doi.org/10.3233/JIFS-189476
Lanjewar, M. G., Panchbhai, K. G., & Charanarur,
P. (2023). Lung cancer detection from CT scans using modified DenseNet with feature selection methods and ML classifiers.
Expert Systems with Applications, 224, 119961. https://doi.org/10.1016/j.eswa.2023.119961
Liu,
M., Li, L., Wang, H., Guo, X., Liu, Y., Li, Y., Song, K., Shao, Y., Wu, F.,
Zhang, J., Sun, N., Zhang, T., & Luan, L. (2023). A multilayer
perceptron-based model applied to histopathology image classification of lung
adenocarcinoma subtypes. Frontiers in
Oncology, 13, 1172234. https://doi.org/10.3389/fonc.2023.1172234
Maleki, N., & Niaki, S. T. A. (2023). An intelligent algorithm for lung
cancer diagnosis using extracted features from Computerized Tomography images. Healthcare Analytics, 3, 100150. https://doi.org/10.1016/j.health.2023.100150
Masud, M., Sikder,
N., Nahid, A.-A., Bairagi, A. K., & AlZain, M. A. (2021). A Machine Learning Approach to
Diagnosing Lung and Colon Cancer Using a Deep Learning-Based Classification
Framework. Sensors, 21(3), Article 3. https://doi.org/10.3390/s21030748
Mendoza,
J., & Pedrini, H. (2020). Detection and
classification of lung nodules in chest X-ray images using deep convolutional
neural networks. Computational
Intelligence, 36(2), 370-401. https://doi.org/10.1111/coin.12241
Mohamed,
T. I. A., Oyelade, O. N., & Ezugwu,
A. E. (2023). Automatic detection and classification of lung cancer CT scans
based on deep learning and ebola optimization search
algorithm. PLOS ONE, 18(8), e0285796. https://doi.org/10.1371/journal.pone.0285796
Moragheb, M. A., Badie, A., & Noshad, A.
(2022). An Effective Approach for Automated Lung Node Detection using CT Scans.
Journal of Biomedical Physics &
Engineering, 12(4), 377-386. https://doi.org/10.31661/jbpe.v0i0.2110-1412
Mothkur, R., &
B. N, Dr. V. (2022). A Robust Approach for Segmentation and Classification of
Lung Cancer using Marker Controlled Watershed Method and Deep Hybrid Learning. Indian Journal of Computer Science and
Engineering, 13(5), 1366-1377. https://doi.org/10.21817/indjcse/2022/v13i5/221305003
Nanglia, P., Kumar,
S., Mahajan, A. N., Singh, P., & Rathee, D.
(2021). A hybrid algorithm for lung cancer classification using SVM and Neural
Networks. ICT Express, 7(3), 335-341. https://doi.org/10.1016/j.icte.2020.06.007
Naseer,
I., Akram, S., Masood, T., Rashid, M., & Jaffar,
A. (2023). Lung Cancer Classification Using Modified U-Net Based Lobe
Segmentation and Nodule Detection. IEEE
Access, 11, 60279-60291. IEEE
Access. https://doi.org/10.1109/ACCESS.2023.3285821
Nooreldeen, R., &
Bach, H. (2021). Current and Future Development in Lung Cancer Diagnosis. International Journal of Molecular Sciences,
22(16), Article 16. https://doi.org/10.3390/ijms22168661
Ozdemir, O.,
Russell, R. L., & Berlin, A. A. (2020). A 3D Probabilistic Deep Learning
System for Detection and Diagnosis of Lung Cancer Using Low-Dose CT Scans. IEEE Transactions on Medical Imaging, 39(5), 1419-1429. IEEE Transactions on
Medical Imaging. https://doi.org/10.1109/TMI.2019.2947595
Raju,
M. S. N., & Rao, B. S. (2022). Classification of Colon and Lung Cancer
Through Analysis of Histopathology Images Using Deep Learning Models. Ingénierie des systèmes d
information, 27(6), 967-971. https://doi.org/10.18280/isi.270613
Raza,
R., Zulfiqar, F., Khan, M. O., Arif, M., Alvi, A., Iftikhar, M. A., & Alam,
T. (2023). Lung-EffNet: Lung cancer classification
using EfficientNet from CT-scan images. Engineering Applications of Artificial
Intelligence, 126, 106902. https://doi.org/10.1016/j.engappai.2023.106902
Saied,
M., Raafat, M., Yehia, S., & Khalil, M. M.
(2023). Efficient pulmonary nodules classification using radiomics and
different artificial intelligence strategies. Insights into Imaging, 14(1),
91. https://doi.org/10.1186/s13244-023-01441-6
Saleem,
M. A., Thien Le, N., Asdornwised,
W., Chaitusaney, S., Javeed, A., & Benjapolakul, W. (2023). Sooty Tern Optimization
Algorithm-Based Deep Learning Model for Diagnosing NSCLC Tumours.
Sensors, 23(4), Article 4. https://doi.org/10.3390/s23042147
Saleh,
A. Y., & Chin, C. K. (2023). Development of hybrid convolutional neural
network and autoregressive integrated moving average on computed tomography
image classification. IAES International
Journal of Artificial Intelligence, 12(4),
1864-1872. Scopus. https://doi.org/10.11591/ijai.v12.i4.pp1864-1872
Shafi, I., Din, S., Khan,
A., Díez, I. D. L. T., Casanova, R. del J. P., Pifarre, K. T., & Ashraf, I.
(2022). An Effective Method for Lung Cancer Diagnosis from CT
Scan Using Deep Learning-Based Support Vector Network. Cancers, 14(21), Article
21. https://doi.org/10.3390/cancers14215457
Shah,
A. A., Malik, H. A. M., Muhammad, A., Alourani, A.,
& Butt, Z. A. (2023). Deep learning ensemble 2D CNN approach towards the
detection of lung cancer. Scientific
Reports, 13(1), Article 1. https://doi.org/10.1038/s41598-023-29656-z
Shakeel,
P. M., Burhanuddin, M. A., & Desa, M. I. (2019).
Lung cancer detection from CT image using improved profuse clustering and deep
learning instantaneously trained neural networks. Measurement, 145,
702-712. https://doi.org/10.1016/j.measurement.2019.05.027
Shanid, M., & Anitha, A. (2020). Lung Cancer Detection from Ct Images
Using Salp-Elephant Optimization-Based Deep Learning.
BIOMEDICAL ENGINEERING-APPLICATIONS BASIS
COMMUNICATIONS, 32(1), 2050001. https://doi.org/10.4015/S1016237220500015
Sori,
W. J., Feng, J., & Liu, S. (2019). Multi-path convolutional neural network
for lung cancer detection. Multidimensional
Systems and Signal Processing, 30(4),
1749-1768. https://doi.org/10.1007/s11045-018-0626-9
Sousa,
J., Pereira, T., Silva, F., Silva, M. C., Vilares, A.
T., Cunha, A., & Oliveira, H. P. (2022). Lung Segmentation in CT Images: A
Residual U-Net Approach on a Cross-Cohort Dataset. Applied Sciences, 12(4),
Article 4. https://doi.org/10.3390/app12041959
Sung,
H., Ferlay, J., Siegel, R. L., Laversanne,
M., Soerjomataram, I., Jemal, A., & Bray, F.
(2021). Global Cancer Statistics 2020: GLOBOCAN Estimates of Incidence and
Mortality Worldwide for 36 Cancers in 185 Countries. CA: A Cancer Journal for Clinicians, 71(3), 209-249. https://doi.org/10.3322/caac.21660
Talukder, Md. A.,
Islam, Md. M., Uddin, M. A., Akhter, A., Hasan, K. F., & Moni, M. A.
(2022). Machine learning-based lung and colon cancer detection using deep
feature extraction and ensemble learning. Expert
Systems with Applications, 205,
117695. https://doi.org/10.1016/j.eswa.2022.117695
Tang,
T., Li, F., Jiang, M., Xia, X., Zhang, R., & Lin, K. (2022). Improved
Complementary Pulmonary Nodule Segmentation Model Based on Multi-Feature
Fusion. Entropy, 24(12),
Article 12. https://doi.org/10.3390/e24121755
Tiwari, L., Raja, R.,
Awasthi, V., Miri, R., Sinha, G. R., Alkinani, M. H., & Polat, K. (2021). Detection
of lung nodule and cancer using novel Mask-3 FCM and TWEDLNN algorithms. Measurement, 172, 108882. https://doi.org/10.1016/j.measurement.2020.108882
V.
R., N., & Chandra S. S., V. (2023). ExtRanFS: An
Automated Lung Cancer Malignancy Detection System Using Extremely Randomized
Feature Selector. Diagnostics, 13(13), 2206. https://doi.org/10.3390/diagnostics13132206
Wadekar, S., & Singh,
D. K. (2023). A modified convolutional neural network framework for
categorizing lung cell histopathological image based on residual network. Healthcare Analytics, 4, 100224. https://doi.org/10.1016/j.health.2023.100224
Wankhade, S., &
S., V. (2023). A novel hybrid deep learning method for early detection of lung
cancer using neural networks. Healthcare
Analytics, 3, 100195. https://doi.org/10.1016/j.health.2023.100195
Yan,
C., & Razmjooy, N. (2023). Optimal lung cancer
detection based on CNN optimized and improved Snake optimization algorithm. Biomedical Signal Processing and Control,
86, 105319. https://doi.org/10.1016/j.bspc.2023.105319
Yu,
H., Li, J., Zhang, L., Cao, Y., Yu, X., & Sun, J. (2021). Design of lung
nodules segmentation and recognition algorithm based on deep learning. BMC Bioinformatics, 22(Suppl 5), 314. https://doi.org/10.1186/s12859-021-04234-0
Yu,
K.-H., Lee, T.-L. M., Yen, M.-H., Kou, S. C., Rosen, B., Chiang, J.-H., & Kohane, I. S. (2020). Reproducible Machine Learning Methods
for Lung Cancer Detection Using Computed Tomography Images: Algorithm
Development and Validation. Journal of Medical
Internet Research, 22(8), e16709. https://doi.org/10.2196/16709