Revista de Ciencias Sociales (RCS)

Vol. XXIX, Número Especial 7, junio 2023. pp. 152-164

FCES - LUZ ● ISSN: 1315-9518 ● ISSN-E: 2477-9431

Como citar APA: López, J. F., Pomaquero, J. C., López, J. L., y Almeida, D. M. (2023). Deep learning como estrategia de servicio al cliente para el diagnóstico precoz de Covid-19. Revista de Ciencias Sociales (Ve), XXIX(Número Especial 7), 152-164.

Deep learning como estrategia de servicio al cliente para el diagnóstico precoz de Covid-19

López Aguirre, José Fernando*

Pomaquero Yuquilema, Juan Carlos**

López Salazar, José Luis***

Almeida López, Diego Marcelo****

Resumen

El virus Covid-19 (Neumonía Atípica), desde su origen hace más de tres años, continúa cobrando vidas y causando aglomeraciones en los sistemas de salud de países como Ecuador, por lo que se hace necesario el uso de tecnologías de la información para asistir al personal médico en el diagnóstico temprano. El objetivo de la investigación fue analizar el deep learning como estrategia de servicio al cliente para el diagnóstico precoz de Covid-19. La metodología utilizada se sistematizó mediante selección de imágenes de tipo no probabilístico, la elección del investigador fue clave en el uso de imágenes de rayos X de tórax obtenidas en casas de salud privadas y públicas en las ciudades de Riobamba y Quito-Ecuador, además se utilizó la base de datos “Chest X-ray”, en la plataforma Kaggle. La evidencia científica muestra que las radiografías de tórax son una prueba eficaz para una primera fase diagnóstica de presunción de Covid-19, por lo que el uso de deep learning como estrategia de atención al cliente a través del análisis de radiografías de tórax, cuenta con las propiedades necesarias para extraer características y lograr un buen nivel de precisión en su clasificación y ayudar con el cribado de pacientes infectados.

Palabras clave: Covid-19; rayos X; redes pre-entrenadas; aplicación web; atención al cliente.

* Master en Análisis Masivo de Datos. Ingeniero en Industrias Pecuarias. Docente Investigador en la Escuela Superior Politécnica de Chimborazo, Riobamba, Ecuador. E-mail: josef.lopez@espoch.edu.ec ORCID: https://orcid.org/0000-0001-9706-5115

** Máster en Políticas Públicas y Sociales. Ingeniero en Administración de Empresas. Docente Investigador en la Escuela Superior Politécnica de Chimborazo, Riobamba, Ecuador. E-mail: carlos.pomaquero@espoch.edu.ec ORCID: https://orcid.org/0000-0003-0952-943X

*** Master Universitario en Investigación en Administración y Economía de la Empresa. Magister en Administración de Empresas mención Administración Estratégica. Licenciado en Administración de Empresas de Hospitalidad. Docente Investigador en la Escuela Superior Politécnica de Chimborazo, Riobamba, Ecuador. E-mail: josel.lopez@espoch.edu.ec ORCID: https://orcid.org/0000-0003-1012-4472

****   Magíster en Gestión Empresarial. Ingeniero en Marketing. Docente Investigador en la Escuela Superior Politécnica de Chimborazo, Riobamba, Ecuador. E-mail: diego.almeida@espoch.edu.ec ORCID: https://orcid.org/0000-0001-5860-8308

Recibido: 2022-12-13 · Aceptado: 2023-03-02

Deep learning as a customer service strategy for the early diagnosis of Covid-19

Abstract

The Covid-19 virus (Atypical Pneumonia), since its origin more than three years ago, continues to claim lives and cause crowds in the health systems of countries such as Ecuador, for which the use of information technologies is necessary to assist medical staff in early diagnosis. The objective of the research was to analyze deep learning as a customer service strategy for the early diagnosis of Covid-19. The methodology used was systematized through the selection of non-probabilistic images, the choice of the researcher was key in the use of chest X-ray images obtained in private and public health centers in the cities of Riobamba and Quito-Ecuador, in addition used the “Chest X-ray” database, on the Kaggle platform. Scientific evidence shows that chest X-rays are an effective test for a first phase of presumptive diagnosis of Covid-19, so the use of deep learning as a customer service strategy through the analysis of chest X-rays has the properties needed to extract features and achieve a good level of accuracy in their classification and help with the screening of infected patients.

Keywords: Covid-19; X-rays; pre-trained networks; web application; customer support.

Introducción

En la actualidad la inteligencia artificial es utilizada con mayor regularidad en la vida cotidiana en organizaciones, empresas y población en general que requieren moldear su gestión, y tener herramientas que permitan tomar decisiones en diferentes aspectos, que pueden ser tan sencillos como mirar una película por streaming, conocer los históricos de las inversiones o con el enfoque de este trabajo que es ayudar con el diagnóstico precoz del padecimiento de alguna enfermedad (Handelman et al., 2018; Arbeláez-Campillo, Villasmil y Rojas-Bahamón, 2021; Maita-Cruz et al., 2022).

El presente trabajo de investigación se realiza con el objetivo de llevar a cabo un proceso de aprendizaje automático usando las redes neuronales artificiales de deep learning (aprendizaje profundo), con las arquitecturas Vgg16 e InveptionV3, para la clasificación de imágenes en la detección de neumonía atípica (Covid-19) con el uso de imágenes de rayos X de tórax (Apostolopoulos y Mpesiana, 2020; Sait et al., 2021). Uno de los recursos que los médicos utilizan para tratar las enfermedades es por medio de imágenes que son obtenidas a través de un equipo que emite ondas electromagnéticas conocidas como rayos X y permiten tener una vista del interior del cuerpo que le permite la interpretación.

Si bien el profesional médico que se encarga de hacer el primer diagnóstico es el radiólogo que lee e interpreta las imágenes y finalmente elabora un informe para el especialista, este informe es el paso final que se propone se puede agilizar empleando el Deep Learning para determinar patrones que permitan establecer un resultado con un alto grado de fiabilidad con el uso de una aplicación web que ayude a mejorar la calidad en el servicio de atención médica considerando que una de las limitaciones que tienen los consultorios médicos sobre todo en el sistema de salud pública es que no cuentan con ordenadores que permitan visualizar e interpretar las imágenes rápidamente (Arizmendi, 2007; Delgado, Ledesma y Rostro, 2019). Por lo tanto, el objetivo de la presente investigación consiste en analizar el deep learning como estrategia de servicio al cliente para el diagnóstico precoz de Covid-19.

1. Deep Learning: Creación para la interpretación de un aprendizaje profundo en salud

Hoy en día, uno de los métodos de inteligencia artificial más utilizado es el conocido como Deep Learning, que fue desarrollado para mejorar los resultados de las redes neuronales convolucionales convencionales, debido a que permite realizar el proceso de extracción de características, minería de datos y clasificación como un solo bloque algorítmico. De manera general, el Deep Learning es una subdivisión del aprendizaje profundo conocido como Machine Learning (Castelli y Bergman, 2005); este tipo de técnicas tratan de actuar de la misma manera que opera el proceso de aprendizaje del cerebro para extraer características que permiten identificar objetos posteriormente. Su funcionamiento está basado en el algoritmo perceptrónico de Rosenblatt, que utiliza las características adquiridas durante el aprendizaje para realizar análisis predictivos (Coppin, 2004; Brownlee, 2019).

La extracción de características es el proceso de obtener información discriminante de una imagen en una forma reducida normalmente conocida como vector de características. Una red neuronal convolucional (CNN) bien entrenada puede servir como extractor de características. Se puede tomar un modelo CNN entrenado en un problema distinto, donde la CNN puede aprender a reconocer objetos determinados que no coinciden con los que se quieren clasificar. Se puede usar este modelo como extractor de características internamente de una forma composicional para una tarea en concreto, y luego usar estas características para entrenar un clasificador de imágenes (Salas, 2004; Pan y Yang, 2010; Fos, 2015).

Se proponen sistemas de recomendación basado en Deep Learning, el que ayuda cuando existe alta demanda y la experiencia radiológica requerida es baja (Shibly et al., 2020). En este estudio, se investigaron cuatro arquitecturas diferentes de red neuronal convolucional profunda (Xception, MobileNet, ResNet50 e InceptionV3), usando imágenes de rayos X de tórax; y se utilizó el editor Jupyter Notebook para probarlas con el objetivo de proporcionar una recomendación del diagnóstico en pacientes de Covid-19 a través de redes neuronales convolucionales pre-entrenadas en la base de datos de ImageNet, es decir, se les proporciona pesos pre-entrenados que ayudan a transferir la información o data previa sobre el conjunto de datos que se investiga, los resultados muestran que, de los cuatro modelos estudiados, MobileNet es el mejor (Sethi, Mehrotra y Sethi, 2020; Grupo Atico34, 2020).

Hay estudios que demuestran que el rendimiento del modelo relativamente sencillo VGG16, es mejor en comparación con los modernos GoogleNet y ResNet. Por lo tanto, se han probado versiones simples de 2D-CNN inspiradas en VGG-11. La red CNN es un subconjunto de VGG-11 que consta de 5 capas de convolución, cada una de las cuales va seguida de una capa de activación y otra de agrupación (Ebrahimzadeh et al., 2021). Además, en la red se utiliza una única capa densa con 512 neuronas en lugar de múltiples capas densas con un gran número de neuronas. Esto ayudó a reducir la complejidad del sistema en términos de parámetros (Liang et al., 2018; Khattak et al., 2020).

Estudios como los de Pan y Yang (2010), han puesto en evidencia la efectividad de utilizar una red neuronal convolucional como extractor de características, en conjuntos no muy extensos de imágenes de entrenamiento, que se define como la habilidad de un sistema a reconocer y aplicar conocimiento, así como habilidades aprendidas en tareas previas en una tarea nueva (Cortés y Sánchez, 2021).

Con esta investigación se pretende establecer una base de datos con imágenes de rayos X de tórax, hacer una clasificación de la base de datos con apoyo de personal médico para entrenar y testear el modelo usando lenguaje Python con el fin de determinar el mejor algoritmo de clasificación para el diagnóstico clínico de Covid-19 y reducir los tiempos de espera de resultados para alivianar la carga de pacientes en los centros de salud (Dhiman et al., 2021; Narin, Kaya y Pamuk, 2021).

2. Metodología

A través de un estudio descriptivo, para analizar el deep learning como estrategia de servicio al cliente para el diagnóstico precoz de Covid-19; la selección de las imágenes utilizadas fue de tipo no probabilístico, porque el proceso se orientó a elección del investigador con el uso de imágenes de rayos X de tórax, que fueron obtenidas de casas de salud privadas y públicas del Ecuador en las ciudades de Riobamba y Quito; además, se utilizó una base de datos llamada “Chest X-ray (Covid-19 & Pneumonia)”, la cual se encuentra en la plataforma Kaggle.

La clasificación de las imágenes de fuentes primarias se basa en el criterio de profesionales de la salud, para lo que se contó con la asesoría de médicos y radiólogos para realizar una adecuada clasificación de imágenes y establecer los parámetros bajo los que se realizó el entrenamiento del sistema, con un método de investigación basado en la experiencia adquirida por medio de las pruebas de experimentación (González, 2021).

En el estudio se consideran 2 arquitecturas de redes neuronales y se adopta la idea de predicción por el análisis de conjuntos de imágenes con capas ocultas, así como se selecciona el modelo que luego del entrenamiento y pruebas logre la mejor precisión de predicción, para lo que se aplica la técnica de transfer learning aprovechando la información existente por lo que se compararan los algoritmos (VGG16, e InceptionV3), que se ejecutan desde una versión pro de Google Colab para reducir el coste computacional del ordenador local y determinar la mejor alternativa para ser propuesta.

Para el desarrollo de la investigación, se trabajó sobre una base de datos pública del repositorio Kaggle y para validar el modelo se empleó una base de datos que contiene imágenes obtenidas de hospitales del Ecuador catalogada en dos clases: Normal y Covid-19. Para el reconocimiento de las imágenes se decidió utilizar redes convolucionales, en las que las capas se organizan en tres dimensiones, imitando al córtex visual que tienen los humanos y presentan gran adaptabilidad para irse especializando.

Para la implementación de la propuesta de las ramas del machine learning se escogió el método de aprendizaje profundo, debido a que permitió reducir el tiempo de desarrollo y aplicación con el uso de redes pre-entrenadas (VGG16 e InceptionV3), del entorno Google Colab por las facilidades que ofrece para programar con Python, que es un lenguaje amigable y versátil, además de la garantía que presenta para su uso en procesamiento de imágenes y aplicación de técnicas de machine learning con la combinación de librerías que ayudan a incrementar el rendimiento de las actividades en ejecución.

El proceso metodológico para cada una de las arquitecturas, parte de la exploración de datos para conocer la cantidad y tipo de información con la que se entrenaran los modelos, luego se importan las librerías y se da paso al diseño del modelo, se realiza una compilación del modelo, se pasa a la etapa de entrenamiento, se evalúa la funcionalidad del modelo, y se obtienen los resultados para tomar decisiones.

Finalmente, se utilizó una aplicación web con frameworks escritos en Python y que, además, presenta facilidades de uso en dispositivos fijos como móviles para que los profesionales de la salud puedan hacer uso del modelo de diagnóstico precoz de Covid-19 subiendo la imagen a diagnosticar al modelo.

El conjunto de datos se obtuvo de dos fuentes, una publica alojada en: https://www.kaggle.com/paultimothymooney/chest-xray-pneumonia, en la que se organiza la información en 3 categorías (train, test, val), y a su vez cada carpeta tiene 2 subcategorías (Pneumonia, Normal), en total hay 6.40 GB que contienen 8.503 imágenes de rayos x en formato jpg con tamaños desde los 170 a 1.050 kb; y otra fuente privada, de los Hospitales públicos Carlos Andrade Marín de la ciudad de Quito y el Hospital Docente de la ciudad de Riobamba, en los que se obtuvieron imágenes en formato jpg y png con tamaños de entre los 7.91 kb hasta los 8 Mb.

A continuación, se dan a conocer los resultados obtenidos con la utilización de las arquitecturas de las redes pre-entrenadas que se mencionaron anteriormente, y se explica el proceso que se aplicó con la utilización de una base de datos publica, en combinación con las imágenes facilitadas por los centros de salud del Ecuador y los parámetros que se obtuvieron al utilizar únicamente imágenes de rayos X de tórax de pacientes atendidos en los Hospitales: Carlos Andrade Marín de la ciudad de Quito y el Hospital General Docente de la ciudad de Riobamba (ver Figura I).

Fuente: Elaboración propia, 2022.

Figura I: Diseño del modelo de predicción

Con el objetivo de mejorar la precisión de los modelos se realizaron algunas modificaciones a la propuesta original. Se conserva la estructura del modelo y se utilizaron 3 data sets de imágenes. El primer grupo, es el de fuente pública, que son las imágenes obtenidas de Kaggle; el segundo grupo, es un mix de imágenes públicas y de las imágenes proporcionadas por 2 hospitales ecuatorianos; y finalmente, se aplicó el modelo a imágenes exclusivas de los hospitales ecuatorianos, su proporción se indica en el apartado de los resultados.

Para las pruebas se mantendrán las capas, batch size, optimizador y se utilizarán cambios en las épocas, empleando 5 Epoch para la fuente publica con respecto al algoritmo Vgg16 e InceptionV3; 10 Epoch con los dos algoritmos para el mix de imágenes; y, 20 Epoch para las imágenes de rayos X proporcionadas por las casas de salud ecuatorianas.

3. Red neuronal pre-entrenada: Resultados necesarios

Los resultados para cada red neuronal pre-entrenada se compararon por fuente, es decir, según la procedencia de los datos; en este caso se emplearon datos de fuentes públicas, un mix de información entre los tipos de fuentes, y una base con información netamente privada. Estos tres tipos de fuentes, cuya proporción se puede apreciar en la Tabla 1, se evaluaron en función de épocas, tiempo, precisión, perdida, además de las métricas que ofrece SCIKIT-learn como es el caso de F1 Score, recall y la matriz de confusión, para en base a estos parámetros definir cuál es la mejor opción.

Tabla 1

Grupos de imágenes empleadas

Fuente

Train

Validation

Cantidad

%

Cantidad

%

Publicas (Kaggle)

5.216

88

624

12

Mix

3.006

76

718

24

Ecuador

512

75

128

25

Fuente: Elaboración propia, 2022.

Los grupos de imágenes que se utilizaron para cada modelo se dividieron en tres grupos y bajo las proporciones que se muestran en la Tabla 1. Asimismo, las métricas que se evaluaron para estas pruebas fueron la precisión, perdida de entropía y la puntuación F1.

3.1. Precisión del modelo

La métrica de precisión (Accuracy), se calcula en función de un conjunto de etiquetas y las instancias en el conjunto de datos, dando como resultado un valor que se mide ente 1 y 0, con una lectura porcentual del resultado (ver Tabla 2). En lo referente a la perdida (Loss), mientras menor sea el resultado mejor es el modelo, por lo que el objetivo de un modelo de aprendizaje es minimizar la perdida.

Tabla 2

Precisión y validación en diferentes Epochs

No. Epochs

Fuente

Modelo Vgg16

Modelo InceptionV3

Tiempo

minutos

Accuracy

Loss

Tiempo

minutos

Accuracy

Loss

5

Publica

8.45

0.8125

0.3720

9.60

0.6250

0.9628

10

Mix

13.83

0.9196

0.1946

15.75

0.6161

0.9620

20

Ecuador

7.85

0.9486

0.1367

8.75

0.8630

0.2611

Fuente: Elaboración propia, 2022.

3.2. Curva de aprendizaje

La precisión obtenida no refleja la confianza del modelo, se puede complementar el criterio con la curva de aprendizaje que muestra el comportamiento y la generalización de los modelos Vgg16 e InceptionV3. Mientras más alineados estén los parámetros, se puede decir que el modelo está realizando una mejor tarea de clasificación; en términos generales se puede decir que el modelo realiza una buena predicción; sin embargo, se evidenció que el modelo Vgg16 presenta un mejor ajuste para las tres categorías de data que se analizaron (ver Gráficos I, II, y III, para el modelo Vgg16; y Gráficos IV, V y VI, para el modelo InceptionV3).

Fuente: Elaboración propia, 2022.

Gráfico I: Curvas de aprendizaje Pública 5 Epoch - Vgg16 (Cuenta de Google Colab)

Fuente: Elaboración propia, 2022.

Gráfico II: Curva de aprendizaje Mix 10 EpochVgg16 (Cuenta de Google Colab)

Fuente: Elaboración propia, 2022.

Gráfico III: Curva de aprendizaje Ecuador 20 Epoch - Vgg16 (Cuenta de Google Colab)

Fuente: Elaboración propia, 2022.

Gráfico IV: Curvas de aprendizaje Pública 5 Epoch InceptionV3 (Cuenta de Google Colab)

Fuente: Elaboración propia, 2022.

Gráfico V: Curva de aprendizaje Mix 10 EpochInceptionV3 (Cuenta de Google Colab)

Fuente: Elaboración propia, 2022.

Gráfico VI: Curva de aprendizaje Ecuador 20 Epoch - InceptionV3 (Cuenta de Google Colab)

3.3. F1 Score

La métrica denominada F1 Score, se calcula en función de la precisión y el recall, por lo que es una medida apropiada sobre todo cuando hay un desbalance de datos, puesto que es un promedio entre estos dos parámetros. Para determinar qué modelo presentó el mejor desempeño se miden valores entre 0 y 1, tal como se muestra en la Tabla 3.

Tabla 3

Evaluación de resultados Modelo VGG16 e InceptionV3

No. Epochs

Fuente

Modelo Vgg16

Modelo InceptionV3

F1 Score

F1 Score

5

Publica

0.77

0.22

10

Mix

0.87

0.60

20

Ecuador

0.86

0.30

Fuente: Elaboración propia, 2022.

Como medida de evaluación final, se pudo determinar que el modelo Vgg16 obtuvo mejores precisiones en los tres conjuntos de datos y diferentes épocas en relación a InceptionV3; por el desequilibrio de datos una de las métricas que más peso aportó para le selección del modelo fue la F1 Score, en virtud que la distribución de las clases del conjunto de datos de entrenamiento era desigual, lo que significa que había un marcado desequilibrio en el número de instancias en las clases.

Considerando las otras métricas utilizadas se puede seleccionar con confianza que la utilización de la arquitectura Vgg16 es la que mejor se ajustó a los datos y fue capaz de generalizar las imágenes de rayos X de tórax en las tres categorías de imágenes que se emplearon para probar los modelos.

Para interactuar con los usuarios finales se optó por utilizar una aplicación web a través de un link en la que se sube la imagen que el modelo pre-entrenado clasificará como Normal o Covid-19, al ser un medio sencillo e intuitivo el usuario no tendrá problemas al momento de utilizarla. El concepto de una aplicación web está relacionado con la utilización de medios virtuales para el uso, procesamiento y almacenamiento de información, lo que Nievas y García (2020) llaman eSalud, por lo que resultan una gran alternativa por su escalabilidad, puesto que una misma aplicación puede ser utilizada por diferentes usuarios y se obtendrán los resultados que cada usuario espera conseguir.

La aplicación web proporcionada por Anvil Works es básicamente un programa que se almacena en un servidor remoto para conectarse con los usuarios a través de la interfaz de un navegador, que puede utilizarse desde un estación fija o un dispositivo móvil, con el objetivo que el usuario final pueda realizar tareas de manera rápida, gracias a que utilizan una arquitectura de tres capas, que está compuesta por la capa de datos, en la que se encuentra la base de datos; la capa del servidor web, en la que se aloja la aplicación; y la capa cliente, que conecta al usuario con la aplicación a través del browser.

Para que el código sea interactivo y asimilable para quienes no conocen de ciencia de datos, se colocó la interfaz web del block de notas de Google Colab en el que se ejecuta el algoritmo de clasificación y utilizando las funcionalidades de Anvil Works que trabaja utilizando Python, se logró desarrollar una aplicación para cargar y clasificar los rayos X de tórax para diagnóstico de Covid-19 (ver Figura II).

Fuente: Elaboración propia, 2022.

Figura II: Aplicación web para reconocimiento Neumonía Atípica con imágenes de rayos X de tórax (Cuenta Anvil)

El link que se desarrolló para la prueba de usuario está alojado en Anvil Works: https://UXRTM4AB6GXVZ3I4.anvil.app/N5HSHW3XJI3VYHTONY4RYE52, y fue probada por un licenciado en radiología y un médico general que trabajan en centros públicos y privados, llegando a la conclusión que el acceso a la información desde dispositivos móviles facilita el acceso rápido y sencillo a los datos desde cualquier lugar, así como pueden disponer de los elementos para establecer diagnósticos basados en información en tiempo real, mejorando la seguridad de la atención y con la facilidad de comprobar la evolución del paciente, sin necesidad de estar en el hospital o en consultorio. La prueba de usuario dio resultados positivos en virtud que las imágenes de rayos X que fueron cargadas por los médicos se clasificaron acertadamente; sin embargo, manifestaron que es necesario ampliar el reconocimiento a otras afecciones de pulmón para que el aplicativo resulte realmente funcional.

La presencia del Covid-19 es una enfermedad que a pesar de estar en camino al tercer año y aunque existe gran cantidad de investigaciones que se han realizado sobre las causas y consecuencias de esta pandemia, no llega a dejar de ocasionar perjuicios en varios aspectos, por lo que sigue dejando encrucijadas sobre todo en el área de la salud humana.

Una vez que se llega a contar con información clínica, de laboratorio de imagen sobre el virus, aparecen nuevas cepas que requieren que se siga fortaleciendo e investigando cada vez más sobre cómo se puede llegar a conocer mejor sobre su proceso infeccioso, el diagnóstico rápido y el tratamiento que debe darse a los infectados.

En este contexto es importante contar con sistemas que se puedan aplicar rápidamente y den resultados con un alto grado de fiabilidad, es así como en concordancia con lo que manifiesta Castillo (2021), se pudo demostrar que con la utilización de transfer learning se puede empezar desde cero y los recursos, así como el tiempo empleados para el entrenamiento de los modelos llega a ser más eficiente que al desarrollar modelos de aprendizaje para completar tareas complejas.

Existe mucha bibliografía en la que se han usado redes pre-entrenadas para procesamiento de imágenes, obteniendo buenos resultados como lo indica Wali (2021), con el uso de diferentes modelos para el reconocimiento de imágenes médicas entre los que destacan Vgg16 e InceptionV3.

Con Google Colab y su servidor de Jupyter, más la utilización de la red Vgg16, empleando diferentes épocas y combinaciones de imágenes se pudieron obtener resultados similares a los expuestos en los artículos relacionados en los que se recomienda el uso de esta red pre-entrenada.

Conclusiones

Las conclusiones a las que se llegó luego de la prueba y ajustes de los modelos se enmarcan en el objetivo planteado en el presente estudio. Esta investigación se desarrolló con la finalidad de poder aplicar las técnicas de Deep Learning para el reconocimiento y clasificación de imágenes de rayos X, para lo que se consiguió establecer tres conjuntos de datos, desde una base publica, que son las imágenes que se pueden conseguir fácilmente desde plataformas como Kaggle; una combinación de imágenes púbicas y privadas (Mix); y finalmente, poder disponer de una base de imágenes de rayos X de tórax de pacientes con Covid-19 de centros de salud ecuatorianos, que gracias al apoyo de las direcciones de los hospitales públicos a los que se solicitó la información, se logró contar con la base de datos para el entrenamiento y validación de las redes Vgg16 e InceptionV3.

La exploración de imágenes permitió identificar los tamaños y los formatos de las imágenes que no requirieron mayor procesamiento, además de la anonimización de datos de los pacientes, la clase de Keras ImageDataGenerator permito aplicar la técnica data augmentation que consintió optimizar la cantidad de imágenes de rayos X de tórax disponibles con la modificación de las imágenes originales, haciendo escalado, rotación, estiramiento, ensanchamiento, recorte, zoom y flip horizontal.

Se empelaron dos modelos para el diagnóstico de imágenes de rayos X de tórax e identificar la presunta presencia de Covid-19, es así como los resultados evidencian que el modelo Vgg16 fue superior a InceptionV3 llegando a una precisión del 94% con una pérdida del 14% a 20 Epoch en la base de datos de rayos X de fuentes ecuatorianas en 7.85 minutos de entrenamiento en relación con el 86% de precisión que dio como resultado la utilización de InceptionV3.

Gracias a la disponibilidad de tecnologías se pudo desarrollar una aplicación web para el uso del modelo que puede ejecutarse desde ordenador o dispositivos móviles, considerando que en muchos centros de salud se dispone de equipos que no permiten visualizar rápidamente las imágenes, esta alternativa es una ventaja para optimizar el tiempo de consulta, y la calidad de atención; sin embargo, es importante recalcar que el reconocimiento es solo un mecanismo coadyuvante al proceso de diagnóstico y debe completarse con la clínica y laboratorio como lo sugieren los radiólogos, así como especialistas que validaron la aplicación.

Referencias bibliográficas

Apostolopoulos, I. D., y Mpesiana, T. A. (2020). Covid-19: Automatic detection from X-ray images utilizing transfer learning with convolutional neural networks. Physical and Engineering Sciences in Medicine, 43(2), 635-640. https://doi.org/10.1007/s13246-020-00865-4

Arbeláez-Campillo, D. F., Villasmil, J. J., y Rojas-Bahamón, M. J. (2021). Inteligencia artificial y condición humana: ¿Entidades contrapuestas o fuerzas complementarias? Revista de Ciencias Sociales (Ve), XXVII(2), 502-513. https://doi.org/10.31876/rcs.v27i2.35937

Arizmendi, C. J. (2007). Técnicas de análisis del patrón repiratorio y cardiorrespiratorio para la extracción de índices en pacientes en proceso de extubación [Tesis doctoral, Universidad Politécnica de Cataluña].

Brownlee, J. (31 de mayo de 2019). A gentle introduction to Deep Learning for face recognition. Machine Learning Mastery. https://machinelearningmastery.com/introduction-to-deep-learning-for-face-recognition/

Castelli, V., y Bergman, L. D. (Eds.) (2005). Image Databases: Search and retrieval of digital imagery. Jonh Willey & Sons.

Castillo, D. (29 de junio de 2021). Transfer Learning for Machine Learning. Seldon. https://www.seldon.io/transfer-learning/#:~:text=Machine%20learning%20models%20designed%20to,be%20shared%20across%20different%20models

Coppin, B. (2004). Artificial Intelligence Iluminated. Jones and Bartlett Publishers.

Cortés, E., y Sánchez, S. (2021). Deep Learning Transfer with AlexNet for chest X-ray COVID-19 recognition. IEEE Latin America Transactions, 19(6), 944-951 https://doi.org/10.1109/TLA.2021.9451239

Delgado, K., Ledesma, S., y Rostro, H. (2019). Análisis de electroencefalograma usando redes neuronales artificiales. Acta Universitaria, 29, 1-24. https://doi.org/10.15174/au.2019.1672

Dhiman, G., Kumar, V. V., Kaur, A., y Sharma, A. (2021). DON: Deep Learning and Optimization-Based framework for detection of novel coronavirus disease using X-ray images. Interdisciplinary Sciences: Computational Life Sciences, 13(6), 260-272. https://doi.org/10.1007/s12539-021-00418-7

Ebrahimzadeh, S., Islam, N., Dawit, H., Salameh, J. P., Kazi, S., Fabiano, N., Treanor, L., Absi, M., Ahmad, F., Rooprai, P., Al Khalil, A., Harper, K., Kamra, N., Leeflang, M. M., Hooft, L., Van der Pol, C. B., Prager, R., Hare, S. S., Dennie, C.,… McInnes, M. D. (2021). Thoracic imaging tests for the diagnosis of COVID‐19. Cochrane Database of Systematic Reviews, (5), CD013639. https://doi.org/10.1002/14651858.CD013639.pub4

Fos, B. (2015). Diseño de técnicas de inteligencia artificial aplicadas a imágenes médicas de rayos x para la detección de estructuras anatómicas de los pulmones y sus alteraciones [Tesis de pregrado, Unicersidad Politécnica de Valéncia]. https://riunet.upv.es/handle/10251/70103

González, A. (3 de octubre de 2021). ¿Qué es Machine Learning? Cleverdata. https://cleverdata.io/que-es-machine-learning-big-data/

Grupo Atico34 (18 de junio de 2020). Inteligencia artificial: Definición, tipos y aplicaciones. Grupo Atico34. https://protecciondatos-lopd.com/empresas/inteligencia-artificial/

Handelman, G. S., Kok, H. K., Chandra, R. V., Razavi, A. H., Lee, M. J., y Asadi, H. (2018). eDoctor: Machine learning and the future of medicine. Journal of Internal Medicine, 284(6), 603-619. https://doi.org/10.1111/joim.12822

Khattak, M. I., Al-Hasan, M., Jan, A., Saleem, N., Verdú, E., y Khurshid, N. (2020). Automated detection of COVID-19 using Chest X-Ray Images and CT Scans through multilayer-spatial convolutional neural networks. International Journal of Interactive Multimedia and Artificial Intelligence, 6(6), 15-24. https://doi.org/10.9781/ijimai.2021.04.002

Liang, Y., Cai, Z., Yu, J., Han, Q., y Li, Y. (2018). Deep learning based inference of private information using embedded sensors in smart devices. IEEE Networ, 32(4), 8-14. https://doi.org/10.1109/MNET.2018.1700349

Maita-Cruz, Y. M., Flores-Sotelo, W. S., Maita-Cruz, Y. A., y Cotrina-Aliaga, J. C. (2022). Inteligencia artificial en la gestión pública en tiempos de Covid-19. Revista de Ciencias Sociales (Ve), XXVIII(E-5), 331-330. https://doi.org/10.31876/rcs.v28i.38167

Narin, A., Kaya, C., y Pamuk, Z. (2021). Automatic detection of coronavirus disease (COVID-19) using X-ray images and deep convolutional neural networks. Pattern Analysis and Applications, 24(3), 1207-1220. https://doi.org/10.1007/s10044-021-00984-y

Nievas, B. J., y García, S. (2020). eSalud, una respuesta social frente a la pandemia por Covid-19. Revista de Ciencias Sociales (Ve), XXVI(4), 23-27. https://doi.org/10.31876/rcs.v26i4.34643

Pan, S. J., y Yang, Q. (2010). A Survey on Transfer Learning. IEEE Transactions On Knowledge and Data Engineerin, 22(10), 1345-1359. https://doi.org/10.1109/TKDE.2009.191

Sait, U., Lal, G., Shivakumar, S., Kumar, T., Bhaumik, R., Prajapati, S., Bhalla, y Chakrapanif, A. (2021). A deep-learning based multimodal system for Covid-19 diagnosis using breathing sounds and chest X-ray images. Applied Soft Computing, 109, 107522. https://doi.org/10.1016/j.asoc.2021.107522

Salas, R. (2004). Redes Neuronales Artificiales. Universidad de Valparaíso.

Sethi, R., Mehrotra, M., y Sethi, D. (2020). Deep Learning based diagnosis recommendation for COVID-19 using Chest X-Rays Images. Second International Conference on Inventive Research in Computing Applications (ICIRCA). Coimbatore, India. https://doi.org/10.1109/ICIRCA48905.2020.9183278

Shibly, K. H., Dey, S. K., Tahzib-UlIslam, M., y Rahman, M. M. (2020). COVID faster R–CNN: A novel framework to Diagnose Novel Coronavirus Disease (COVID-19) in X-Ray images. Informatics in Medicine Unlocked, 20, 100405. https://doi.org/10.1016/j.imu.2020.100405