Avances Iniciales en la Identificación de la Técnica NLP Adecuada para Evaluación de Contenidos en Conversaciones Textuales de Personas Contagiadas por Sars-Cov-2
DOI:
https://doi.org/10.53591/easi.v2i3.2488Palabras clave:
Python, Google Collab, NLP, LSTMResumen
El Covid-19 se convirtió en pandemia en el 2020, generando la necesidad urgente de información fiable, se crearon Asistentes Virtuales que enseñasen al público cómo evitarlos en la variante Alfa. Pero nuevas variantes Beta, Delta y Ómicron surgieron con síntomas diferentes, provocando nuevas oleadas de infecciones y muertes. Para hacer frente a esto, se creó un prototipo de Procesamiento del Lenguaje Natural (NLP) que permita analizar las experiencias de 4.422 personas que se infectaron en Ecuador, detectando los síntomas más comunes mencionados en sus conversaciones. Este estudio impulsó la creación del prototipo NLP, empleando lenguaje Python, la plataforma Google Collab, se consideraron dos combinaciones de técnicas NLP, se realizó la medición de resultados mediante métricas de calidad, precisión, Recall, F1, encontrando que la combinación más adecuada de técnicas de las dos probadas la que dio más alta efectividad para un modelo clasificador Multietiqueta, incluyo Stop Word, Tokenización, Stemming con clasificador LSTM (Long Short-Term Memory), como primer avance del estudio.
Citas
Attal, M. (Diciembre de 2021). Mapeo de incrustaciones de Word con Word2vec. https://datascientest.com/es/nlp-natural-language-processing-introduccion
Bonilla, G. J. (Mayo de 2020). Las dos caras de la educación en el Covid-19. Cuestiones de Administración, 9(2). https://doi.org/10.33210/ca.v9i2.294 Brownlee, J. (Octubre de 2017). Machine Learning Mastery. https://machinelearningmastery.com/gentle-introduction-bag-words-model/
Campos, C. (Febrero de 2020). Fases del proceso de investigación científica y elementos de la investigación cuantitativa y cualitativa. https://www.scribd.com/document/447304281/Actividad-N-02-Fases-del-proyecto-de-Investigacion-Cientifica-inv-cualitativa-y-cuantitativa
Chen, P. H. (Septiembre de 2019). Essential Elements of Natural Language Processing: What the Radiologist Should Know. Academic Radiology. https://doi.org/10.1016/j.acra.2019.08.010 Coronel y Pérez (Abril de 2020). Covid-19 y efectos. https://www.coronelyperez.com/2020/04/23/la-crisis-ocasionada-por-el-covid-19-y-sus-implicaciones-legales-en-el-ecuador/
Haleem, RV. (Agosto de 2020). Artificial Intelligence (AI) applications for COVID-19 pandemic. Diabetes & Metabolic Syndrome: Clinical Research & Reviews, 14(4), 337-339. https://doi.org/10.1016/j.dsx.2020.04.012
Instituto Nacional de Estadística y Censos (INEC). (2023). Encuesta de salud y nutrición (ENSANUT). Recuperado de https://www.ecuadorencifras.gob.ec/encuesta-de-salud-y-nutricion-ensanut/ Johnson, D. (Enero de 2022). What is Natural Language Processing?. https://www.guru99.com/nlp-tutorial.html
Kohlbacher, F. (2006). The use of qualitative content analysis in case study research. Forum Qualitative Sozialforschung / Forum: Qualitative Social Research, 7(1), Art. 21. Recuperado de http://www.qualitative-research.net/index.php/fqs/article/view/75/153
Labarthe, S. (2020). ¿Qué pasa en Ecuador?. https://www.nuso.org/articulo/que-pasa-en-ecuador/
LIMA, A. (2021). PNL CÓMO FUNCIONA LA TOKENIZACIÓN DE TEXTO, ORACIONES Y PALABRAS. https://es.acervolima.com/pnl-como-funciona-la-tokenizacion-de-texto-oraciones-y-palabras/
León, E. (Diciembre de 2020). Procesamiento del lenguaje natural (PLN) con Python. Baoss Analytics Everywhere. https://www.baoss.es/procesamiento-del-lenguaje-natural-pln-con-python López, I. P. (2018). Análisis comparativo de algoritmos de Deep Learning para la clasificación de textos. https://e-archivo.uc3m.es/bitstream/handle/10016/29209/TFG_Ivan_Lopez_Pacheco_2018.pdf?sequence=1 Microsoft. (2021). Tecnología de procesamiento de lenguaje natural. https://docs.microsoft.com/es-es/azure/architecture/data-guide/technology-choices/natural-language-processing
Ministerio De Salud Pública. (Marzo de 2020). Informe De Situación Covid-19 Ecuador. https://www.gestionderiesgos.gob.ec/wp-content/uploads/2020/03/informe-de-situaci%c3%b3n-no008-casos-coronavirus-ecuador-16032020-20h00.pdf
OMS. (Marzo de 2020). La OMS caracteriza a COVID-19 como una pandemia. Recuperado de https://www.paho.org/es/noticias/11-3-2020-oms-caracteriza-covid-19-como-pandemia
Pedregosa, F., Varoquaux, G. & Gramfort, et al. (2011). Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research, 12, 2825—2830. https://scikit-learn.org/stable/modules/multiclass.html
Pham, B. (Febrero de 2020). Parts of Speech Tagging: Rule-Based. Computer and Information Sciences Undergraduate. https://digitalcommons.harrisburgu.edu/cgi/viewcontent.cgi?article=1001&context=cisc_student-coursework
QuestionPro. (Noviembre de 2019). ¿Qué es la investigación cualitativa?. https://www.questionpro.com/es/investigacion-cualitativa.html
Sitiobigdata. (Agosto de 2018). Mejora de incrustaciones de Word con Word2Vec. https://sitiobigdata.com/2018/08/24/mapeo-de-incrustaciones-de-word-con-word2vec/# Solis, L. D. (Febrero de 2020). La entrevista en la investigación cualitativa. https://investigaliacr.com/investigacion/la-entrevista-en-la-investigacion-cualitativa/#:~:text=La%20entrevista%20en%20la%20investigaci%C3%B3n%20cualitativa%20es%20una%20t%C3%A9cnica%20para,a%20prop%C3%B3sitos%20concretos%20del%20estudio.&text=La%20entrev
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2023 Ivan L. Acosta-Guzmán, Eleanor A. Varela-Tapia, Alexandra E. Piza-Guale, Nory X. Acosta-Guzmán, Christopher I. Acosta Varela
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.
Las contribuciones publicadas en la revista EASI se rigen por la licencia de acceso abierto CC BY-NC-ND 4.0 (Creative Commons Reconocimiento-NoComercial-SinDerivadas 4.0). Esta licencia te empodera como autor, y garantiza la amplia difusión de tu investigación mientras protege tus derechos.
Para autores:
- Los autores pueden reproducir y distribuir la obra en cualquier formato no comercial, siempre que la obra indique los autores y datos de la revista EASI, y no contravenga los puntos mencionados en el apartado de los permisos y prácticas editoriales.
- La revista obtiene una licencia para publicar y distribuir el manuscrito original.
Para lectores/usuarios:
Acceso y distribución gratuita: cualquier lector o usuario puede acceder, descargar, copiar, imprimir y compartir el artículo publicado libremente según los términos de la licencia CC BY-NC-ND 4.0.
Reconocimiento obligatorio: si un tercero utiliza el material publicado, debe dar crédito al creador proporcionando el nombre, el título del artículo y el nombre de la revista, lo que garantiza la propiedad intelectual del autor(es) y ayuda a construir su reputación académica.
Uso no comercial: solo se permite el uso no comercial del trabajo publicado. No comercial significa que no está destinado principalmente ni dirigido al aprovechamiento comercial o la compensación monetaria por parte de ningún tercero.
No se permiten modificaciones: el contenido del artículo publicado no se puede cambiar, mezclar o reconstruir a partir del trabajo del autor. Esto asegura la integridad y precisión de los resultados de la investigación.