Morales Ríos, Alejandro2023-09-152023-09-152023-06-14http://hdl.handle.net/10785/15651Proyecto de aplicación de conocimiento (Ingeniería en Sistemas y Telecomunicaciones), Facultad de Ciencias Básicas e Ingeniería, Pereira, 2023La Extracción Automática de Términos es una rama del Procesamiento de Lenguaje Natural (PLN) que emplea métodos lingüísticos y estadísticos para generar materiales lexicográficos por medio de la obtención computarizada de términos. Los materiales lexicográficos permiten el conocimiento riguroso de vocabulario, con esto se busca adquirir nuevos conceptos llamados también unidades léxicas. La literatura especializada resalta la importancia de crear bases comunes para la construcción de teorías unificadas carentes de ambigüedad y para desarrollarlas construyen recursos lexicográficos en forma de vocabularios, diccionarios, glosarios o tesauros. Sin embargo, crear recursos terminológicos manualmente es una tarea costosa en tiempo y dinero, siendo ineficaz debido a la sistematicidad de criterios y volúmenes de información. En este Proyecto de Grado se propone desarrollar una herramienta computacional que permita realizar extracción terminológica sobre literatura científica relacionada con Internet de las cosas (IoT). Se propone una solución mediante un algoritmo híbrido de extracción terminológica en un entorno web y móvil, para generar materiales lexicográficos de manera automática y eficiente, para ello se utiliza una arquitectura Orientada a Servicios (SOA-REST) con herramientas basadas en JavaScript, como React y React Native, así como las librerías NLTK, SpaCy y el framework Flask de Python. Se espera que la herramienta contribuya para la creación de un lenguaje común de términos que sirvan como base para la construcción unificada de teorías, así como contribuir con el modelado de buenas prácticas para la creación de Sistemas IoT. También cabe mencionar que, el trabajo aporta a uno de los objetivos en el marco de un proyecto de investigación en Tecnología IoT, el cual se lleva a cabo en la Universidad Católica de Pereira. Abstract: Automatic Term Extraction is a branch of Natural Language Processing (NLP) that employs linguistic and statistical methods to generate lexicographic materials by means of computerized term retrieval. The lexicographic materials allow the rigorousknowledge of vocabulary, with the aim of acquiring new concepts also called lexical units. The specialized literature highlights the importance of creating common bases for the construction of unified theories lacking ambiguity and to develop them are built lexicographic resources in the form of vocabularies, dictionaries, glossaries, or thesaurus. However, creating terminological resources manually is a costly and time consuming task, being inefficient due to the systematicity of criteria and volumes of information. In this Degree Project we propose to develop a computational tool to perform terminology extraction on scientific literature related to the Internet of Things (IoT). A solution is proposed through a hybrid terminology extraction algorithm in a web and mobile environment, to generate lexicographic materials automatically and efficiently, using a SOA-REST architecture with tools base on JavaScript, as React and React Native, besides NLTK, SpaCy libraries and the Python’s Flask framework. It is expected that the tool will contribute to the creation of a common language of terms that will serve as a basis for the unified construction of theories, as well as contribute to the modelling of good practices for the creation of IoT systems. It is also worth mentioning that the work contributes to one of the objectives within the framework of a research project on IoT Technology, which is development at Universidad Católica de Pereira.EspañolBuenas prácticasbest practicesDiccionario de términosTerm dictionaryExtracción automática de términosAutomatic term extractionInternet de las cosasInternet of thingsProcesamiento de lenguaje naturalNatural language processingDesarrollo de una Herramienta computacional que Permita Realizar Extracción terminológica sobre Literatura Científica en IOTThesis