Técnicas de minería de texto aplicadas para la identificación de grupos de patentes afines en la industria del cacao
dc.contributor.advisor | Talero Sarmiento, Leonardo Hernán | |
dc.contributor.advisor | Lamos Díaz, Henry | |
dc.contributor.advisor | Cárdenas Solano, Leidy Johanna | |
dc.contributor.author | Rodríguez Millán, Paola Milena | |
dc.date.accessioned | 2024-03-04T00:43:59Z | |
dc.date.available | 2020 | |
dc.date.available | 2024-03-04T00:43:59Z | |
dc.date.created | 2020 | |
dc.date.issued | 2020 | |
dc.description.abstract | En la última década el número de patentes ha aumentado cada vez más rápido, y la cantidad de información técnica contenida en ellas dificulta su análisis. Los documentos de patentes permiten la generación de grandes cantidades de datos no estructurados, que pueden procesarse con la ayuda de diferentes técnicas de minería de textos. Las bases de datos de patentes disponibles, a través de su interfaz, permite la inclusión y exclusión de aplicaciones estándar en las ecuaciones de búsqueda, posibilitando la extracción efectiva de los datos requeridos para el análisis, dando paso a la aplicación de herramientas automatizadas con el fin de identificar relaciones y tendencias que pueden mejorar la ventaja competitiva. El presente trabajo de investigación tiene como objetivo la identificación de grupos de patentes afines en la industria del cacao por medio de una minería de texto, donde se aplicó una metodología de agrupamiento de documentos no supervisada, basada en datos no estructurados para los que se lleva a cabo un preprocesamiento de los datos, luego se genera un corpus como espacio vectorial de los documentos de patentes, una representación de TF-IDF para finalmente aplicar la técnica de agrupamiento k-means, que permitió identificar relaciones entre las patentes y los grupos generados. | |
dc.description.abstractenglish | In the last decade the number of patents has increased faster and faster, and the amount of technical information contained in them makes their analysis difficult. Patent documents allow the generation of large amounts of unstructured data, which can be processed with the help of text mining techniques. The patent databases, through their interface, allows the inclusion and exclusion of standard applications in the search equations, enabling the effective extraction of the data required for the analysis, giving way to the application of automated tools in order to identify relationships and trends that can improve competitive advantage. The objective of this research work is to identify groups of related patents in the cocoa industry through text mining, where an unsupervised document grouping methodology was applied, based on unstructured data for which it is carried out. carry out a preprocessing of the data, then a corpus is generated as a vector space of the patent documents, a representation of TF-IDF to finally apply the k-means grouping technique, which seeks to identify relationships between the patents and the generated groups. | |
dc.description.degreelevel | Pregrado | |
dc.description.degreename | Ingeniero Industrial | |
dc.format.mimetype | application/pdf | |
dc.identifier.instname | Universidad Industrial de Santander | |
dc.identifier.reponame | Universidad Industrial de Santander | |
dc.identifier.repourl | https://noesis.uis.edu.co | |
dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/40226 | |
dc.language.iso | spa | |
dc.publisher | Universidad Industrial de Santander | |
dc.publisher.faculty | Facultad de Ingenierías Fisicomecánicas | |
dc.publisher.program | Ingeniería Industrial | |
dc.publisher.school | Escuela de Estudios Industriales y Empresariales | |
dc.rights | http://creativecommons.org/licenses/by/4.0/ | |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
dc.rights.license | Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc/4.0 | |
dc.subject | Minería de Texto | |
dc.subject | Análisis de Patentes | |
dc.subject | K-means | |
dc.subject | Cacao. | |
dc.subject.keyword | Text Mining | |
dc.subject.keyword | Patent Analysis | |
dc.subject.keyword | K-means | |
dc.subject.keyword | Cocoa. | |
dc.title | Técnicas de minería de texto aplicadas para la identificación de grupos de patentes afines en la industria del cacao | |
dc.title.english | Text mining techniques applied to identify groups of related patents in the cocoa industry* | |
dc.type.coar | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
dc.type.hasversion | http://purl.org/coar/resource_type/c_7a1f | |
dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado |
Files
Original bundle
1 - 3 of 3
No Thumbnail Available
- Name:
- Carta de autorización.pdf
- Size:
- 120.49 KB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- Nota de proyecto.pdf
- Size:
- 54.67 KB
- Format:
- Adobe Portable Document Format