Publicación: Reconocimiento de actividades en video utilizando un descriptor local de covarianza volumétrica
| dc.contributor.advisor | Martínez Carrillo, Fabio | |
| dc.contributor.author | Mendoza Casas, Oscar Mauricio | |
| dc.date.accessioned | 2024-03-04T00:45:41Z | |
| dc.date.available | 2020 | |
| dc.date.available | 2024-03-04T00:45:41Z | |
| dc.date.created | 2020 | |
| dc.date.issued | 2020 | |
| dc.description.abstract | La caracterización de acciones involucra reconocer gestos, actividades cotidianas e interacciones entre humanos, objetos o agentes presentes en un video. Sin embargo, esta caracterización es compleja debido a las múltiples variaciones de las acciones, el cambio de iluminación, la superposición de objetos, variaciones de movimiento, entre otros factores. Existen numerosos métodos que han sido propuestos para el reconocimiento y clasificación de acciones, tales como algoritmos densos de aprendizaje mediante redes convolucionales profundas. Estos trabajos son ampliamente analizados en imágenes, sin embargo, su extensión a un análisis volumétrico ha sido poco explorada. Además, estos trabajos requieren extensas bases de datos para aprender representaciones volumétricas y sus procesos de entrenamiento suelen ser redundantes y complejos. En el presente trabajo, se presenta un método computacional, el cual reconoce acciones a partir del modelamiento local de covarianzas, que resumen patrones densos convolucionales de forma local, usando un soporte temporal guiado por trayectorias de movimiento. Para ello, cada cuadro del video es descrito por un conjunto de activaciones de arquitecturas convolucionales pre-entrenadas. Las regiones salientes, que siguen trayectorias de movimiento, son utilizadas como entrada en las matrices de covarianza. Para el cálculo de la covarianza se utilizó una estrategia integral que permite permanecer eficientes en cuanto al costo computacional. Entonces, para cada secuencia se calculan M covarianzas locales, las cuales son representadas por K, K« M centroides, que conforman el descriptor de video. El método propuesto logro en la base de datos publica UT-Interaction, una exactitud de 83.3 %, una sensibilidad de 86.1 %, y una especificidad de 91.3% para su primer segmento, y para el segundo, una exactitud de 83.3 %, una sensibilidad de 83.3 %, y una especificidad de 96.4 %. | |
| dc.description.abstractenglish | Video action recognition involves recognizing gestures, everyday activities and interactions between humans, objects or agents present in a video. However, this characterization is complex due to the multiple variations of actions, the change of lighting, the overlapping of objects, variations of movement, among other factors. There are numerous methods that have been proposed for the recognition and classification of actions, such as dense learning algorithms using deep convolutional networks. These works are widely analyzed in images, however, their extension to a volumetric analysis has been little explored. In addition, these works require extensive databases to learn volumetric representations and their training processes are often redundant and complex. In the present work, a computational method is presented, which recognizes actions from local covariance modeling, which summarizes dense convolutional patterns locally, using a time support guided by motion paths. For this purpose, each frame in the video is described by a set of pre-trained convolutional architecture activations. The outgoing regions, which follow motion paths, are used as input to the covariance matrices. For the calculation of covariance, a comprehensive strategy was used to remain computationally cost efficient. Then, for each sequence, M local covariances are calculated, which are represented by K, K« M centroids, which conform the video descriptor. The proposed method achieved in the public database UT-Interaction, an accuracy of 83.3 %, a sensitivity of 86.1 %, and a specificity of 91.3% for its first segment, and for the second segment, an accuracy of 83.3 %, a sensitivity of 83.3 %, and a specificity of 96.4 %. | |
| dc.description.degreelevel | Pregrado | |
| dc.description.degreename | Ingeniero de Sistemas | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.instname | Universidad Industrial de Santander | |
| dc.identifier.reponame | Universidad Industrial de Santander | |
| dc.identifier.repourl | https://noesis.uis.edu.co | |
| dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/40398 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Industrial de Santander | |
| dc.publisher.faculty | Facultad de Ingenierías Fisicomecánicas | |
| dc.publisher.program | Ingeniería de Sistemas | |
| dc.publisher.school | Escuela de Ingeniería de Sistemas e Informática | |
| dc.rights | http://creativecommons.org/licenses/by/4.0/ | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
| dc.rights.license | Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc/4.0 | |
| dc.subject | Covarianza | |
| dc.subject | Reconocimiento De Acciones | |
| dc.subject | Trayectorias Densas. | |
| dc.subject.keyword | Covariance | |
| dc.subject.keyword | Action Recognition | |
| dc.subject.keyword | Dense Trajectories. | |
| dc.title | Reconocimiento de actividades en video utilizando un descriptor local de covarianza volumétrica | |
| dc.title.english | Video action recognition using a local volumetric covariance descriptor | |
| dc.type.coar | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
| dc.type.hasversion | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado | |
| dspace.entity.type | Publication |
Archivos
Bloque original
1 - 3 de 3
Cargando...
- Nombre:
- Carta de autorización.pdf
- Tamaño:
- 113.73 KB
- Formato:
- Adobe Portable Document Format
Cargando...
- Nombre:
- Nota de proyecto.pdf
- Tamaño:
- 210.59 KB
- Formato:
- Adobe Portable Document Format
