Medición del desempeño de un algoritmo de inversión de onda completa (fwi) 2d acústica con densidad constante, implementado sobre una unidad de procesamiento grafico (gpu)

Abstract
El siguiente trabajo de investigación presenta una propuesta enfocada en realizar un análisis y mejora de desempe˜no de un algoritmo de inversión de onda completa (FWI, por sus siglas en inglés) 2D acística con densidad constante, implementado sobre una unidad de procesamiento gráfico (GPU, por sus siglas en inglés), específicamente en una Nvidia GeForce GTX 970. Entiéndase como mejora una disminución del tiempo de ejecución, disminución de los requerimientos de memoria y una mejor utilización de los recursos de la GPU (ocupación). El lenguaje de programación usado es CUDA-C, una variación del lenguaje C que permite implementar funciones especiales llamadas kernels que son ejecutadas en la GPU mientras que el código principal es ejecutado en la unidad de procesamiento central (CPU, por sus siglas en inglés), en pocas palabras, la GPU actía como un co-procesador del procesador central. En el análisis de desempe˜no se utilizan algunas herramientas de software y Hardware creadas por los desarrolladores de Nvidia, estas herramientas permiten obtener datos de desempe˜no del algoritmo (métricas), registrar actividades específicas, visualizar líneas de tiempo de las actividades de la CPU y GPU, entre otras. Todas, adquiridas durante tiempo de ejecución. El trabajo realizado se basó en un proceso de cuatro etapas, evaluación, paralelización, optimización e implementación (APOD, por sus siglas en ingles), se hicieron varias iteraciones en las cuales se hacia un peque˜no análisis, una propuesta de implementación y una breve evaluación de los resultados obtenidos.
Description
Keywords
Inversión De Onda Completa, Métrica, Optimización, Cuda-C, Unidad De Procesamiento Gráfico, Ocupación, Apod.
Citation