Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)Castillo Villar, JavierReyes Torres, Óscar MauricioFajardo Aríza, Carlos Augusto2024-03-0320162024-03-0320162016https://noesis.uis.edu.co/handle/20.500.14071/35646Nosotros proponemos una estrategia para reducir el impacto del cuello de botella Entrada/Salida en un cluster heterogéneo, en el contexto de las aplicaciones sísmicas. La estrategia está basada en un proceso de compresión/descompresión optimizado. La estrategia comprime los datos en campo, mientras son adquiridos, usando un algoritmo de compresión optimizado. Las operaciones de transferencia desde la memoria principal hasta la memoria del nodo son ejecutadas usando los datos comprimidos para reducir el tiempo de transferencia. La descompresión de los datos es ejecutada dentro del nodo antes de que el dato sea procesado. La estrategia se dise˜nó para dos tipos de clusters heterogeneos. El primer tipo de clíster usa GPUs y el segundo usa FPGAs. Por un lado, nuestros resultados muestran que las etapas secuenciales en el proceso de descompresión se convierten rápidamente en un cuello de botella en el cluster basado en GPUs. De otro lado, la implementación de la estrategia en un clíster basado en FPGAs, nos permitió proponer una arquitectura computacional específica, la cual se optimizó para las etapas secuenciales del proceso de descompresión. La implementación de nuestra estrategia en un cluster con FPGAs puede acelerar el proceso de transferencia hasta 10× para una relación de compresión de 16 : 1 y hasta 3× para una relación de compresión de 7 : 1. Por consiguiente, nuestra estrategia efectivamente reduce el impacto del cuello de botella de Entrada/Salida de datos y puede mejorar el rendimiento general de un cluster basado en FPGAs.application/pdfspahttp://creativecommons.org/licenses/by/4.0/CompresiónCuello De BotellaDatos SísmicosEntrada/SalidaFpgaGpuHpcHuffmanTransformación Wavelet.Seismic data compression to reduce the pcie bandwidth limitationUniversidad Industrial de SantanderTesis/Trabajo de grado - Monografía - DoctoradoUniversidad Industrial de Santanderhttps://noesis.uis.edu.coWe propose a strategy based on an optimized compression/decompression process to reduce the impact of the I/O bottleneck in a heterogeneous clusterusing seismic data as study case. Our strategy involves to compress the seismic data on-site while they are being acquired by a custom lossy compression algorithm. The transfer operationsfrom the disk to the node memoryare performed by using compressed data to reduce the I/O transfer time. Decompression occurs in the node before the data is processed. We designed the strategy for two types of clusters widely used in computationally intensive algorithmssuch as seismic applications. The first type of cluster is a GPU-based and the second one is an FPGA-based cluster. On the one handour results show that the use of a GPU-based cluster to perform the sequential stages of the decompression process generates a bottleneck because this architecture is not optimized for serial processes. On the other handthe implementation of the strategy in an FPGA-based cluster allows us to propose a custom architecturewhich is optimized for the sequential stages of the decompression process. This optimized architecture let us to overcome the bottleneck created by the sequential stages of the decompression process. Our results show that the speedup in the transfer process (including the decompression process) strongly depends on the compression ratio: as the compression ratio increasesthe speedup in the transfer process improves. The implementation of our strategy into an FPGA-based cluster can speed up the transfer operations up to 10× for a compression ratio of 16:1 and up to 3× for a compression ratio of 7:1. Thereforeour strategy effectively reduces the impact of the I/O bottleneck and can improve the cluster’s overall performance.Compression, Fpga, Gpu, Hpc, Huffman, Seismic Data, Wavelet Transform.info:eu-repo/semantics/openAccessAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)