El desarrollo de esta tesis de grado buscó apoyar al investigador de la salud facilitándole el reconocimiento de entidades en los textos, la predicción de procesos biológicos, formulación de nuevas hipótesis, la extracción y representación del conocimiento con el fin de conocer y comprender las interacciones entre proteínas, para intentar crear modelos comprensibles a partir de información que se encuentra de manera no estructurada en millones de artículos científicos. En primer lugar se destacó la importancia de la minería de texto como herramienta que proporciona la comprensión y extracción de conocimiento de una gran red de interacciones de alta complejidad para el manejo humano. Posteriormente se implementaron herramientas de minería de texto para recopilar información en archivos de texto plano de las proteínas relacionadas con la proteína EVI-1, luego se evaluaron las herramientas comparándolas con un patrón proporcionado por el experto. Mediante un algoritmo aplicado a los archivos, se filtraron datos de interacciones para obtener una matriz de adyacencia que permitió crear la estructura de la red Bayesiana especificando las conexiones entre las proteínas. Este estudio permite hacer enfasis en la existencia de genes y proteínas que contribuyen a originar un cáncer, los cuales, en sus "versiones normales" regulan el crecimiento y la vida celular. Llegando a creer que muchos tumores son el resultado de una alteración mutagénica no reparada en el ADN situación que deriva en el cáncer. Este acercamiento con el área de la biología, que bien puede llamarse biología de sistemas, permitió unir campos que han trabajado separados, para reducir el coste en los procesos de investigación del Instituto de medicina molecular de la UIS, no sólo en lo relacionado con las interacciones entre proteínas sino también en otros trabajos de investigación.