Diseño de matrices MALDI TE asistido por Inteligencia Artificial (IA) a partir de información teórico/experimental

dc.contributor.advisorBlanco Tirado, Cristian
dc.contributor.advisorCombariza Montañez, Marianny Yajaira
dc.contributor.advisorCombariza Montañez, Aldo Fabrizzio
dc.contributor.advisorDíaz Sánchez, Luis Miguel
dc.contributor.authorPadilla Jaramillo, Carlos Andrés
dc.contributor.evaluatorMejía Ospino, Enrique
dc.contributor.evaluatorDoerr, Markus Hans Oliver
dc.date.accessioned2024-11-29T15:46:59Z
dc.date.available2024-11-29T15:46:59Z
dc.date.created2024-11-01
dc.date.issued2024-11-01
dc.description.abstractEl desarrollo de matrices para la espectrometría de masas por desorción/ionización láser asistida por matriz (MALDI MS) ha dependido tradicionalmente de esfuerzos experimentales. Aquí, proponemos un modelo generativo de inteligencia artificial orientado a objetivos, impulsado por datos calculados de química computacional, para construir un espacio químico optimizado para procesos de Transferencia Electrónica (ET) en el análisis MALDI. Utilizamos un grupo de 30 matrices de ET reportadas, sometidas a enumeración estructural y predicción de propiedades moleculares mediante cálculos semiempíricos y ab initio, para establecer una base de datos integral que comprende diversos datos estructurales y de propiedades. Posteriormente, empleando un protocolo de enumeración estructural con 68 SMILES canónicos de fragmentos de Bemis-Murcko (BM), expandimos la complejidad estructural de la biblioteca inicial. Este proceso generó 82,753 compuestos organizados en 10 niveles de andamios, con un índice p50 de la curva de Recuperación de Sistemas Cíclicos (CSR) de andamios del 50%. De la biblioteca enumerada resultante, se seleccionó un subconjunto diverso de estructuras utilizando el método de agrupamiento de Jarvis-Patrick. Estas estructuras, junto con sus propiedades asociadas medidas a partir de datos de mecánica cuántica y experimentales, se utilizaron para entrenar un modelo de Aprendizaje Automático (ML) para predecir los valores de energía de ionización (Ei). Posteriormente, se entrenó una Red Neuronal de Puntuación (SNN), acoplada a nuestro modelo generativo orientado a objetivos utilizando Redes Neuronales Recurrentes (RNN) con arquitecturas de Aprendizaje Profundo (DL). El modelo generativo fue guiado utilizando una red previa dentro de un entorno de Aprendizaje por Refuerzo/Transferencia. El modelo generativo final de IA aprendió que las estructuras con alta insaturación, relaciones H/C inferiores a 1 y pesos moleculares entre 100 u y 300 u son favorables para las matrices ET MALDI, así como aquellas con pocos anillos aromáticos y cero anillos alifáticos. También se favorecieron otras características moleculares. La biblioteca generada por IA resultante exhibe valores de Ei superiores a 8.0 eV, similares a los de las matrices ET MALDI “buenas” reportadas, lo que indica un diseño exitoso con altos puntajes de accesibilidad de síntesis. En conclusión, nuestro modelo generativo proporcionó valiosas ideas sobre las características moleculares ideales para los compuestos ET MALDI, al tiempo que generó una amplia gama de moléculas estructuralmente diversas dentro de un espacio de propiedades moleculares similar. El siguiente paso crítico en este proceso es sintetizar una selección de estos compuestos generados para validación experimental y caracterización adicional.
dc.description.abstractenglishThe development of matrices for Matrix-Assisted Laser Desorption/Ionization Mass Spectrometry (MALDI MS) has traditionally relied on experimental efforts. Here, we propose a Goal-Directed artificial intelligence generative model, fueled by computational chemistry calculated data, to construct a chemical space optimized for Electron Transfer (ET) processes in MALDI analysis. We utilized a group of 30 reported ET matrices, subjected to structural enumeration and molecular properties prediction using semiempirical and ab initio calculations, to establish a comprehensive database comprising diverse structural and property data. Subsequently, employing a protocol of structural enumeration with 68 canonical SMILES of Bemis-Murcko (BM) fragments, we expanded the structural complexity of the initial library. This process generated 82753 compounds organized into 10 scaffold levels, with a p50 index from the Cyclic System Retrieval (CSR) curve of scaffolds of 50%. From the resulting enumerated library, a diverse subset of structures was selected using the Jarvis-Patrick clustering method. These structures, along with their associated properties measured from quantum mechanics and experimental data, were used to train a Machine Learning (ML) model to predict ionization energy (Ei) values. Subsequently, a Scoring Neural Network (SNN), coupled with our Goal-Directed generative model using Recurrent Neural Network (RNN) with Deep Learning (DL) architectures, was trained. The generative model was guided using a prior network within a Reinforcement/Transfer Learning environment. The final AI-generative model learned that structures with high unsaturation, H/C ratios under 1, and molecular weights between 100 u and 300 u are favorable for ET MALDI matrices, as well as those with few aromatic rings and zero aliphatic rings. Other molecular features were also favored. The resulting AI-generated library exhibits Ei values over 8.0 eV, akin to those of reported “good” ET MALDI matrices, indicating successful design with high synthesis accessibility scores. In conclusion, our generative model provided valuable insights into the molecular features ideal for ET MALDI compounds while generating a wide range of structurally diverse molecules within a similar molecular property space. The next critical step in this process is to synthesize a selection of these generated compounds for experimental validation and further characterization.
dc.description.cvlachttps://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000152656
dc.description.degreelevelMaestría
dc.description.degreenameMagíster en Química
dc.description.googlescholarhttps://scholar.google.com/citations?user=0DHkpFkAAAAJ&hl=en
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/44855
dc.language.isoeng
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ciencias
dc.publisher.programMaestría en Química
dc.publisher.schoolEscuela de Química
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAtribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO)
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectDiseño Racional
dc.subjectMALDI MS
dc.subjectInteligencia Artificial
dc.subjectMecánica Cuántica
dc.subject.keywordRational Design
dc.subject.keywordMALDI MS
dc.subject.keywordArtificial Intelligence
dc.subject.keywordQuantum Mechanics
dc.titleDiseño de matrices MALDI TE asistido por Inteligencia Artificial (IA) a partir de información teórico/experimental
dc.title.englishDesign of ET MALDI matrices assisted by Artificial Intelligence (AI) from Theoretical and Empirical data
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.hasversionhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.localTesis/Trabajo de grado - Monografía - Maestría
Files
Original bundle
Now showing 1 - 3 of 3
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
566.09 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
257.35 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Documento.pdf
Size:
2 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
2.18 KB
Format:
Item-specific license agreed to upon submission
Description: