tut. (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions)
| Títol variant: |
Estudi de la curvatura del DNA en la regulació genètica |
| Títol variant: |
Estudio de la curvatura del ADN en la regulación genética |
| Data: |
2025 |
| Resum: |
Identificar amb precisió els llocs d'unió dels factors de transcripció (TFBS) és un repte fonamental en biologia computacional. Mentre que els mètodes tradicionals es basen en gran mesura en la seqüència de nucleòtids, investigacions recents suggereixen que les característiques estructurals de l'ADN, com la curvatura, també poden tenir un paper clau en el reconeixement dels factors de transcripció (TF). Aquest estudi explora la contribució de la curvatura de l'ADN en la regulació de l'expressió gènica bacteriana analitzant la seva conservació a través de les regions TFBS i avaluant la seva utilitat en models de classificació binària. Utilitzant xarxes neuronals convolucionals (CNN), avaluem els perfils de curvatura per a TFBS validats experimentalment de dos factors de transcripció, NAC i Crp, en Escherichia coli. Els resultats mostren que la curvatura és una característica conservada i amb informació per als llocs d'unió de Crp, mentre que la seva contribució és mínima per a NAC. Tot i que els models entrenats només amb curvatura van aconseguir un rendiment modest, la incorporació de la curvatura amb informació de la seqüència de nucleòtids va conduir a petites però consistents millores, especialment en condicions. |
| Resum: |
La identificación precisa de los sitios de unión de factores de transcripción (TFBS) es un desafío fundamental en biología computacional. Si bien los métodos tradicionales se basan en gran medida en la secuencia de nucleótidos, investigaciones recientes sugieren que las características estructurales del ADN, como la curvatura, también pueden desempeñar un papel clave en el reconocimiento de factores de transcripción (FT). Este estudio explora la contribución de la curvatura del ADN en la regulación de la expresión génica bacteriana mediante el análisis de su conservación en las regiones TFBS y la evaluación de su utilidad en modelos de clasificación binaria. Mediante redes neuronales convolucionales (CNN), evaluamos los perfiles de curvatura para TFBS validados experimentalmente de dos factores de transcripción, NAC y Crp, en Escherichia coli. Los resultados muestran que la curvatura es una característica conservada e informativa para los sitios de unión de Crp, mientras que su contribución es mínima para NAC. Si bien los modelos entrenados solo con curvatura lograron un rendimiento moderado, la incorporación de la curvatura con información de la secuencia de nucleótidos condujo a mejoras pequeñas pero consistentes, especialmente en condiciones desequilibradas. Estos hallazgos resaltan la relevancia de las características estructurales del ADN y respaldan la investigación adicional sobre su integración para la predicción de TFBS. |
| Resum: |
Accurately identifying transcription factor binding sites (TFBS) is a fundamental challenge in computational biology. While traditional methods rely heavily on sequence motifs, recent research suggests that DNA structural features, such as curvature, may also play a key role in transcription factor (TF) recognition. This study explores the contribution of DNA curvature in the regulation of bacterial gene expression by analyzing its conservation across TFBS regions and evaluating its utility in binary classification models. Using convolutional neural networks (CNNs), we assess curvature profiles for experimentally validated TFBSs of two transcription factors, NAC and Crp, in Escherichia coli. Results show that curvature is a conserved and informative feature for Crp binding sites, while its contribution is minimal for NAC. Although models trained with curvature alone achieved modest performance, incorporating curvature with nucleotide sequence information led to small yet consistent improvements, especially under imbalanced conditions. These findings highlight the relevance of structural DNA features and support further investigation into their integration for TFBS prediction. |
| Drets: |
Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades.  |
| Llengua: |
Anglès |
| Titulació: |
Enginyeria Informàtica [2502441] |
| Pla d'estudis: |
Enginyeria Informàtica [958] |
| Document: |
Treball final de grau ; Text |
| Àrea temàtica: |
Menció Computació |
| Matèria: |
Bioinformàtica ;
Xarxes neuronals convolucionals ;
Regulació gènica ;
Aprenentatge computacional ;
Identificació de motius ;
Factors de transcripció ;
Bioinformática ;
Redes neuronales convolucionales ;
Regulación Génica ;
Aprendizaje computacional ;
Identificación de motivos ;
Factores de transcripción ;
Bioinformatics ;
Convolutional neural networks ;
Gene regulation ;
Machine learning ;
Motif identification ;
Transcription factors |