Identification of motifs in biological sequences using genetic programming
Velasco, Àlex
Serra-Sagristà, Joan, dir. (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Títol variant: Identificació de motius en seqüències biològiques mitjançant programació genètica
Títol variant: Identificación de motivos en secuencias biológicas mediante programación genética
Data: 2020
Resum: Current tools for motif discovery search patterns that are over-represented in DNA sequences but do not use DNA curvature or cofactors associated with the protein bind. We developed a tool that searches for motifs with a variable gap between patterns. The search is done using a genetic programming algorithm that searches for possible models that could be the motif and tries to fit them in a set of positive sequences with the motif against a control dataset. To evaluate the fitness of the organisms we have created an energy model for each component of the regulated bacterial promoters. The final genetic algorithm is able to find hidden motifs in synthetic sequences and real biological sequences.
Resum: Les eines actuals per al descobriment de motius busquen patrons que estan sobre-representats a les seqüències d'ADN, però no utilitzen la curvatura de l'ADN o cofactors associats a la unió de la proteïna. Hem desenvolupat una eina que busca motius amb un espaiador variable entre patrons. La cerca es fa mitjançant un algorisme de programació genètica que busca possibles models que podrien ser el motiu i intenta encaixar-los en un conjunt de seqüències positives que inclouen el motiu envers un conjunt de seqüències de control. Per avaluar l'encaix dels organismes hem creat un model d'energia per a cada component dels promotors reguladors bacterians. L'algorisme genètic final és capaç de trobar motius ocults a seqüències sintètiques i seqüències reals.
Resum: Las herramientas actuales para el descubrimiento de motivos buscan patrones que están sobrerepresentados en las secuencias de ADN, pero no usan la curvatura del ADN o cofactores asociados a la unión de la proteína. Hemos desarrollado una herramienta que busca motivos con un espaciado variable entre patrones. La búsqueda se hace mediante un algoritmo de programación genética que busca posibles modelos que podrían ser el motivo y los intenta encajar en un conjunto de secuencias positivas que incluyen el motivo contra un conjunto de secuencias de control. Para evaluar el encaje de los organismos, hemos creado un modelo de energía para cada componente de los promotores reguladores bacterianos. El algoritmo genético final es capaz de encontrar motivos ocultos en secuencias sintéticas y secuencias reales.
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Llengua: Anglès
Titulació: Grau en Enginyeria Informàtica [2502441]
Pla d'estudis: Enginyeria Informàtica [958]
Document: bachelorThesis ; Text
Àrea temàtica: Menció Tecnologies de la Informació
Matèria: Algorithm ; Binding site ; Biological motif ; Complexity control ; Framework ; Genetic programming ; Mutation operator ; Organism ; Placement ; Population ; PSSM recognizer ; Sequences ; Tree structure ; Algorisme ; Lloc d'unió ; Motiu biològic ; Control de la complexitat ; Entorn de treball ; Programació genètica ; Mutació ; Operador ; Organisme ; Posicionament ; Població ; Reconeixedor de pssm ; Seqüències ; Estructura en arbre ; Algoritmo ; Lugar de unión ; Motivo biológico ; Control de la complejidad ; Entorno de trabajo ; Programación genética ; Mutación ; Organismo ; Posicionamiento ; Población ; Reconocedor de pssm ; Secuencias ; Estructura en árbol



10 p, 975.2 KB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de Fi de Grau > Escola d'Enginyeria. TFG

 Registre creat el 2020-09-02, darrera modificació el 2020-11-09



   Favorit i Compartir