Descripción:
La computación ha logrado desarrollar diferentes herramientas con gran potencial que permiten a diversas áreas de aplicación descubrir conocimiento relevante que apoya la toma de decisiones es estos ámbitos. Un caso particular es la Biología, y específicamente, la especificación de motifs, los cuales permiten dar indicios sobre el comportamiento de organismos vivos. Este trabajo de tesis presenta el desarrollo de una plataforma computacional enfocada al descubrimiento de motifs utilizando algoritmos de minería de patrones frecuentes. Se propone el uso de este tipo de procedimientos debido a que consisten en buscar elementos recurrentes en grandes volúmenes de datos a través del manejo eficiente de estructuras de datos, reducción en el espacio de búsqueda o en el conteo de elementos. Para el desarrollo de la plataforma, se empleó una metodología que permitió una construcción gradual de ella, considerando cinco fases principales: Entrada de secuencias de ADN, Pre-procesamiento de datos, Análisis de datos biológicos, Estructuración de resultados y Despliegue de resultados. Para la creación de dicha plataforma, se utilizaron diferentes herramientas de codificación como HTML, CSS, JavaScript y Python. Con estas acciones se logró desarrollar una plataforma computacional web, la cual posee una interfaz sencilla, donde el usuario puede utilizar diferentes algoritmos para analizar de forma eficiente grupos de secuencias de ADN de alto volumen, con la finalidad de hallar sus respectivos patrones frecuentes y, posteriormente, el conjunto de motifs asociado a ese grupo de secuencias.
La obtención de patrones frecuentes en este trabajo se realiza implementando una mejora en su identificación dentro de un grupo de secuencias. Para la obtención de motifs, se propone en esta investigación una nueva forma de búsqueda, comprobando experimentalmente que obtiene más motifs que otras estrategias reportadas en la literatura, empleando un menor tiempo.