RT info:eu-repo/semantics/doctoralThesis T1 Evaluación del rendimiento de metodologías univariantes, multivariantes y de aprendizaje automático en el análisis de variaciones genómicas T2 Performance assesment of univariate, multivariate and machine learning methodologies in genoma wide assocciation studies A1 Díez Díaz, Fidel A2 Medicina Preventiva K1 Medicina. Salud K1 Medicina preventiva K1 Ciencias biomédicas K1 Genética médica K1 Genomas K1 3210 Medicina Preventiva K1 3212 Salud pública K1 1203.04 Inteligencia artificial AB [ES] La asociación genética se puede definir como la ocurrencia simultánea de herencias o de características con una probabilidad superior a la que sería esperable por azar. El estudio de la asociación genética trata de identificar esas relaciones con el propósito de establecer un vínculo con un fenotipo observable, como, por ejemplo, una enfermedad, que puede aportar información acerca del mecanismo que lleva a la aparición de cierto rasgo. Además debe tenerse en cuenta que puede existir una asociación entre polimorfismo genéticos (existencia de dos o más variantes) bien por su proximidad física (ligadura genética) o debido al desequilibrio de ligamiento. En este proyecto de investigación se ha presentado y validado una nueva metodología que no solo sirven para la selección de los SNPs más relevantes dentro de cierto pathway previamente definido para la detección del rasgo objeto de interés, en este caso el cáncer colorrectal, sino que también podría emplearse como un método preliminar para la reducción dimensional del pathway analizado. Desde el punto de vista del autor, esta aplicación también podría ser de interés en un futuro. Los resultados obtenidos demuestran que es posible la construcción de nuevos algoritmos de análisis de pathways basado en técnicas de aprendizaje automático que consideren relaciones multivariadas entre todos los SNPs. En este proyecto de investigación se ha presentado una nueva metodología basada en técnicas de machine learning que no solo sirven para la selección de los SNPs más relevantes dentro de cierto pathway previamente definido para la detección del cáncer colorrectal, sino que se trata de una metodología que, por una parte, también podría emplearse como un método preliminar para la reducción dimensional del pathway analizado. Desde el punto de vista del autor, esta aplicación también podría ser de interés en un futuro. Tal y como se ha venido indicando a lo largo de todo el presente proyecto de investigación, aunque el algoritmo desarrollado se ha aplicado a una base de datos con casos y controles provenientes de un estudio de cáncer colorrectal, dicho algoritmo sería de aplicación a cualquier otro tipo de cáncer o rasgo que fuera de interés. Aunque desde un punto de vista biológico, en la actualidad resulta bastante difícil encontrar una relación directa entre parte de los SNPs seleccionados por los algoritmos propuestos con el cáncer, en nuestro entendimiento es de interés la colaboración de equipos interdisciplinares que puedan abordar este tipo de problemas desde diferentes puntos de vista, fundamentalmente desde la genética y aprendizaje automático. Así pues, aunque los algoritmos presentados superan a métodos anteriores con los que se comparan, también tiene algunas limitaciones, fundamentalmente relacionadas con la consideración del fenómeno de la epítasis que no ha sido tenido en cuenta, pues aumentaba de forma exponencial la complejidad del problema. Actualmente, los autores continúan desarrollando algoritmos híbridos que mejorarían los resultados de los algoritmos existentes de aplicación a los estudios de genoma amplio. LK https://hdl.handle.net/10612/17402 UL https://hdl.handle.net/10612/17402 NO Díez Díaz, F. (2023). Evaluación del rendimiento de metodologías univariantes, multivariantes y de aprendizaje automático en el análisis de variaciones genómicas. [Tesis doctoral, Universidad de León] NO 119 p. DS BULERIA. Repositorio Institucional de la Universidad de León RD 05-jun-2024