Descubrimiento basado en datos de péptidos antivirales frente a PRRSV utilizando múltiples modelos de aprendizaje automático
Yongheng Shen2
Panpan Sun1
Yaogui Sun1
Hua Zhang1
Jia Zhong1
Nairui Huo4*- 1Laboratorio Clave de Shanxi para la Modernización de TCVM, Facultad de Medicina Veterinaria, Universidad Agrícola de Shanxi, Taigu, Shanxi, China
- número arábigoFacultad de Recursos y Medio Ambiente, Universidad Agrícola de Shanxi, Taigu, Shanxi, China
- 3Centro de Animales de Laboratorio, Universidad Agrícola de Shanxi, Taigu, Shanxi, China
- 4Facultad de Medicina Veterinaria, Universidad Agrícola de Shanxi, Taigu, Shanxi, China
Introducción: La maquinaria celular se construye sobre proteínas y sus interrelaciones funcionales. Su evaluación de redes es esencial para una visión completa de los procesos biológicos y puede sentar una base para predecir la antivirulencia. Los péptidos antivirales (AVPs) tienen capacidades antivirulencias robustas y de amplio espectro. No obstante, la base de datos existente de AVPs predicha es insuficiente y requiere anotaciones más precisas y fiables. Este estudio tenía como objetivo detectar proteínas y péptidos expresados de forma diferencial de tejidos infectados por virus del síndrome reproductivo y respiratorio (PRRSV) sanos y porcinos, así como predecir los AVP utilizando métodos computacionales basados en aprendizaje automático y aprendizaje profundo.
Métodos: Se recogieron muestras de pulmones, intestino delgado e intestino grueso para validar y cuantificar proteínas y péptidos mediante proteómica, y luego se predijeron los AVPs mediante el uso de aprendizaje automático (ML) y aprendizaje profundo (DL). Se desarrollaron modelos que aprovechaban características significativas basadas en características fisicoquímicas, incluyendo composición de aminoácidos (CAA), estructura secundaria e hidrofilidad. El análisis proteómico facilitó la cualificación de péptidos mediante análisis GO, KEGG, COG y PPI. Para predecir AVPs, empleamos una red neuronal de grafos DL (GNN) haciendo su primera implicación en este ámbito y comparamos su eficacia frente a modelos tradicionales de ML de bosque aleatorio (RF) y máquinas de vectores de soporte (SVM).
Resultados: Los hallazgos demostraron que la lisina, arginina y leucina estaban clasificadas casi 0,1, lo que ponía de relieve su importancia significativa en la predicción. Además, el mapa de calor de correlación mostró que la lisina y el glutamato mostraron la asociación positiva más fuerte (0,57). El modelo RF alcanzó un área bajo la curva (AUC) de 0,95 ± 2, verificada mediante validación cruzada de 5 veces. En contraste, los modelos GNN y SVM ofrecieron 0,94 ± 1 AUC, demostrando un rendimiento comparable entre modelos, y revelaron que el modelo RF superó a los demás.
Discusión: La integración de la proteómica con la modelización computacional reveló péptidos con potencial antiviral frente al PRRSV. El modelo RF demostró el mejor poder discriminatorio, y la composición de aminoácidos desempeñó un papel predictivo clave. En consecuencia, estos resultados predictivos comparativos pueden servir como recursos revolucionarios y distintivos para la validación experimental e identificación de los AVPs de PRRSV como terapias prospectivas.
Trabajo completo aquí
Date de alta y recibe nuestro 👉🏼 Diario Digital AXÓN INFORMAVET ONE HEALTH
Date de alta y recibe nuestro 👉🏼 Boletín Digital de Foro Agro Ganadero
Noticias animales de compañía
Noticias animales de producción
Trabajos técnicos animales de producción
Trabajos técnicos animales de compañía

