病毒学报

2021, v.37(02) 309-317

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

基于Web服务的流感病毒基因组自动化翻译注释系统
Construction of an Automatic Translation and Annotation System for Influenza Virus Genomes Based on an Internet Service

陈翠霞;杨磊;蒋太交;王小龙;曹宗富;李天君;于磊;高华方;马旭;

摘要(Abstract):

随着流感病毒基因组测序数据的急剧增加,深入挖掘流感病毒基因组大数据蕴含的生物学信息成为研究热点。基于中国流感病毒流行特征数据,建设一个集自动化、一体化和信息化的序列库系统,对于实现流感病毒基因组批量快速翻译、注释、存储、查询、分析具有重要的应用价值。本课题组通过集成一系列软件和工具包,并结合自主研发的其他功能,在底层维护的2个关键的参考数据集基础上另外追加了翻译注释信息最佳匹配的精细化筛选规则,构建具有流感病毒基因组信息存储、自动化翻译、蛋白序列精准注释、同源序列比对和进化树分析等功能的自动化系统。结果显示,通过Web端输入fasta格式的流感病毒基因序列,本系统可针对参考序列片段数据集(blastdb.fasta)进行Blast同源性检索,可以鉴定流感病毒的型别(A、B或C)、亚型和基因片段(1~8片段);在此基础上,通过查询数据库底层用于翻译、注释的基因片段参考数据集,可以获得一组肽段数据集,然后通过循环调用ProSplign软件对其进行预测。结合精细化的筛选准入规则,选出与输入序列匹配最好的翻译后产物,作为该输入序列的预测蛋白,输出为gbk,asn和fasta等通用格式的文件,给出序列长度、是否全长、病毒型别、亚型、片段等信息。基于以上工作,另外自主研发了系统其他的附加功能如进化树分析展示、基因组数据存储等功能,构建成基于Web服务的流感病毒基因组自动化翻译注释系统。本研究提示,系统高度集成系列软件以及自有的注释翻译数据库文件,实现从序列存储、翻译、注释到序列分析和展示的功能,可全面满足我国高通量基因检测数据共享化、本土化、一体化、自动化的需求。

关键词(KeyWords): 流感病毒;关键数据集;翻译;注释;一体化序列库

Abstract:

Keywords:

基金项目(Foundation): “十三五”国家重点研发计划(项目号:2016YFC1000307),题目:生殖遗传资源和生殖健康大数据平台建设与应用示范;; 中央公益性科研机构基础研究基金(项目号:2018GJM06),题目:HPV病毒基因组学分析与毒力、耐药性研究;中央公益性科研机构基础研究基金(项目号:2020GJM05),题目:单基因病名称机器学习智能精准推荐技术研发;; 国家人口与生殖健康科学数据中心(项目号:2005DKA32408),题目:复杂遗传病远程协同服务网~~

作者(Author): 陈翠霞;杨磊;蒋太交;王小龙;曹宗富;李天君;于磊;高华方;马旭;

Email:

DOI: 10.13242/j.cnki.bingduxuebao.003909

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享