最近,洛斯阿拉莫斯国家实验室(LosAlamosNationalLaboratory)发布了强大的、屡获殊荣的生物信息学软件Sequedex的更新版本,现在该软件能够辨认来自病毒和生命树所有部分的DNA,从而可解决各种各样的问题,例如鉴定病原体引发的疾病、为癌症医治选择治疗靶点、在卫生保健专业人员、研究人员等相对容易到达的范围内优化藻场产量。
LosAlamos国家实验室理论生物学和生物物理学小组科学家BenMcmahon称:“作为我们测试的1部分,我们使用Sequedex辨认非洲1位合作者临床血样中的病毒序列。经过1个下午,该软件已发现了1种致命的狂犬病毒,如果使用传统方法这将需要几周的时间。现在,Sequedex软件可以在每百万水平上辨认测序样本中病毒和真菌的序列。”
Sequedex的新版本V1,可辨认短DNA序列中的模式,然后将这些序列与系统产生——样本在生命进化树上的定位——和片断功能联系起来。从进化的角度而言,加速疾病和癌症治疗靶点检测的软件,“生命之树”代表现代物种与其共同先人之间的遗传差异。基于DNA模式的辨认,该软件可创建结果的数据库。
Sequedex分类片断的速度比传统方法快250,000倍。利用Sequedex,1台笔记本电脑可以比现有产生DNA序列的的DNA测序仪更快地分析DNA序列,加速疾病和癌症治疗靶点检测的软件。LosAlamos研究人员设计了1种软件来进行生物信息学分析,而无需生物信息学者来进行计算和解释结果。
Sequedex可以Web阅读器搜索的相同方式,在DNA序列集合中分析系统产生和功能。例如,在Google中,输入搜索关键词plumber、Smith和Chicago,你可能搜索到芝加哥1名叫Smith的水电工;一样,Sequedex使用之前已分类基因组产生的检索词名单,将系统产生和功能与DNA序列联系起来。Sequedex所产生的检索词被进化而选择,在这类意义上,它们必须存在于多个基因组中。每个检索词也与生命之树的1个分支、和1组或多个生物功能有关。
例如,在每一个氨基酸每个字母的1个代码中,蛋白质模式“CVELAHEIRS”存在于人类和小鼠中,所以Sequedex将其与系统分类的脊索动物联系起来,人类和小鼠都属于此类。在人类中,CVELAHEIRS存在于被归类为“RegulatorofG-proteinSignaling"(orRGSforshort)”的蛋白质中,所以Sequedex也与具有RGS功能的检索词有关。当Sequedex在1段DNA序列(通过遗传密码翻译成蛋白质序列)中发现CVEHLAHEIRS时,它能够辨认可能来自于脊索动物RGS的序列。
在1段DNA中随机偶然发现CVELAHEIRS的可能性很小,所以,即便当搜索词来自于Sequedex其实不了解的1个生物体(例如耗牛、杀人鲸和裸鼹鼠,目前都不在Sequedex数据库里,但是它们基因组中都有CVELAHEIRS)时,该软件依然有很大的可能性做出正确的谱系和功能鉴定。
Sequedex有望用于辨认临床样本中的感染病;表征人体内被其他生物共享的空间,和这些所谓的微生物组如何与疾病或健康相干;为了化疗选择或预后,分析肿瘤遗传学。SequedexV1的其他特点包括,自我更新能力和绘制结果图。但是,该软件现在仅仅是作为1种研究工具,它不能用于诊断疾病或其他情况。
相关新闻
相关问答