测序数据的自动判读分析方法及装置、设备、存储介质与流程

本发明属于生物信息分析自动化,具体涉及一种测序数据的自动判读分析方法及装置、设备、存储介质。
背景技术:
1、高通量测序即二代测序(next-generation sequencing,ngs)技术,目前已广泛应用于肿瘤、遗传病、感染性疾病以及无创产前检测等领域,在肿瘤诊断与治疗中的应用更是精准医学的重要组成部分。
2、高通量测序可检测的变异类型有单核苷酸变异(single nucleotide variants,snvs)、微小插入缺失突变(insert-deletion,indel)和结构变异(structuralvariations,svs)。indel为基因组上小片段(<50bp)的插入或缺失。结构变异主要包括拷贝数变异(copy number variants,cnvs)、染色体内部的某个区域发生翻转颠换、两条染色体之间发生重排(inter-chromosome translocation)等。拷贝数变异是大小在50bp到几mb的dna片段的缺失、插入、倒置和重复等变异。基因融合(fusion)属于染色体重排,两个或者多个基因编码区相连形成新的嵌合基因,产生新的融合蛋白。基因融合可能导致蛋白质功能异常或表达水平改变,从而引起一系列疾病,如慢性粒细胞性白血病、肺腺癌等。另外,肿瘤的ngs数据还可用于分析微卫星不稳定(microsatellite instability,msi)、肿瘤突变负荷(tumor mutation burden,tmb)等肿瘤标志物。
3、传统的ngs数据分析可以分为一级、二级、三级分析。一级分析是利用测序技术将荧光信号转换成四种碱基信号的过程,主要是basecall软件通过碱基判读技术和算法,从原始图像中识别出碱基类型,将结果写入cal文件,最终生成测序报告和fastq数据,其流程基本一致。二级分析则是在一级分析的基础上,对数据进行更深入的处理,包括进行序列质量控制(去除低质量序列和去除接头序列等)、序列比对、变异筛选和注释等。二级分析根据不同的分析目的,需要用到不同的分析方法,还需要整合不同的数据库进行注释。一级分析和二级分析由生物信息分析人员完成,而三级分析则经过生物信息分析人员进一步变异筛选,再由解读报告人员结合临床信息对变异进行进一步分析和解读。
4、ngs数据量大,数据分析流程复杂,可分析的变异类型多样,整个分析过程涉及数据过滤、序列比对、变异注释、变异筛选、变异分类和相关质控等步骤,需要建立一个专业的、系统的数据分析流程。这些分析流程多为实验室自主开发,流程复杂,需要根据实际应用目的不同,检测变异类型不同以及检测项目不同等,采用不同的分析方法和变异筛选流程,这些都给生物信息分析和数据解读报告人员提出较高的要求。
5、总而言之,相较于传统的pcr检测,ngs数据分析质量控制参数更多,由生信分析统计质控信息后需要人工判读,而现有针对ngs数据的分析流程复杂,分析效率低,自动化解读程度不高,导致过于依赖人工判读,且数据解读报告人员人工分析出错的概率较高。
技术实现思路
1、本发明的目的在于提供一种测序数据的自动判读分析方法及装置、设备、存储介质,可以提高自动化解读程度,提高分析效率,进而减少对人工判读的依赖,降低解读报告分析出错率。
2、本发明第一方面公开一种测序数据的自动判读分析方法,包括:
3、响应于第一数据分析指令,显示对应的第一数据分析界面;
4、根据在所述第一数据分析界面上被选中的目标批次样本,确定出所述目标批次样本的测序数据;
5、根据质控规则设置对应的规则表达式,对所述目标批次样本的测序数据进行自动质控判读,获得所述目标批次样本的质控结果;
6、若所述质控结果为全部通过,且检测到针对上机批次的点击指令,跳转至第二数据分析界面;
7、在所述第二数据分析界面上显示样本列表以及目标变异的相关信息,其中,所述目标变异为所述样本列表中被选中的样本经过数据过滤规则设置和报告规则设置的规则表达式双层筛选后得到的变异位点,所述相关信息至少包括所述目标变异的唯一标识、变异是否报告、变异的判读结果和结果解释;
8、响应于在所述第二数据分析界面上输入的提交指令,将所述目标变异的相关信息提交到结果录入界面,在所述结果录入界面抓取报告单所需的要素内容,根据所述要素内容自动填充生成所述目标批次样本的报告单;其中,所述要素内容至少包括变异基因、变异位点、变异频率和变异解释。
9、在一些实施例中,根据质控规则设置对应的规则表达式,对所述目标批次样本的测序数据进行自动质控判读,获得所述目标批次样本的质控结果之后,所述方法还包括:
10、响应于针对质控分析界面入口的点击指令,进入质控分析界面;
11、在所述质控分析界面显示所述质控结果的具体信息,所述具体信息包括空白质控、阴性质控、阳性质控和样本内控的质控规则和抓取到的对应数值。
12、在一些实施例中,根据质控规则设置对应的规则表达式,对所述目标批次样本的测序数据进行自动质控判读,获得所述目标批次样本的质控结果,包括:
13、根据质控规则设置对应的规则表达式中的变量名,匹配所述目标批次样本的测序数据与下机数据表格中的第一目标数值;
14、根据质控规则设置对应的规则表达式,对所述第一目标数据值进行比较计算和逻辑计算,获得所述目标批次样本的质控结果。
15、在一些实施例中,响应于第一数据分析指令,显示对应的第一数据分析界面之前,所述方法还包括:
16、响应于质控设置指令,显示对应的质控设置界面;
17、检测所述质控设置界面上针对开启的质控类型的质控参数设置指令,对各个开启的质控类型配置相应的各个质控参数;
18、在各个所述质控参数的规则配置界面中,接收所述规则配置界面导入的下机质控信息表格的表头,导入成功后,将表头对应列呈现在所述规则配置界面的名称列中;
19、检测针对所述名称列中各个名称的质控开关指令,若任一名称的质控开关指令为开,根据输入完成该名称对应的质控规则设置。
20、在一些实施例中,根据输入完成该名称对应的质控规则设置,包括:
21、接收该名称对应的编辑按键的点击指令,弹出该名称对应的规则定义对话框;检测在该名称对应的规则定义对话框中输入的规则表达式,以完成该名称对应的质控规则设置。
22、在一些实施例中,响应于第一数据分析指令,显示对应的第一数据分析界面之前,所述方法还包括:
23、响应于数据分析配置指令,显示对应的数据分析配置界面;
24、检测数据分析配置界面上针对规则配置入口的点击指令,弹出数据过滤的规则定义对话框,检测在数据过滤的规则定义对话框中输入的规则表达式,以完成数据过滤规则设置。
25、在一些实施例中,响应于第一数据分析指令,显示对应的第一数据分析界面之前,所述方法还包括:
26、响应于项目配置指令,显示对应的项目配置界面;
27、根据在所述项目配置界面输入的检索因子,输出对应的检测项目信息;
28、检测针对所述检测项目信息的编辑按键的点击指令,弹出项目明细配置对话框;
29、检测所述项目明细配置对话框中针对某一种目标变异类型的生信文件的选择指令,将该种目标变异类型增加为该检测项目需要报告的变异类型,并显示所述目标变异类型的报告规则设置入口;
30、检测针对所述目标变异类型的报告规则设置入口的点击指令,弹出所述目标变异类型的报告规则设置对话框,检测在所述目标变异类型的报告规则设置对话框中输入的规则表达式,以完成报告规则设置。
31、本发明第二方面公开一种测序数据的自动判读分析装置,包括:
32、第一显示单元,用于响应于第一数据分析指令,显示对应的第一数据分析界面;
33、确定单元,用于根据在所述第一数据分析界面上被选中的目标批次样本,确定出所述目标批次样本的测序数据;
34、判读单元,用于根据质控规则设置对应的规则表达式,对所述目标批次样本的测序数据进行自动质控判读,获得所述目标批次样本的质控结果;
35、跳转单元,用于若所述质控结果为全部通过,且检测到针对上机批次的点击指令,跳转至第二数据分析界面;
36、第二显示单元,用于在所述第二数据分析界面上显示样本列表以及目标变异的相关信息,其中,所述目标变异为所述样本列表中被选中的样本经过数据过滤规则设置和报告规则设置的规则表达式双层筛选后得到的变异位点,所述相关信息至少包括所述目标变异的唯一标识、变异是否报告、变异的判读结果和结果解释;
37、提交单元,用于响应于在所述第二数据分析界面上输入的提交指令,将所述目标变异的相关信息提交到结果录入界面;
38、报告生成单元,用于在所述结果录入界面抓取报告单所需的要素内容,根据所述要素内容自动填充生成所述目标批次样本的报告单;其中,所述要素内容至少包括变异基因、变异位点、变异频率和变异解释。
39、本发明第三方面公开一种电子设备,包括存储有可执行程序代码的存储器以及与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行第一方面公开的测序数据的自动判读分析方法。
40、本发明第四方面公开一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行第一方面公开的测序数据的自动判读分析方法。
41、本发明的有益效果在于,根据质控规则设置的规则表达式,对目标批次样本的测序数据进行自动质控判读,获得质控结果;若质控结果为全部通过,显示样本列表以及样本列表中被选中的样本经过数据过滤规则设置和报告规则设置的规则表达式双层筛选后得到的目标变异,从目标变异的相关信息中抓取报告单所需的要素内容,根据要素内容自动填充生成目标批次样本的报告单;其中,要素内容至少包括变异基因、变异位点、变异频率和变异解释,从而通过自定义质控规则设置、过滤规则设置和报告规则设置,实现质量控制自动判读和变异自动筛选,可以提高自动化解读程度,提高分析效率,进而减少对人工判读的依赖,降低解读报告分析出错率。
技术研发人员:费凌娜,曾伟强,莫华燕,胡昌明,陈建钊,王华文,吴佳奇
技术所有人:广州金域医学检验中心有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除