首页  专利技术  医药医疗技术的改进;医疗器械制造及应用技术

基于甲基化数据检测突变的方法、设备、介质和程序与流程

495次浏览
基于甲基化数据检测突变的方法、设备、介质和程序与流程

本发明总体上涉及生物信息的处理,并且具体地,涉及基于甲基化数据检测突变的方法、计算设备、计算机存储介质和计算机程序产品。


背景技术:

1、传统的测定dna甲基化水平的方法例如是亚硫酸盐定序(bisulfite sequencing)是利用亚硫酸盐处理,来测定dna甲基化情形。现在常用的dna甲基化测序技术包含化学(例如,bisulfite conversion,bc)或酶学(enzymatic conversion,ec)转化,即,bc或ec转化。具体而言,就是使用重亚硫酸盐或酶学,可使dna上的胞嘧啶(c)转变为尿嘧啶(u),而被甲基化保护的c不会发生此转变。甲基化一般发生在cpg(cg两个碱基相临出现)的c上。根据某个cpg位点上c成功转化成u的比例,可以判断dna不同位点的甲基化水平。甲基化数据中,由于大部分cpg中的c转化成了u(对应dna中的t),导致传统的突变检测软件无法直接区分c→t和g→a的突变。

2、传统的基于甲基化数据的突变检测的方法例如包括从全基因组甲基化数据中检测单核苷酸变异的分析软件bc或ec-snper、bis-snp等。上述方法均采用了贝叶斯方法来估算突变类型。但上述方法都是为高频胚系突变(snp)而设计,在针对例如肿瘤早检和微小残留病灶(minimal residual disease;mrd)等场景,由于肿瘤来源的突变频率可能低至千分之一甚至更低,以至于与部分背景噪音属于相同数量级,因此导致检测低丰度突变时准确率低。

3、综上,传统的基于甲基化数据的突变检测方法存在的不足之处在于:难以提高针对低丰度突变检测的准确率。


技术实现思路

1、本发明提供一种基于甲基化数据检测突变的方法、计算设备、计算机存储介质和计算机程序产品,不仅能够从全基因组甲基化数据中检测单核苷酸变异,而且能够显著提高针对低丰度突变检测的准确率。

2、根据本发明的第一方面,提供了一种用于基于甲基化数据检测突变的方法。该方法包括:获取待测样本的甲基化数据;基于甲基化数据,获得化学或酶学(即,bc或ec)转化后的3碱基基因组的碱基组成数据;基于所述的3碱基基因组的碱基组成数据,根据正链和负链的碱基互补配对关系和/或bc或ec转化前后的基因型的对应关系,确定bc或ec转化前的4碱基基因组的碱基组成数据;基于所述的4碱基基因组的碱基组成数据,识别候选突变位点;任选地,所述方法还包括:针对所述候选突变位点进行过滤,以生成关于单核苷酸变异的突变位点的检测结果。

3、根据本发明的第二方面,还提供了一种计算设备,该设备包括:存储器,被配置为存储一个或多个计算机程序;以及处理器,耦合至存储器并且被配置为执行一个或多个程序使装置执行本发明的第一方面的方法。

4、根据本发明的第三方面,还提供了一种非瞬态计算机可读存储介质。该非瞬态计算机可读存储介质上存储有机器可执行指令,该机器可执行指令在被执行时使机器执行本发明的第一方面的方法。

5、根据本发明的第四方面,还提供了一种计算机程序产品。该计算机程序产品包括指令,该指令被机器执行时实现本发明的第一方面的方法。

6、提供
技术实现要素:
部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本发明的关键特征或主要特征,也无意限制本发明的范围。

7、本发明相对现有技术取得如下技术效果:本发明的方法仅需对甲基化检测获得甲基化数据进行数据分析处理就可以在获得甲基化检测结果的同时获得基因突变检测,即本发明可以在一个反应中同时检测甲基化信号和基因突变,且两种检测模式互不干扰,并且可以在甲基化测序深度(比如10000x)下实现低丰度(af低至0.4%)的snv突变位点的准确检测。



技术特征:

1.一种基于甲基化数据检测突变的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,确定化学或酶学转化前的4碱基基因组的碱基组成数据包括:

3.根据权利要求2所述的方法,其特征在于,确定所述4碱基基因组的基因型和基因频率包括:

4.根据权利要求2所述的方法,其特征在于,确定所述4碱基基因组的基因型和基因频率包括:

5.根据权利要求2所述的方法,其特征在于,确定所述4碱基基因组的基因型和基因频率包括:

6.根据权利要求2所述的方法,其特征在于,确定所述4碱基基因组的基因型和基因频率包括:

7.根据权利要求2或3所述的方法,其特征在于,确定所述4碱基基因组的基因型和基因频率还包括:

8.根据权利要求6所述的方法,其特征在于,负链中的与正链中自c碱基经由化学或酶学转化至t碱基互补的g碱基的碱基数经由以下各项而获得:

9.根据权利要求4所述的方法,其特征在于,确定所述4碱基基因组的基因型和基因频率包括:

10.根据权利要求9所述的方法,其特征在于,正链中自c碱基经由化学或酶学转化至t碱基的碱基数经由以下各项而获得:

11.根据权利要求7所述的方法,其特征在于,计算ot链中化学或酶学转化前的t碱基的碱基数包括:

12.根据权利要求1所述的方法,其特征在于,针对候选突变位点进行过滤以生成关于单核苷酸变异的突变位点的检测结果包括:

13.根据权利要求12所述的方法,其特征在于,过滤掉符合第一预定条件的候选突变位点包括:

14.根据权利要求13所述的方法,其特征在于,确定预定频率阈值包括:

15.根据权利要求13所述的方法,其特征在于,确定预定频率阈值包括:对不同的突变类型设置不同的预定频率阈值。

16.一种计算设备,其特征在于,包括:

17.一种计算机可读存储介质,其特征在于,计算机可读存储介质上存储有计算机程序,所述计算机程序被机器执行时实现根据权利要求1至15中任一项所述的方法。

18.一种计算机程序产品,其特征在于,计算机程序产品包括指令,所述指令被机器执行时实现根据权利要求1至15中任一项所述的方法。


技术总结
本发明涉及一种基于甲基化数据检测突变的方法、设备、介质和程序。该方法包括:获取待测样本的甲基化数据;基于甲基化数据,获得化学或酶学转化后的3碱基基因组的碱基组成数据;基于化学或酶化转化后的3碱基基因组的碱基组成数据,根据正链和负链的碱基互补配对关系、和/或化学或酶化转化前后的基因型的对应关系,确定化学或酶化转化前的4碱基基因组的碱基组成数据;基于所述4碱基基因组的碱基组成数据,识别候选突变位点;任选地,所述方法还包括:针对所述候选突变位点进行过滤,以生成关于单核苷酸变异突变位点的检测结果。本发明不仅能够从全基因组甲基化数据中检测单核苷酸变异,而且能够显著提高针对低丰度突变检测的准确率。

技术研发人员:羊星宇,宿静,汉雨生,李冰思
受保护的技术使用者:广州燃石医学检验所有限公司
技术研发日:
技术公布日:2024/11/18
文档序号 : 【 40051557 】

技术研发人员:羊星宇,宿静,汉雨生,李冰思
技术所有人:广州燃石医学检验所有限公司

备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
羊星宇宿静汉雨生李冰思广州燃石医学检验所有限公司
一种具有调控皮肤细胞钙离子作用的欧洲赤松芽提取物及其制备方法与应用与流程 一种自动切割活检针的制作方法
相关内容