首页  专利技术  医药医疗技术的改进;医疗器械制造及应用技术

一种基于深度学习和长读测序的SNP和INDEL检测方法

182次浏览

技术特征:

1.一种基于深度学习和长读测序的snp和indel检测方法,其特征在于,包括:

2.根据权利要求1所述的基于深度学习和长读测序的snp和indel检测方法,其特征在于,对待检测数据进行第一预处理,生成第一叠加图像的步骤,包括选择候选位点的过程;其中:

3.根据权利要求2所述的基于深度学习和长读测序的snp和indel检测方法,其特征在于,所述snp检测模型基于卷积神经网络cnn构建,包括三层卷积层:

4.根据权利要求3所述的基于深度学习和长读测序的snp和indel检测方法,其特征在于,所述估计候选位点合子性的概率的步骤,包括:

5.根据权利要求4所述的基于深度学习和长读测序的snp和indel检测方法,其特征在于,所述输出得到indel的vcf文件的步骤,包括:

6.根据权利要求5所述的基于深度学习和长读测序的snp和indel检测方法,其特征在于,所述对待检测数据进行第二预处理,生成第二叠加图像的步骤,包括选择候选点位和生成叠加图像,其中,在选择候选点位之前,包括对待检测数据进行质量过滤的过程,包括:

7.根据权利要求6所述的基于深度学习和长读测序的snp和indel检测方法,其特征在于,所述第二预处理中选择候选点位的步骤,包括:

8.根据权利要求7所述的基于深度学习和长读测序的snp和indel检测方法,其特征在于,所述第二预处理中生成叠加图像的步骤,包括:

9.根据权利要求8所述的基于深度学习和长读测序的snp和indel检测方法,其特征在于,所述的indel检测模型基于卷积神经网络cnn构建,包括三层卷积层:

10.根据权利要求9所述的基于深度学习和长读测序的snp和indel检测方法,其特征在于,所述将第二叠加图像作为indel检测模型的输入,输出得到indel的vcf文件的步骤,包括:


技术总结
本发明适用于生物信息学领域,具体是一种基于深度学习和长读测序的SNP和INDEL检测方法,包括:对待检测数据进行第一预处理,生成第一叠加图像,将第一叠加图像作为SNP检测模型的输入,输出得到SNP的VCF文件;对待检测数据进行第二预处理,生成第二叠加图像,将第二叠加图像作为INDEL检测模型的输入,输出得到INDEL的VCF文件;利用基于R语言的VcfR数据处理工具,对所得到的VCF文件中的数据进行变异检测和处理,得到基因组上的变异检测结果;使用IGV输出显示基因组上的变异检测结果。本发明使用了深度学习技术和长读测序技术,能够解决传统方法在灵活性与泛化能力、计算效率上的低性能,以及面对复杂问题时短读测序存在的无法检测区域的问题。

技术研发人员:石博艺,王永梅,王芃力,吴雨涵,潘海瑞,陈文希,张奥运,范子建
受保护的技术使用者:安徽农业大学
技术研发日:
技术公布日:2024/11/28
文档序号 : 【 40163374 】

技术研发人员:石博艺,王永梅,王芃力,吴雨涵,潘海瑞,陈文希,张奥运,范子建
技术所有人:安徽农业大学

备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
石博艺王永梅王芃力吴雨涵潘海瑞陈文希张奥运范子建安徽农业大学
护理数据自动化采集分析方法及系统 个性化失语症康复训练方法及装置与流程
相关内容