一种基于深度学习和长读测序的SNP和INDEL检测方法
技术特征:
1.一种基于深度学习和长读测序的snp和indel检测方法,其特征在于,包括:
2.根据权利要求1所述的基于深度学习和长读测序的snp和indel检测方法,其特征在于,对待检测数据进行第一预处理,生成第一叠加图像的步骤,包括选择候选位点的过程;其中:
3.根据权利要求2所述的基于深度学习和长读测序的snp和indel检测方法,其特征在于,所述snp检测模型基于卷积神经网络cnn构建,包括三层卷积层:
4.根据权利要求3所述的基于深度学习和长读测序的snp和indel检测方法,其特征在于,所述估计候选位点合子性的概率的步骤,包括:
5.根据权利要求4所述的基于深度学习和长读测序的snp和indel检测方法,其特征在于,所述输出得到indel的vcf文件的步骤,包括:
6.根据权利要求5所述的基于深度学习和长读测序的snp和indel检测方法,其特征在于,所述对待检测数据进行第二预处理,生成第二叠加图像的步骤,包括选择候选点位和生成叠加图像,其中,在选择候选点位之前,包括对待检测数据进行质量过滤的过程,包括:
7.根据权利要求6所述的基于深度学习和长读测序的snp和indel检测方法,其特征在于,所述第二预处理中选择候选点位的步骤,包括:
8.根据权利要求7所述的基于深度学习和长读测序的snp和indel检测方法,其特征在于,所述第二预处理中生成叠加图像的步骤,包括:
9.根据权利要求8所述的基于深度学习和长读测序的snp和indel检测方法,其特征在于,所述的indel检测模型基于卷积神经网络cnn构建,包括三层卷积层:
10.根据权利要求9所述的基于深度学习和长读测序的snp和indel检测方法,其特征在于,所述将第二叠加图像作为indel检测模型的输入,输出得到indel的vcf文件的步骤,包括:
技术总结
本发明适用于生物信息学领域,具体是一种基于深度学习和长读测序的SNP和INDEL检测方法,包括:对待检测数据进行第一预处理,生成第一叠加图像,将第一叠加图像作为SNP检测模型的输入,输出得到SNP的VCF文件;对待检测数据进行第二预处理,生成第二叠加图像,将第二叠加图像作为INDEL检测模型的输入,输出得到INDEL的VCF文件;利用基于R语言的VcfR数据处理工具,对所得到的VCF文件中的数据进行变异检测和处理,得到基因组上的变异检测结果;使用IGV输出显示基因组上的变异检测结果。本发明使用了深度学习技术和长读测序技术,能够解决传统方法在灵活性与泛化能力、计算效率上的低性能,以及面对复杂问题时短读测序存在的无法检测区域的问题。
技术研发人员:石博艺,王永梅,王芃力,吴雨涵,潘海瑞,陈文希,张奥运,范子建
受保护的技术使用者:安徽农业大学
技术研发日:
技术公布日:2024/11/28
技术研发人员:石博艺,王永梅,王芃力,吴雨涵,潘海瑞,陈文希,张奥运,范子建
技术所有人:安徽农业大学
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除