首页  专利技术  医药医疗技术的改进;医疗器械制造及应用技术

一种过滤核苷酸多序列比对矩阵中低质量序列的方法

62次浏览

技术特征:

1.一种过滤核苷酸多序列比对矩阵中低质量序列的方法,其特征在于,包括:

2.如权利要求1所述的过滤核苷酸多序列比对矩阵中低质量序列的方法,其特征在于,基于r语言编写的5个函数分别为revcomplement函数、alignmentlength函数、anyshortseq函数、degap函数、masksegment函数;

3.如权利要求2所述的过滤核苷酸多序列比对矩阵中低质量序列的方法,其特征在于,利用所述revcomplement函数纠正矩阵中反向互补序列的方法包括:通过将每个矩阵中的一条序列与其余所有序列进行相似性搜索,获得相似性搜索结果文件;

4.如权利要求2所述的过滤核苷酸多序列比对矩阵中低质量序列的方法,其特征在于,利用所述alignmentlength函数筛选符合长度阈值的矩阵的方法包括:通过直接判断矩阵总长度,矩阵总长度大于等于设置阈值长度时,将矩阵输出在一个新文件夹中;矩阵总长度小于设置阈值长度的矩阵选择输出在一个新文件夹中。

5.如权利要求2所述的过滤核苷酸多序列比对矩阵中低质量序列的方法,其特征在于,利用所述anyshortseq函数删除矩阵中存在的短序列的方法包括:

6.如权利要求2所述的过滤核苷酸多序列比对矩阵中低质量序列的方法,其特征在于,利用所述degap函数删除矩阵中缺失区段的方法包括:

7.如权利要求2所述的过滤核苷酸多序列比对矩阵中低质量序列的方法,其特征在于,利用所述masksegment函数屏蔽矩阵中高度变异、比对不可靠的片段的方法包括:

8.如权利要求7所述的过滤核苷酸多序列比对矩阵中低质量序列的方法,其特征在于,计算随机相似性概率p的方法为:

9.如权利要求7所述的过滤核苷酸多序列比对矩阵中低质量序列的方法,其特征在于,计算随机排列相似性rs的方法为:

10.如权利要求7所述的过滤核苷酸多序列比对矩阵中低质量序列的方法,其特征在于,计算成对相似性得分ps的方法为:


技术总结
本发明公开了一种过滤核苷酸多序列比对矩阵中低质量序列的方法,包括:基于R语言编写了5个函数,分别为revComplement函数、alignmentLength函数、anyShortseq函数、degap函数、maskSegment函数;revComplement函数用于纠正矩阵中反向互补序列;alignmentLength函数用于筛选符合长度阈值的矩阵;anyShortseq函数用于删除矩阵中存在的短序列;degap函数用于删除矩阵中缺失达到预设阈值的列;maskSegment函数用于屏蔽矩阵中高度变异、比对不可靠的片段。

技术研发人员:张强,覃信梅,卢永彬,李鹏伟,羊学荣,黄夕洋
受保护的技术使用者:广西壮族自治区中国科学院广西植物研究所
技术研发日:
技术公布日:2024/11/18
文档序号 : 【 40048702 】

技术研发人员:张强,覃信梅,卢永彬,李鹏伟,羊学荣,黄夕洋
技术所有人:广西壮族自治区中国科学院广西植物研究所

备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
张强覃信梅卢永彬李鹏伟羊学荣黄夕洋广西壮族自治区中国科学院广西植物研究所
抗皮肤老化的功效组合物及其在D相乳化产品中的应用的制作方法 一种载PDGF-BBmRNA的纳米复合物及其制备方法与应用
相关内容