一种针对单细胞表达谱的智能化异常检测系统的制作方法

本发明涉及细胞表达谱异常检测领域,具体涉及一种针对单细胞表达谱的智能化异常检测系统。
背景技术:
1、单细胞表达谱(single-cell expression profiling)是一种在单个细胞水平上研究基因表达的技术,对通过单细胞测序技术得到的单细胞的基因表达谱进行异常检测,能够在单个细胞水平上分析和识别基因表达的变异或差异,帮助相关人员在分子层面上发现疾病的早期信号等,在生物细胞基因研究领域具有重要意义。
2、相关技术中,通常基于单细胞的基因表达谱中的数据构建异常检测模型,并通过异常检测模型实现对单细胞基因表达谱的异常检测,但由于单细胞的基因表达谱中不同数据的变化关系比较复杂,导致构建出的传统的异常检测模型的检测精度较低,从而降低对单细胞的基因表达谱异常检测的准确性。
技术实现思路
1、为了解决构建出的传统的异常检测模型的检测精度较低,从而降低对单细胞的基因表达谱异常检测的准确性的技术问题,本发明的目的在于提供一种针对单细胞表达谱的智能化异常检测系统,所采用的技术方案具体如下:
2、本发明提出了一种针对单细胞表达谱的智能化异常检测系统,所述系统包括:
3、数据获取模块,用于获取待测组织中不同细胞的基因表达谱以及两两细胞之间的距离,所述基因表达谱中包括预设调节基因和预设激酶基因在预设时间段内每个时刻的基因表达水平;
4、异常分析模块,用于将任意一个细胞作为目标细胞,根据目标细胞的预设调节基因在各时刻的所述基因表达水平的变化,获得每个时刻的变化速率值;根据目标细胞的预设调节基因在每个时刻的预设窗口中各时刻的所述变化速率值的差异,获得目标细胞的初始异常特征值;
5、修正模块,用于对目标细胞的预设调节基因和预设激酶基因之间各时刻的基因表达水平的相关性进行分析,获得目标细胞的相关性参数;基于目标细胞的所述相关性参数,对所述初始异常特征值进行修正,获得目标细胞的真实异常特征值;根据目标细胞和除目标细胞之外的其他细胞之间所述真实异常特征值的差异以及所述距离,获得目标细胞的基因表达异常指标;
6、异常检测模块,用于基于目标细胞的所述基因表达异常指标,对目标细胞的基因表达谱进行异常检测。
7、进一步地,所述根据目标细胞的预设调节基因在各时刻的所述基因表达水平的变化,获得每个时刻的变化速率值包括:
8、将目标细胞的基因表达谱中的每个时刻和预设调节基因在每个时刻的所述基因表达水平组成的二维数据点,作为目标细胞的预设调节基因在每个时刻的样本点;
9、根据目标细胞的预设调节基因的各时刻的样本点之间相对位置的变化,获得每个时刻的变化速率值。
10、进一步地,所述根据目标细胞的预设调节基因在每个时刻的预设窗口中各时刻的所述变化速率值的差异,获得目标细胞的初始异常特征值包括:
11、将任意一个时刻作为目标时刻,根据目标细胞的预设调节基因在目标时刻的预设窗口中相邻时刻的所述变化速率值的差异,获得目标时刻的异常因子;
12、基于每个时刻的所述异常因子,从所有时刻中筛选出目标细胞的预设调节基因的异常时刻;
13、对目标细胞的所有所述异常时刻的所述异常因子进行综合,获得目标细胞的初始异常特征值。
14、进一步地,所述根据目标细胞的预设调节基因在目标时刻的预设窗口中相邻时刻的所述变化速率值的差异,获得目标时刻的异常因子包括:
15、将目标时刻的预设窗口中任意两个相邻的时刻作为目标时刻的一个时刻组;
16、根据每个时刻组中两个时刻的所述变化速率值的差异,获得每个时刻组的速率变化差异值;
17、对目标时刻的所有时刻组的所述速率变化差异值的离散程度进行分析,获得目标时刻的速率变化杂乱程度;
18、对目标时刻的速率变化杂乱程度进行归一化处理,获得目标时刻的异常因子。
19、进一步地,所述基于每个时刻的所述异常因子,从所有时刻中筛选出目标细胞的预设调节基因的异常时刻包括:
20、将所述异常因子大于预设第一阈值的时刻,作为目标细胞的预设调节基因的异常时刻。
21、进一步地,所述对目标细胞的预设调节基因和预设激酶基因之间各时刻的基因表达水平的相关性进行分析,获得目标细胞的相关性参数包括:
22、将目标细胞的预设调节基因和预设激酶基因之间各时刻的基因表达水平的皮尔逊相关系数,作为目标细胞的相关性参数。
23、进一步地,所述基于目标细胞的所述相关性参数,对所述初始异常特征值进行修正,获得目标细胞的真实异常特征值包括:
24、对目标细胞的所述相关性参数与常数1的差异进行归一化处理,获得目标细胞的非正相关程度;
25、利用目标细胞的所述非正相关程度,对所述初始异常特征值进行加权调整,获得目标细胞的真实异常特征值。
26、进一步地,所述根据目标细胞和除目标细胞之外的其他细胞之间所述真实异常特征值的差异以及所述距离,获得目标细胞的基因表达异常指标包括:
27、根据目标细胞和除目标细胞之外的其他细胞之间的所述距离,对除目标细胞之外的所有其他细胞的所述真实异常特征值进行调整,获得目标细胞的参考异常特征值;
28、对目标细胞的所述真实异常特征值和所述参考异常特征值的差异进行归一化处理,获得目标细胞的基因表达异常指标。
29、进一步地,所述根据目标细胞和除目标细胞之外的其他细胞之间的所述距离,对除目标细胞之外的所有其他细胞的所述真实异常特征值进行调整,获得目标细胞的参考异常特征值包括:
30、将除目标细胞之外的任意一个其他细胞,作为参考细胞,对参考细胞与目标细胞之间的所述距离进行负相关映射后并进行归一化处理,获得参考细胞的参考价值参数;
31、利用除目标细胞之外的各个其他细胞的所述参考价值参数,对各个其他细胞的所述真实异常特征值进行加权调整,获得目标细胞的参考异常特征值,其中,除目标细胞之外的各个其他细胞的所述参考价值参数的累加值等于1。
32、进一步地,所述基于目标细胞的所述基因表达异常指标,对目标细胞的基因表达谱进行异常检测包括:
33、若目标细胞的所述基因表达异常指标大于预设第二阈值,则认为目标细胞的基因表达谱存在异常。
34、本发明具有如下有益效果:
35、本发明考虑到单细胞的基因表达谱中不同数据的变化关系比较复杂,导致构建出的传统的异常检测模型的检测精度较低,从而降低对单细胞的基因表达谱异常检测的准确性,因此本发明首先获取待测组织中不同细胞的基因表达谱以及两两细胞之间的距离,考虑到在正常细胞分裂过程中,其预设调节基因的基因表达水平是逐渐增长的,因此可首先通过变化速率值反映目标细胞的预设调节基因的基因表达水平在每个时刻的变化趋势情况,考虑到正常情况下目标细胞的预设调节基因局部的基因表达水平的增长速率是逐渐增加的,并且增长速率变化的比较均匀,而当预设调节基因表达出现异常时,导致增长速率变化的均匀性较差,因此可通过获取的初始异常特征值初步反映目标细胞存在基因异常表达的可能性,同时,在正常情况下目标细胞的预设调节基因和预设激酶基因的基因表达水平具有正相关性,因此可通过获取的相关性参数对目标细胞的初始异常特征值进行修正,从而得到更加准确的真实异常特征值,由于目标细胞与其他细胞是属于同一组织的类型相同的细胞,正常情况下各细胞的基因表达情况相似,因此可将其他细胞作为参考,并且距离目标细胞越近的其他细胞的参考价值就越大,进而通过基因表达异常指标准确反映目标细胞存在基因异常表达的可能性,提高后续对单细胞的基因表达谱异常检测的准确性。
技术研发人员:裴朱中
技术所有人:北京国浩宇医疗科技有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除