一种护理病历表生成方法及系统

本发明涉及护理病历表生成,具体为一种护理病历表生成方法及系统。
背景技术:
1、传统的护理病历表生成方法及系统存在多方面的技术问题。
2、首先,这些系统通常采用简单的关键词匹配或规则基础的方法,无法有效捕捉文本的深层语义信息,导致模版选择和信息填充的准确性较低。
3、其次,传统方法难以处理医疗文本的复杂性和多样性,往往只能处理结构化数据,对非结构化文本的处理能力有限。再者,这些系统缺乏对整体语义和局部语义的综合考虑,无法在保留细节信息的同时把握文本的整体语义结构。此外,传统方法在信息提取和填充过程中,缺乏灵活的语义相关性评估机制,容易引入无关或不准确的信息。同时,这些系统通常没有建立有效的文本-向量映射关系,难以实现精确的信息追溯和上下文理解。
4、最后,传统方法缺乏智能化的信息筛选机制,无法根据语义相关性自动调整填充内容的重要性,这导致生成的病历表质量不稳定,难以满足现代医疗实践的高效率和高准确性需求。
5、以上技术问题综合起来,严重限制了传统护理病历表生成系统的效率和实用性。
技术实现思路
1、本发明的目的在于提供一种护理病历表生成方法及系统,以解决上述背景技术中提出的问题。
2、为实现上述目的,本发明目的之一在于,提供了一种护理病历表生成方法,包括如下方法步骤:
3、s1、收集护理病历表模版库和病人文本数据,其中病人文本数据包括多个语义单元;
4、s2、利用双向文本向量化模型,通过将病人文本数据中的多个语义单元进行向量空间的映射,生成多个文本词向量,用于捕捉病人文本数据中词语的语义信息;以及将护理病历表模版库中的所有模版转换为多种模版库词向量,用于捕捉模版的语义信息;
5、s3、根据多个文本词向量,通过计算多个文本词向量的算术平均值,得出文本平均词向量,用于捕捉整体语义信息;并计算文本平均词向量和多种模版库词向量之间的余弦相似度,作为模版匹配相似度分数,通过比较文本平均词向量的整体语义信息与所有模版的语义信息的余弦相似度,选择模版匹配相似度分数最大的模版作为待使用护理病历表模版;
6、s4、对待使用护理病历表模版进行解析,解析出对待使用护理病历表模版中的各个字段,生成字段词向量;计算该字段词向量与多个文本词向量之间的余弦相似度,作为字段填充相似度分数,用于定位文本中与字段相关的语义匹配信息;并根据字段填充相似度分数的大小,生成对待使用护理病历表模版中的各个字段与多个文本词向量之间的语义相关性列表;根据语义相关性列表,对护理病历表模版的对应字段进行填充,用于提高具体字段语义要求的填充准确性。
7、作为本技术方案的进一步改进,所述护理病历表模版库通过公共数据库进行收集,护理病历表模版库包括多个字段,字段包括患者基本信息、症状描述、治疗计划和护理观察;病人文本数据表示患者的当前状态,包括最新的症状描述、生命体征和治疗反应。
8、作为本技术方案的进一步改进,所述双向文本向量化模型的过程具体包括:
9、对病人文本数据进行清洗,包括去除特殊字符、标点符号,并进行分词;对护理病历表模版库中的每个模版进行同样的清洗和分词处理;
10、从公共数据库中获取预训练的医疗领域词嵌入模型,词嵌入模型是一种将词语映射到高维向量空间的技术,能够捕捉词语之间的语义关系;
11、将预处理后的病人文本数据分割成多个语义单元,其中语义单元是指文本中具有完整语义的最小单位,通常是一个句子或一个段落,包含了一个相对独立的信息,对每个语义单元中的每个词通过词嵌入模型映射到向量空间,获得单词向量,并计算该语义单元内所有单词向量的平均值,得到一个文本词向量,最终得到多个文本词向量,每个向量对应病人文本数据中的一个语义单元;其中:为每个语义单元分配一个唯一的标识符,在将语义单元转换为文本词向量时,保存该向量与语义单元的对应映射关系,通过创建一个数据结构,其中键为文本词向量的标识符,值为对应的语义单元,在生成文本词向量时,同时记录该向量对应的语义单元的位置信息;
12、将护理病历表模版库中每个模版所对应字段中的每个词,通过词嵌入模型映射到向量空间,获得字段单词向量;计算该字段内所有字段单词向量的平均值,得到一个字段词向量;将所有字段词向量组合,形成一个完整的模版词向量;对模版库中的所有模版重复上述过程,最终得到多种模版库词向量。
13、作为本技术方案的进一步改进,所述文本平均词向量的计算过程如下:
14、利用多个文本词向量,计算该文本词向量的算术平均值,通过将所有文本词向量按维度相加,将得到的和向量除以文本词向量的总数,得到一个单一的文本平均词向量,该向量表示了整个病人文本数据的语义信息。
15、作为本技术方案的进一步改进,所述模版匹配相似度分数的计算过程如下:
16、对于每一个模版库词向量,计算文本平均词向量与每一个模版库词向量之间的余弦相似度,作为模版匹配相似度分数,模版匹配相似度分数cos(a)的计算公式如下:
17、cos(a)=(a·b)/(||a||*||b||),其中a是文本平均词向量,b是模版库词向量,·表示向量点积,||a||和||b||分别表示向量a和b的欧几里得范数;
18、比较计算得到的所有模版匹配相似度分数,选择模版匹配相似度分数最大的值所对应的模版,将该模版确定为待使用的护理病历表模版。
19、作为本技术方案的进一步改进,所述字段填充相似度分数的计算过程如下:
20、对于每个文本词向量和字段词向量,计算该每个文本词向量与每个字段词向量之间的余弦相似度,作为字段填充相似度分数,字段填充相似度分数cos(b)计算公式如下:
21、cos(b)=(c·d)/(||c||*||d||),其中c是字段词向量,d是文本词向量;对每个字段。
22、作为本技术方案的进一步改进,所述根据字段填充相似度分数的大小,生成对待使用护理病历表模版中的各个字段与多个文本词向量之间的语义相关性列表,并根据语义相关性列表,对护理病历表模版进行填充,具体包括:
23、对每个字段,创建一个列表,包含字段名称、每个文本词向量以及两者的填充相似度分数,按填充相似度分数降序排列这些列表,形成一个综合的语义相关性列表;
24、根据语义相关性列表,利用百分位数统计方法设定相关性阈值,根据相关性阈值提取对应的语义单元,通过遍历语义相关性列表中的每个字段,比较相关性阈值与每个字段的填充相似度分数大小,如果该填充相似度分数超过相关性阈值,通过保存的映射关系,提取对应的语义单元,将该语义单元所对应的文本填入相应的字段中。
25、作为本技术方案的进一步改进,所述相关性阈值设定过程如下:
26、根据语义相关性列表,获取所有字段与每个文本词向量的填充相似度分数,并按照填充相似度分数从小到大顺序,形成一个分数列表;
27、计算分数列表的75th百分位数,将其设定为相关性阈值,其中75th百分位数表示将分数列表分成四等份时的第三个分割点,即75%的数据小于或等于该值。
28、本发明目的之二在于,提供了一种护理病历表生成方法的系统,包括数据收集模块、数据处理模块、模版确定模块和填充模块。
29、所述数据收集模块收集护理病历表模版库和病人文本数据;
30、所述数据处理模块利用双向文本向量化模型,将病人文本数据转换为多个文本词向量,以及将护理病历表模版库中的所有模版转换为多种模版库词向量;
31、所述模版确定模块根据多个文本词向量,计算得出文本平均词向量;并计算文本平均词向量和多种模版库词向量之间的余弦相似度,作为模版匹配相似度分数,选择模版匹配相似度分数最大的模版作为待使用护理病历表模版;
32、所述填充模块对待使用护理病历表模版进行解析,解析出对待使用护理病历表模版中的各个字段;计算该各个字段与多个文本词向量之间的余弦相似度,作为字段填充相似度分数,并根据字段填充相似度分数的大小,生成对待使用护理病历表模版中的各个字段与多个文本词向量之间的语义相关性列表;根据语义相关性列表,对护理病历表模版进行填充。
33、与现有技术相比,本发明的有益效果是:
34、1、该一种护理病历表生成方法及系统通过多个文本词向量的多重应用,实现了高效准确的护理病历表生成;首先,通过计算多个文本词向量的平均值得到文本平均词向量,这一步骤有效地综合了病人文本数据中的全面语义信息;随后,通过计算文本平均词向量与模版库词向量之间的余弦相似度,精确地选择了最匹配的护理病历表模版;这种方法不仅考虑了整体语义,还保留了局部语义信息的重要性;其次,通过计算各个字段与多个文本词向量之间的余弦相似度,生成了详细的语义相关性列表;这一步骤充分利用了文本词向量的局部语义信息,确保了病历表填充的精准性;通过这种多层次的向量应用,本方法既能捕捉整体语义结构,又能识别细节信息,从而大大提高了护理病历表生成的准确性和适用性。
35、2、该一种护理病历表生成方法及系统采用的双向文本向量化模型和余弦相似度计算,结合语义相关性列表的应用,极大地提升了护理病历表生成的效率和准确性;双向文本向量化模型能够同时考虑病人文本数据和护理病历表模版,将两者映射到同一向量空间,使得语义比较更加直观和精确,并保存向量与语义单元的对应映射关系,这种映射关系的建立和维护使得系统能够在向量空间中进行计算和比较的同时,随时追溯到原始文本的具体内容和位置,当系统根据语义相关性列表识别出高度相关的文本向量时,可以立即通过这个映射关系定位到原始文本中的相应语义单元,从而准确提取所需信息。这不仅提高了填充过程的精确度,还保证了所填充内容的语境完整性。此外,通过生成语义相关性列表并设定相关性阈值,本方法能够智能地筛选出最相关的信息进行填充,避免了无关信息的干扰,这种基于语义的智能填充方式大大提高了病历表的质量和一致性,同时显著减少了医护人员的工作负担。
技术研发人员:赵姝姝,张旭光,孙万里,张静,王涛
技术所有人:潍坊医学院附属医院
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除