一种基于档案信息的数据处理方法及系统与流程

本发明涉及档案数据处理的,具体为一种基于档案信息的数据处理方法及系统。
背景技术:
1、档案,汉语词语,意为人们在各项社会活动中直接形成的各种形式的具有保存价值的原始记录。原始记录性是它的本质属性;我国古代的档案,在各个朝代有着不同的称谓。商代称为“册”,周代叫作“中”,秦汉称作“典籍”,汉魏以后谓之“文书”,“文案”,“案牍”,“案卷”,“簿书”,清代以后多用“档案”,现统一称作“档案”;其中电子档案应用最为广泛;电子档案具有凭证、查考和保存价值并归档保存的电子文件。电子文件是国家机构、社会组织或个人在履行其法定职责或处理事务过程中,通过计算机等电子设备形成、办理、传输和存储的数字格式的各种信息记录。电子文件由内容、结构和背景组成。电子档案,是指通过计算机磁盘等设备进行存储,与纸质档案相对应,相互关联的通用电子图像文件集合,通常以案卷为单位。现有的电子档案信息归档过程无法实现档案文件归档地址智能判断,也不能对档案文件归档地址处理结果精准反馈;更无法基于管理人员校准信息进行档案文件归档地址修正和档案文件归档作业,降低了档案信息归档的效率和准确性。
2、公开号为cn116974989a的中国发明专利申请公开了一种面向数据来源多样化的档案数据处理方法,通过纸质档案处理模块、业务系统档案处理模块和原始数据档案处理模块;对获取的多来源数据,采用目录关键词核对进行数据重组形成密匙,对密匙重合度进行监测,筛选超过阈值的密匙,并对应重合档案数据做出筛选和删除,实现对多来源档案的整理、存储、设定密匙;保证数据的可靠性和安全性,然而以上技术方案不能为采集的来源多样化的档案数据进行归档地址精准判断和修正,降低了档案数据归档的效率。
技术实现思路
1、(一)解决的技术问题
2、为解决上述现有的电子档案信息归档过程无法实现档案文件归档地址智能判断,也不能对档案文件归档地址处理结果精准反馈;更无法基于管理人员校准信息进行档案文件归档地址修正和档案文件归档作业的问题,实现以上档案文件归档地址智能化判断,归档地址标准化可视化反馈,精准修正档案文件归档地址数据,自主执行档案文件归档作业,提高档案信息管理的效率和准确性的目的。
3、(二)技术方案
4、本发明通过以下技术方案予以实现:一种基于档案信息的数据处理方法,所述方法包括如下步骤:
5、s1、采集档案文件内容特征数据;
6、s2、采集档案文件归档空间图像数据并与归档空间文件夹图像数据进行归档空间分类文件夹识别处理,生成归档空间分类文件夹识别结果数据;
7、s3、当识别结果为存在时,搜索出归档空间分类文件夹内部文件信息并生成归档空间分类文件夹文件内容特征数据,依据所述档案文件内容特征数据与所述归档空间分类文件夹文件内容特征数据进行档案文件归档目标文件夹分析处理,生成档案文件归档对象文件夹数据;
8、s4、基于所述档案文件归档对象文件夹数据生成的归档空间循环执行s2步骤直至当识别结果为不存在时,结束循环操作指令;
9、s5、当识别结果为不存在时,依据所述档案文件归档对象文件夹数据进行档案文件归档地址搜索,生成档案文件归档地址数据并逐层打开截取各层归档空间的界面图像,构建出档案文件归档地址及图像数据并推送到档案管理端;
10、s6、采集档案文件归档地址校准数据与所述档案文件归档地址数据进行档案文件归档地址修正处理,生成档案文件归档地址修正数据;
11、s7、依据所述档案文件归档地址修正数据执行档案文件归档作业。
12、优选的,所述采集档案文件内容特征数据的操作步骤如下:
13、s11、采用办公软件打开档案文件并采集档案文件内部文本信息并生成档案文件内容特征数据p,所述办公软件包括officesuite、sumatrapdf、wpsoffice中任意一种。
14、优选的,所述采集档案文件归档空间图像数据并与归档空间文件夹图像数据进行归档空间分类文件夹识别处理,生成归档空间分类文件夹识别结果数据的操作步骤如下:
15、s21、通过截图软件采集电子档案管理平台的初始归档空间的界面图像并生成档案文件归档空间图像数据a,所述截图软件包括截图王、qq截图、sharex中任意一种;
16、s22、建立归档空间文件夹图像数据集合其中a'm表示第m个归档空间文件夹图像数据,表示归档空间文件夹图像数据数量的最大值,所述归档空间文件夹图像数据表示档案文件在电子档案管理平台的归档空间中分类归档的文件夹图像数据;
17、s23、采用宽度优先搜索算法将所述档案文件归档空间图像数据a与所述归档空间文件夹图像数据集合a'中归档空间文件夹图像数据a'm进行归档空间分类文件夹图像特征识别,依据归档空间分类文件夹图像特征识别结果生成归档空间分类文件夹识别结果数据ajieguo;
18、当a与a'm进行归档空间分类文件夹图像特征识别成功,表示电子档案管理平台的归档空间中存在分类归档的文件夹,则输出归档空间分类文件夹识别结果数据ajieguo为存在;
19、当a与a'm进行归档空间分类文件夹图像特征识别成功,表示电子档案管理平台的归档空间中不存在分类归档的文件夹,则输出归档空间分类文件夹识别结果数据ajieguo为不存在。
20、优选的,所述当识别结果为存在时,搜索出归档空间分类文件夹内部文件信息并生成归档空间分类文件夹文件内容特征数据,依据所述档案文件内容特征数据与所述归档空间分类文件夹文件内容特征数据进行档案文件归档目标文件夹分析处理,生成档案文件归档对象文件夹数据的操作步骤如下:
21、s31、当所述归档空间分类文件夹识别结果数据ajieguo为存在时,采用bert语言模型逐个对归档空间分类文件夹内部档案文件进行检索并结合办公软件打开、采集档案文件内部文本信息,建立归档空间分类文件夹文件内容特征数据集合b=(b1,…,bn,…,bθ),n=1,2,3,…,θ;其中bn表示采集第n种分类文件夹对应的归档空间分类文件夹文件内容特征数据,θ归档空间分类文件夹种类数量的最大值;
22、s32、将所述档案文件内容特征数据p与所述归档空间分类文件夹文件内容特征数据集合b中归档空间分类文件夹文件内容特征数据bn进行档案文件内容特征匹配,搜索出所述档案文件内容特征数据p最匹配的归档空间分类文件夹文件内容特征数据bn,执行搜索出所述p最匹配的bn的执行步骤如下:
23、s321、初始化,更新算法最大迭代次数t、文本特征搜索鹈鹕种群位置;
24、s322、勘探阶段,文本特征搜索鹈鹕确定猎物的位置,即在归档空间分类文件夹文件内容特征数据集合b搜索空间中的搜索与档案文件内容特征数据p相匹配的归档空间分类文件夹文件内容特征数据bn的位置,然后向这个确定的位置区域移动,对文本特征搜索鹈鹕逼近猎物策略进行建模,文本特征搜索鹈鹕对归档空间分类文件夹文件内容特征数据集合b的搜索空间进行扫描,进而增加文本特征搜索鹈鹕在归档空间分类文件夹文件内容特征数据集合b搜索空间中的不同位置区域的勘探范围;猎物的位置在归档空间分类文件夹文件内容特征数据集合b搜索空间中是随机生成的,即与档案文件内容特征数据p相匹配的归档空间分类文件夹文件内容特征数据bn在归档空间分类文件夹文件内容特征数据集合b搜索空间中是随机生成,文本特征搜索鹈鹕逼近猎物策略公式如下:其中mi,j为第i个文本特征搜索鹈鹕在第j维的位置,即第i个文本特征搜索鹈鹕在空间维度为θ的归档空间分类文件夹文件内容特征数据集合b搜索空间中的位置,α表示位置调整随机整数,rand表示取值[0,1]范围内的随机数,m'i,j为勘探阶段更新后第i个文本特征搜索鹈鹕在第j维的位置,即勘探阶段更新后第i个文本特征搜索鹈鹕在空间维度为θ的归档空间分类文件夹文件内容特征数据集合b搜索空间中的位置,jj为猎物在第j维的位置,即与档案文件内容特征数据p相匹配的归档空间分类文件夹文件内容特征数据bn在归档空间分类文件夹文件内容特征数据集合b搜索空间中的位置,δy为猎物的目标函数值,δi为第i个文本特征搜索鹈鹕的目标函数值;
25、s323、开发阶段,文本特征搜索鹈鹕执行狩猎行为;即在归档空间分类文件夹文件内容特征数据集合b搜索空间中搜索所有与档案文件内容特征数据p相匹配的归档空间分类文件夹文件内容特征数据bn,对文本特征搜索鹈鹕的狩猎行为过程进行建模,使得算法收敛到狩猎区域更优的位置,算法运行过程必须检查文本特征搜索鹈鹕位置附近的位置,使得算法狩猎到更优的位置,文本特征搜索鹈鹕狩猎行为计算公式如下:
26、其中g”i,j表示开发阶段更新后第i个文本特征搜索鹈鹕在第j维的位置,即开发阶段更新后第i个文本特征搜索鹈鹕在维度为θ的在归档空间分类文件夹文件内容特征数据集合b搜索空间中的位置;π为0或2的随机整数;t为当前迭代次数;t为最大迭代次数;
27、s324、当算法满足最大迭代次数,输出与档案文件内容特征数据p最匹配的归档空间分类文件夹文件内容特征数据bn;
28、s33、依据s324步骤中输出的归档空间分类文件夹文件内容特征数据bn对应归档空间分类文件夹种类编号标识生成档案文件归档对象文件夹数据cn。
29、优选的,基于所述档案文件归档对象文件夹数据生成的归档空间循环执行s2步骤直至当识别结果为不存在时,结束循环操作指令的操作步骤如下:
30、s41、依据所述档案文件归档对象文件夹数据cn对应的归档文件夹打开并生成新的档案文件归档空间中循环重复执行s21步骤、s22步骤、s23步骤直至所述归档空间分类文件夹识别结果数据ajieguo为不存在时,结束循环操作指令。
31、优选的,所述当识别结果为不存在时,依据所述档案文件归档对象文件夹数据进行档案文件归档地址搜索,生成档案文件归档地址数据并逐层打开截取各层归档空间的界面图像,构建出档案文件归档地址及图像数据并推送到档案管理端的操作步骤如下:
32、s51、当所述归档空间分类文件夹识别结果数据ajieguo为不存在时,采用宽度优先搜索算法搜索并获取所述档案文件归档对象文件夹数据cn所在电子档案管理平台中的存储地址,生成档案文件归档地址数据集合d=(d1,…,do1);其中d1表示档案文件在电子档案管理平台第1层的档案文件归档地址数据,do1表示档案文件在电子档案管理平台第o1层的档案文件归档地址数据;
33、s52、依据所述档案文件归档地址数据集合d中d1至do1有序逐层打开各个档案文件归档地址对应的电子档案管理平台的归档空间界面,并采用截图软件有序截取各层归档空间的界面图像与所述档案文件归档地址数据集合d中d1至do1进行地址数据进行数据组合,构建出档案文件归档地址及图像数据集合e=(e1,…,eo1),其中e1表示档案文件归档地址数据d1与相匹配的归档空间界面图像进行数据组合后的档案文件归档地址及图像数据,eo1表示档案文件归档地址数据do1与相匹配的归档空间界面图像进行数据组合后的档案文件归档地址及图像数据;
34、s53、将所述档案文件归档地址及图像数据集合e中e1至eo1通过显示屏有序推送到档案管理端。
35、优选的,所述采集档案文件归档地址校准数据与所述档案文件归档地址数据进行档案文件归档地址修正处理,生成档案文件归档地址修正数据的操作步骤如下:
36、s61、通过语音识别设备在线档案管理人员关于档案文件归档地址中需要校准的存储地址数据并生成档案文件归档地址校准数据g;
37、s62、将所述档案文件归档地址校准数据g按照归档地址字符与所述档案文件归档地址数据集合d中d1至do1进行档案文件归档地址识别修正所述档案文件归档地址数据集合d中的所述档案文件归档地址数据,生成档案文件归档地址修正数据集合d'=(d'1,…,d'o2),其中d'1表示档案文件在电子档案管理平台第1层的档案文件归档地址修正数据,d'o2表示档案文件在电子档案管理平台第o2层的档案文件归档地址修正数据,所述修正包括替换和删除;
38、优选的,依据所述档案文件归档地址修正数据执行档案文件归档作业的操作步骤如下:
39、s71、依据所述档案文件归档地址修正数据集合d'中d'1至d'o2搜索打开档案文件归档地址所在的归档空间并执行档案文件归档作业。
40、一种基于档案信息的数据处理系统,用于实现所述一种基于档案信息的数据处理方法,所述系统包括档案文件归档地址判断模块、档案文件归档地址反馈模块、档案文件归档地址修正和归档执行模块;
41、所述档案文件归档地址判断模块包括档案文件内容参数采集单元、档案文件归档空间图像采集单元、归档空间文件夹图像存储单元、归档空间分类文件夹识别单元、归档空间分类文件夹内容信息搜索单元、档案文件归档对象文件夹分析单元、归档空间分类文件夹识别循环单元;
42、所述档案文件内容参数采集单元,通过办公软件采集档案文件内容特征数据;所述档案文件归档空间图像采集单元,通过截图软件采集档案文件归档空间图像数据;所述归档空间文件夹图像存储单元,用于存储归档空间文件夹图像数据;所述归档空间分类文件夹识别单元,将档案文件归档空间图像数据与归档空间文件夹图像数据进行归档空间分类文件夹识别处理,生成归档空间分类文件夹识别结果数据;所述归档空间分类文件夹内容信息搜索单元,用于搜索出归档空间分类文件夹内部文件信息并生成归档空间分类文件夹文件内容特征数据;所述档案文件归档对象文件夹分析单元,依据所述档案文件内容特征数据与所述归档空间分类文件夹文件内容特征数据进行档案文件归档目标文件夹分析处理,生成档案文件归档对象文件夹数据;所述归档空间分类文件夹识别循环单元,基于所述档案文件归档对象文件夹数据生成的归档空间循环执行采集档案文件归档空间图像数据和生成归档空间分类文件夹识别结果数据步骤直至当识别结果为不存在时,结束循环操作指令;
43、所述档案文件归档地址反馈模块包括档案文件归档地址生成单元、档案文件归档地址界面图像截取单元、档案文件归档地址推送单元;
44、所述档案文件归档地址生成单元,依据所述档案文件归档对象文件夹数据进行档案文件归档地址搜索,生成档案文件归档地址数据;所述档案文件归档地址界面图像截取单元,依据所述档案文件归档地址数据逐层打开截取各层归档空间的界面图像,构建出档案文件归档地址及图像数据;所述档案文件归档地址推送单元,将所述档案文件归档地址及图像数据推送到档案管理端;
45、所述档案文件归档地址修正和归档执行模块包括档案文件归档地址校准信息采集单元、档案文件归档地址修正单元、档案文件归档作业执行单元;
46、所述档案文件归档地址校准信息采集单元,通过语音识别设备采集档案文件归档地址校准数据;所述档案文件归档地址修正单元,将所述档案文件归档地址校准数据与所述档案文件归档地址数据进行档案文件归档地址修正处理,生成档案文件归档地址修正数据;所述档案文件归档作业执行单元,依据所述档案文件归档地址修正数据执行档案文件归档作业。
47、(三)有益效果
48、本发明提供了一种基于档案信息的数据处理方法及系统。具备以下
49、有益效果:
50、一、通过办公软件和截图软件准确采集档案文件文本参数和档案文件归档空间图像参数,为档案文件智能归档提供数据支撑;将档案文件归档空间图像参数与科学预存的归档空间文件夹图像参数进行归档空间分类文件夹识别,准确搜索出档案文件归档空间是否存在多种分类归档空间;准确搜索出多种分类归档空间中存储档案文件的文件内容特征参数并与档案文件内容特征数据进行文本字符分析,准确判断出档案文件归档目标文件夹对象;实现档案文件最终归档目标文件夹准确识别,实现档案文件归档文件夹的智能化检索,提高档案文件归档效率。
51、二、通过精准检索档案文件归档地址参数;采用截图软件逐层打开截取各层归档空间的界面图像,科学构建出档案文件归档地址和对应档案文件归档空间图像参数,实现档案文件归档空间的地址和地址空间准确数图融合;将档案文件归档地址和对应档案文件归档空间图像通过显示屏可视化推送到档案管理端。
52、三、通过采用语音识别设备准确采集档案文件归档地址校准参数,同时将档案文件归档地址校准数据与档案文件归档地址数据进行档案文件归档地址修正处理,精准修正档案文件归档地址参数,提高了档案文件归档地址分析的精度;依据档案文件归档地址修正参数,自主实现档案文件归档作业,提高了档案文件归档作业管理的质量和效率。
技术研发人员:卢晓洁,冯文敏,石晟,梁顺,陆日攀,李妞,陈水奔
技术所有人:广西智汇通人力资源有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除