首页  专利技术  其他产品的制造及其应用技术

一种流式语音推理方法、装置、车机、存储介质及车辆与流程

206次浏览

技术特征:

1.一种流式语音推理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述计算结果是对所述预设张量维度对应的第二帧张量进行拆解得到的拆解结果,

3.根据权利要求1所述的方法,其特征在于,所述计算结果是对所述预设张量维度对应的第二帧张量进行形状调整得到的调整结果,包括:

4.根据权利要求3所述的方法,其特征在于,所述调整方式为切片,所述目标帧张量为形状依赖区间对应的帧张量,所述形状依赖区间用于指示起始帧张量对应的位数和终止帧张量对应的位数;

5.根据权利要求1所述的方法,其特征在于,所述计算结果是对所述预设张量维度对应的第二帧张量进行对齐得到的对齐结果,所述第二帧张量是多个来自不同路径的帧张量,包括:

6.根据权利要求1所述的方法,其特征在于,所述将所述输入语音转换为第一帧张量,并确定所述第一帧张量的帧张量维度,包括:

7.根据权利要求1所述的方法,其特征在于,所述将所述输入语音转换为第一帧张量,包括:

8.一种流式语音推理装置,其特征在于,包括:

9.一种车机,其特征在于,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的流式语音推理方法。

10.一种计算机可读存储介质,其特征在于,包括:所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的流式语音推理方法。

11.一种车辆,其特征在于,包括:如权利要求8所述的一种流式语音推理装置,或者如权利要求9所述的一种车机。


技术总结
本公开涉及一种流式语音推理方法、装置、车机、存储介质及车辆,尤其涉及语音推理技术领域。包括:获取输入语音和流式参数,流式参数用于指示预设张量维度;将输入语音转换为第一帧张量,并确定第一帧张量的帧张量维度;对预设张量维度对应的第二帧张量进行流式化计算,以得到计算结果,其中,流式化计算包括拆解、形状调整和对齐中的至少一个,计算结果用于指示输入语音的上下文依赖数据;按照帧张量维度对计算结果进行维度恢复,以得到维度恢复结果,维度恢复结果用于进行语音推理。本公开实施例使得语音推理不再局限于某个模型中的特定算子,提升了语音推理的通用性和可拓展性。

技术研发人员:薛原
受保护的技术使用者:北京罗克维尔斯科技有限公司
技术研发日:
技术公布日:2024/11/14
文档序号 : 【 40001196 】

技术研发人员:薛原
技术所有人:北京罗克维尔斯科技有限公司

备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
薛原北京罗克维尔斯科技有限公司
配电设备和配电系统的制作方法 亮度补偿方法、装置、设备和存储介质与流程
相关内容