声源分离装置的制作方法

本发明涉及声源分离装置。
背景技术:
1、通过传声器输入的声音输入信号不仅包括需要识别声音的目标声音,而且,可包括阻碍声音识别的噪声。因此,当前正在进行多种研究,以便从声音输入信号去除噪声并仅提取需要的目标声音来提高声音识别性能。
2、现有技术文献
3、专利文献
4、韩国授权专利第10-1133308号(授权日:2012年3月28日)
技术实现思路
1、技术问题
2、本发明所要实现的技术目的在于,提供如下的声源分离装置,即,通过基于多个传声器输入信号推定的推定源向量及推定噪声向量来生成目标函数,利用对数似然函数(log-likelihood function)替换目标函数包括的第一项(term)及第二项,在目标函数包括的第三项为非负数的限制条件下最大化对数似然函数来推定分层矩阵,由此,可进一步精确分离分别从多个声源传递的声音信号。
3、技术方案
4、为了实现上述目的,本发明实施例的声源分离装置可包括多个传声器、矩阵部及输出部。多个传声器可接收从多个声源传递的多个传声器输入信号。矩阵部可通过基于上述多个传声器输入信号推定的推导源向量及推定噪声向量来生成目标函数,可利用对数似然函数(log-likelihood function)替换上述目标函数包括的第一项(term)及第二项来推定分层矩阵。输出部可提供基于上述传声器输入信号及上述分层矩阵计算的输出向量。
5、在本发明一实施例中,上述目标函数包括的第三项可大于或等于0。
6、在本发明一实施例中,在上述第三项为非负数的限制条件下,上述对数似然函数的最大化可通过拉格朗日函数(lagrangian function)的最大化实现。
7、在本发明一实施例中,上述拉格朗日函数能够被分离为各个频率的拉格朗日函数,可通过对所有频率独立地最大化各个频率的拉格朗日函数来最大化上述拉格朗日函数。
8、在本发明一实施例中,上述推定源向量的方差可通过上述拉格朗日函数对上述推定源向量的方差进行偏微分来计算。
9、在本发明一实施例中,上述声源分离装置还可包括第一方差推定器。第一方差推定器可基于上述传声器输入信号推定上述推定源向量的方差。
10、在本发明一实施例中,上述声源分离装置还可包括第一掩膜部。第一掩膜部可利用应用于上述传声器输入信号的第一掩膜提供上述推定源向量的方差。
11、在本发明一实施例中,上述推定噪声向量的方差可通过上述拉格朗日函数对上述推定噪声向量的方差进行偏微分来计算。
12、在本发明一实施例中,上述推定噪声向量的方差可以为大于0的常数。
13、在本发明一实施例中,上述声源分离装置还可包括第二方差推定器。第二方差推定器可基于上述传声器输入信号推定上述推定噪声向量的方差。
14、在本发明一实施例中,上述声源分离装置还可包括第二掩膜部。第二掩膜部可利用应用于上述传声器输入信号的第二掩膜提供上述推定源向量的方差。
15、在本发明一实施例中,上述声源分离装置还可包括矩阵计算部。矩阵计算部可分别基于上述推定源向量及上述推定噪声向量分别计算上述分层矩阵包括的推导源分层矩阵及推定噪声分层矩阵。
16、在本发明一实施例中,上述推定源分层矩阵可通过依次计算推定源分层向量来计算。
17、在本发明一实施例中,上述推定噪声分层矩阵可通过依次计算推定噪声分层向量来计算。
18、在本发明一实施例中,上述推定噪声分层矩阵可通过上述推定源分层矩阵计算。
19、在本发明一实施例中,上述推定源分层向量更新的上述分层矩阵的行列式(determinant)可以为上述推定源分层向量更新之前的上述分层矩阵的共轭(conjugate)行列式的倒数。
20、在本发明一实施例中,上述推定噪声分层向量更新的上述分层矩阵的行列式可以为上述推定噪声分层向量更新之前的上述分层矩阵的共轭行列式的倒数。
21、在本发明一实施例中,上述分层矩阵由恒等矩阵(identity matrix)初始化,在初始化后,上述分层矩阵的行列式能够始终维持为1。
22、在本发明一实施例中,上述推定源分层向量可基于推定源空间协方差逆矩阵及分层逆矩阵计算。
23、在本发明一实施例中,上述推定噪声分层向量可基于推定噪声空间协方差逆矩阵及分层逆矩阵计算。
24、在本发明一实施例中,上述推定源空间协方差逆矩阵可利用上述推定源向量的方差及先前时间推定源的空间协方差逆矩阵递归计算。
25、在本发明一实施例中,上述推定源空间协方差逆矩阵的初始化可利用恒等矩阵(identity matrix)实现。
26、在本发明一实施例中,上述推定噪声空间协方差逆矩阵能够利用上述推定噪声向量的方差及先前时间推定噪声空间协方差逆矩阵递归计算。
27、在本发明一实施例中,上述推定噪声空间协方差逆矩阵的初始化可利用恒等矩阵(identity matrix)实现。
28、在本发明一实施例中,上述分层逆矩阵可利用上述推定源分层向量计算。
29、在本发明一实施例中,上述分层逆矩阵可利用上述推定噪声分层向量计算。
30、除如上所述的本发明技术方案外,本发明所属技术领域的普通技术人员可通过以下记载内容明确理解本发明的其他特征及优点。
31、发明的效果
32、如上所述的本发明具有以下效果。
33、本发明的声源分离装置可通过基于多个传声器输入信号推定的推定源向量及推定噪声向量来生成目标函数,利用对数似然函数(log-likelihood function)替换上述目标函数包括的第一项(term)及第二项来推定分层矩阵,由此,可进一步精确分离分别从多个声源传递的声音信号。
34、除此之外,也可通过本发明实施例明确理解本发明的其他特征及优点。
技术特征:
1.一种声源分离装置,其特征在于,包括:
2.根据权利要求1所述的声源分离装置,其特征在于,上述目标函数包括的第三项大于0。
3.根据权利要求2所述的声源分离装置,其特征在于,在上述第三项为非负数的限制条件下,上述对数似然函数的最大化通过拉格朗日函数的最大化实现。
4.根据权利要求3所述的声源分离装置,其特征在于,上述拉格朗日函数能够被分离为各个频率的拉格朗日函数,通过对所有频率独立地最大化上述各个频率的拉格朗日函数来最大化上述拉格朗日函数。
5.根据权利要求4所述的声源分离装置,其特征在于,上述推定源向量的方差通过上述拉格朗日函数对推定源向量的方差进行偏微分来计算。
6.根据权利要求5所述的声源分离装置,其特征在于,上述声源分离装置还包括第一方差推定器,上述第一方差推定器基于上述传声器输入信号推定上述推定源向量的方差。
7.根据权利要求6所述的声源分离装置,其特征在于,上述声源分离装置还包括第一掩膜部,上述第一掩膜部利用应用于上述传声器输入信号的第一掩膜提供上述推定源向量的方差。
8.根据权利要求7所述的声源分离装置,其特征在于,上述推定噪声向量的方差通过上述拉格朗日函数对上述推定噪声向量的方差进行偏微分来计算。
9.根据权利要求8所述的声源分离装置,其特征在于,上述推定噪声向量的方差为大于0的常数。
10.根据权利要求9所述的声源分离装置,其特征在于,上述声源分离装置还包括第二方差推定器,上述第二方差推定器基于上述传声器输入信号推定上述推定噪声向量的方差。
11.根据权利要求10所述的声源分离装置,其特征在于,上述声源分离装置还包括第二掩膜部,上述第二掩膜部利用应用于上述传声器输入信号的第二掩膜提供上述推定源向量的方差。
12.根据权利要求11所述的声源分离装置,其特征在于,上述推定源分层矩阵由推定源分层向量构成,推定源分层向量能够基于推定源空间协方差逆矩阵及分层逆矩阵计算。
13.根据权利要求12所述的声源分离装置,其特征在于,上述推定源空间协方差逆矩阵能够利用上述推定源向量的方差及先前时间推定源的空间协方差逆矩阵递归计算。
14.根据权利要求13所述的声源分离装置,其特征在于,上述分层逆矩阵能够利用上述推定源分层向量计算。
15.根据权利要求11所述的声源分离装置,其特征在于,上述推定噪声分层矩阵由推定噪声分层向量构成,推定噪声分层向量能够基于推定噪声空间协方差逆矩阵及分层逆矩阵计算。
16.根据权利要求15所述的声源分离装置,其特征在于,上述推定噪声空间协方差逆矩阵能够利用上述推定噪声向量的方差及先前时间推定噪声空间协方差逆矩阵递归计算。
17.根据权利要求16所述的声源分离装置,其特征在于,上述分层逆矩阵能够利用上述推定噪声分层向量计算。
18.根据权利要求17所述的声源分离装置,其特征在于,上述推定噪声分层矩阵能够基于上述推定源分层矩阵计算。
19.根据权利要求11所述的声源分离装置,其特征在于,上述分层矩阵由恒等矩阵初始化,在初始化后,上述分层矩阵的行列式能够始终维持为1。
技术总结
本发明实施例的声源分离装置可包括多个传声器、矩阵部及输出部。多个传声器可接收从多个声源传递的多个传声器输入信号。矩阵部可通过基于多个传声器输入信号推定的推导源向量及推定噪声向量来生成目标函数,可利用对数似然函数替换目标函数包括的第一项及第二项来推定分层矩阵。输出部可提供基于传声器输入信号及分层矩阵计算的输出向量。本发明的声源分离装置通过基于多个传声器输入信号推定的推定源向量及推定噪声向量来生成目标函数,可利用对数似然函数替换目标函数包括的第一项及第二项来推定分层矩阵,由此,可进一步精确分离分别从多个声源传递的声音信号。
技术研发人员:朴亨敏,赵炳俊
受保护的技术使用者:株式会社mp微波
技术研发日:
技术公布日:2024/11/14
技术研发人员:朴亨敏,赵炳俊
技术所有人:株式会社mp微波
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除