图像合成的制作方法
技术特征:
1.一种装置,包括:
2.根据权利要求1所述的装置,其中,所述第一接收器(301)被布置为接收一组输入视频序列,所述一组输入视频序列表示来自所述不同观看姿势的所述三维场景的视图,并且所述多幅图像是所述一组输入视频序列的帧;
3.根据任一前述权利要求所述的装置,其中,所述神经网络训练器(309)被布置为使用一组训练图像来训练所述视图合成神经网络(307),所述一组训练图像包括针对未由所述多幅图像中的所述至少一些图像中的图像所表示的观看姿势的第一组参考图像。
4.根据权利要求3所述的装置,其中,所述第一组参考图像包括从以下各项的组中选择的至少一幅图像:
5.根据权利要求3或4所述的装置,其中,所述一组训练图像包括第二组参考图像,所述第二组参考图像包括所述多幅图像中的图像,并且所述神经网络训练器(309)被布置为将不同的权重应用于所述第一组参考图像和所述第二组参考图像。
6.根据任一前述权利要求所述的装置,其中,所述神经网络训练器(309)被布置为在所述多幅图像中的至少一些图像被提供给所述视图合成神经网络之前对所述多幅图像中的至少一些图像进行编码和解码。
7.根据任一前述权利要求所述的装置,其中,所述神经网络训练器(309)被布置为在所述三维空间数据被提供给所述视图合成神经网络之前对所述三维空间数据进行编码和解码。
8.根据任一前述权利要求所述的装置,其中,所述神经网络训练器(309)被布置为利用一组默认系数来初始化所述视图合成神经网络,并且训练所述视图合成神经网络以确定用于所述视图合成神经网络(307)的经修改的系数;并且其中,所述生成器(305)被布置为将至少一些经修改的系数包括在所述视听数据流中。
9.根据权利要求8所述的装置,其中,所述生成器(305)被布置为响应于所述经修改的系数与所述默认系数之间的差异而选择系数的子集以进行发送。
10.一种装置,包括:
11.根据权利要求10所述的装置,其中,所述视听数据流包括一组视频序列,所述一组视频序列包括表示来自所述不同观看姿势的所述三维场景的视图的多个帧,并且所述多幅图像是所述多个帧中的帧;并且,所述系数数据包括描述所述视图合成神经网络(403)的时变系数的时变系数数据;并且,所述神经网络控制器(405)被布置为响应于所述时变系数数据而改变所述视图合成神经网络(403)的所述系数。
12.根据权利要求11所述的装置,其中,所述神经网络控制器(405)被布置为:确定针对至少一个时刻的内插系数值,针对所述至少一个时刻,系数数据不被包括在所述视听数据流中,所述内插系数值是根据所述时变系数数据的系数值确定的;并且将所述视图合成神经网络(403)的所述系数设置为针对所述至少一个时刻的所述内插系数值。
13.根据权利要求10至12中的任一项所述的装置,其中,所述视听数据流包括针对与所述多幅图像的观看姿势不同的观看姿势的图像的至少一个神经网络特征图,并且所述神经网络控制器(405)被布置为利用所述至少一个特征图来配置所述视图合成神经网络(403)。
14.根据前述权利要求10至13中的任一项所述的装置,其中,所述神经网络控制器(405)被布置为利用一组默认系数来初始化所述视图合成神经网络(403),并且由来自所述视听数据流的系数来覆写所述默认系数。
15.根据权利要求14所述的装置,其中,所述神经网络控制器(403)被布置为响应于所述多幅图像而从多组默认系数中选择所述一组默认系数。
16.根据任一前述权利要求所述的装置,其中,所述图像数据、所述场景数据以及所述系数数据中的至少两者共享所述视听数据流中的图片群组gop结构。
17.根据任一前述权利要求所述的装置,其中,所述视图合成神经网络(307、403)包括多个可调谐层和多个不可调谐层,并且所述视听数据流包括仅用于可调谐层的系数数据。
18.根据任一前述权利要求所述的装置,其中,所述三维空间数据包括针对所述场景的视频点云数据。
19.一种视听数据流,包括:
20.一种视听数据分布系统,包括根据权利要求1至9中的任一项所述的装置和根据权利要求10-18中的任一项所述的装置。
21.一种用于生成视听数据流的方法,所述方法包括:
22.一种方法,包括:
23.一种包括计算机程序代码单元的计算机程序产品,当所述程序在计算机上运行时,所述计算机程序代码单元适于执行根据权利要求20或21所述的所有步骤。
技术总结
第一装置包括接收所捕获的场景的图像的第一接收器(301)和接收场景的3D空间数据的第二接收器(303)。视图合成神经网络(307)根据图像和三维空间数据来生成针对不同观看姿势的场景的视图移位图像。神经网络训练器(309)基于针对不同观看姿势的所述场景的图像来训练所述视图合成神经网络(307)。生成器(305)生成视听数据流,所述视听数据流包括:所述图像的图像数据、表示所述三维空间数据的场景数据、以及描述训练之后的所述视图合成神经网络(307)的系数的系数数据。第二装置接收所述视听数据流,并且基于所述系数数据设置本地神经网络(403)。所述本地神经网络(403)然后用于生成针对不同观看姿势的场景的图像。
技术研发人员:C·韦雷坎普,B·克龙
受保护的技术使用者:皇家飞利浦有限公司
技术研发日:
技术公布日:2024/11/14
技术研发人员:C·韦雷坎普,B·克龙
技术所有人:皇家飞利浦有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除