换脸变声的交互方法、装置、存储介质以及电子设备与流程

更新时间:2025-04-01 01:26:44 0条评论

默认

换脸变声的交互方法、装置、存储介质以及电子设备与流程

1.本发明涉及计算机领域，具体而言，涉及一种换脸变声的交互方法、装置、存储介质以及电子设备。

背景技术：

2.随着互联网的发展，越来越多的人喜欢通过观看直播来丰富自己的业余生活，且直播在当代越发受年轻人的喜欢。在直播过程中观众对主播的审美标准不一，对颜值和声音的审美存在差异，单一的主播形象导致直播效果不理想。

技术实现要素：

3.本发明实施例提供了一种换脸变声的交互方法、装置、存储介质以及电子设备，以至少解决在直播过程中，单一的主播形象导致直播效果不理想的技术问题。
4.根据本发明实施例的一个方面，提供了一种换脸变声的交互方法，包括：在检测到用户选择开始直播的情况下，确定上述用户选择的人脸转换方案和声道转换方案；获取上述用户的真实人脸和真实声道；根据上述人脸转换方案将上述真实人脸转换为目标人脸，根据上述声道转换方案将上述真实声道转换为目标声道；根据上述目标人脸和上述目标声道展示直播界面。
5.根据本发明实施例的另一方面，提供了一种换脸变声的交互装置，包括：确定模块，用于在检测到用户选择开始直播的情况下，确定上述用户选择的人脸转换方案和声道转换方案；获取模块，用于获取上述用户的真实人脸和真实声道；转换模块，用于根据上述人脸转换方案将上述真实人脸转换为目标人脸，根据上述声道转换方案将上述真实声道转换为目标声道；展示模块，用于根据上述目标人脸和上述目标声道展示直播界面。
6.作为一种可选的示例，上述第一确定模块包括：第一展示单元，用于在检测到上述用户选择开始直播的情况下，展示人脸自定义模式组；第二展示单元，用于在检测到上述用户在上述人脸自定义模式组中选择第一人脸自定义模式的情况下，展示预设的多个美颜配置；第一确定单元，用于确定上述用户在上述多个美颜配置中选择的第一目标美颜配置；第一生成单元，用于根据上述第一目标美颜配置，生成上述人脸转换方案。
7.作为一种可选的示例，上述第一确定模块还包括：第二确定单元，用于在检测到上述用户选择第二人脸自定义模式的情况下，确定上述用户自定义的第二目标美颜配置；第二生成单元，用于根据上述第二目标美颜配置，生成上述人脸转换方案。
8.作为一种可选的示例，上述第一确定模块还包括：第一获取单元，用于在检测到上述用户选择开始直播的情况下，展示人脸自定义模式组之后，在检测到上述用户选择第三人脸自定义模式的情况下，获取上述用户输入的目标图片；第三确定单元，用于从上述目标图片中确定第一人脸；第三生成单元，用于根据上述第一人脸生成上述人脸转换方案。
9.作为一种可选的示例，上述第一确定模块还包括：第二获取单元，用于在检测到上述用户选择开始直播的情况下，展示人脸自定义模式组之后，在检测到上述用户选择第三
人脸自定义模式的情况下，获取上述用户输入的目标视频；第四确定单元，用于从上述目标视频中确定第二人脸；第四生成单元，用于根据上述第二人脸生成上述人脸转换方案。
10.作为一种可选的示例，上述第一确定模块包括：第三展示单元，用于在检测到上述用户确定上述人脸转换方案的情况下，展示声道自定义模式组；第四展示单元，用于在检测到上述用户在上述声道自定义模式组中选择第一声道自定义模式的情况下，展示预设的多个声道配置；第四确定单元，用于确定上述用户在上述多个声道配置中选择的目标声道配置；第五生成单元，用于根据上述目标声道配置，生成上述声道转换方案。
11.作为一种可选的示例，上述第一确定模块还包括：第三获取单元，用于在检测到上述用户确定上述人脸转换方案的情况下，展示声道自定义模式组之后，在检测到上述用户选择第二声道自定义模式的情况下，获取上述用户输入的目标语音；第六生成单元，用于根据上述目标语音生成上述声道转换方案。
12.根据本发明实施例的又一方面，还提供了一种存储介质，该存储介质中存储有计算机程序，其中，该计算机程序被处理器运行时执行上述换脸变声的交互方法。
13.根据本发明实施例的又一方面，还提供了一种电子设备，包括存储器和处理器，上述存储器中存储有计算机程序，上述处理器被设置为通过所述计算机程序执行上述的换脸变声的交互方法。
14.在本发明实施例中，采用了在检测到用户选择开始直播的情况下，确定上述用户选择的人脸转换方案和声道转换方案；获取上述用户的真实人脸和真实声道；根据上述人脸转换方案将上述真实人脸转换为目标人脸，根据上述声道转换方案将上述真实声道转换为目标声道；根据上述目标人脸和上述目标声道展示直播界面的方法，由于在上述方法中，根据用户选择的人脸转换方案和声道转换方案，生成目标人脸和目标声道并展示在直播界面，从而实现了自定义人脸形象和语音声道的目的，进而解决了在直播过程中，单一的主播形象导致直播效果不理想的技术问题。
附图说明
15.此处所说明的附图用来提供对本发明的进一步理解，构成本技术的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：
16.图1是根据本发明实施例的一种可选的换脸变声的交互方法的流程图；
17.图2是根据本发明实施例的一种可选的换脸变声的交互方法的实现流程图；
18.图3是根据本发明实施例的一种可选的换脸变声的交互装置的结构示意图；
19.图4是根据本发明实施例的一种可选的电子设备的示意图。
具体实施方式
20.为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。
21.需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第
二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
22.根据本发明实施例的第一方面，提供了一种换脸变声的交互方法，可选地，如图1所示，上述方法包括：
23.s102，在检测到用户选择开始直播的情况下，确定用户选择的人脸转换方案和声道转换方案；
24.s104，获取用户的真实人脸和真实声道；
25.s106，根据人脸转换方案将真实人脸转换为目标人脸，根据声道转换方案将真实声道转换为目标声道；
26.s108，根据目标人脸和目标声道展示直播界面。
27.可选地，本实施例中，用户选择开始直播后，通过选择界面确定人脸转换方案和声道转换方案，确定完成选择后，开始直播，直播界面展示根据人脸转换方案和声道转换方案将用户的真实人脸和真实声道转换的目标人脸和目标声道。人脸转换方案和声道转换方案可以根据选择界面自定义选择，也可以通过录入的方式自定义。
28.可选地，本实施例中，检测到用户选择开始直播后，展示人脸和声道转换的选择界面，可以同时展示人脸转换的选择界面和声道转换的选择界面，也可以先展示人脸转换的选择界面，待人脸转换方案确定后展示声道转换的选择界面，展示方法不限。在用户确定人脸转换方案和声道转换方案后，获取用户的真实人脸和真实声道，根据人脸转换方案将真实人脸转换为目标人脸，根据声道转换方案将真实声道转换为目标声道，可以预展示目标人脸和目标声道，若用户不满意可重新选择。在确定选择完成后，开始直播，直播界面展示目标人脸和目标声道，在直播过程中也可以修改人脸转换方案和声道转换方案。
29.可选地，本实施例中，根据用户选择的人脸转换方案和声道转换方案，生成目标人脸和目标声道并展示在直播界面，从而实现了自定义人脸形象和语音声道的目的，进而解决了在直播过程中，单一的主播形象导致直播效果不理想的技术问题。
30.作为一种可选的示例，在检测到用户选择开始直播的情况下，确定用户选择的人脸转换方案包括：
31.在检测到用户选择开始直播的情况下，展示人脸自定义模式组；
32.在检测到用户在人脸自定义模式组中选择第一人脸自定义模式的情况下，展示预设的多个美颜配置；
33.确定用户在多个美颜配置中选择的第一目标美颜配置；
34.根据第一目标美颜配置，生成人脸转换方案。
35.可选地，本实施例中，在检测到用户选择开始直播后，展示人脸自定义模式组，人脸自定义模式组包括第一人脸自定义模式、第二人脸自定义模式、第三人脸自定义模式，在检测到用户选择第一人脸自定义模式的情况下，展示预设的多组美颜配置，美颜配置包括脸型组、妆容组、五官比例组以及发型组，还可以包括牙齿组、皮肤组等。每一组中有多个供
选择的方案，例如脸型组包括鹅蛋脸、方圆脸等。确定用户从多个方案中选择出的第一目标脸型、第一目标妆容、第一目标五官比例、第一目标发型，得到目标美颜配置，根据目标美颜配置生成人脸转换方案。
36.作为一种可选的示例，在检测到用户选择开始直播的情况下，展示人脸自定义模式组之后，上述方法还包括：
37.在检测到用户选择第二人脸自定义模式的情况下，确定用户自定义的第二目标美颜配置；
38.根据第二目标美颜配置，生成人脸转换方案。
39.可选地，本实施例中，在检测到用户选择第二人脸自定义模式的情况下，展示自定义界面，用户可以自定义脸型，妆容，五官比例，发型等，确定用户自定义的第二目标美颜配置：第二目标脸型、第二目标妆容、第二目标五官比例、第二目标发型、根据第二目标美颜配置生成人脸转换方案。
40.作为一种可选的示例，在检测到用户选择开始直播的情况下，展示人脸自定义模式组之后，方法还包括：
41.在检测到用户选择第三人脸自定义模式的情况下，获取用户输入的目标图片；
42.从目标图片中确定第一人脸；
43.根据第一人脸生成人脸转换方案。
44.可选地，本实施例中，在检测到用户选择第三人脸自定义模式的情况下，展示上传图片或视频界面，检测到用户上传的是图片的情况下，获取用户上传的目标图片，同时确定目标图片中的第一人脸，根据第一人脸生成人脸转换方案。
45.作为一种可选的示例，在检测到用户选择开始直播的情况下，展示人脸自定义模式组之后，上述方法还包括：
46.在检测到用户选择第三人脸自定义模式的情况下，获取用户输入的目标视频；
47.从目标视频中确定第二人脸；
48.根据第二人脸生成人脸转换方案。
49.可选地，本实施例中，可选地，本实施例中，在检测到用户选择第三人脸自定义模式的情况下，展示上传图片或视频界面，检测到用户上传的是视频的情况下，获取用户上传的目标视频，同时确定目标视频中的第二人脸，根据第二人脸生成人脸转换方案。
50.作为一种可选的示例，在检测到用户选择开始直播的情况下，确定用户选择的声道转换方案包括：
51.在检测到用户确定人脸转换方案的情况下，展示声道自定义模式组；
52.在检测到用户在声道自定义模式组中选择第一声道自定义模式的情况下，展示预设的多个声道配置；
53.确定用户在多个声道配置中选择的目标声道配置；
54.根据目标声道配置，生成声道转换方案。
55.可选地，本实施例中，在检测到用户确定人脸转换方案后，展示声道自定义模式组，包括第一自定义模式和第二自定义模式，在检测到用户选择的是第一自定义模式的情况下，展示预设的多个声道配置，包括发音风格组，语言组，性别组以及性格组，每一组有多个方案，例如发音风格组有萝莉音、大叔音等，语言组有英语、韩语等，还可以是各地方言。
性别组有男、女，性格组有活泼、文静等。确定用户从多个方案中选择出目标发音风格，目标语言，目标性别，目标性格，得到目标声道配置，根据目标声道配置生成声道转换方案。
56.作为一种可选的示例，在检测到用户确定人脸转换方案的情况下，展示声道自定义模式组之后，上述方法还包括：
57.在检测到用户选择第二声道自定义模式的情况下，获取用户输入的目标语音；
58.根据目标语音生成声道转换方案。
59.可选地，本实施例中，在检测到用户选择的是第二自定义模式的情况下，展示上传目标语音界面，可以进行录音，也可以由用户上传语音文件，从语音文件中提取目标语音。根据目标语音生成声道转换方案。
60.结合一种示例进行说明，本技术涉及一种换脸变声的交互方法，通过ai(人工智能artificial intelligence)智能换脸技术和ai智能语音技术，在直播间添加主播换脸变声功能，由官方统一建模各类风格人脸模型以及声道模型，便于用户在直播间自定义主播形象。具体实现流程如图2所示：
61.1.用户进入商城，点击直播间，在直播间侧方ai形象按钮中，自定义人脸转换方案和声道转换方案；
62.2.自定义人脸转换方案：
63.a.第一人脸自定义模式，用户从脸型组、妆容组、五官比例组以及发型组中选择第一目标脸型、第一目标妆容、第一目标五官比例、第一目标发型，生成人脸转换方案；
64.b.第二人脸自定义模式，用户自定义第二目标脸型、第二目标妆容、第二目标五官比例、第二目标发型，生成人脸转换方案；
65.c.第三人脸自定义模式，用户拍照或录视频，上传图片或视频，生成人脸转换方案。
66.3.自定义声道转换方案：
67.a.第一声道自定义模式，用户从发音风格组、语言组、性别组以及性格组中选择目标发音风格、目标语言、目标性别、目标性格，生成声道转换方案；
68.b.第二声道自定义模式，用户录音或上传语音文件，提取目标语音，生成声道转换方案。
69.4.用户确定更换，开始直播。
70.需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。
71.根据本技术实施例的另一方面，还提供了一种换脸变声的交互装置，如图3所示，包括：
72.确定模块302，用于在检测到用户选择开始直播的情况下，确定用户选择的人脸转换方案和声道转换方案；
73.获取模块304，用于获取用户的真实人脸和真实声道；
74.转换模块306，用于根据人脸转换方案将真实人脸转换为目标人脸，根据声道转换
方案将真实声道转换为目标声道；
75.展示模块308，用于根据目标人脸和目标声道展示直播界面。
76.可选地，本实施例中，用户选择开始直播后，通过选择界面确定人脸转换方案和声道转换方案，确定完成选择后，开始直播，直播界面展示根据人脸转换方案和声道转换方案将用户的真实人脸和真实声道转换的目标人脸和目标声道。人脸转换方案和声道转换方案可以根据选择界面自定义选择，也可以通过录入的方式自定义。
77.可选地，本实施例中，检测到用户选择开始直播后，展示人脸和声道转换的选择界面，可以同时展示人脸转换的选择界面和声道转换的选择界面，也可以先展示人脸转换的选择界面，待人脸转换方案确定后展示声道转换的选择界面，展示方法不限。在用户确定人脸转换方案和声道转换方案后，获取用户的真实人脸和真实声道，根据人脸转换方案将真实人脸转换为目标人脸，根据声道转换方案将真实声道转换为目标声道，可以预展示目标人脸和目标声道，若用户不满意可重新选择。在确定选择完成后，开始直播，直播界面展示目标人脸和目标声道，在直播过程中也可以修改人脸转换方案和声道转换方案。
78.可选地，本实施例中，根据用户选择的人脸转换方案和声道转换方案，生成目标人脸和目标声道并展示在直播界面，从而实现了自定义人脸形象和语音声道的目的，进而解决了在直播过程中，单一的主播形象导致直播效果不理想的技术问题。
79.作为一种可选的示例，第一确定模块包括：
80.第一展示单元，用于在检测到用户选择开始直播的情况下，展示人脸自定义模式组；
81.第二展示单元，用于在检测到用户在人脸自定义模式组中选择第一人脸自定义模式的情况下，展示预设的多个美颜配置；
82.第一确定单元，用于确定用户在多个美颜配置中选择的第一目标美颜配置；
83.第一生成单元，用于根据第一目标美颜配置，生成人脸转换方案。
84.可选地，本实施例中，在检测到用户选择开始直播后，展示人脸自定义模式组，人脸自定义模式组包括第一人脸自定义模式、第二人脸自定义模式、第三人脸自定义模式，在检测到用户选择第一人脸自定义模式的情况下，展示预设的多组美颜配置，美颜配置包括脸型组、妆容组、五官比例组以及发型组，还可以包括牙齿组、皮肤组等。每一组中有多个供选择的方案，例如脸型组包括鹅蛋脸、方圆脸等。确定用户从多个方案中选择出的第一目标脸型、第一目标妆容、第一目标五官比例、第一目标发型，得到目标美颜配置，根据目标美颜配置生成人脸转换方案。
85.作为一种可选的示例，第一确定模块还包括：
86.第二确定单元，用于在检测到用户选择第二人脸自定义模式的情况下，确定用户自定义的第二目标美颜配置；
87.第二生成单元，用于根据第二目标美颜配置，生成人脸转换方案。
88.可选地，本实施例中，在检测到用户选择第二人脸自定义模式的情况下，展示自定义界面，用户可以自定义脸型，妆容，五官比例，发型等，确定用户自定义的第二目标美颜配置：第二目标脸型、第二目标妆容、第二目标五官比例、第二目标发型、根据第二目标美颜配置生成人脸转换方案。
89.作为一种可选的示例，第一确定模块还包括：
90.第一获取单元，用于在检测到用户选择开始直播的情况下，展示人脸自定义模式组之后，在检测到用户选择第三人脸自定义模式的情况下，获取用户输入的目标图片；
91.第三确定单元，用于从目标图片中确定第一人脸；
92.第三生成单元，用于根据第一人脸生成人脸转换方案。
93.可选地，本实施例中，在检测到用户选择第三人脸自定义模式的情况下，展示上传图片或视频界面，检测到用户上传的是图片的情况下，获取用户上传的目标图片，同时确定目标图片中的第一人脸，根据第一人脸生成人脸转换方案。
94.作为一种可选的示例，第一确定模块还包括：
95.第二获取单元，用于在检测到用户选择第三人脸自定义模式的情况下，获取用户输入的目标视频；
96.第四确定单元，用于从目标视频中确定第二人脸；
97.第四生成单元，用于根据第二人脸生成人脸转换方案。
98.可选地，本实施例中，可选地，本实施例中，在检测到用户选择第三人脸自定义模式的情况下，展示上传图片或视频界面，检测到用户上传的是视频的情况下，获取用户上传的目标视频，同时确定目标视频中的第二人脸，根据第二人脸生成人脸转换方案。
99.作为一种可选的示例，第一确定模块包括：
100.第三展示单元，用于在检测到用户确定人脸转换方案的情况下，展示声道自定义模式组；
101.第四展示单元，用于在检测到用户在声道自定义模式组中选择第一声道自定义模式的情况下，展示预设的多个声道配置；
102.第四确定单元，用于确定用户在多个声道配置中选择的目标声道配置；
103.第五生成单元，用于根据目标声道配置，生成声道转换方案。
104.可选地，本实施例中，在检测到用户确定人脸转换方案后，展示声道自定义模式组，包括第一自定义模式和第二自定义模式，在检测到用户选择的是第一自定义模式的情况下，展示预设的多个声道配置，包括发音风格组，语言组，性别组以及性格组，每一组有多个方案，例如发音风格组有萝莉音、大叔音等，语言组有英语、韩语等，还可以是各地方言。性别组有男、女，性格组有活泼、文静等。确定用户从多个方案中选择出目标发音风格，目标语言，目标性别，目标性格，得到目标声道配置，根据目标声道配置生成声道转换方案。
105.作为一种可选的示例，第一确定模块还包括：
106.第三获取单元，用于在检测到用户确定人脸转换方案的情况下，展示声道自定义模式组之后，在检测到用户选择第二声道自定义模式的情况下，获取用户输入的目标语音；
107.第六生成单元，用于根据目标语音生成声道转换方案。
108.可选地，本实施例中，在检测到用户选择的是第二自定义模式的情况下，展示上传目标语音界面，可以进行录音，也可以由用户上传语音文件，从语音文件中提取目标语音。根据目标语音生成声道转换方案。
109.本实施例的其他示例请参见上述示例，在此不在赘述。
110.图4是根据本技术实施例的一种可选的电子设备的结构框图，如图4所示，包括处理器402、通信接口404、存储器406和通信总线408，其中，处理器402、通信接口404和存储器406通过通信总线408完成相互间的通信，其中，
111.存储器406，用于存储计算机程序；
112.处理器402，用于执行存储器406上所存放的计算机程序时，实现如下步骤：
113.在检测到用户选择开始直播的情况下，确定用户选择的人脸转换方案和声道转换方案；
114.获取用户的真实人脸和真实声道；
115.根据人脸转换方案将真实人脸转换为目标人脸，根据声道转换方案将真实声道转换为目标声道；
116.根据目标人脸和目标声道展示直播界面。
117.可选地，在本实施例中，上述的通信总线可以是pci(peripheral component interconnect，外设部件互连标准)总线、或eisa(extended industry standard architecture，扩展工业标准结构)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图4中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。通信接口用于上述电子设备与其他设备之间的通信。
118.存储器可以包括ram，也可以包括非易失性存储器(non-volatile memory)，例如，至少一个磁盘存储器。可选地，存储器还可以是至少一个位于远离前述处理器的存储装置。
119.作为一种示例，上述存储器406中可以但不限于包括上述换脸变声的交互装置中的确定模块302、获取模块304、转换模块306以及展示模块308。此外，还可以包括但不限于上述请求的处理装置中的其他模块单元，本示例中不再赘述。
120.上述处理器可以是通用处理器，可以包含但不限于：cpu(central processing unit，中央处理器)、np(network processor，网络处理器)等；还可以是dsp(digital signal processing，数字信号处理器)、asic(application specific integrated circuit，专用集成电路)、fpga(field－programmable gate array，现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
121.可选地，本实施例中的具体示例可以参考上述实施例中所描述的示例，本实施例在此不再赘述。
122.本领域普通技术人员可以理解，图4所示的结构仅为示意，实施上述换脸变声的交互方法的设备可以是终端设备，该终端设备可以是智能手机(如android手机、ios手机等)、平板电脑、掌上电脑以及移动互联网设备(mobile internet devices，mid)、pad等终端设备。图4其并不对上述电子设备的结构造成限定。例如，电子设备还可包括比图4中所示更多或者更少的组件(如网络接口、显示装置等)，或者具有与图4所示的不同的配置。
123.本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、rom、ram、磁盘或光盘等。
124.根据本发明的实施例的又一方面，还提供了一种计算机可读的存储介质，该计算机可读的存储介质中存储有计算机程序，其中，该计算机程序被处理器运行时执行上述换脸变声的交互方法中的步骤。
125.可选地，在本实施例中，本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(read-only memory，
rom)、随机存取器(random access memory，ram)、磁盘或光盘等。
126.上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。
127.上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在上述计算机可读取的存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在存储介质中，包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
128.在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。
129.在本技术所提供的几个实施例中，应该理解到，所揭露的客户端，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。
130.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
131.另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
132.以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

技术特征：

1.一种换脸变声的交互方法，其特征在于，包括：在检测到用户选择开始直播的情况下，确定所述用户选择的人脸转换方案和声道转换方案；获取所述用户的真实人脸和真实声道；根据所述人脸转换方案将所述真实人脸转换为目标人脸，根据所述声道转换方案将所述真实声道转换为目标声道；根据所述目标人脸和所述目标声道展示直播界面。2.根据权利要求1所述的方法，其特征在于，所述在检测到用户选择开始直播的情况下，确定所述用户选择的人脸转换方案包括：在检测到所述用户选择开始直播的情况下，展示人脸自定义模式组；在检测到所述用户在所述人脸自定义模式组中选择第一人脸自定义模式的情况下，展示预设的多个美颜配置；确定所述用户在所述多个美颜配置中选择的第一目标美颜配置；根据所述第一目标美颜配置，生成所述人脸转换方案。3.根据权利要求2所述的方法，其特征在于，在检测到所述用户选择开始直播的情况下，展示人脸自定义模式组之后，所述方法还包括：在检测到所述用户选择第二人脸自定义模式的情况下，确定所述用户自定义的第二目标美颜配置；根据所述第二目标美颜配置，生成所述人脸转换方案。4.根据权利要求2所述的方法，其特征在于，在检测到所述用户选择开始直播的情况下，展示人脸自定义模式组之后，所述方法还包括：在检测到所述用户选择第三人脸自定义模式的情况下，获取所述用户输入的目标图片；从所述目标图片中确定第一人脸；根据所述第一人脸生成所述人脸转换方案。5.根据权利要求2所述的方法，其特征在于，在检测到所述用户选择开始直播的情况下，展示人脸自定义模式组之后，所述方法还包括：在检测到所述用户选择第三人脸自定义模式的情况下，获取所述用户输入的目标视频；从所述目标视频中确定第二人脸；根据所述第二人脸生成所述人脸转换方案。6.根据权利要求1所述的方法，其特征在于，所述在检测到用户选择开始直播的情况下，确定所述用户选择的声道转换方案包括：在检测到所述用户确定所述人脸转换方案的情况下，展示声道自定义模式组；在检测到所述用户在所述声道自定义模式组中选择第一声道自定义模式的情况下，展示预设的多个声道配置；确定所述用户在所述多个声道配置中选择的目标声道配置；根据所述目标声道配置，生成所述声道转换方案。7.根据权利要求6所述的方法，其特征在于，在检测到所述用户确定所述人脸转换方案
的情况下，展示声道自定义模式组之后，所述方法还包括：在检测到所述用户选择第二声道自定义模式的情况下，获取所述用户输入的目标语音；根据所述目标语音生成所述声道转换方案。8.一种换脸变声的交互装置，其特征在于，包括：确定模块，用于在检测到用户选择开始直播的情况下，确定所述用户选择的人脸转换方案和声道转换方案；获取模块，用于获取所述用户的真实人脸和真实声道；转换模块，用于根据所述人脸转换方案将所述真实人脸转换为目标人脸，根据所述声道转换方案将所述真实声道转换为目标声道；展示模块，用于根据所述目标人脸和所述目标声道展示直播界面。9.一种计算机可读的存储介质，所述计算机可读的存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器运行时执行所述权利要求1至7任一项中所述的方法。10.一种电子设备，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行所述权利要求1至7任一项中所述的方法。

技术总结

本发明公开了一种换脸变声的交互方法、装置、存储介质以及电子设备。该方法包括：在检测到用户选择开始直播的情况下，确定用户选择的人脸转换方案和声道转换方案；获取用户的真实人脸和真实声道；根据人脸转换方案将真实人脸转换为目标人脸，根据声道转换方案将真实声道转换为目标声道；根据目标人脸和目标声道展示直播界面。本发明解决了在直播过程中，单一的主播形象导致直播效果不理想的技术问题。主播形象导致直播效果不理想的技术问题。主播形象导致直播效果不理想的技术问题。