直播平台开发中美颜、滤镜的技术要求
直播平台开发完成采集之后得到原始数据,为了增强一些现场效果或者加上一些额外的效果,
我们一般会在将其编码压缩前进行处理,比如打上时间戳或者公司Logo的水印,祛斑美颜
和声音混淆等处理。
直播平台开发完成采集之后得到原始数据,为了增强一些现场效果或者加上一些额外的效果,
我们一般会在将其编码压缩前进行处理,比如打上时间戳或者公司Logo的水印,祛斑美颜
和声音混淆等处理。在主播和观众连麦场景中,主播需要和某个或者多个观众进行对话,并
将对话结果实时分享给其他所有观众,连麦的处理也有部分工作在推流端完成。
处理环节中分为音频和视频处理,音频处理中具体包含混音、降噪和声音特效等处理,视频
处理中包含美颜、水印、以及各种自定义滤镜等处理。
美颜是直播产品中最常见的功能之一。美颜的主要原理是通过「磨皮+美白」来达到整体美
颜的效果。磨皮的技术术语是「去噪」,也即对图像中的噪点进行去除或者模糊化处理,常
见的去噪算法有均值模糊、高斯模糊和中值滤波等。当然,由于脸部的每个部位不尽相同,
脸上的雀斑可能呈现出眼睛黑点的样子,对整张图像进行「去噪」处理的时候不需要将眼睛
也去掉,因此这个环节中也涉及到人脸和皮肤检测技术。
视频水印包括播放器水印和视频内嵌水印两种方式可供选择,对于播放器水印来说,如果没
有有效的防盗措施,对于没有播放鉴权的推流,客户端拿到直播流之后可以在任何一个不带
水印的播放器里面播放,因此也就失去了视频保护的能力。综合考虑云端录制对于水印的需
求,一般来说会选择「视频内嵌水印」的方式打水印。
连麦是互动直播中常见的需求。主播和部分观众之间可以进行实时互动,然后将互动结果实
时播放给其他观众观看。
基于以上业务需求,我们很容易想到基于单向直播原理,在主播端和连麦观众端进行双向推
流和双向播流的方式互动,然后在服务端将两路推流合成一路推送给其他观众。但RTMP带
来的延迟决定了这种方式无法做到用户可接受的互动直播。
实际上,互动直播的主要技术难点在于:
低延迟互动:保证主播和互动观众之间能够实时互动,两者之间就像电话沟通,因此必须保
证两者能在秒级以内听到对方的声音,看到对方的视频;
音画同步:互动直播中对音画同步的需求和单向直播中类似,只不过互动直播中的延迟要求
更高,必须保证在音视频秒级传输情况下的秒级同步;
音视频实时合成:其他观众需要实时观看到对话结果,因此需要在客户端或者服务端将画面
和声音实时合成,然后以低成本高品质的方式传输观众端。
在视频和电话会议领域,目前比较成熟的方案是使用思科或者WebEx的方案,但这些商用
的方案一不开源,二比较封闭,三成本比较高。对于互动人数比较少的互动直播,目前市场
上比较成熟的方案是使用基于WebRTC的实时通讯方案。
同时,为了保证合成后的音视频实时传输到其他观众端,可以采用经过改造的UDP协议传
输:
通过UDP降低传输延迟;
在UDP之上进行传输控制,保证用户互动体验QoS。
本文发布于:2023-03-04 13:51:04,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/zuowen/1677909064135495.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:视频如何美颜.doc
本文 PDF 下载地址:视频如何美颜.pdf
留言与评论(共有 0 条评论) |