优质的直播内容已经成为各大直播间营收增长的核心驱动力,而在打造优质直播内容的方式中,AIGC无疑是目前更具性价比和效率的方向。事实上,AI在直播间的应用也越来越深入,比如AI数字人主播、AI技术推动直播服务的优化和升级等等。
直播行业线上化程度高,且内容质量直接决定其价值创造,这两大特征使得AIGC应用在其中能够产生最大化的价值,并能够迅速渗透至核心生产环节。
这些听起来让人感觉新的增长机会近在眼前,而参差不齐、真真假假的应用能力让人感到焦虑又踌躇——想跟上AI 浪潮,但投入了成本,真能产生效益吗?哪些层面才能产生效益?
为此,我们深入直播行业调研,并采访到直播行业的技术TOP厂商,将AI技术在直播行业的细分应用场景挖掘出来,供大家参考与讨论——AI+直播是如何降低直播内容生产的成本和门槛,来赋能优质直播内容的创作,提升直播内容的质量、互动性和个性化体验。
AIGC为内容生产降本提效
AI技术以”低门槛、低成本、高效率”的创作模式赋能直播内容创作,已经显著地推动了降本增效的进程。主要体现在以下几个方面:
虚拟主播生成:
AI技术可以生成虚拟主播形象和声音,通过深度学习算法训练模型,创造逼真的虚拟形象,提供新颖的直播体验。虚拟主播可以24小时不间断直播,不需要休息,也不受到情绪、健康等因素的影响。通过预先设定的脚本和互动话术,能够持续吸引用户注意力,提高直播的频率和覆盖度,同时减少了对真人主播的依赖,降低了成本。
AI主播作为一个新型事物,目前处在发展应用的初期,平台、商家,以及MCN等都表现出了拥抱探索的心态。技术的发展有一个过程,目前AI直播在互动反馈、画面效果等方面仍然存在着短板,而技术的突破也直接决定了数字人直播的发展走向。
内容创作辅助:
在内容创作的辅助方面,主要分为视频和音频两大类。
AI视频创作类工具,如百度的”度加”,允许用户输入文案后自动匹配视频素材和编辑,快速生成内容丰富的视频。AI技术还可以基于热点新闻和用户兴趣自动生成文案脚本,为创作者提供灵感和素材,降低创作门槛。还包括个性化推荐、实时弹幕处理等。
AI音频频创作类工具,AI技术在声音创作方向上提供了文本配音、音色定制、智能变声等功能,帮助创作者高效简洁地完成配音工作。以即构科技的”VC音色转换”为例,该技术可支持Any-to-One音色转换,即将任意说话人的语音转换为特定音色,算法可实时生成高清目标音色语音,保留原始语气与说话韵律。
另外,在直播场景中,主播在做外景直播时,常常有不确定的噪音”乱入”,严重影响用户听感,甚至会让用户离开直播间。此时,主播通常选择降噪,但一般降噪技术,在降低噪音的同时,也会损伤音乐声音。假如主播表演个弹唱,降噪技术直接就把音乐伴奏识别为噪音,一并消除了大部分,别说普通用户的听感不舒适,对于热爱音乐的用户简直是一种折磨。
对此,即构科技针对性地推出了”场景化AI降噪”,在消除环境噪音的同时,还能保障纯净音乐伴奏声。并且能根据不同的直播环境(户外噪音环境和音乐演奏场景),智能调整最佳降噪策略——如果是户外噪音,没有音乐演唱,AI降噪将启动消噪,保障优质人声;如果环境里有音乐伴奏,AI降噪将自动识别音乐伴奏,降噪同时,保留人声和纯净音乐。如此,主播无论在怎样的环境开播,无需手动操作,AI降噪都能实时保护主播人声和音乐的最佳音质,保证用户最舒适的听感。
另外,AI技术还通过内容水印、内容指纹识别、监测与屏蔽技术等,保护直播内容的版权,减少盗版风险。
AI技术不仅提高了直播内容创作的效率和质量,还为直播平台和创作者提供了更多的创新可能性和商业机会。可以预见的是,随着AI技术的不断进步,未来直播内容创作将变得更加智能化、个性化和互动化。
AI 能发挥的”降本增效”的作用,无非是对劳动力的”替代”,而非”超越。但AI未来的发展速度将比我们想象的更快,对直播内容创作的赋能或许也很快就将从”降本增效”转变为”不可替代的全新生产方式”。积极拥抱AIGC,不仅仅是企业降本增效的手段,而是跟上时代发展脚步的基础门槛。