新闻中心

搜索:

服务项目分类:

蛇年春节杭州台综合频道新闻联播启用数字人双播引关注

频频出现的数字人主播,引发了一个核心方面的争议,这个争议是,它们到底是当作炫技用的噱头,还是能够真正承担起生产主要任务具有关键性作用能发挥主导功能的核心工具呢 ?

技术分级与现状

当前,数字人技术依据交互能力可划分成多个不同的层级,最基础的那种是视频生成数字人,就如同杭州电视台所运用的播报员一样,其功能较为单一,仅仅是被用来进行信息的宣读活动,并且技术门槛较低;再高一级别的则是直播数字人,它能够识别简单的弹幕而且还能产生回应现象了,不过其反应常常会出现延迟状况,体验方面还不是很流畅。

2024年9月,上海有一家媒体启用的AI主播,是属于那更先进的实时交互类别的。此AI主播,它能够开展语音对话,并且反应速度有了一定程度的提升。然而,行业当中的观察者表明,该AI主播的动作表情依旧呈现出呆板的状态,显得不够自然且生动。这一情况,也就反映出了当前技术的其中一个普遍瓶颈。

表情生成与动作瓶颈

对数字人表情单一这一问题,技术专家称,借特定动作训练去延展丰富表情,现在已能较好达成。而真正的难点处在复杂的肢体动作模拟上。要使数字人像真人那般自然地走动、做手势,就得攻克动作捕捉与生成的协同难题。

相对而言合成一个静态数字人比较简单,用户上传一部分自己的视频,借助AI后台处理就能生成。不过这种标准模式的产出效果常常普通,缺少个性与深度,很难满足对品质有所要求的应用场景。

新闻播报领域的替代潜力

在新闻播报这种标准化场景那儿,数字人主播呈现出明确的替代潜力。传统播音属于单向输出,主持人是严格按照稿件去播读的。如今数字人的语音合成已经高度自然了,口型跟表情的匹配也是相当逼真的。

这使得,在晨间新闻当中,采用数字人主播,在技术上是完全可行的,并且还能够,节省人力成本。再者,在天气预告这类固定栏目里,采用数字人主播,同样在技术上完全可行,也能节省人力成本。另外,一些地方媒体已经开始尝试这么做了,将其用于填补非黄金时段的播报任务,以及重复性内容的播报任务。

实时互动与专业壁垒

然而,新闻工作绝非仅仅是念稿而已。特别是在访谈、连线直播这种情况下,主播要跟观众进行实时互动,还要应对突发的提问。这毫无疑问需要强大的知识库以及专业的应对体系当作支撑才能实现。资深主播所具备的经验和临场判断是不是能够轻易被复制的呢 。

现今,多数直播数字人所连接的乃是通用AI模型,缺少垂直领域里的深度训练。在被询问行业专业问题之际,它所给出的回答易于流于表面,甚而会出现错误,不能够提供具备价值的深度信息。

成本与商业应用的挑战

专业性问题要去着手解决,从理论层面而言能够对垂直领域的大模型开展训练。然而这必须投入数量巨大的专业数据用以长时间训练,其在资金以及技术方面的成本是非常高的,普通的中小企业根本没有能力去承担。这便形成了数字人深入到核心生产环节的主要阻碍 。

基于商业平台所反馈呈现的情况而言,单纯依靠AI的数字人进行直播时,观众流量情形以及转化获取到的效果,并非处于理想状态范围内。鉴于平台是从内容具备的质量以及管理层面方向予以考量,针对此类直播活动,也设置了许多的规范去进行约束限制安排。因成本投与效果之间存在不匹配的状况,这便对其朝着大规模实现商业化进而落地的进程形成了制约 。

未来发展的关键路径

数字人若要成为核心生产力,关键之处在于突破“交互深度”以及“专业精度”的瓶颈,这需要AI技术在理解上下文方面得到实质性进步,且需在把握专业语境方面取得实质性进展,而并非仅仅是外观的仿真,与此同时,具备开发成本更低以及效率更高特点的垂类模型训练方法也是至关重要的。

未来的突破说不定会源自技术跟场景的深度交融,比如说,在电商客服、企业培训等那些对交互模式要求相对固定的领域,率先达成有价值的替换,它的发展将会是一个从辅助工具演变为核心环节的渐变进程 。

你持有怎样的观点去看待,于哪一个确切的行业抑或是工作呈现的场景范围以内,数字人能够最为具备可能性地在紧接着的三年时间当中率先去变成那种绝对不可缺少的生产力呢?欢迎你将自身的看法分享出来。

返回列表