作为一款融合阿里通义大模型的「音视频转文字」产品,阿里通义听悟近日升级发布多项新功能。
目前,通义听悟提供“实时语音转文字、上传音视频转文字、输入播客链接转写文字”三大主力音视频转文字服务,支持的单个视频最大时长,从4小时调整为6小时,视频文件大小上限调整为6G。

同时,通义听悟融合了十多项AI功能,包括转写、翻译、角色分离、全文摘要、章节速览、发言总结、PPT提取等,并支持标重点、记笔记,被许多用户称为“宝藏AI工具”。
用户注册后,就能免费使用通义听悟。目前,用户可在PC端及ChRoMe Edge浏览器插件,钉钉、微信小程序方式使用通义听悟。

据悉,未来,将在通义千问app中集成通义听悟的功能,到时候app端也能使用通义听悟。
阿里通义听悟产品负责人杨帆介绍,自去年6月发布以来,通义听悟累计注册用户超500万,包括学生、老师、白领、记者、律师、金融分析师等群体,每日处理音视频20万次。通义听悟面向C端用户没有收费计划,针对B端用户的需求,目前通义听悟API已经开放。
针对音视频转文字后的更多细节能力,通义听悟不断在做功能更新。此次,就一次性推出了多项新功能和服务,包括音视频问答助手“小悟”、音视频文件语种自动识别、思维导图、一键插入视频时间戳及截图、AI改写、高校公益计划等。

此次通义听悟上线的「小悟」擅长理解并回答与记录内容和播客内容相关的问题,帮用户更好地理解和掌握知识,无论是单篇记录还是多篇记录,小悟都能胜任。

笔记可添加时间戳,点击跳转对应进度。通过一键插入视频时间戳,右侧用户手动输入的笔记中带有时间信息,用户点击时间戳,可以直接把笔记记录时间对应的原音频/原视频的位置找到。

一键AI改写,可将口语转为书面表达,尤其适合整理采访速记等文本。

思维导图自动生成,最多支持五级xMind脑图,适合播客摘要。

通义听悟推出「高校公益计」”,推动AI算力普惠。所有中国大陆高校师生通过后缀edu.cn的教育邮箱进行认证后,均可直接获赠500小时转写时长,存储空间从20G拓展至200G。按目前市面上语音厂商9.9元每小时的折扣价,这一教育福利价值数千元。
通过教育邮箱认证的中国大陆高校师生,认证有效期内可享专属权益:
赠送500小时通义听悟转写时长
通义听悟存储空间扩大至200G
认证有效期1年(自认证成功之日起365天),到期后需重新认证。
就读于中国大陆院校的学生
任职于中国大陆院校的教职员
且须拥有就读/任职院校的电子邮箱
提交电子邮箱地址后,通义听悟将向此邮箱发送认证页面链接。用户需打开认证页面并确认进行认证。经系统验证通过,即完成认证,在认证有效期内可享专属权益。