
你需要通义听悟吗
如果你是一名职场人士,通义听悟可以帮你记录和回顾你的每一场会议;
如果你是一位学生朋友,通义听悟可以让你不遗漏老师讲授的每一个重点;
如果你是一名金融分析师或媒体从业人员,通义听悟可以存档你每一次的调研访谈;
如果你想以最快的时间看完你最喜爱的视频博主的直播分享,通义听悟可以使你以成倍的速度抓住最精彩的内容。
根据阿里云智能首席技术官周靖人介绍,听悟集成了阿里最先进的语音和语言技术。其内置阿里新一代工业级语音识别模型,识别准确率在多个权威中文数据集上名列第一;融合自研语音语义多模态说话人算法,能对 10 人以上说话场景进行角色区分;接入通义千问大模型后,能够对上万字的音视频内容进行摘要总结,事实准确与要点完备性国内领先,支持跨多音视频内容的精准问答理解。
事实上,通义听悟的前身是阿里云内部一个名为“听悟”的产品,主要功能包括实时会议、音频转写功能,“听悟”自2022 年年底就开始小范围内测。而如今,在阿里云通义千问大模型的加持下,通义听悟成为人们工作学习的AI 助手,从会议讨论、教学培训到调研访谈,通义听悟都能极大提高人们的工作效率。
自动做笔记、提取PPT、整理访谈“打工人”的好帮手
通义听悟具有极强的工具属性,而在看重软件生产力的办公领域,能够帮助“打工人”自动做笔记、提取PPT、整理访谈的通义听悟一亮相就受到大众的高度关注。目前通义听悟提供小程序和PC 网页两个使用途径,其中,移动端通义听悟界面设计相对简单,提供“上传手机音视频”“实时记录”“权益加油站”三个选项,通常简单的会议记录喜欢用手机直接做“实时记录”,不过遗憾的是通义听悟建议在PC 端体验更多功能,这意味着手机端更多的操作还是以“上传手机音视频”为主(如图1)。
上传之前,通义听悟会让用户选择“转写语言”及是否“区分发言人”,提前做好预设之后,明显能更准确地获得文字转写记录。而在选择上传内容界面,让笔者比较惊喜的是除顶部工具条按照“图片”“音频”“视频”“文档”做了分类,方便用户选择本地文件外,用户还可以打开第三方应用提取音视频文件。
比较有意思的是通义听悟自身介绍时表示可以打通同阿里云盘的内容关联,但在移动版通义听悟内容选择界面,其加入了“中国移动云盘”这一选项(如图2)。笔者尝试点击“中国移动云盘”后发现,能很好地识别网盘里面的内容,但是无法提取文件。

