通义听悟

阿里智能AI会议转录和总结工具,支持实时双语翻译字幕,一键高亮要点,智能提炼总结,高效记录、整理和共享音视频内容。

通义听悟是阿里巴巴集团推出的一款基于通义千问大语言模型和音视频AI模型能力的AI助手,旨在为用户提供高效、智能的音视频内容处理体验。它通过语音识别、自然语言处理、说话人分离、全文摘要、章节速览等技术,帮助用户轻松记录、整理和理解音视频内容,广泛应用于企业办公、在线教育、媒体采访、分析师访谈、新媒体工作者整理视频、外语交流等场景。

详细介绍

通义听悟的核心功能包括:

发展历程

  1. 2021年1月:通义听悟最初诞生于阿里巴巴内部,作为一项企业内部提效工具,用于提升会议效率和内部沟通。

  2. 2023年6月1日:通义听悟正式上线,成为阿里云通义家族的首个面向大众消费者的应用产品。它基于通义千问大模型,融合了十多项AI功能,包括实时语音转文字、多语言翻译、内容理解/摘要、全文概要、章节速览、发言总结、PPT提取等。

  3. 2023年11月:在2023云栖大会上,通义听悟正式上线,并进一步优化了用户体验,如提供每日免费转写时长、扩展存储空间、推荐播客内容一键转写等特色服务。

  4. 2024年3月19日:通义听悟发布多项新功能,包括音视频问答助手“小悟”、一键AI改写、思维导图生成等六大功能。同时,推出了“高校公益计划”,向中国大陆高校师生赠送500小时音视频转写时长和200G存储空间。

  5. 2024年9月:通义听悟继续升级,新增“PPT创作”功能,支持用户通过一句话或文档输入生成PPT大纲及详细内容,满足工作汇报、学术演讲等多种场景需求。

技术优势

应用场景

通义听悟的目标用户群体包括:

商业化路径

通义听悟的商业化路径目前主要面向B端客户收费,无面向C端收费计划。产品负责人杨帆表示,目前通义听悟没有任何对C端收费的计划,“C端的应用承载的使命更多是向所有用户展现阿里技术的研究方向,通过API(应用程序编程接口)的方式在B端实现商业化,是我们的产品策略”。

通义听悟自2023年6月正式上线以来,迅速获得了市场的认可,并在短短几个月内吸引了数百万用户,涵盖学生、教师、白领、记者、律师、金融分析师等各类人群。平台每天处理字符数高达20亿字,以高效性和易用性广受好评。

留言评论