通义千问

阿里通用AI助手,处理各行业基于文本的内容。
通义入口
通义简介
通义千问是一款基于阿里巴巴自研的超大规模语言模型“通义”大模型开发的多模态智能服务平台。它能够理解和分析自然语言、图片、音频和视频等多模态数据,为用户提供高效智能的服务。通义千问在多个领域展现出色能力,包括文字创作、文本处理、编程辅助、翻译服务、对话模拟和数据可视化等。
通义千问的多个版本,如商业版、Qwen2.5推理模型、通义千问-Max、通义千问-Plus、通义千问-Turbo、通义千问-Long、通义千问Omni、通义千问VL和通义千问OCR,每个版本都有其特定的上下文长度、最大输入输出、成本和免费额度,适用于不同复杂度的任务。例如,通义千问-Max适合复杂多步骤任务,而通义千问-Turbo则适合简单任务,成本极低。通义千问Omni支持多模态输入输出,通义千问VL具有视觉理解能力,通义千问OCR专注于文字提取。
通义千问在技术上采用了增强的Transformer结构,结合了旋转位置嵌入(RoPE)和无偏置的RMSNorm技术,以及闪光注意力(Flash Attention)来加速训练过程,并使用了SwiGLU激活函数以提高模型性能。这些技术使得通义千问在处理长文本和复杂任务时表现出色。
通义千问的发展历程
2020年1月:为了解决移动淘宝推荐系统冷启动问题,阿里启动了多模态大模型研发项目。
2022年9月:阿里云发布了自研大模型“通义”大模型。
2023年4月7日:通义千问开始邀请测试。
2023年4月11日:通义千问在2023阿里云峰会上正式揭晓。
2023年7月:AI绘画创作大模型“通义万相”开启定向邀测。
2023年8月:通义千问正式开源。
2023年9月:通义千问大模型已首批通过备案,并正式向公众开放。
2023年10月31日:通义千问2.0正式发布,标志着模型的进一步升级和优化。
2023年11月7日:阿里云旗下大模型展开更名为通义,意为“通情,达义”,具备全副AI能力。
2023年11月:通义千问7B模型系列开源,包括Qwen-7B和Qwen-VL。
2023年11月:通义千问14B模型开源,其中包括Qwen-Agent和Qwen-Browser组件。
2023年11月:通义千问72B模型预计在2023年11月开源。
2024年5月:通义千问2.5发布,其性能进一步超越了GPT-4 Turbo。
2024年9月:阿里云通义千问再次回应Github页面404问题。
2024年10月:通义千问APP上线“通义舞王”功能。
2024年12月:通义千问在权威评测中表现优异,Qwen2.5-Max模型位居全球第九名,中国非推理类大模型第一名。