阿里云通义大模型全面升级

CTO周靖人:大模型将创造更多可能

2024-09-20

商报讯（实习记者余杨楠）在9月19日举办的杭州云栖大会上，阿里云再次展现其在人工智能领域的强大实力，通过一系列创新发布与模型升级，推动通义大模型在文本、图像、视频以及编程等多个领域的全面发展，引领AI技术进入全新阶段。

大会现场，阿里云CTO周靖人首先宣布了通义千问新一代开源模型Qwen2.5的发布。这一里程碑式的升级不仅将旗舰模型Qwen2.5-72B的性能推向极致，使其在MMLU-rudex、MBPP和MATH等多个权威基准测试中的表现超越了Llama 405B，再登全球开源大模型王座，还一举上架了超过100个不同尺寸和版本的模型，全面覆盖了大语言模型、多模态模型、数学模型和代码模型，充分满足不同开发者和场景的需求。在云栖大会现场，通过通义灵码，13岁中学生仅用2分钟就生成Python倒计时网页。

不仅如此，Qwen2.5系列还展现出了强大的多语言能力和跨场景应用能力。它能够支持中文、英文、法文等29种以上语言，并且能够丝滑响应多样化的系统提示，实现角色扮演、聊天机器人等多种复杂任务。同时，在数学和编程能力上，Qwen2.5-Math和Qwen2.5-Coder专项模型的推出，进一步推动了AI在专业领域的应用深度。

而在视觉理解领域，通义万相则带来了令人瞩目的突破。凭借其卓越的文生视频和图生视频功能，通义万相如今可以一键创作影视级高清视频。通过高压缩比、高质量的视频VAE框架和轻量微调框架，通义万相在视频生成过程中不仅解决了画面表现力和大幅度运动等难题，还实现了对中式传统元素和风格化视频的精准呈现。随着此次视频生成模型的发布，通义大模型已经实现了对文本、图像、视频、音频等全模态场景的全面覆盖。

此外，周靖人还宣布了通义旗舰模型Qwen-Max的全方位升级。该模型在训练中使用了更多的数据、更大的模型规模和更强的人类对齐，最终实现了性能接近GPT-4o的突破。在多个权威基准测试中，Qwen-Max不仅在理解能力和幻觉抵御能力上取得了显著提升，更在数学和代码能力上超越了GPT-4o，成为目前市面上最接近GPT-4o水平的大模型之一。

随着技术的不断演进和应用场景的不断拓展，我们有理由相信通义大模型将在未来创造更多可能，为我们带来更多便利和价值。