阿里巴巴今日宣布全面升级其全栈 AI 能力,涵盖云端基础设施、模型服务、AI 芯片及基础模型,协助客户更高效、更稳定、更高性能地构建、部署及扩展 AI Agent。

在阿里云峰会上发布的千问旗舰模型 Qwen3.7-Max,是阿里巴巴最新推出的大语言模型,专为先进 Agentic 编程、复杂推理及超长任务而打造。Qwen3.7-Max 即将面向全球开发者及企业开放服务。

为应对 Agentic 时代快速增长的算力与 AI 工作负载需求,阿里云同步升级基础设施与模型服务。重点发布包括磐久 AL128 超节点服务器(Panjiu AL128 Supernode Server),支持海量 Agent 并发推理与大规模模型训练;同时,阿里巴巴模型服务平台也完成优化升级,持续提升模型性能。

 

此外,阿里巴巴旗下半导体子公司平头哥推出最新 AI 训练与推理芯片真武 M890。该芯片具备大容量显存、高速芯片互联带宽,并原生支持 FP4 精度。

 

Qwen3.7-Max:专为 Agent 时代打造的多元基础模型

Qwen3.7-Max 旨在为 AI Agent 提供稳健基础,可无缝处理代码编写与调试、办公流程自动化,以及涉及数百至数千项操作的复杂多步骤任务。

 

该模型在多个领域展现出卓越的 Agent 能力。作为前沿编程助手,它支持从快速前端原型开发到复杂多文件软件工程的各类编程任务。为提升办公效率,它能够稳定协调多 Agent 工作流程,处理复杂操作。值得关注的是,Qwen3.7-Max 可自主执行长时间 Agentic 任务,连续运行长达 35 小时,并处理超过 1,000 次工具调用,同时保持稳定性能。

 

Qwen3.7-Max 已针对 OpenClaw、Hermes Agent、Claude Code、Qwen Paw 及 Qoder 等主流 Agent 框架进行深度优化,可作为不同 Agent 系统的可靠核心。该模型在编程、通用 Agent、综合能力及多语言等主要基准测试中均达到业界领先水平,可媲美市场顶尖模型。未来,该模型将通过阿里巴巴模型服务平台 Model Studio 面向全球开发者开放使用。

 

新一代智能计算与升级版模型服务

为支持海量 AI Agent 并发推理及大规模模型训练,阿里云推出磐久 AL128 超节点服务器,并搭载真武 M890 AI 芯片及 ICN Switch 1.0 互联芯片。该系统在单机柜内紧密集成 128 个 AI 加速器,提供 PB/s(每秒千万亿字节)级单柜带宽,大幅提升大规模 Agent 并发请求处理效率。

 

磐久 AL128 目前已在中国市场的 Model Studio(“百炼”)上线,助力企业高效应对各行业训练与推理需求。

 

百炼同时推出 Agentic RL(强化学习)机制,通过 Agent 执行反馈驱动模型持续迭代。平台亦内建安全治理能力,确保自主运行的 Agent 始终在预设权限范围内运作。

 

平头哥最新 AI 训练与推理芯片及软件栈

平头哥最新 AI 加速器真武 M890 的性能达到上一代真武 810E 的 3 倍。真武 M890 配备 144GB 显存,芯片间互联带宽高达每秒 800GB。该芯片原生支持从 FP32(32 位浮点)至 FP4(4 位浮点)等多种数据精度,可兼顾高精度模型训练与超低精度模型推理。

 

这些能力使其非常适合复杂 Agentic AI 工作负载,包括需要大量工作记忆以保留上下文、支持多 Agent 协同的高速通信,以及在降低成本同时维持高速运行的低精度计算。该芯片基于平头哥自研并行计算架构,并采用定制化 ICN(芯片间网络)互联协议。

 

除 AI 加速器外,平头哥亦发布 ICN Switch 1.0 专用互联芯片,旨在为计算集群构建高带宽、低延迟的扩展网络。该芯片吞吐量高达 25.6 Tbps,并实现超低延迟及无拥塞通信。真武 M890 搭配 ICN Switch 1.0,可实现 64 卡全带宽互联,显著提升大规模智能算力集群的计算效率与稳定性。

 

同时,平头哥也发布自研 T-Head SAIL™ 软件栈,进一步释放芯片算力潜能。

 

目前,平头哥自研 AI 芯片已广泛应用于产业领域,真武系列累计交付超过 56 万片。相关芯片已获得来自 20 个行业、超过 400 家外部客户采用,包括领先汽车制造商及金融服务企业,助力其智能化运营。