跳到正文

更多文章

影响力日常操作系统:21天习惯养成计划 从技能雇佣者到价值创造者 互惠账户的运营 影响力的三层架构 组织的注意力经济学
AI大模型月报2026年3月封面

说明:本期月报内容均来自权威媒体原文,每条附原始来源链接,不做超出来源的推断。


一、OpenAI 发布 GPT-5.4,上下文窗口达 105 万 Token

2026 年 3 月 5 日,OpenAI 正式发布 GPT-5.4。

根据 TechCrunch 报道,GPT-5.4 定位为”最强大、最高效的专业工作前沿模型”,提供三个版本:

  • 标准版:面向日常使用
  • GPT-5.4 Thinking:强化推理能力
  • GPT-5.4 Pro:高性能版本

API 版本支持最大 105 万 Token 上下文窗口,为 OpenAI 迄今最大。与 GPT-5.2 相比,单条声明错误率降低 33%,完整回复错误率降低 18%。定价为输入 2.50/1Mtokens,输出2.50/1M tokens,输出 15.00/1M tokens。

3 月 17 日,OpenAI 进一步发布 GPT-5.4 mini 和 nano,定位”针对编码和子 Agent 优化的最强小模型”。

来源:TechCrunch, 2026-03-05


二、小米确认万亿参数模型 MiMo-V2-Pro,揭开”Hunter Alpha”身份

3 月 19 日,小米公开确认 OpenRouter 平台上调用量排名第一的匿名模型”Hunter Alpha”,正是其自研模型 MiMo-V2-Pro

根据量子位报道,MiMo-V2-Pro 的核心参数:

  • 万亿级总参数,42B 激活参数
  • 百万 Token 上下文窗口
  • Artificial Analysis 智能指数:全球第 8,国内第 2
  • PinchBench 得分 84.0,SWE-bench Verified 得分 78

同步发布的还有 MiMo-V2-Omni(图文视频音频多模态)和 MiMo-V2-TTS(语音合成)两款模型。

Hunter Alpha 上线后数日内,累计处理超 1,600 亿 Token

来源:量子位, 2026-03-19


三、阿里 Qwen3.5 小模型开源,9B 媲美 120B 闭源模型

3 月 3 日,阿里开源四款 Qwen3.5 小尺寸模型:0.8B、2B、4B、9B,全部原生支持多模态。

根据量子位报道,9B 模型在 GPQA Diamond 基准测试中得分 81.7,性能与 GPT-OSS-120B 相当,显存占用更低。原生上下文窗口 26.2 万 Token,可扩展至 100 万。

3 月 20 日,Qwen3.5-Max Preview 在 LMArena 盲测中全球排名第 6、中国第 1,得分 1464,超越豆包 2.0、GLM-5、Kimi 2.5 等国内竞品。

来源:量子位, 2026-03-03 / 量子位, 2026-03-20


四、Google Gemini 推出跨平台迁移工具,整合 Workspace 全家桶

3 月 26 日,Google 推出”switching tools”,允许用户将对话历史和个人数据从其他 AI 聊天机器人直接迁移至 Gemini。根据 TechCrunch 报道,这一功能旨在降低用户从竞争平台转移的门槛。

同期,Google 官方博客披露 Workspace 更新:

  • Docs:新增”Help me create”,可调用 Drive、Gmail、Chat 信息生成初稿
  • Sheets:推出”Fill with Gemini”,支持实时 Google Search 数据填充
  • Docs:新增”Match writing style”,统一多人协作文档语气和风格

此外,Gemini 3.1 的”Personal Intelligence”功能(整合 Gmail、Photos、YouTube 做个性化规划)向美国全体用户免费开放。

来源:TechCrunch, 2026-03-26 / Google 官方博客


五、Claude 登顶 App Store,Anthropic 考虑最早 10 月 IPO

3 月 1 日,Anthropic 与五角大楼的谈判引发广泛关注,焦点为阻止国防部将 Claude 用于大规模国内监控或全自主武器。事件发酵后,Claude 在美国 App Store 免费榜升至第 1 名,超越 ChatGPT。

3 月 24 日,Anthropic 为 Claude Code 推出研究预览版”auto mode”,允许 AI 自主判断并执行操作,内置 AI 安全审查机制,在每步操作前检测风险行为和提示注入。

3 月 27 日,据 Bloomberg 报道,Anthropic 正考虑最早于 10 月上市,已与华尔街投行进行早期接触。

来源:TechCrunch, 2026-03-01 / TechCrunch, 2026-03-24 / Bloomberg, 2026-03-27


六、NVIDIA GTC:Nemotron 3 Super 开源,预测 AI 芯片 2027 年前贡献万亿营收

GTC 2026 大会于 3 月 16-19 日在圣何塞举行。

根据 Bloomberg 报道,黄仁勋在约 2.5 小时主题演讲中宣布:旗舰 AI 处理器将在 2027 年前贡献 1 万亿美元销售额,并发布基于 Groq 技术的新一代 Rubin 平台,包含 6 款新芯片。

TechCrunch 报道,NVIDIA 在大会上发布 Nemotron 3 Super:60 亿参数,在 SWE-Bench Verified 编程基准上得分 60.47%,完全开放权重,提供完整训练流程。

3 月 17 日,Mistral 在 GTC 发布 Mistral Forge 平台,支持企业用自有数据从头训练定制 AI 模型,直接面向 OpenAI、Anthropic 竞争企业市场。

来源:Bloomberg, 2026-03-16 / TechCrunch, 2026-03-17


七、DeepSeek 网页版升级后宕机超 8 小时

3 月 30 日,DeepSeek 网页版能力悄然大幅提升,SVG 绘图、前端代码生成效果明显改善。随后平台出现宕机,持续超过 8 小时,登上微博热搜。

根据量子位报道,模型现稳定自报”DeepSeek-V3”,知识截止日期推测为 2026 年 1 月。DeepSeek 此前发布 17 个 Agent 相关职位,外界猜测正酝酿重大发布。

来源:量子位, 2026-03-30


本文内容整理自 TechCrunch量子位BloombergGoogle 官方博客,发布于 2026 年 4 月 2 日。

Elazer (石头)
Elazer (石头)

11 年数据老兵,从分析师到架构专家。用真实经历帮数据人少走弯路。

加入免费社群

和数据从业者一起交流成长

了解详情 →

成为会员

解锁全部内容 + 知识库

查看权益 →
← 上一篇 中国数据产业月报 | 2026 年 3 月:日均词元调用量破 140 万亿,两会明确数字经济目标 下一篇 → 数据科学家高频面试真题精讲