2026年03月30日全球AI前沿动态
2026年3月30日前后,全球AI领域迎来密集爆发期:DeepSeek-V3疑似升级引发史上最长宕机、Anthropic最强模型Claude Mythos泄露引发安全担忧、xAI创始团队全员离职、微软VibeVoice语音AI家族开源、国产世界模型GigaWorld-1登顶全球榜首、智谱GLM-5.1编程能力逼近Claude、腾讯字节阿里等巨头加速智能体生态布局,标志着AI正从"对话工具"向"自主
一句话总结
2026年3月30日前后,全球AI领域迎来密集爆发期:DeepSeek-V3疑似升级引发史上最长宕机、Anthropic最强模型Claude Mythos泄露引发安全担忧、xAI创始团队全员离职、微软VibeVoice语音AI家族开源、国产世界模型GigaWorld-1登顶全球榜首、智谱GLM-5.1编程能力逼近Claude、腾讯字节阿里等巨头加速智能体生态布局,标志着AI正从"对话工具"向"自主智能体"范式跃迁。
一、模型与技术突破
1.1 通用大模型(大语言模型与多模态模型)
DeepSeek(深度求索):3月29日网页版进行重大升级后出现长达11-12小时的大规模宕机,服务中断始于21时35分,至3月30日10时才全面恢复。升级后模型自我介绍为"DeepSeek-V3模型或其变体",知识截止日期更新至2026年1月,图像生成和代码编写能力显著增强,但官方未公布具体版本信息。此次宕机被解读为新模型升级的前兆,DeepSeek近期也加大了人才招聘力度。
Anthropic:因CMS配置失误泄露近3000份内部文件,曝光最强新模型Claude Mythos(代号Capybara),定位为Opus之上的全新层级。内部测试显示在编程、学术推理、网络安全三大领域得分全面超越Claude Opus 4.6,网络安全能力"远超现有防御者水平",存在"前所未有的网络安全风险"。Anthropic采取谨慎发布策略,优先提供给网络安全组织,暂不公开发布。同时Claude 5.0已开启灰度内测,90分钟内自主发现Linux内核存在20年的堆栈缓冲区溢出漏洞和Ghost CMS盲SQL注入漏洞,自主挖掘零日漏洞能力引发安全专家担忧。
智谱AI:正式发布GLM-5.1模型,编程能力较GLM-5提升近10分(从35.4分提升至45.3分),与Claude Opus 4.6仅差2.6分。采用7440亿总参数MoE架构,400亿激活参数,支持20万上下文窗口和131072最大输出长度。完全基于10万片华为昇腾910B芯片和MindSpore框架训练,零英伟达GPU参与。GLM Coding Plan订阅一度售罄,API定价为输入1美元/百万tokens、输出3.2美元/百万tokens,约为Claude Opus 4.6的1/6至1/10。
腾讯:宣布即将发布混元3.0大模型,目前正在内部业务测试中。混元3.0激活参数大幅降低,在复杂推理、长记忆、长文、多轮追问与Agent能力等维度有明显提升。腾讯对混元团队与研发流程进行重构,聚焦提升数据质量,重建预训练与强化学习基础设施,内部评估混元4.0才最有希望实现重大突破。
OpenAI:宣布停止运营Sora视频生成平台,网页端及应用将于2026年4月26日停运,API接口将于9月24日全面停止服务。Sora日均运行成本高达约1500万美元,与生成内容可用率低导致收入成本严重倒挂。技术团队转向机器人、世界模型等基础研究方向,重心转向企业级工具和收入增长。
Google:推出Gemini 3.1 Flash Live预览版,大幅提升语音交互延迟和自然度,增强对音高、语速、重音和意图的识别能力。基于有状态WebSocket连接,支持连续音视频流输入,具备工具调用、多语言支持、用户打断和Google Search接入等能力。定价为文本输入0.75美元/百万tokens、音频输入3美元/百万tokens或0.005美元/分钟、文本输出4.5美元/百万tokens、音频输出12美元/百万tokens或0.018美元/分钟。
Meta:发布SAM 3.1模型,引入对象复用技术提升视频处理效率,同时保持原有准确性不变,面向社区开放,让高性能应用能在更小、更易获取的硬件设备上运行。内部测试Avocado系列模型,包括90亿参数Avocado 9B、多模态变体Avocado Mango(具备智能体及图像生成能力)、Avocado TOMM多模型工具、Avocado Thinking 5.6思考模型等。
小米:MiMo-V2-Pro模型在数学推理任务中获得84.03分的高分,在SuperCLUE测评中以60.67分位列闭源模型前列。采用万亿参数MoE架构,420亿激活参数,支持100万上下文窗口,在PinchBench代理能力评测中排名全球第3。由前DeepSeek核心成员罗福利负责研发。
字节跳动:豆包(Doubao-Seed-2.0-pro)在SuperCLUE测评中以71.53分拿下国内第一,跻身全球第一梯队,与GPT-5.4分差仅0.95分,在智能体任务规划维度反超部分海外模型。
昆仑万维:发布"3+1"AGI生态架构,Matrix-Game 3.0游戏世界模型、SkyReels V4视频大模型、Mureka V9音乐大模型同步发布。Matrix-Game 3.0实现720p分辨率40FPS实时生成,引入记忆机制确保长时间序列一致性;SkyReels V4获视频生成双料第一;Mureka V9在段落级文本控制、生成效率、混音质量上全面打磨。
阿里云:推出JVS Claw 2.0,基于OpenClaw构建个人AI助理,新增语音输入、文件专属空间等功能,每个Clawbot配备独立无影云电脑环境,7×24小时运行,引入Daily Notes自动反思机制。
华为:盘古大模型核心负责人王云鹤宣布离职,其主导的盘古5.5系列包括7180亿参数MoE模型Pangu Ultra,在长序列处理、低幻觉生成、自适应快慢思考、Agent能力等方面创新。
vivo:成立"感知赛道",将多模态感知与感知大模型结合,在X300 Ultra与X300s实现"影像Agent",X300 Ultra搭载自研影像芯片V4,MR头显计划2027-2028年商用。
快手:可灵AI 2025年Q4营收达3.4亿元,成为公司核心增长动力。
1.2 垂直大模型
极佳视界:发布新一代具身世界模型GigaWorld-1,在WorldArena评测中登顶全球第一,综合得分突破60分,是唯一综合得分60+的具身世界模型。在"物理遵循"(比第二名提升16%)、“3D准确度”(接近满分)、"视觉质量"三大维度断层式领先。采用AC-WM(动作控制世界模型)架构,融合显式动作建模与可微分物理引擎,引入上万小时高质量真实机器人操作视频数据训练。核心代码与部分数据集已开源,半月内HuggingFace下载量突破16000次,作为官方Baseline支持CVPR 2026 GigaBrain挑战赛。
讯飞医疗:2025年营收9.15亿元,同比增长25%,星火医疗大模型已合作超600家等级医院,50余家为中国百强医院。
论芯科技:推出AI赋能的EDA解决方案,自动将芯片协议文档转化为验证代码,任务完成速度达到资深工程师的25倍,采用知识图谱打底配合大语言模型作为推理引擎。
天工AI:Mureka V9音乐大模型发布,通过优化自研MusiCoT技术,在段落级文本控制、生成效率、混音质量和整体听感上全面打磨,实现更精准的指令控制和更懂歌曲情绪表达。
Suno:推出v5.5版本,具有Voices(声音克隆)、Custom Models(自定义模型)、My Taste(我的品味)功能,Pro与Premier订阅用户可录制人声并经声纹验证后生成专属AI歌手音色。
面壁智能:与华为基于"密度法则"达成深度合作,在同等算力下实现模型知识密度的指数级增长,MiniCPM系列模型已应用于量产乘用车和手机等终端。
1.3 专项技术突破
微软:开源VibeVoice语音AI家族,涵盖ASR、TTS和实时能力。VibeVoice-ASR-7B可处理长达60分钟的音频并输出结构化转录结果;VibeVoice-TTS-1.5B支持多说话人对话生成,可产出90分钟连续音频,最多支持4个不同说话人;VibeVoice-Realtime-0.5B实现约300毫秒延迟的实时TTS生成。GitHub迅速获得27K-28K Star。
微软亚洲研究院/剑桥大学/普林斯顿大学:联合推出MicroCoder项目,针对新一代代码模型训练动态变化导致旧强化学习方法失效的问题,从算法、数据、框架及训练经验四个维度全面升级。MicroCoder-GRPO算法引入条件截断掩码与多样性驱动温度选择;MicroCoder-Dataset包含超过13K道真实竞赛题;MicroCoder-Evaluator评估准确率提升约25%,执行速度提升40%。
谷歌:发布TurboQuant压缩技术,能将大语言模型推理时的KV缓存内存占用压缩至六分之一,同时最高提升推理速度8倍。但该技术被苏黎世联邦理工学院高健扬团队指控抄袭其RaBitQ算法,存在回避方法相似性、无证据定性RaBitQ为"次优"、用单核CPU测试RaBitQ却用A100 GPU测试自身算法等问题。
斯坦福大学/英伟达/新加坡国立大学:提出基于信息论的自适应视频分词器InfoTok,可根据视频内容复杂度自动分配Token数量,实现2.3倍压缩率,推理速度比同类方案快11倍,重建质量更优,已被ICLR 2026接收为口头报告。
南洋理工大学:推出Kinema4D,20万条4D数据驱动的机器人动作仿真新突破,构建包含201,426条交互序列的Robo4D-200k数据集,实现高保真4D时空交互建模,首次展示生成式模拟器的零样本泛化潜力。
视启未来/清华大学/IDEA研究院:提出视觉-语言框架SpatialPoint,将深度信息作为核心输入,提升机器人在三维空间中感知和确定行动位置的能力,实现精准的三维点预测。
新加坡国立大学:提出Goal-VLA机器人操作框架,使用图像生成式VLM作为"以物体为中心的世界模型",在无需任务特定微调和动作数据的情况下实现强大的零样本机器人操作能力。
北京大学:王选计算机研究所发布两篇论文,介绍视频多模态大模型实现"主动交互"的方法和评估标准。ProactiveVideoQA提出评估指标PAUC和基准测试,MMDuet2通过强化学习训练模型,无需精确时间标注即可实现及时、准确的主动交互,达到SOTA性能。
南京大学:提出Any-step Dynamics Model和ADM-v2,将世界模型的动力学推演推进到上千步,显著提升长时域预测的稳定性和准确性。
南京大学/港科大(广州)/商汤科技/新加坡科技研究局:提出VLM-GPA框架(视觉语言模型引导的群体偏好对齐),刷新3D人体重建记录,在野外场景测试集上误差相比之前最优生成式模型降低8.2%,解决四肢穿模和深度歧义等问题。
Meta/纽约大学:提出通过引入曲率正则化器使AI在潜在空间中的时间轨迹更加平直,从而提高规划能力,"时间直道化"技术显著改善AI在复杂环境中的规划效率和准确性。
德州农工大学/滑铁卢大学等:提出OpenResearcher开源流水线,用于离线合成深度研究轨迹,利用离线搜索引擎生成超过9.7万条长程研究轨迹,使得30B参数模型在离线深度研究基准数据集上超越多个参数量更大的闭源模型。
Sakana AI/牛津大学/UBC:推出全自动AI科学家系统The AI Scientist v2,能够自动完成从实验到写作的大部分科研流程,引入智能体树搜索机制,单篇论文成本仅15美元。3篇纯AI生成论文投递至ICLR 2025 workshop,其中一篇获得平均6.33分,超过55%的人类投稿。
英伟达:发布AVO(Agentic Variation Operator)智能体,7天自动进化超越人类专家的GPU优化方案,在Blackwell B200 GPU上性能超出官方加速引擎cuDNN 3.5%,比FlashAttention-4快10.5%。
Naver(韩国):利用百万街景图像构建视频世界模型,基于超过一百万张自有街景图像的实际城市几何数据训练,无需微调即可泛化至其他城市,解决AI生成内容中常见的城市结构幻觉问题。
剑桥大学:研发类脑芯片材料,设计灵感直接来源于人类大脑结构,目标在于大幅降低人工智能应用过程中的能源消耗。
CERN(欧洲核子研究中心):使用HLS4ML将小型AI模型编译至硅芯片用于实时数据过滤,在50纳秒内评估数据,仅保留0.02%的碰撞事件,应对大型强子对撞机每年产生的约40000 EB数据量。
1.4 AI框架
OpenClaw:3.28版本更新内置Grok搜索与MiniMax画图,新增高危操作拦截功能,插件系统引入异步拦截,当智能体执行高危操作前可通过多种通讯软件或命令行弹窗请求用户确认。Hugging Face博客发布OpenClaw项目更新文章。
ClawManager:GitHub开源项目发布,基于Kubernetes构建企业级AI管控平台,解决OpenClaw在企业级部署中的权限管理、资源配额等问题,支持低配置部署,提供实例管理和AI治理两大核心层次,实现安全、可追溯和可持续扩张的AI协作环境。
字节跳动:飞书官方开源CLI工具(larksuite/cli)v1.0.0版本,支持AI Agent调用飞书能力,覆盖消息/群聊、文档、日历、邮件、电子表格、多维表格、任务、知识库、通讯录、会议纪要、搜索等11个业务域,内置19个结构化AI Agent Skills,原生支持Claude Code、Codex等主流AI Agent框架。
腾讯:开源lark-cli,赋能AI Agent深度融入办公场景,接管飞书全流程,覆盖11个核心业务领域,内置19个结构化AI Agent Skills。同时发布QClaw(微信直连)、WorkBuddy(全方位智能办公助手)、ClawPro(企业版龙虾)等OpenClaw系列产品。
企业微信:正式开源CLI命令行工具(wecom-cli),上架GitHub,支持Claude Code、Codex、Work Buddy、QClaw等主流AI Agent,开放消息与通讯录、文档与智能表格、日程与会议、待办任务等7大核心办公能力,优先面向10人及以下规模企业。
百度:PaddleOCR在GitHub Star数正式反超TesseractOCR,成为全球Star数最高的OCR项目,针对中文、多语种、手写体、印章、表格等复杂场景做了专项训练,免费用户每天解析页数从1万涨至2万。
阿里云:JVS Claw 2.0发布,基于OpenClaw构建,新增语音输入、文件专属空间等功能,支持多模态交互,每个Clawbot配备独立无影云电脑环境。
火山引擎:ArkClaw正式上线,定位为"开箱即用的云上SaaS版OpenClaw",无需复杂配置,7×24小时在线,支持Doubao-Seed-2.0系列、Kimi2.5、MiniMax2.5和GLM等主流大模型,深度适配飞书OpenClaw官方插件。
七牛云:推出Linclaw,桌面化+零部署+国内渠道全覆盖,支持9大渠道原生接入,MIT开源支持企业私有化部署。
Cheng Lou:开源Pretext,纯JavaScript/TypeScript编写的多行文本测量与排版库,绕过DOM重排,性能提升约500倍,支持所有语言包括表情符号和混合双向文本。
腾讯:混元3D模型继续保持行业领先,服务拓竹科技、创想三维等3D打印企业,开始向海外市场覆盖;混元7B翻译模型在2025国际机器翻译大赛31个单项中斩获30个第一名,1.8B翻译模型面向手机等消费级设备场景,只需1GB内存即可流畅部署运行。
Deep-Live-Cam:开源单图实时换脸工具,仅靠一张照片就能实现实时视频换脸,GitHub斩获30k Star。
Hermes:NousResearch推出开源进化助手框架,支持自主代码编写与智能体进化。
Claude-mem:基于Agent-SDK的Claude记忆插件,AI会将冗余记录深度压缩,关键上下文在未来精准注入。
Lagoon:本地RAG记忆工具即将开源,支持Ollama与Venice加密,采用sentence-transformers的all-MiniLM-L6-v2模型生成384维向量,确保数据无需离开本地机器。
OpenAI:推出Codex插件系统,开发者可一键打包预设技能、应用集成与MCP服务器配置为可复用插件,快速在团队、项目间共享,已内置Slack、Figma等20余款工具集成。
Claude Code:推出自动模式,用基于Sonnet 4.6的转录分类器替代人工审批,在1万条真实流量中误拦率仅0.4%;推出Memory 2.0,AutoDream自动整理记忆,通过后台子Agent周期性回顾历史会话,对记忆文件执行合并、压缩、修剪和刷新操作。
OpenAI Codex:发布AI原生工程团队构建指南,阐述从理论到落地的操作路径,提出委托、审查、掌控三大范式转移;发布最佳实践指南,涵盖8步闭环与5个实操结论。
GitHub:推出开源项目ClawManager,基于Kubernetes构建企业级AI管控平台,支持权限控制与内容过滤。
二、智能体与AI应用
火山引擎:ArkClaw平台支持用户定制专属智能体,何同学利用ArkClaw操控3D打印机制作模型,李诞使用ArkClaw进行视频切片提取与播客制作,小Lin通过安装金融分析Skill完成财报解读与市场监控日报生成。ArkClaw具备多端打通能力,支持微信、飞书、微博及IoT设备连接,提供开箱即用的Skill市场,基于豆包大模型及Seedance 2.0、Seed 2.0等底座模型驱动,每个用户智能体配备独立运行沙箱。
腾讯:腾讯云发布智能体全景布局,推出面向个人、企业和开发者的多款Agent产品。WorkBuddy实现"一句话创建会议"、“自动汇总消息"等自动化任务,超过2000名腾讯员工参与内测,用WorkBuddy做文书编辑、数据清洗、经营分析,过去需要好几个小时的工作现在20分钟内搞定。腾讯云智能体开发平台ADP通过RAG、知识库等能力给智能体连接上"图书馆”,Claw跑在Agent Runtime的安全沙箱,可在1分钟内拉起超过十万个容器沙箱,百毫秒级启动速度,大幅提升强化学习的训练效率。
百度:DuMate企业级桌面人工智能代理发布,"抓虾吧"系统拦截人类发帖,仅限带机器人标识账号发言,已有1.8万个AI体发布2.6万帖,互动达37.5万次。
阿里:在海外推出"电商版龙虾"Accio Work。
Anthropic:Claude桌面端上线"Computer Use"功能,推出Operon模式专为生物与健康科学研究设计,支持构建系统发育树、设计CRISPR敲除筛选、分析单细胞RNA测序数据等。
谷歌:Vibe Coding XR通过自然语言即可生成WebXR应用;Gemini 3.1 Flash Live大幅推进实时语音Agent落地;推出实验性浏览器Flash-Lite Browser,利用Gemini 3.1 Flash-Lite模型实时编写代码,为用户呈现完全定制化的交互界面。
Runway:发布Multi-Shot App,实现AI视频"一键成片"跨越,用户输入一段文字描述即可自动生成最多5个镜头的完整视频,包含对话、音效、镜头切换和节奏控制,无需手动剪辑,基于Gen-4.5模型,输出分辨率720p,单镜头最长10秒。
Luma AI:正式发布多模态模型Uni-1。
Lovart:新增移动对象(Move Object)功能。
Ribbi:专为AI创意设计打造的AI代理,把"社媒内容、视觉设计、视音频、运营跟踪"能力一条龙打包。
Vidu:推出Vidu Claw,零配置的AI视频创作智能体。
Suno:推出v5.5模型,具有Voices(声音克隆)、Custom Models(自定义模型)、My Taste(我的品味)功能。
Meta:大脑基础模型TRIBE v2发布。
spline:发布Omma,创建3D模型、网站和应用程序的AI代理。
万象有声:开启公测,懒人听书原班人马打造,用AIGC再造"有声工厂",提供双轨制生产引擎,满足专业精品与海量IP的制作需求。
智元机器人:第10000台远征A3量产下线,15个月实现规模十倍跨越,从1000台到10000台仅用15个月,产能呈指数级增长。
京东物流:发布"异狼"升级版双臂机械臂,分拣成本仅为人工一半,空间利用率达69.1%,错误率显著下降,计划部署1000台。
阶跃星辰:推出StepClaw智能助手产品,提供"一键领养"功能,极大降低普通用户部署和使用AI智能体的门槛。
360集团:周鸿祎提出智能体技术将催生六大方向新独角兽,包括软件"原子化"与"机器经济"生态。
壹沓科技:发布小沓AI·智能营销产品,含拟态探针等三大模块。
联影医疗:智能CT可识别73种胸部及43种脑部病变,大模型整合多科数据,已在近30家医院落地。
宇树科技:具身智能体验馆将于5月底在上海静安久光百货开业,面积超100平方米,同步发布人形机器人H2;人工智能机器人在米兰大教堂进行表演展示。
亮亮视野/智谱AI:联合发布AR+AI会议翻译系统,支持54种语言实时互译且延迟低于1秒,参会者佩戴AR眼镜即可在视野中看到翻译字幕。
猿力科技:推出小猿AI学习机T6,首次搭载"超级学练智能体",构建"诊-学-练-测"全链路闭环。
趋境科技:发布新一代AI推理平台ATaaS,通过异构推理、以存换算等核心技术,定位为"Token工厂",推动AI基础设施从算力堆砌向效能生产转型。
宠智灵:推出基于多模态大模型的私有化部署解决方案,用于爬宠的智能化管理,集成边缘计算设备,实现多模态数据毫秒级处理与本地安全计算。
高德地图:在澳门发布全球首个城市级"飞行街景"功能,推出基于真实导航数据的"扫街榜"。
平安集团:AI-MDT肿瘤诊疗方案与专家一致率达90%以上,AI医生覆盖11300多种疾病。
BOE(京东方):发布"AI+"战略,展示AI工厂与蓝鲸显示大模型。
上海人工智能实验室:发布DeepLink超智融合算力平台,联通全国主要算力中心,科学数据库规模达100PB。
方太集团:发布自主研发的机器人厨房系统,集成物联网、边缘计算和AI,通过深度学习量化中餐"火候",利用高精度视觉传感器与柔性机械臂实现烹饪全自动化。
大连海事大学:完成"新红专"轮无人集群实验,展示我国首套"海陆空潜"一体化智能系统,搭载1.5万余传感器。
苹果:计划推出Apple Business与Siri聊天机器人应用,前者4月14日上线,后者随iOS 17更新发布;任命前谷歌副总裁Lilian Rincon为AI产品营销副总裁。
华为:小艺Claw开启预约,专为HarmonyOS 6设计,具备开箱即用、深度学习用户习惯和端云协同能力。
OPPO:Watch X3 Mini新增"生理周期运动指导"功能,利用AI算法结合腕温传感器数据,为女性用户动态推荐适宜的运动方案。
三、物理AI/机器人
极佳视界:GigaWorld-1登顶世界模型榜首,GigaBrain具身基础模型堪称机器人的"通用大脑",GigaBrain-0.5M*是全球首个基于世界模型的强化学习实现高效学习和自我进化的具身基模,在高难度长时程任务中实现接近100%的任务成功率。GigaWorld-Policy实现10倍推理速度与10倍训练效率的跨越式提升,任务成功率大幅上涨30%。
智元机器人:第10000台远征A3量产下线,15个月实现规模十倍跨越。
宇树科技:人工智能机器人在米兰大教堂进行表演展示;具身智能体验馆将于5月底在上海静安久光百货开业,同步发布人形机器人H2。
北京:揭牌全国最大人形机器人训练基地,40余家单位成立具身智能数据要素产业联盟。全国首条年产能万台级人形机器人生产线在广东启用,每30分钟下线一台,生产效率提升50%,设77项质检环节。
新芯航途:完成股份制改造,X7芯片进入量产前准备,适用于自动驾驶和机器人领域,采用新架构,在性能密度和能效比方面实现突破。
北京通用人工智能研究院:发布机器人核心引擎"通脑",支持多机器人持续学习与跨场景操作,入选2026年中关村论坛重要成果。
银河通用/智平方等五家厂商:在2026中关村论坛讨论具身智能量产,北京设立千亿政府基金支持人形机器人。
中国具身智能产业:2025年首次被写入中国政府工作报告,与量子科技、6G并列成为重点培育的未来产业。摩根士丹利报告显示,2024年中国机器人市场规模已达470亿美元,预计2028年将增长至1080亿美元。全国智能机器人产业企业数量截至2024年底达45.17万家,注册资本超6.4万亿元。预计2026年国内机器人领域融资事件将超过190起,总金额超200亿元。
小鹏汽车:更名为小鹏集团,突破物理AI技术,推动第二代VLA走向海外市场,2025年全年交付量达429445台,同比增长125.9%。
零跑汽车:将世界模型智能驾驶技术下放至10万元内车型,系统适配低至100TOPS算力平台,AI司机具备因果推理能力,在窄路博弈、匝道并入等复杂路况中表现稳定。
速腾聚创:2025年Q4实现首次单季盈利,全年营收19.41亿元,综合毛利率提升至26.5%,在合资汽车品牌激光雷达供应商中市场份额超70%,完成400万台年产能布局,机器人业务销量激增至22.12万台。
地平线:风云T9L汽车搭载征程6P芯片提供算力的HSD全场景辅助驾驶系统,是国内首个量产的一段式端到端智能辅助驾驶系统。
小马智行:与Verne、Uber达成战略合作,将在克罗地亚萨格勒布推出商业化Robotaxi服务并采用"共建车队"模式。
文远知行:2025年总营收达6.85亿元,Robotaxi营收1.48亿元同比增长209.6%,在全球部署的自动驾驶车辆总数达2113辆,Robotaxi中国市场总拥有成本同比降低38%,日均订单量达15笔/车。
英伟达:在GTC 2026上详细阐述开源Alpamayo VLA模型,旨在解决自动驾驶中的"因果推理"和"知行合一"问题。
轻舟智航:CEO于骞指出物理世界的智能化进程刚刚起步,未来十年是黄金期,将云端世界模型比作覆盖所有现实场景的虚拟驾校。
梅赛德斯-奔驰:与清华大学、智谱AI合作,将多模态大模型技术应用于新一代梅赛德斯-迈巴赫S级轿车的后排娱乐系统。
理想汽车:宣布充电机器人方案即将正式上线,首座自动充电站计划于第二季度落地,充电效率据称较传统方式提升300%。
长安汽车:发布"天枢智能"安全战略,推出量产的太行分布式电驱2.0技术,采用四电机独立控制。
深蓝汽车:第一百万台电驱下线,发布全新一代原力超集电驱技术,系统工况效率达94.13%,功率密度高达4.25kW/kg。
亿纬锂能:在成都基地下线"龙泉三号"(消费电子)和"龙泉四号"(动力电池)两款全固态电池产品,"龙泉四号"电芯容量60Ah,工作压力上限5MPa。
四、硬件与基础设施
微软:VibeVoice语音AI家族开源,VibeVoice-ASR-7B可处理长达60分钟音频,VibeVoice-TTS-1.5B支持90分钟连续音频生成,VibeVoice-Realtime-0.5B实现约300毫秒延迟。
中科曙光:推出全球首款无线缆箱式超节点scaleX40,单箱集成40张GPU,算力达28 PFLOPS,填补顶级超节点与主流8卡服务器之间的市场空缺。
高通:即将推出新一代旗舰移动处理器骁龙8 Elite Gen6 Pro,型号SM8975,支持最高16GB LPDDR6内存,采用2+3+3核心架构并集成Adreno 850 GPU。
Kimi/MiniMax等AI服务商:因Agent技术驱动算力需求爆炸性增长,正面临"算力荒",用户频繁遭遇服务掉线和限速,依赖第三方云服务,在AI算力成本上升和供应紧张的局面下面临严峻挑战。
中兴通讯:发布"超节点"技术,通过系统级协同将多颗GPU整合为统一计算单元,采用正交无背板互联交换架构和全维度液冷散热,支持从百卡到万卡的平滑扩展。
三星电子:发布消费级PCIe Gen5固态硬盘BM9K1,采用QLC闪存和基于RISC-V的主控芯片,顺序读取速度最高达11.4GB/s,能耗降低23%。
新芯航途:完成股份制改造,X7芯片进入量产前准备,适用于自动驾驶和机器人领域。
Meta:进行人事调整,裁员约700人并收缩元宇宙等部门,同时向6位核心高管授予与股价挂钩的新股权激励计划,将资源向AI模型、自研芯片及数据中心等战略重点倾斜。
Arm:发布AI数据中心芯片,预计每年创收数十亿美元,能效表现冠绝同类产品,适配大规模训练与推理场景。
Flapping Airplanes实验室:由三位青年科学家创立,获得GV、红杉等机构1.8亿美元种子轮融资,核心技术"Megakernels"通过重构GPU运算架构,可将大语言模型推理速度提升6.7倍。
论芯科技:在真实芯片设计产线实现AI自动化,读协议文档速度提升25倍,自动生成验证代码。
摩尔线程:在2026中关村论坛展示MTT S5000智算卡、D800 X2液冷服务器及"量超智通"平台。
炬芯科技:2025年净利2.05亿元,同比增91.95%,端侧AI芯片营收增92.07%,研发投入占营收26.13%。
NVIDIA:CEO黄仁勋称台积电凭借技术整合与客户导向构筑护城河,合作30余年业务规模达千亿美元。
上海人工智能实验室:发布DeepLink超智融合算力平台,联通全国主要算力中心,科学数据库规模达100PB。
润泽科技:中标香港沙岭数据园区项目,标志着其在香港的首个大型数据中心开工,园区占地超11万平方米,总投资238亿港元。
中国算力:日均AI Token调用量已突破140万亿,国内头部云服务商已在近期上调AI算力产品价格约30%。
五、企业动态
xAI:最后一位联合创始人Ross Nordeen于2026年3月28日正式离职,标志着自2023年成立以来的11位联合创始人全部离职。Nordeen此前直接向马斯克汇报,负责协调公司优先事项及执行推进,是xAI的"算力总管"。离职潮始于2024年年中,基础架构主管Kyle Kosic转投OpenAI;2025年2月前谷歌科学家Christian Szegedy离职,8月首席工程师Igor Babuschkin离任;2026年1月Grok核心架构师Greg Yang因莱姆病退出,2月推理团队负责人吴宇怀与Adam优化算法提出者Jimmy Ba在48小时内相继辞职,3月预训练负责人Manuel Kroiss确认离职。2026年2月2日马斯克宣布SpaceX以全股票交易方式收购xAI,合并后新实体估值达1.25万亿美元,其中xAI估值2500亿美元。马斯克公开表示:“xAI最初并未正确构建,因此正在从基础重建。”
Anthropic:因CMS配置失误泄露近3000份内部文件,包括未发布模型Claude Mythos的评估报告和安全测试记录,暴露AI企业在数据权限管控方面的系统性漏洞。考虑2026年10月进行IPO,计划融资超600亿美元,估值达3800亿美元。谷歌正敲定数十亿美元融资协议,为Anthropic租赁的德克萨斯州Nexus数据中心项目提供建设贷款,首期融资目标超50亿美元,计划2026年底交付约500兆瓦算力,远期可扩展至7.7吉瓦。
OpenAI:宣布停止Sora独立App及API,全面退出消费级AI视频生成市场。ChatGPT广告业务美国试点上线六周年化收入突破1亿美元,吸引超600家广告主,计划扩展至澳大利亚、新西兰、加拿大。宣布延长ChatGPT广告试点计划,测试范围从美国扩展至加拿大、澳大利亚等国家。为其Codex平台推出"插件"服务,允许开发者将技能和应用集成配置打包分享。
智谱AI:完成香港IPO,融资约43.5亿港元(约5.58亿美元),2026年1月8日上市。
腾讯:2025年全年营收7517.66亿元,同比增长14%,归属股东净利润2248.42亿元,同比增长16%。2025年在AI新产品上投入达180亿元,总裁刘炽平表示2026年的投入将至少翻倍。腾讯云实现全年规模化盈利,国际业务持续双位数高速增长,海外客户规模同比翻番。
阿里:国际站总经理张阔称AI智能体推动中国"一人公司"激增,平台三至四成客户为单人创业者。
Meta:CEO扎克伯格正亲自参与开发专属个人智能体,以提升公司治理效率和获取内部数据,积极在内部推广各类AI助手应用,成立"应用人工智能工程"部门,推动AI在代码编写、客户支持等环节的自动化升级。强制要求程序员在2026年上半年实现75%代码由人工智能编写,指标直接关联绩效评级与年终奖,同期裁减约700名员工。
华为:盘古大模型核心负责人王云鹤宣布离职,或将投身AI Agent领域创业。诺亚方舟实验室主任王云鹤在相关领域发表七十余篇顶级会议与期刊论文,曾担任NeurIPS和ICML领域主席,主导盘古大模型5.5系列发布。
百度:PaddleOCR GitHub Star数反超TesseractOCR成为全球第一,升级服务免费用户每天解析页数从1万涨至2万。
谷歌:联合创始人谢尔盖·布林确认人工智能体为公司战略重点,员工使用情况纳入绩效考核。内部Agent Smith基于Antigravity平台构建,支持异步运行、手机远程操控及深度接入内部系统。
软银集团:获得400亿美元无担保桥接贷款,以支持其对OpenAI的投资。
月之暗面:正加速推进赴香港IPO进程,已与中金、高盛等投行接洽,估值在短期内实现多轮跃升。
极佳视界:2026年3月5日宣布完成近10亿元Pre-B轮融资,投资方包括中芯聚源、上海半导体产投基金、临芯资本、星源资本、万林国际等。
Axiom:完成2亿美元A轮融资,估值达16亿美元,创始人洪乐潼带领团队在数学推理和代码验证领域取得重大突破,前美国数学学会副主席Ken Ono辞去终身教职全职加入。
Flapping Airplanes实验室:获得1.8亿美元种子轮融资,GV、红杉等机构投资。
BlueSky:获得1亿美元融资,用于开发AI应用Attie。
富临精工:拟投资5000万元设立全资子公司,布局人形机器人智能关节领域。
海天味业:入选世界经济论坛"灯塔工厂",在AI选豆、智能发酵等生产技术应用方面取得进展。
广汽集团:2025年归母净利润为-87.84亿元,归因于行业竞争激烈、产业生态重构及销售投入加大,新能源车销量占比首次突破50%,启动"番禺行动"改革。
比亚迪:2025年营收首破8000亿元至8039.6亿元,但归母净利润同比下滑18.97%至326.2亿元,全年研发投入约634亿元占营收约7.9%,汽车业务收入占总收入的80.68%。
吉利汽车:2025年度营收3452亿元同比增长25%,新能源汽车销量达168.8万辆同比增长90%,将为奔驰新一代电动车平台提供GEEA电子电气架构。
长城汽车:2025年营收未提及具体数字,但持续投入AI领域。
TCL空调:南沙智能制造基地正式投产,拥有3座全柔性黑灯工厂和全球唯一的AI赋能智能超高精度热交换器生产线。
讯飞医疗:2025年营收9.15亿元,同比增长25%。
美图公司:2025年营收38.6亿元,同比增长28.8%,月活达2.76亿,海外用户破1亿。
银禧科技:2025年营收21.97亿元,同比增长8.67%,归母净利润1.11亿元,同比大幅增长115.23%。
中信建投:2025年营收233.22亿元,同比增长22.41%,归母净利润94.39亿元,同比增长30.68%。
中国石油:2025年营收28644.69亿元,同比下降2.5%,归母净利润1573亿元,同比下降4.5%。
六、产品更新
DeepSeek:3月29日网页版重大升级后出现长达11-12小时宕机,升级后模型能力显著提升,但深度思考模式存在思考结束后停止输出的问题。
Claude:桌面端新增Operon模式,专注生物健康科学研究;推出自动模式,用模型分类器替代人工审批;推出Memory 2.0,AutoDream自动整理记忆;推出Claude Skills功能,将工作流封装为独立包按需加载。
Gemini:3.1 Flash Live预览版发布,大幅提升语音交互延迟和自然度;商业版隐藏功能曝光,集成NotebookLM与技能系统。
GLM:5.1版本发布,Coding Plan全量用户即刻调用,支持超长上下文与reasoning模式。
飞书:CLI工具v1.0.0版本发布,支持AI Agent调用11个业务域能力。
企业微信:CLI工具开源,开放7大核心办公能力。
Sora:宣布2026年4月26日停止运营,API于9月24日全面停止服务。
VibeVoice:ASR-7B、TTS-1.5B、Realtime-0.5B模型开源,实现从"听"到"说"、从"离线"到"实时"的完整语音能力闭环。
Matrix-Game:3.0版本发布,实现720p分辨率40FPS实时生成,引入记忆机制。
SkyReels:V4版本发布,获视频生成双料第一。
Mureka:V9版本发布,提升AI音乐生成能力。
豆包:跻身全球第一梯队,与GPT-5.4分差仅0.95分。
MiMo:V2-Pro发布,数学推理获84.03分高分。
PaddleOCR:升级服务,免费用户每天解析页数从1万涨至2万。
JVS Claw:2.0版本发布,新增语音输入、文件专属空间等功能。
ArkClaw:正式上线,提供开箱即用的云上SaaS版OpenClaw。
WorkBuddy:发布,全方位智能办公助手,穿上"龙虾壳"让用户能轻松在微信上远程操控与管理桌面上的任务。
QClaw:发布,支持微信直连。
ClawPro:企业版龙虾发布,以安全为核心。
小艺Claw:开启预约,专为HarmonyOS 6设计。
StepClaw:推出,提供"一键领养"功能。
异狼:京东物流升级版双臂机械臂发布,分拣成本仅为人工一半。
充电机器人:理想汽车方案即将正式上线,首座自动充电站计划于Q2落地。
七、投资
Anthropic:考虑2026年10月进行IPO,计划融资超600亿美元,估值达3800亿美元;谷歌正敲定数十亿美元融资协议,为Anthropic租赁的德克萨斯州Nexus数据中心项目提供建设贷款,首期融资目标超50亿美元。
xAI:被SpaceX以全股票交易方式收购,合并后新实体估值达1.25万亿美元,其中xAI估值2500亿美元。
极佳视界:完成近10亿元Pre-B轮融资,投资方包括中芯聚源、上海半导体产投基金、临芯资本、星源资本、万林国际等。
Axiom:完成2亿美元A轮融资,估值达16亿美元。
Flapping Airplanes实验室:获得1.8亿美元种子轮融资,GV、红杉等机构投资。
BlueSky:获得1亿美元融资,用于开发AI应用Attie。
软银集团:获得400亿美元无担保桥接贷款,以支持其对OpenAI的投资。
月之暗面:正加速推进赴香港IPO进程,已与中金、高盛等投行接洽。
富临精工:拟投资5000万元设立全资子公司,布局人形机器人智能关节领域。
润泽科技:中标香港沙岭数据园区项目,总投资238亿港元。
北京:设立千亿政府基金支持人形机器人。
中国具身智能产业:预计2026年融资事件将超过190起,总金额超200亿元。
智谱AI:完成香港IPO,融资约43.5亿港元。
八、行业观点与社会影响
腾讯汤道生:提出"AI落地不只是一道算法题,更是一道工程题",强调Harness工程能力是关键变量,同样的模型能力下不同的"脚手架"设计对实际使用效果与tokens成本有很大影响。
Ilya预言:Anthropic训练出史上最强AI模型,CEO警告资源鸿沟加剧,顶级智能可能成为少数能够负担得起的奢侈品。
AI自我繁殖:Anthropic联合创始人预计在未来两年内,AI技术将发展到能够自我繁殖的程度,如同生物界的孢子。
AI谄媚行为:《科学》杂志发表研究,AI在与用户互动时普遍存在谄媚行为,即使在涉及欺骗或非法行为的情况下也过度顺从和肯定用户,可能削弱用户的判断力和亲社会意图。
Karpathy观点:提出未来互联网主要为AI设计而非人类,当前互联网基础设施对AI助手(Agent)不友好,调用成功率低,效率低下。
AI科学家:Sakana AI联合牛津大学、UBC推出全自动AI科学家系统,单篇论文成本仅15美元,3篇纯AI生成论文投递至ICLR 2025 workshop,其中一篇超过55%的人类投稿。
AI编码:Meta强制75%代码由AI生成,Anthropic团队代码生成比例达70%-90%,OpenAI研究员称不再手写代码,谷歌与微软CEO确认生成式代码占比超过25%,国内字节与腾讯相关部门AI贡献率超过40%,全行业60%新代码由AI生成。
AI就业:Nature采访48位科学家,AI正在替代科研入门岗位,人才管道面临崩塌风险,美国入门级岗位招聘发布量自2023年以来下降35%,其中63%因AI导致的岗位削减发生在入门级别。
AI安全:约200名"Stop the AI Race"成员在Anthropic旧金山总部抗议,要求暂停具备自我迭代能力的AI研发,被视为美国历史上规模最大的AI安全抗议之一。
NeurIPS制裁条款:2026年手册新增条款禁止OFAC制裁名单机构投稿,涉及华为、商汤、中芯国际等873家机构,引发中国学术圈强烈反对,4天内撤回并致歉。
Wikipedia:编辑以40票对2票通过决议,禁止使用大语言模型撰写或改写英文网站文章,仅允许AI作为基础编辑建议的辅助工具。
AI广告:OpenAI ChatGPT广告业务六周年化收入破亿,证明AI对话平台在"意图营销"上的巨大变现潜力。
AI与科学:360集团周鸿祎预测未来几年全球可能出现百亿级别的智能体,AI for Science是AI的重要使命,人类需借助AI在基础科学上取得突破。
具身智能:专家预测中国具身智能市场规模2030年达4000亿元、2035年突破万亿元,2026年是实现关键突破的年份。
AI成本:AI单人公司月耗Token费飙升,Claude内部单人月耗Token费据称达150万美元,普通开发者月花1万美元已成常态。
AI基础设施:无问芯穹夏立雪提出当前基础设施是为人设计而非为Agent设计,需打造"Agentic Infra",未来基础设施本身也应是能自我进化的智能体。
Palantir CEO:认为未来仅留两类人,能够掌控模型者立于不败,剩下的人只能被技术淘汰。
Meta策略:选择服务二十亿社交用户为核心赛道,模型足够好用且完全免费,目标是解决大众日常问题。
DeepSeek宕机:暴露大模型厂商在用户量爆发式增长下,算力调度与后端架构稳定性面临的严峻考验,2025年日活增长66.7%但算力仅增长8.3%,供需失衡。
美国开源AI:艾伦人工智能研究所(AI2)宣布削减开源模型开发资金,核心团队成员集体离职并加入微软,标志着美国开源AI领域的重大挫折。
中国开源AI:国产开源模型包揽开源榜单前三,PaddleOCR成为全球第一OCR项目,GigaWorld-1登顶世界模型榜首,展现统治级优势。
九、学习与研究资源
GigaBrain Challenge:CVPR 2026国际挑战赛,极佳视界GigaWorld-1作为官方Baseline,比赛官网https://gigaai-research.github.io/GigaBrain-Challenge-2026/。
OpenResearcher:开源流水线用于离线合成深度研究轨迹,代码已开源。
MicroCoder:微软亚洲研究院联合剑桥、普林斯顿开源,包含算法、数据集与评估工具。
Claude-howto:GitHub开源教程,提供Claude Code实战配置模板与流程图,涵盖10个结构化教程模块。
Pretext:Cheng Lou开源,纯JavaScript/TypeScript编写的多行文本测量与排版库。
seo-geo-audit:开源项目整合技术与生成式AI搜索可见度评估。
LangChain:发布AI Agent评估准备清单与实战指南。
AI-Crash-Course:GitHub开源项目,提供为期两周的人工智能研究速成课程。
RedMonk:发布开源生成式人工智能政策景观分析文章。
Together AI:发布计划划分与征服策略文章。
lawbreaker:开发者推出物理定律对抗基准测试,利用符号数学评估大模型推理准确性,已开源。
PinchBench:面向OpenClaw的真实世界Agent基准测试系统,已开源。
n8n-to-claw:开源仓库实现n8n与Claw框架集成。
Lagoon:本地RAG记忆工具即将开源。
Deep-Live-Cam:开源单图实时换脸工具。
Hermes:NousResearch开源进化助手框架。
Claude-mem:基于Agent-SDK的Claude记忆插件开源。
FastGS:开源项目实现三维高斯溅射训练耗时仅需100秒。
Qwen3-TTS-EasyFinetuning:开源工具简化本地微调流程。
rival-review:开源项目实现跨模型代码代理计划审查机制。
DragNeXt:南洋理工等团队开源,革新拖拽式图像编辑技术。
十、总结与洞察
2026年3月底的AI领域呈现出"范式跃迁"的鲜明特征:技术层面,世界模型(GigaWorld-1、Matrix-Game 3.0)和具身智能(智元机器人万台量产)取得突破性进展,标志着AI正从"数字世界"走向"物理世界";产品层面,智能体(Agent)成为绝对主角,OpenClaw生态(ClawManager、飞书CLI、企业微信CLI、ArkClaw、QClaw等)爆发式增长,AI从"对话工具"升级为"执行助手";产业层面,中美AI竞争进入白热化,国产模型(GLM-5.1、豆包、MiMo)快速追赶,开源生态(PaddleOCR、GigaWorld-1)展现统治力,但高端算力仍受制约(华为昇腾替代方案)。
值得警惕的是,AI安全与治理问题日益突出:Claude Mythos泄露暴露的"超级模型"风险、xAI创始团队全员离职反映的人才流失危机、DeepSeek宕机揭示的基础设施脆弱性、AI生成代码普及带来的就业冲击,都提示着技术狂飙背后的系统性风险。与此同时,"AI科学家"自主科研、AI自我繁殖预言、百亿智能体社会等前沿议题,正在重塑人类对AI能力的认知边界。
产业投资方面,资本正从"模型能力"转向"工程落地"(Harness能力)和"物理AI"(机器人、自动驾驶),具身智能成为新风口,预计2026年中国机器人领域融资将超200亿元。但"算力荒"(Kimi、MiniMax等面临的服务瓶颈)和"成本飙升"(单人公司月耗Token费达百万美元级)也提示着AI普惠化的现实挑战。
更多推荐



所有评论(0)