资讯摘要
今日AI行业迎来多模态模型集中发布,阶跃星辰推出StepAudio 2.5系列,商汤开源SenseNova U1,英伟达发布Nemotron 3 Nano Omni全模态模型
AI工具日报 | 2026年4月30日
今日热点
🔥 阶跃星辰发布 StepAudio 2.5 系列
发布时间:2026年4月30日
阶跃星辰今日重磅发布 StepAudio 2.5 语音模型系列,包含两大核心产品:
StepAudio 2.5 TTS(语音合成)
- 面向 Agent 时代的语境感知语音合成
- 自然语言驱动,无需标签或专业知识
- 支持情绪、节奏、停顿、表达方式精准控制
- 零样本复刻,全局语境与文中语境理解
StepAudio 2.5 ASR(语音识别)
- 号称全球最快的 ASR 大模型
- 500 TPS 极速推理,推理成本降低 80%
- API 定价仅 0.15 元/小时,刷新行业底价
- 30 分钟长音频秒级转写,超长音频一次性处理
🚀 商汤科技开源 SenseNova U1
发布时间:2026年4月28日
商汤科技正式发布并开源日日新 SenseNova U1 系列原生理解生成统一模型:
- 基于自研 NEO-unify 架构,摒弃传统拼接式架构
- 统一多模态理解、推理与生成能力
- 去除独立视觉编码器与变分自编码器
- 构建统一表征空间,实现从模态集成向原生统一的范式跨越
开源版本:SenseNova U1 Lite 轻量版(8B-MoT 和 A3B-MoT 两个规格)
🧠 英伟达发布 Nemotron 3 Nano Omni
发布时间:2026年4月28-29日
英伟达推出 Nemotron 3 Nano Omni 开源全模态推理模型:
- 整合视觉、音频及语言能力于单一模型
- 基于 30B-A3B 混合专家(MoE)架构
- 推理吞吐量是同类开放式全模态模型的 9 倍
- 在六大权威排行榜位居榜首
应用企业:富士康、甲骨文、Palantir、H Company 等
具身智能与机器人
MagicLab 发布 Magic-Mix 世界模型
魔法原子 MagicLab 发布自研 Magic-Mix 世界模型:
- 双引擎架构:WAM(物理环境理解、空间推演与动作决策)+ Creator(离线数据生成引擎)
- 日均采集 1.6 万条数据
- 配套 MagicHand H01 灵巧手:20 个自由度、44 个触觉传感器、5mm 级毫秒响应
LG × 英伟达战略合作
2026年4月30日,LG 电子与英伟达宣布全面战略合作:
- 重点领域:机器人技术、AI 数据中心、移动设备
- 核心项目:家用机器人 CLOiD 研发
- 加速物理 AI 赛道布局
平台与基础设施
国家数据集管理服务平台上线
发布时间:2026年4月29日 | 发布机构:国家数据局
- 全国高质量数据集突破 11.6 万个
- 数据集总体量超过 960 PB
- 已认证各类供需主体 200 余家
- 发布数据集 1000 余个
财报与业绩
Alphabet(谷歌)Q1 财报超预期
- 营收:1099 亿美元(同比增长 22%)
- 净利润:626 亿美元(同比增长 81%)
- Google Cloud 营收:200 亿美元(同比增长 63%)
- Gemini Enterprise 付费月活环比增长 40%
- 资本开支上调至 1800-1900 亿美元
高通 Q2 财报与战略转型
- GAAP 营收:106 亿美元
- 净利润:74 亿美元(同比增长 162%)
- 重大战略:2026 年内开始向大型超大规模数据中心运营商交付数据中心芯片,正式进军数据中心 AI 芯片市场
- 盘后股价暴涨 17%
其他动态
| 公司/机构 | 事件 | 要点 |
|---|---|---|
| 苹果 | iOS 27 Siri 相机模式 | 视觉 AI 整合相机应用,支持 ChatGPT 问答 |
| 谷歌 | 印度 AI 中心奠基 | 150 亿美元投资,建设千兆瓦级数据中心 |
| 国家发改委 | 叫停 Meta 收购 Manus | 首个被公开叫停的 AI 领域外资收购案 |
| 成都"爱湫"机器人 | 一日店长服务 | 情感交互人形机器人首次商业化服务 |
今日趋势总结
- 多模态统一:从拼接式架构向原生统一架构演进
- 语音技术突破:语境感知、极速推理、成本大幅降低
- 具身智能加速:世界模型 + 灵巧手,商业化落地提速
- 开源生态繁荣:商汤、英伟达等头部企业积极开源
- AI 芯片竞争加剧:高通进军数据中心,英伟达持续领先
数据来源:OpenAI 官方博客、商汤科技、阶跃星辰、英伟达、AIProductHub 等 整理时间:2026年4月30日