AI工具日报 | 2026年4月30日

今日热点

🔥 阶跃星辰发布 StepAudio 2.5 系列

发布时间：2026年4月30日

阶跃星辰今日重磅发布 StepAudio 2.5 语音模型系列，包含两大核心产品：

StepAudio 2.5 TTS（语音合成）

面向 Agent 时代的语境感知语音合成
自然语言驱动，无需标签或专业知识
支持情绪、节奏、停顿、表达方式精准控制
零样本复刻，全局语境与文中语境理解

StepAudio 2.5 ASR（语音识别）

号称全球最快的 ASR 大模型
500 TPS 极速推理，推理成本降低 80%
API 定价仅 0.15 元/小时，刷新行业底价
30 分钟长音频秒级转写，超长音频一次性处理

🚀 商汤科技开源 SenseNova U1

发布时间：2026年4月28日

商汤科技正式发布并开源日日新 SenseNova U1 系列原生理解生成统一模型：

基于自研 NEO-unify 架构，摒弃传统拼接式架构
统一多模态理解、推理与生成能力
去除独立视觉编码器与变分自编码器
构建统一表征空间，实现从模态集成向原生统一的范式跨越

开源版本：SenseNova U1 Lite 轻量版（8B-MoT 和 A3B-MoT 两个规格）

🧠 英伟达发布 Nemotron 3 Nano Omni

发布时间：2026年4月28-29日

英伟达推出 Nemotron 3 Nano Omni 开源全模态推理模型：

整合视觉、音频及语言能力于单一模型
基于 30B-A3B 混合专家（MoE）架构
推理吞吐量是同类开放式全模态模型的 9 倍
在六大权威排行榜位居榜首

应用企业：富士康、甲骨文、Palantir、H Company 等

具身智能与机器人

MagicLab 发布 Magic-Mix 世界模型

魔法原子 MagicLab 发布自研 Magic-Mix 世界模型：

双引擎架构：WAM（物理环境理解、空间推演与动作决策）+ Creator（离线数据生成引擎）
日均采集 1.6 万条数据
配套 MagicHand H01 灵巧手：20 个自由度、44 个触觉传感器、5mm 级毫秒响应

LG × 英伟达战略合作

2026年4月30日，LG 电子与英伟达宣布全面战略合作：

重点领域：机器人技术、AI 数据中心、移动设备
核心项目：家用机器人 CLOiD 研发
加速物理 AI 赛道布局

平台与基础设施

国家数据集管理服务平台上线

发布时间：2026年4月29日 | 发布机构：国家数据局

全国高质量数据集突破 11.6 万个
数据集总体量超过 960 PB
已认证各类供需主体 200 余家
发布数据集 1000 余个

财报与业绩

Alphabet（谷歌）Q1 财报超预期

营收：1099 亿美元（同比增长 22%）
净利润：626 亿美元（同比增长 81%）
Google Cloud 营收：200 亿美元（同比增长 63%）
Gemini Enterprise 付费月活环比增长 40%
资本开支上调至 1800-1900 亿美元

高通 Q2 财报与战略转型

GAAP 营收：106 亿美元
净利润：74 亿美元（同比增长 162%）
重大战略：2026 年内开始向大型超大规模数据中心运营商交付数据中心芯片，正式进军数据中心 AI 芯片市场
盘后股价暴涨 17%

其他动态

公司/机构	事件	要点
苹果	iOS 27 Siri 相机模式	视觉 AI 整合相机应用，支持 ChatGPT 问答
谷歌	印度 AI 中心奠基	150 亿美元投资，建设千兆瓦级数据中心
国家发改委	叫停 Meta 收购 Manus	首个被公开叫停的 AI 领域外资收购案
成都"爱湫"机器人	一日店长服务	情感交互人形机器人首次商业化服务

今日趋势总结

多模态统一：从拼接式架构向原生统一架构演进
语音技术突破：语境感知、极速推理、成本大幅降低
具身智能加速：世界模型 + 灵巧手，商业化落地提速
开源生态繁荣：商汤、英伟达等头部企业积极开源
AI 芯片竞争加剧：高通进军数据中心，英伟达持续领先

数据来源：OpenAI 官方博客、商汤科技、阶跃星辰、英伟达、AIProductHub 等 整理时间：2026年4月30日

AI工具日报 | 2026年4月30日：多模态模型集中爆发，语音技术突破

资讯摘要