返回资讯列表
每日 AI 资讯

AI工具日报 | 2026年4月30日:多模态模型集中爆发,语音技术突破

2026-04-30
AI日报多模态语音合成具身智能开源模型

资讯摘要

今日AI行业迎来多模态模型集中发布,阶跃星辰推出StepAudio 2.5系列,商汤开源SenseNova U1,英伟达发布Nemotron 3 Nano Omni全模态模型

AI工具日报 | 2026年4月30日

今日热点

🔥 阶跃星辰发布 StepAudio 2.5 系列

发布时间:2026年4月30日

阶跃星辰今日重磅发布 StepAudio 2.5 语音模型系列,包含两大核心产品:

StepAudio 2.5 TTS(语音合成)

  • 面向 Agent 时代的语境感知语音合成
  • 自然语言驱动,无需标签或专业知识
  • 支持情绪、节奏、停顿、表达方式精准控制
  • 零样本复刻,全局语境与文中语境理解

StepAudio 2.5 ASR(语音识别)

  • 号称全球最快的 ASR 大模型
  • 500 TPS 极速推理,推理成本降低 80%
  • API 定价仅 0.15 元/小时,刷新行业底价
  • 30 分钟长音频秒级转写,超长音频一次性处理

🚀 商汤科技开源 SenseNova U1

发布时间:2026年4月28日

商汤科技正式发布并开源日日新 SenseNova U1 系列原生理解生成统一模型:

  • 基于自研 NEO-unify 架构,摒弃传统拼接式架构
  • 统一多模态理解、推理与生成能力
  • 去除独立视觉编码器与变分自编码器
  • 构建统一表征空间,实现从模态集成向原生统一的范式跨越

开源版本:SenseNova U1 Lite 轻量版(8B-MoT 和 A3B-MoT 两个规格)


🧠 英伟达发布 Nemotron 3 Nano Omni

发布时间:2026年4月28-29日

英伟达推出 Nemotron 3 Nano Omni 开源全模态推理模型:

  • 整合视觉、音频及语言能力于单一模型
  • 基于 30B-A3B 混合专家(MoE)架构
  • 推理吞吐量是同类开放式全模态模型的 9 倍
  • 在六大权威排行榜位居榜首

应用企业:富士康、甲骨文、Palantir、H Company 等


具身智能与机器人

MagicLab 发布 Magic-Mix 世界模型

魔法原子 MagicLab 发布自研 Magic-Mix 世界模型

  • 双引擎架构:WAM(物理环境理解、空间推演与动作决策)+ Creator(离线数据生成引擎)
  • 日均采集 1.6 万条数据
  • 配套 MagicHand H01 灵巧手:20 个自由度、44 个触觉传感器、5mm 级毫秒响应

LG × 英伟达战略合作

2026年4月30日,LG 电子与英伟达宣布全面战略合作:

  • 重点领域:机器人技术、AI 数据中心、移动设备
  • 核心项目:家用机器人 CLOiD 研发
  • 加速物理 AI 赛道布局

平台与基础设施

国家数据集管理服务平台上线

发布时间:2026年4月29日 | 发布机构:国家数据局

  • 全国高质量数据集突破 11.6 万个
  • 数据集总体量超过 960 PB
  • 已认证各类供需主体 200 余家
  • 发布数据集 1000 余个

财报与业绩

Alphabet(谷歌)Q1 财报超预期

  • 营收:1099 亿美元(同比增长 22%)
  • 净利润:626 亿美元(同比增长 81%)
  • Google Cloud 营收:200 亿美元(同比增长 63%)
  • Gemini Enterprise 付费月活环比增长 40%
  • 资本开支上调至 1800-1900 亿美元

高通 Q2 财报与战略转型

  • GAAP 营收:106 亿美元
  • 净利润:74 亿美元(同比增长 162%
  • 重大战略:2026 年内开始向大型超大规模数据中心运营商交付数据中心芯片,正式进军数据中心 AI 芯片市场
  • 盘后股价暴涨 17%

其他动态

公司/机构事件要点
苹果iOS 27 Siri 相机模式视觉 AI 整合相机应用,支持 ChatGPT 问答
谷歌印度 AI 中心奠基150 亿美元投资,建设千兆瓦级数据中心
国家发改委叫停 Meta 收购 Manus首个被公开叫停的 AI 领域外资收购案
成都"爱湫"机器人一日店长服务情感交互人形机器人首次商业化服务

今日趋势总结

  1. 多模态统一:从拼接式架构向原生统一架构演进
  2. 语音技术突破:语境感知、极速推理、成本大幅降低
  3. 具身智能加速:世界模型 + 灵巧手,商业化落地提速
  4. 开源生态繁荣:商汤、英伟达等头部企业积极开源
  5. AI 芯片竞争加剧:高通进军数据中心,英伟达持续领先

数据来源:OpenAI 官方博客、商汤科技、阶跃星辰、英伟达、AIProductHub 等 整理时间:2026年4月30日