Apple 向所有 AI 开放 Siri,Google 发布最强语音模型,Mistral 开源 TTS 挑战 ElevenLabs,Shield AI 融资 20 亿美元
1. Apple 将在 iOS 27 中向所有 AI 助手开放 Siri
据 Bloomberg 报道,Apple 计划在 iOS 27 中推出全新的「Extensions」系统,允许任何通过 App Store 安装的 AI 聊天机器人与 Siri 深度集成。这意味着 Claude、Gemini、Copilot、Grok、Perplexity 等 AI 助手都将能直接接入 Siri,结束了此前 ChatGPT 作为唯一外部 AI 合作伙伴的独占地位。
这是 Apple AI 战略的重大转向。过去两年,Apple 一直将 Siri 作为封闭生态的一部分,仅与 OpenAI 建立合作关系。如今开放平台意味着 Apple 更看重 iPhone 作为 AI 平台的定位,而非押注单一 AI 提供商。对用户来说,这意味着更多选择——你可以让 Claude 处理写作、Gemini 处理搜索、Copilot 处理代码,各取所长。
2. Google 发布 Gemini 3.1 Flash Live:迄今最强语音模型
Google 于 3 月 26 日推出 Gemini 3.1 Flash Live,称其为「迄今最高质量的音频和语音模型」。该模型支持实时多模态流处理,具备低延迟语音对话、视频理解和工具调用能力,已面向 200 个国家推出。
Gemini 3.1 Flash Live 直接驱动了 Gemini Live 和 Search Live 的重大升级。Search Live 的全球推出尤其值得关注——用户现在可以在 Google 搜索中直接进行语音对话,还能通过摄像头获取视觉问答。这标志着搜索从「输入文字」向「自然对话」的又一步跨越,对整个搜索行业和 AI 语音交互领域都有深远影响。
来源: 9to5Google / MarkTechPost
3. Mistral 开源 Voxtral TTS:3GB 模型挑战 ElevenLabs
Mistral AI 于 3 月 26 日发布 Voxtral TTS,一个 30 亿参数的开源文本转语音模型。这个模型仅需 3GB 内存即可运行,支持 5 秒音频克隆声音,在人类偏好测试中以 68.4% 的胜率超越了 ElevenLabs Flash v2.5。
这是开源语音 AI 的里程碑时刻。ElevenLabs 刚在 2 月完成 5 亿美元 D 轮融资、估值 110 亿美元,是语音 AI 领域的绝对霸主。Mistral 却用一个可以在智能手机上运行的开源模型挑战了这一格局。Voxtral TTS 支持 9 种语言,API 价格约为 ElevenLabs 的一半,开源权重意味着企业可以完全私有化部署。这对依赖云端 TTS 服务的商业模式是一个实质性威胁。
来源: VentureBeat / AI Haven
4. Shield AI 融资 20 亿美元,估值翻倍至 127 亿美元
军用无人机初创公司 Shield AI 宣布完成 20 亿美元融资,包括 15 亿美元 G 轮融资和 5 亿美元优先股融资。本轮由 Advent International 领投,JPMorgan Chase 联合领投,公司估值从一年前的 53 亿美元飙升至 127 亿美元,增幅达 140%。
Shield AI 的核心产品是基于 AI 的自主飞行系统,用于军事无人机和航空器。在全球地缘政治紧张加剧的背景下,国防科技领域持续受到资本追捧。20 亿美元的单轮融资规模在国防科技初创公司中极为罕见,反映了 AI 在军事领域的应用正从实验阶段进入大规模部署阶段。这也引发了关于 AI 军事化的持续争议。
来源: NYTimes / TechCrunch
编辑点评
今天的新闻有一个共同主题:开放与竞争。Apple 开放 Siri、Mistral 开源语音模型、Google 将语音搜索推向全球——巨头们不再试图垄断某个 AI 赛道,而是通过开放平台和开源策略抢占生态位。与此同时,Shield AI 的巨额融资提醒我们,AI 的应用边界正在向更敏感的领域延伸。2026 年的 AI 竞争,已经从「谁的模型更强」演变为「谁的生态更开放」。

