O

Openai Whisper

精选

openai-whisper

v1.0.0⚡ 加速下载可用

OpenAI Whisper Skill 将 OpenAI 开源的 Whisper 语音识别模型集成到 AI 智能体中,提供完全本地化的语音转文本服务。所有处理在本机完成,无需联网、无需 API 密钥,既保护数据隐私又节省成本。该技能支持多种音频格式输入,可输出纯文本、SRT 字幕、VTT 字幕等多种格式,满足不同场景需求。Whisper 模型支持近百种语言的识别与翻译,中文识别准确率极高。用户可根据硬件条件选择不同大小的模型——从快速轻量的 tiny 到精度最高的 large——灵活平衡速度与质量。首次使用时模型会自动下载缓存,后续使用无需重复下载,真正做到开箱即用。

2.7万下载量
142收藏
100+安装量

安装方式

将此提示发送给你的 Agent,以安装技能

请帮我安装 Openai Whisper 技能。

可以通过 npm install -g @anthropic-ai/openai-whisper 全局安装,

或使用 npx @anthropic-ai/openai-whisper 免安装直接运行。

也可以将技能内容添加到项目的 CLAUDE.md~/.claude/CLAUDE.md 文件中。

卸载方式

1

npm 卸载

推荐

如果是通过 npm 全局安装的技能,在终端执行

npm uninstall -g @anthropic-ai/openai-whisper
2

手动卸载

找到并删除对应的技能配置内容

步骤 1 — 定位技能文件

检查以下位置,找到包含 Openai Whisper 相关内容的文件:

  • 项目根目录 CLAUDE.md
  • 全局配置 ~/.claude/CLAUDE.md
  • 技能目录 ~/.claude/skills/

步骤 2 — 删除技能内容

打开对应文件,删除 Openai Whisper 技能的完整配置段落,保存文件后即生效。

核心功能

1

完全本地运行,无需网络连接和 API 密钥,保障数据隐私

2

支持近百种语言的语音识别,中文识别准确率优秀

3

多种输出格式:纯文本、SRT 字幕、VTT 字幕,适配不同场景

4

提供 tiny 到 large 五档模型,灵活平衡速度与精度

典型使用场景

播客制作人将录音快速转为文字稿,用于发布文字版内容

视频创作者批量生成多语言字幕文件,提升内容可及性

记者和研究人员转录采访录音,高效整理访谈资料

开发者在 CI 流水线中集成语音转文本,实现自动化内容处理

适用人群

播客主播、视频创作者、记者、学术研究人员、会议记录员,以及需要将音频内容转为文字的各类专业人士。

安装须知

在 Claude Code 终端中运行安装命令即可添加技能,首次使用时会自动下载所选 Whisper 模型。需预装 Python 3.7+ 和 ffmpeg。

同类推荐:内容创作