OpenAI Whisper

内容创作openai-whisper

本地离线语音转文字，无需 API key，保护隐私

使用示例

把录音文件丢给 agent 说「把这段音频转成文字」；或在对话里用快捷键录音后说「转写刚才这段并整理成会议纪要」

https://github.com/openclaw/openclaw/tree/main/skills/openai-whisper

一键总结网页、PDF、图片、音频、YouTube 视频

基于 Gemini 3 Pro Image（Nano Banana）的 PDF 编辑 CLI，用自然语言修改幻灯片/页面内容，保留可搜索文本层。

调用 Google Gemini 3 Pro Image (gemini-3-pro-image-preview) 进行文生图 / 图生图，支持 1K/2K/4K 高清输出。