Whisper 设置
使用 OpenAI 的 Whisper 模型配置语音转文字功能。
启用 Whisper
语音输入功能的主开关。
启用后:
- 语音输入按钮出现在聊天界面
- 使用键盘快捷键(默认:
Cmd/Ctrl+Shift+V)切换语音输入 - 语音使用 Whisper 模型在本地转录
模型选择
选择的模型
选择使用哪个已下载的 Whisper 模型进行转录。
TIP
你必须先下载至少一个模型才能使用语音输入。
语言
选择转录的语言:
- 自动检测:自动检测所说的语言
- 或选择特定语言以获得更好的准确性
支持的语言包括:英语、中文、日语、韩语、德语、法语、西班牙语、葡萄牙语、俄语、意大利语等。
可用模型
根据你的需求下载 Whisper 模型:
| 模型 | 大小 | 速度 | 准确性 | 最适合 |
|---|---|---|---|---|
| Large V3 Turbo(推荐) | 1.6 GB | 快 | 高 | 最佳总体选择 |
| Tiny | 75 MB | 最快 | 低 | 快速测试,存储有限 |
| Tiny (English) | 75 MB | 最快 | 低 | 仅英语,最快 |
| Base | 142 MB | 很快 | 中等 | 日常使用,平衡 |
| Base (English) | 142 MB | 很快 | 中等 | 仅英语 |
| Small | 466 MB | 快 | 好 | 大多数用户 |
| Small (English) | 466 MB | 快 | 好 | 仅英语 |
| Medium | 1.5 GB | 中等 | 高 | 高准确性需求 |
| Medium (English) | 1.5 GB | 中等 | 高 | 仅英语 |
| Large V3 | 3.1 GB | 慢 | 最高 | 最佳准确性 |
仅英语模型
带有 "(English)" 后缀的模型针对英语进行了优化,可能为英语语音提供更好的准确性,但无法转录其他语言。
管理模型
下载模型
- 在可用模型列表中找到你想要的模型
- 点击 下载 按钮
- 等待下载完成
- 准备就绪时模型会显示勾选标记
下载进度显示:
- 完成百分比
- 下载速度
- 预计剩余时间
删除模型
- 点击已下载模型旁边的删除(垃圾桶)图标
- 确认删除
WARNING
如果你删除当前选择的模型,Alma 将切换到另一个可用模型,或者如果没有剩余模型则禁用 Whisper。
使用
配置完成后:
- 点击聊天输入中的麦克风图标,或使用键盘快捷键
- 清晰地对着麦克风说话
- 你的语音将被转录并插入到输入框中
- 如有需要进行编辑,然后发送消息
