Skip to content

Whisper 设置

使用 OpenAI 的 Whisper 模型配置语音转文字功能。

启用 Whisper

语音输入功能的主开关。

启用后:

  • 语音输入按钮出现在聊天界面
  • 使用键盘快捷键(默认:Cmd/Ctrl+Shift+V)切换语音输入
  • 语音使用 Whisper 模型在本地转录

模型选择

选择的模型

选择使用哪个已下载的 Whisper 模型进行转录。

TIP

你必须先下载至少一个模型才能使用语音输入。

语言

选择转录的语言:

  • 自动检测:自动检测所说的语言
  • 或选择特定语言以获得更好的准确性

支持的语言包括:英语、中文、日语、韩语、德语、法语、西班牙语、葡萄牙语、俄语、意大利语等。

可用模型

根据你的需求下载 Whisper 模型:

模型大小速度准确性最适合
Large V3 Turbo(推荐)1.6 GB最佳总体选择
Tiny75 MB最快快速测试,存储有限
Tiny (English)75 MB最快仅英语,最快
Base142 MB很快中等日常使用,平衡
Base (English)142 MB很快中等仅英语
Small466 MB大多数用户
Small (English)466 MB仅英语
Medium1.5 GB中等高准确性需求
Medium (English)1.5 GB中等仅英语
Large V33.1 GB最高最佳准确性

仅英语模型

带有 "(English)" 后缀的模型针对英语进行了优化,可能为英语语音提供更好的准确性,但无法转录其他语言。

管理模型

下载模型

  1. 在可用模型列表中找到你想要的模型
  2. 点击 下载 按钮
  3. 等待下载完成
  4. 准备就绪时模型会显示勾选标记

下载进度显示:

  • 完成百分比
  • 下载速度
  • 预计剩余时间

删除模型

  1. 点击已下载模型旁边的删除(垃圾桶)图标
  2. 确认删除

WARNING

如果你删除当前选择的模型,Alma 将切换到另一个可用模型,或者如果没有剩余模型则禁用 Whisper。

使用

配置完成后:

  1. 点击聊天输入中的麦克风图标,或使用键盘快捷键
  2. 清晰地对着麦克风说话
  3. 你的语音将被转录并插入到输入框中
  4. 如有需要进行编辑,然后发送消息