Skip to content

聊天设置

配置聊天行为和响应参数。

聊天参数

Temperature

控制响应的随机性(0-2):

  • 0:确定性、专注的响应
  • 1:平衡(默认)
  • 2:创意、多样的响应

较低的值产生更一致的输出,较高的值引入更多变化和创意。

最大 Tokens

AI 响应的最大长度(1-8192)。

较高的值允许更长的响应,但可能增加成本和延迟。

响应设置

启用流式响应

  • 启用:生成时显示响应(推荐)
  • 禁用:完成后显示完整响应

流式传输提供更好的感知性能,并允许你看到 AI 的思考过程。

显示 Token 使用量

显示每条消息的 token 计数:

  • 输入 tokens
  • 输出 tokens
  • 缓存 tokens(如适用)

用于监控 API 成本。

启用 Markdown 渲染

渲染消息中的 markdown 格式:

  • 标题
  • 列表
  • 带语法高亮的代码块
  • 链接
  • 表格

单美元符号 LaTeX

启用 markdown 后,你还可以启用单美元符号 LaTeX 渲染:

  • $x = y$ 渲染为行内数学公式
  • $$公式$$ 渲染为块级数学公式

TIP

仅在你经常处理数学内容时启用此选项。它可能会干扰包含美元符号的普通文本。

默认工具选择

配置新对话中工具默认启用的方式:

自动(推荐)

AI 根据对话上下文自动选择合适的工具。这是默认和推荐的设置。

全部

为每个对话启用所有可用工具。如果你想要最大能力,请使用此选项。

默认不启用任何工具。你需要为每个对话手动启用工具。用于简单的纯聊天交互。

声音效果

在 AI 响应流式传输期间播放合成声音。

启用声音效果

切换流式声音效果的开/关。

声音预设

选择合成器预设:

  • 经典:温暖的三角波,带有柔和的混响
  • 空灵:柔和的正弦波,带有宽广的氛围
  • 数字:清脆的方波,效果最小
  • 复古:怀旧的锯齿波,带有温暖的滤波

点击 预览 在选择前试听每个预设。

音量

调整声音效果的音量(0-100%)。

自动压缩

当上下文接近模型限制时,自动管理长对话。

启用自动压缩

启用后,Alma 会自动总结对话的较早部分,以保持在上下文限制内,同时保留重要信息。

使用阈值

当上下文使用超过此百分比时触发压缩(5-95%)。

  • 较低的值(如 60%):更早压缩,更积极的内存管理
  • 较高的值(如 90%):更晚压缩,保留更多上下文

保留最近消息

始终保持不变的最近消息数量(2-20)。

这些消息永远不会被压缩,确保最近的上下文始终可用。

TIP

自动压缩对于你想要继续讨论而不丢失重要上下文的超长对话特别有用。