Ollama

适用范围

在以下情况使用此页面:

  • 你想通过 Ollama 在 Moltbot 中使用本地模型
  • 你需要 Ollama 设置和配置指导

Ollama 是一个本地 LLM 运行时,可以轻松在您的机器上运行开源模型。Moltbot 与 Ollama 的 OpenAI 兼容 API 集成,当你选择加入 OLLAMA_API_KEY(或认证配置文件)并且未定义明确的 models.providers.ollama 条目时,可以自动发现支持工具的模型

快速开始

  1. 安装 Ollama:https://ollama.ai

  2. 拉取模型:

ollama pull llama3.3
# 或
ollama pull qwen2.5-coder:32b
# 或
ollama pull deepseek-r1:32b
  1. 为 Moltbot 启用 Ollama(任何值都有效;Ollama 不需要真实的密钥):
# 设置环境变量
export OLLAMA_API_KEY="ollama-local"

# 或在配置文件中配置
moltbot config set models.providers.ollama.apiKey "ollama-local"
  1. 使用 Ollama 模型:
{
  agents: {
    defaults: {
      model: { primary: "ollama/llama3.3" }
    }
  }
}

模型发现(隐式提供商)

当你设置 OLLAMA_API_KEY(或认证配置文件)并且定义 models.providers.ollama 时,Moltbot 从位于 http://127.0.0.1:11434 的本地 Ollama 实例发现模型:

  • 查询 /api/tags/api/show
  • 仅保留报告工具能力的模型
  • 当模型报告 thinking 时标记 reasoning
  • model_info["<arch>.context_length"] 读取 contextWindow(如果可用)
  • maxTokens 设置为上下文窗口的 10 倍
  • 将所有成本设置为 0

这避免了手动模型输入,同时保持目录与 Ollama 的能力一致。

要查看可用的模型:

ollama list
moltbot models list

要添加新模型,只需使用 Ollama 拉取它:

ollama pull mistral

新模型将自动发现并可使用。

如果你明确设置 models.providers.ollama,则跳过自动发现,你必须手动定义模型(参见下文)。

配置

基本设置(隐式发现)

启用 Ollama 的最简单方法是通过环境变量:

export OLLAMA_API_KEY="ollama-local"

明确设置(手动模型)

在以下情况下使用明确配置:

  • Ollama 在另一个主机/端口上运行。
  • 你想强制特定的上下文窗口或模型列表。
  • 你想包含不报告工具支持的模型。
{
  models: {
    providers: {
      ollama: {
        // 使用包含 /v1 的主机以实现 OpenAI 兼容 API
        baseUrl: "http://ollama-host:11434/v1",
        apiKey: "ollama-local",
        api: "openai-completions",
        models: [
          {
            id: "llama3.3",
            name: "Llama 3.3",
            reasoning: false,
            input: ["text"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 8192,
            maxTokens: 8192 * 10
          }
        ]
      }
    }
  }
}

如果设置了 OLLAMA_API_KEY,你可以在提供商条目中省略 apiKey,Moltbot 将为可用性检查填充它。

自定义基本 URL(明确配置)

如果 Ollama 在不同的主机或端口上运行(明确配置会禁用自动发现,因此手动定义模型):

{
  models: {
    providers: {
      ollama: {
        apiKey: "ollama-local",
        baseUrl: "http://ollama-host:11434/v1"
      }
    }
  }
}

模型选择

配置完成后,所有 Ollama 模型都可用:

{
  agents: {
    defaults: {
      model: {
        primary: "ollama/llama3.3",
        fallback: ["ollama/qwen2.5-coder:32b"]
      }
    }
  }
}

高级

推理模型

当 Ollama 在 /api/show 中报告 thinking 时,Moltbot 将模型标记为具有推理能力:

ollama pull deepseek-r1:32b

模型成本

Ollama 是免费的并在本地运行,因此所有模型成本都设置为 0 美元。

上下文窗口

对于自动发现的模型,Moltbot 使用 Ollama 报告的上下文窗口(如果可用),否则默认为 8192。你可以在明确的提供商配置中覆盖 contextWindowmaxTokens

故障排除

未检测到 Ollama

确保 Ollama 正在运行,并且你设置了 OLLAMA_API_KEY(或认证配置文件),并且你没有定义明确的 models.providers.ollama 条目:

ollama serve

并且 API 可访问:

curl http://localhost:11434/api/tags

没有可用的模型

Moltbot 仅自动发现报告工具支持的模型。如果你的模型未列出,请:

  • 拉取支持工具的模型,或
  • models.providers.ollama 中明确定义模型。

要添加模型:

ollama list  # 查看已安装的内容
ollama pull llama3.3  # 拉取模型

连接被拒绝

检查 Ollama 是否在正确的端口上运行:

# 检查 Ollama 是否正在运行
ps aux | grep ollama

# 或重启 Ollama
ollama serve

另请参阅