OpenResponses API(HTTP)

OpenResponses API(HTTP)

适用范围

在以下情况使用此页面:

  • 集成使用 OpenResponses API 的客户端
  • 您想要基于项目的输入、客户端工具调用或 SSE 事件

Moltbot 的网关可以提供 OpenResponses 兼容的 POST /v1/responses 端点。

此端点 默认禁用。首先在配置中启用它。

  • POST /v1/responses
  • 与网关相同的端口(WS + HTTP 多路复用):http://<gateway-host>:<port>/v1/responses

在底层,请求作为正常的网关代理运行执行(与 moltbot agent 相同的代码路径),因此路由/权限/配置与您的网关匹配。

身份验证

使用网关身份验证配置。发送不记名令牌:

  • Authorization: Bearer <token>

注意:

  • gateway.auth.mode="token" 时,使用 gateway.auth.token(或 MOLTBOT_GATEWAY_TOKEN)。
  • gateway.auth.mode="password" 时,使用 gateway.auth.password(或 MOLTBOT_GATEWAY_PASSWORD)。

选择代理

不需要自定义标头:在 OpenResponses model 字段中编码代理 id:

  • model: "moltbot:<agentId>"(例如:"moltbot:main""moltbot:beta"
  • model: "agent:<agentId>"(别名)

或通过标头定位特定的 Moltbot 代理:

  • x-moltbot-agent-id: <agentId>(默认:main

高级:

  • x-moltbot-session-key: <sessionKey> 以完全控制会话路由。

启用端点

gateway.http.endpoints.responses.enabled 设置为 true

{
  gateway: {
    http: {
      endpoints: {
        responses: { enabled: true }
      }
    }
  }
}

禁用端点

gateway.http.endpoints.responses.enabled 设置为 false

{
  gateway: {
    http: {
      endpoints: {
        responses: { enabled: false }
      }
    }
  }
}

会话行为

默认情况下,端点是 每个请求无状态的(每次调用生成新的会话键)。

如果请求包含 OpenResponses user 字符串,网关会从中派生稳定的会话键,以便重复调用可以共享代理会话。

请求形状(支持)

请求遵循 OpenResponses API,具有基于项目的输入。当前支持:

  • input:字符串或项目对象数组。
  • instructions:合并到系统提示中。
  • tools:客户端工具定义(函数工具)。
  • tool_choice:过滤或要求客户端工具。
  • stream:启用 SSE 流式传输。
  • max_output_tokens:尽力输出限制(取决于提供程序)。
  • user:稳定的会话路由。

接受但 当前被忽略

  • max_tool_calls
  • reasoning
  • metadata
  • store
  • previous_response_id
  • truncation

项目(input)

message

角色:systemdeveloperuserassistant

  • systemdeveloper 附加到系统提示。
  • 最近的 userfunction_call_output 项目成为"当前消息"。
  • 早期的 user/assistant 消息作为上下文的历史记录包括在内。

function_call_output(基于轮次的工具)

将工具结果发送回模型:

{
  "type": "function_call_output",
  "call_id": "call_123",
  "output": "{\"temperature\": \"72F\"}"
}

reasoningitem_reference

为架构兼容性接受,但在构建提示时被忽略。

工具(客户端函数工具)

提供带有 tools: [{ type: "function", function: { name, description?, parameters? } }] 的工具。

如果代理决定调用工具,响应返回 function_call 输出项目。 然后您发送带有 function_call_output 的后续请求以继续轮次。

图像(input_image

支持 base64 或 URL 来源:

{
  "type": "input_image",
  "source": { "type": "url", "url": "https://example.com/image.png" }
}

允许的 MIME 类型(当前):image/jpegimage/pngimage/gifimage/webp。 最大大小(当前):10MB。

文件(input_file

支持 base64 或 URL 来源:

{
  "type": "input_file",
  "source": {
    "type": "base64",
    "media_type": "text/plain",
    "data": "SGVsbG8gV29ybGQh",
    "filename": "hello.txt"
  }
}

允许的 MIME 类型(当前):text/plaintext/markdowntext/htmltext/csvapplication/jsonapplication/pdf

最大大小(当前):5MB。

当前行为:

  • 文件内容被解码并添加到 系统提示,而不是用户消息,因此它保持短暂(不会持久化在会话历史记录中)。
  • PDF 被解析以获取文本。如果发现很少的文本,前几页将被栅格化为图像并传递给模型。

PDF 解析使用 Node 友好的 pdfjs-dist 传统构建(无 worker)。现代 PDF.js 构建期望浏览器 worker/DOM 全局对象,因此不在网关中使用。

URL 获取默认值:

  • files.allowUrltrue
  • images.allowUrltrue
  • 请求受保护(DNS 解析、私有 IP 阻止、重定向上限、超时)。

文件 + 图像限制(配置)

可以在 gateway.http.endpoints.responses 下调整默认值:

{
  gateway: {
    http: {
      endpoints: {
        responses: {
          enabled: true,
          maxBodyBytes: 20000000,
          files: {
            allowUrl: true,
            allowedMimes: ["text/plain", "text/markdown", "text/html", "text/csv", "application/json", "application/pdf"],
            maxBytes: 5242880,
            maxChars: 200000,
            maxRedirects: 3,
            timeoutMs: 10000,
            pdf: {
              maxPages: 4,
              maxPixels: 4000000,
              minTextChars: 200
            }
          },
          images: {
            allowUrl: true,
            allowedMimes: ["image/jpeg", "image/png", "image/gif", "image/webp"],
            maxBytes: 10485760,
            maxRedirects: 3,
            timeoutMs: 10000
          }
        }
      }
    }
  }
}

省略时的默认值:

  • maxBodyBytes:20MB
  • files.maxBytes:5MB
  • files.maxChars:200k
  • files.maxRedirects:3
  • files.timeoutMs:10s
  • files.pdf.maxPages:4
  • files.pdf.maxPixels:4,000,000
  • files.pdf.minTextChars:200
  • images.maxBytes:10MB
  • images.maxRedirects:3
  • images.timeoutMs:10s

流式传输(SSE)

设置 stream: true 以接收服务器发送事件(SSE):

  • Content-Type: text/event-stream
  • 每个事件行是 event: <type>data: <json>
  • 流以 data: [DONE] 结束

当前发出的事件类型:

  • response.created
  • response.in_progress
  • response.output_item.added
  • response.content_part.added
  • response.output_text.delta
  • response.output_text.done
  • response.content_part.done
  • response.output_item.done
  • response.completed
  • response.failed(错误时)

使用情况

当底层提供程序报告令牌计数时填充 usage

错误

错误使用 JSON 对象,如:

{ "error": { "message": "...", "type": "invalid_request_error" } }

常见情况:

  • 401 缺少/无效的身份验证
  • 400 无效的请求体
  • 405 错误的方法

示例

非流式传输:

curl -sS http://127.0.0.1:18789/v1/responses \
  -H 'Authorization: Bearer YOUR_TOKEN' \
  -H 'Content-Type: application/json' \
  -H 'x-moltbot-agent-id: main' \
  -d '{
    "model": "moltbot",
    "input": "hi"
  }'

流式传输:

curl -N http://127.0.0.1:18789/v1/responses \
  -H 'Authorization: Bearer YOUR_TOKEN' \
  -H 'Content-Type: application/json' \
  -H 'x-moltbot-agent-id: main' \
  -d '{
    "model": "moltbot",
    "stream": true,
    "input": "hi"
  }'