Crun Responses API
CRUN 语言模型的 OpenAI 兼容 /responses 接口,支持灵活输入、有状态追问、结构化输出、流式输出和工具就绪的 response items。
API 地址
身份验证
您可以使用以下任一方式进行身份验证:Authorization: Bearer YOUR_API_KEYX-API-KEY: YOUR_API_KEY
何时使用 Responses
适合使用/responses 的场景:
- 希望使用顶层
instructions,而不是 system message。 - 需要字符串或 message-like items 列表形式的灵活
input。 - 上游模型支持存储响应时,希望通过
previous_response_id做有状态追问。 - 希望通过
text.format获取结构化输出。 - 希望使用工具就绪的 response items,以及
tools/tool_choice字段。
messages -> choices[] -> message 结构,请使用 /chat/completions。
基本文本生成
Message 风格输入
input 也可以传入 message-like items 列表,便于从 Chat Completions 迁移。
图片输入
当所选模型支持视觉能力时,可以在content 数组中使用 type: "input_image" 传入图片。图片可以是公开 URL、Base64 data URL。
文件输入
对于 PDF 和其他上游模型支持的已上传文件,请先上传文件,再作为input_file content part 传入。
有状态追问
当上游模型支持存储响应时,可以设置store=true,并在下一次请求中传入 previous_response_id,无需重新发送全部上下文。
结构化输出
Responses 使用text.format 配置结构化输出。这与 Chat Completions 的 response_format 不同。
工具就绪请求
OpenAI Responses API 支持内置工具和函数式工具。CRUN 会接受兼容的tools 与 tool_choice 字段,并在所选上游模型支持时透传。
流式输出
设置stream=true 后,可以从 /responses 接收 Server-Sent Events。每个事件包含一行 event:,以及紧随其后的 JSON data: 载荷。
响应示例
注意事项
max_output_tokens会受所选模型的输出 token 上限约束。- 其他 OpenAI 兼容字段也会被接受,并在上游模型支持时透传。
- 图片输入使用
input_imagecontent parts。文件输入使用带有上传file_url的input_filecontent parts。 - 结构化输出使用
text.format;Chat Completions 使用response_format。 - 工具可用性取决于所选模型和上游服务商。
- 未知模型 ID 会返回 OpenAI 风格的错误体,其中
code为"model_not_found"。
相关资源
LLM 快速开始
Chat Completions API
价格
授权
将您的 CRUN API Key 作为 Bearer token,用于 OpenAI 兼容 SDK。
请求体
OpenAI 兼容 Responses 请求。其他兼容字段会被接受,并在上游模型支持时透传。
GET /api/v1/models 返回的公开模型 ID。
1 - 128"gpt-5.4"
模型输入。可以是字符串,也可以是 response input items 列表;支持文本、图片和文件 content parts,具体能力取决于所选模型和上游服务。
"Write a one-sentence launch caption for a noise-canceling headset."
发送给模型的系统或开发者指令。
"You are a concise product copywriter."
是否返回 Server-Sent Events 流。
false
上游服务支持时,是否存储响应以便进行有状态追问。
true
上游服务支持时,用于继续对话的上一轮已存储响应 ID。
"resp_abc123"
开发者自定义元数据。
最大输出 token 数,会受所选模型限制。
x >= 1512
采样温度。
0 <= x <= 20.7
核采样参数。
0 <= x <= 11
用于观测的终端用户标识。
"user_123"
上游服务支持时传入的提示词缓存键。
上游服务支持时的提示词缓存保留策略。
in-memory, 24h 推理模型配置。
{ "effort": "medium" }文本输出配置。Responses API 使用 text.format 配置结构化输出。
{ "format": { "type": "json_object" } }OpenAI 兼容 Responses 格式的工具定义。
工具选择策略。
"auto"
上游服务支持时,是否允许并行工具调用。
true
上游服务支持时的上下文截断策略。
"auto"
响应
成功响应。stream=false 时返回 JSON,stream=true 时返回 SSE。
"resp_abc123"
"response"
Unix 秒级时间戳。
1772294400
"completed"
客户端请求的公开模型 ID。
"gpt-5.4"
上游服务提供时返回的便捷文本字段。
"Launch focus anywhere with a headset that quiets distractions and keeps calls crisp."
