消息接口(Anthropic 兼容)
平台数据平面 /v1/messages 的 Anthropic Messages 兼容形态——请求与响应结构、与对话补全接口的字段对照、流式与计量字段,已用 Anthropic 官方 SDK 的应用改地址即可接入
平台数据平面在兼容 OpenAI 规范之外,同时兼容 Anthropic Messages 形态。如果您的应用已经基于 Anthropic 官方 SDK 编写,无需改写任何 Messages 调用代码——只要把客户端的请求地址指向平台统一入口、把密钥换成平台下发的密钥,即可接入平台,同样获得智能查询路由聚合、安全护栏与统一计价词元计量。
本页说明 /v1/messages 端点的请求与响应结构、与对话补全接口(/v1/chat/completions)的字段对照、流式形态以及计量字段。两类接口共用同一套智能研判、择优路由与计量口径,您可按既有 SDK 习惯任选其一。
端点
POST /v1/messagesAnthropic Messages 兼容的统一查询入口。请求进入平台后,经智能研判、择优路由与安全护栏处置后转发至最合适的模型,响应在标准 Messages 结构之上,于 usage 中携带本次请求的统一计价词元用量信息。
认证方式与数据平面其余端点一致:请求头携带 API 密钥(Authorization: Bearer <密钥>),逐请求鉴权并归属到对应子账户分账。
请求
| 参数 | 必填 | 含义 |
|---|---|---|
model | 是 | 模型名,取自平台模型清单(见 模型列表) |
messages | 是 | 对话消息数组,每项含 role(user / assistant)与 content |
max_tokens | 是 | 最大输出词元数;Messages 形态要求显式给出 |
system | 否 | 系统提示(独立字段,区别于对话补全接口中作为一条 system 消息) |
stream | 否 | 是否流式返回;默认 false |
temperature 等 | 否 | 其余标准采样参数,按所选模型透传 |
关于模型名。
model字段填写平台模型清单中的中性模型名,平台据此与复杂度研判结果共同决定本次实际路由的模型。可调用清单见 模型列表 或控制台。
请求示例
curl https://<平台入口地址>/v1/messages \
-H "Authorization: Bearer <您的 API 密钥>" \
-H "Content-Type: application/json" \
-d '{
"model": "<模型名>",
"max_tokens": 1024,
"system": "你是一名严谨的企业知识助手。",
"messages": [
{ "role": "user", "content": "请帮我归纳这段会议纪要的三条关键决议。" }
],
"stream": false
}'已使用 Anthropic 官方 SDK 的应用,通常只需修改客户端初始化时的两个参数即可接入:
base_url → https://<平台入口地址>
api_key → <您的平台 API 密钥>其余 Messages 调用代码(构造 messages、读取 content、处理流式事件等)保持不变。
响应
请求成功后,平台返回标准 Anthropic Messages 兼容结构。除生成内容外,usage 字段在标准基础上扩展,携带本次请求的统一计价词元计量信息:
{
"id": "<响应标识>",
"type": "message",
"role": "assistant",
"model": "<本次实际路由的模型名>",
"content": [
{ "type": "text", "text": "..." }
],
"stop_reason": "end_turn",
"usage": {
"input_tokens": 0,
"output_tokens": 0,
"cached_input_tokens": 0,
"price_tier": "<本次适用单价档>",
"thinking": false
}
}usage 中各字段的含义:
| 字段 | 含义 |
|---|---|
input_tokens | 本次输入的统一计价词元数 |
output_tokens | 本次输出的统一计价词元数 |
cached_input_tokens | 命中上游模型供应商缓存的输入词元数 |
price_tier | 本次适用的单价档(6 档计量口径之一) |
thinking | 本次是否走深度推理(thinking)档 |
计量口径速读。 平台按「输入·缓存命中 / 输入·缓存未命中 / 输出」三类计量项,各自再分 thinking 与 no-thinking 档,合计 6 档统一计价词元口径。缓存命中档的计价更低,thinking(深度推理)档相对溢价;缓存是否命中以上游模型供应商返回为准。各档计量字段与逐条调用记录的完整说明详见 用量明细与计量说明。
与对话补全接口的字段对照
/v1/messages(Anthropic 形态)与 /v1/chat/completions(OpenAI 形态)是同一推理能力的两种协议外观,背后共用同一套路由、护栏与计量。两种形态的主要字段对照如下,便于您在两者之间迁移:
| 维度 | 对话补全(OpenAI 形态) | 消息接口(Anthropic 形态) |
|---|---|---|
| 端点 | POST /v1/chat/completions | POST /v1/messages |
| 系统提示 | messages 中一条 role: "system" | 顶层独立字段 system |
| 用户 / 助手消息 | messages(role + content) | messages(role + content) |
| 最大输出 | max_tokens(可选) | max_tokens(必填) |
| 流式开关 | stream | stream |
| 响应主体 | choices[].message.content | content[].text |
| 停止原因 | choices[].finish_reason | stop_reason |
| 输入计量 | usage.prompt_tokens | usage.input_tokens |
| 输出计量 | usage.completion_tokens | usage.output_tokens |
| 缓存命中输入 | usage.cached_input_tokens | usage.cached_input_tokens |
| 适用单价档 | usage.price_tier | usage.price_tier |
| 深度推理档 | usage.thinking | usage.thinking |
两种形态的计量字段口径完全一致:无论走哪个端点,统一计价词元的计量结果、适用单价档与逐条调用记录都按同一口径生成,对账时数字同源。
一次查询在平台内部的流转
无论从 /v1/messages 还是对话补全接口进入,每一次查询都经过相同的研判、路由与护栏流程后返回:
整个过程对您的应用透明:您只需以熟悉的 Messages 调用方式发起查询,平台负责研判、路由、护栏与计量。
流式查询
将请求体中的 stream 设为 true,平台以 Anthropic 兼容的事件流形态逐段返回。每个事件块同样经平台护栏逐块处置后下发,整条流在结束时汇总为一条统一计价词元计量记录:
curl https://<平台入口地址>/v1/messages \
-H "Authorization: Bearer <您的 API 密钥>" \
-H "Content-Type: application/json" \
-d '{
"model": "<模型名>",
"max_tokens": 1024,
"messages": [
{ "role": "user", "content": "用三句话介绍一下你的能力。" }
],
"stream": true
}'流式形态下,计量在流末汇总;本次查询整体落为一条逐条调用记录,字段口径与非流式一致。逐条记录的读法详见 用量明细与计量说明。
注意事项
- 入口地址。 Anthropic 官方 SDK 会在客户端
base_url之后自动拼接/v1/messages,请确保最终请求落在<平台入口地址>/v1/messages上。 max_tokens必填。 Messages 形态要求显式给出max_tokens,接入平台后该约束不变。- 模型名用平台模型名。 请以平台模型清单中的中性模型名为准(见 模型列表),不要填写某家来源的私有模型名。
- 密钥状态。 请求返回 401 多为密钥缺失或格式不正确;返回 403 / 404 多为该密钥未授权调用所请求的模型。详见 快速接入指南 · 常见接入问题。
- 额度联动。 全部子账户共用一层汇总信用额度,达额时全部密钥一并暂停,请求返回 429。额度说明详见 额度管理。
相关链接
| 章节 | 内容 |
|---|---|
| 模型列表 | 获取当前密钥可调用的模型清单 |
| 统一计价词元计数 | 发起查询前对给定文本预先计数、用于对账复算 |
| 快速接入指南 | 从拿到密钥到发出第一个查询的最短上手路径 |
| 用量明细与计量说明 | 统一计价词元 6 档计量口径与逐条调用记录字段 |
本页中的统一入口地址、模型名均以您控制台「账户设置 · 接入参数」中的实际信息为准;具体单价、信用额度等商务数值不在文档中固化,以服务协议与控制台实时口径为准。