消息接口（Anthropic 兼容）

平台数据平面 /v1/messages 的 Anthropic Messages 兼容形态——请求与响应结构、与对话补全接口的字段对照、流式与计量字段，已用 Anthropic 官方 SDK 的应用改地址即可接入

平台数据平面在兼容 OpenAI 规范之外，同时兼容 Anthropic Messages 形态。如果您的应用已经基于 Anthropic 官方 SDK 编写，无需改写任何 Messages 调用代码——只要把客户端的请求地址指向平台统一入口、把密钥换成平台下发的密钥，即可接入平台，同样获得智能查询路由聚合、安全护栏与统一计价词元计量。

本页说明 /v1/messages 端点的请求与响应结构、与对话补全接口（/v1/chat/completions）的字段对照、流式形态以及计量字段。两类接口共用同一套智能研判、择优路由与计量口径，您可按既有 SDK 习惯任选其一。

端点

POST /v1/messages

Anthropic Messages 兼容的统一查询入口。请求进入平台后，经智能研判、择优路由与安全护栏处置后转发至最合适的模型，响应在标准 Messages 结构之上，于 usage 中携带本次请求的统一计价词元用量信息。

认证方式与数据平面其余端点一致：请求头携带 API 密钥（Authorization: Bearer <密钥>），逐请求鉴权并归属到对应子账户分账。

请求

参数	必填	含义
`model`	是	模型名，取自平台模型清单（见模型列表）
`messages`	是	对话消息数组，每项含 `role`（`user` / `assistant`）与 `content`
`max_tokens`	是	最大输出词元数；Messages 形态要求显式给出
`system`	否	系统提示（独立字段，区别于对话补全接口中作为一条 `system` 消息）
`stream`	否	是否流式返回；默认 `false`
`temperature` 等	否	其余标准采样参数，按所选模型透传

关于模型名。 model 字段填写平台模型清单中的中性模型名，平台据此与复杂度研判结果共同决定本次实际路由的模型。可调用清单见模型列表或控制台。

请求示例

curl https://<平台入口地址>/v1/messages \
  -H "Authorization: Bearer <您的 API 密钥>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "<模型名>",
    "max_tokens": 1024,
    "system": "你是一名严谨的企业知识助手。",
    "messages": [
      { "role": "user", "content": "请帮我归纳这段会议纪要的三条关键决议。" }
    ],
    "stream": false
  }'

已使用 Anthropic 官方 SDK 的应用，通常只需修改客户端初始化时的两个参数即可接入：

base_url  →  https://<平台入口地址>
api_key   →  <您的平台 API 密钥>

其余 Messages 调用代码（构造 messages、读取 content、处理流式事件等）保持不变。

响应

请求成功后，平台返回标准 Anthropic Messages 兼容结构。除生成内容外，usage 字段在标准基础上扩展，携带本次请求的统一计价词元计量信息：

{
  "id": "<响应标识>",
  "type": "message",
  "role": "assistant",
  "model": "<本次实际路由的模型名>",
  "content": [
    { "type": "text", "text": "..." }
  ],
  "stop_reason": "end_turn",
  "usage": {
    "input_tokens": 0,
    "output_tokens": 0,
    "cached_input_tokens": 0,
    "price_tier": "<本次适用单价档>",
    "thinking": false
  }
}

usage 中各字段的含义：

字段	含义
`input_tokens`	本次输入的统一计价词元数
`output_tokens`	本次输出的统一计价词元数
`cached_input_tokens`	命中上游模型供应商缓存的输入词元数
`price_tier`	本次适用的单价档（6 档计量口径之一）
`thinking`	本次是否走深度推理（thinking）档

计量口径速读。 平台按「输入·缓存命中 / 输入·缓存未命中 / 输出」三类计量项，各自再分 thinking 与 no-thinking 档，合计 6 档统一计价词元口径。缓存命中档的计价更低，thinking（深度推理）档相对溢价；缓存是否命中以上游模型供应商返回为准。各档计量字段与逐条调用记录的完整说明详见用量明细与计量说明。

与对话补全接口的字段对照

/v1/messages（Anthropic 形态）与 /v1/chat/completions（OpenAI 形态）是同一推理能力的两种协议外观，背后共用同一套路由、护栏与计量。两种形态的主要字段对照如下，便于您在两者之间迁移：

维度	对话补全（OpenAI 形态）	消息接口（Anthropic 形态）
端点	`POST /v1/chat/completions`	`POST /v1/messages`
系统提示	`messages` 中一条 `role: "system"`	顶层独立字段 `system`
用户 / 助手消息	`messages`（`role` + `content`）	`messages`（`role` + `content`）
最大输出	`max_tokens`（可选）	`max_tokens`（必填）
流式开关	`stream`	`stream`
响应主体	`choices[].message.content`	`content[].text`
停止原因	`choices[].finish_reason`	`stop_reason`
输入计量	`usage.prompt_tokens`	`usage.input_tokens`
输出计量	`usage.completion_tokens`	`usage.output_tokens`
缓存命中输入	`usage.cached_input_tokens`	`usage.cached_input_tokens`
适用单价档	`usage.price_tier`	`usage.price_tier`
深度推理档	`usage.thinking`	`usage.thinking`

两种形态的计量字段口径完全一致：无论走哪个端点，统一计价词元的计量结果、适用单价档与逐条调用记录都按同一口径生成，对账时数字同源。

一次查询在平台内部的流转

无论从 /v1/messages 还是对话补全接口进入，每一次查询都经过相同的研判、路由与护栏流程后返回：

整个过程对您的应用透明：您只需以熟悉的 Messages 调用方式发起查询，平台负责研判、路由、护栏与计量。

流式查询

将请求体中的 stream 设为 true，平台以 Anthropic 兼容的事件流形态逐段返回。每个事件块同样经平台护栏逐块处置后下发，整条流在结束时汇总为一条统一计价词元计量记录：

curl https://<平台入口地址>/v1/messages \
  -H "Authorization: Bearer <您的 API 密钥>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "<模型名>",
    "max_tokens": 1024,
    "messages": [
      { "role": "user", "content": "用三句话介绍一下你的能力。" }
    ],
    "stream": true
  }'

流式形态下，计量在流末汇总；本次查询整体落为一条逐条调用记录，字段口径与非流式一致。逐条记录的读法详见用量明细与计量说明。

注意事项

入口地址。 Anthropic 官方 SDK 会在客户端 base_url 之后自动拼接 /v1/messages，请确保最终请求落在 <平台入口地址>/v1/messages 上。
max_tokens 必填。 Messages 形态要求显式给出 max_tokens，接入平台后该约束不变。
模型名用平台模型名。 请以平台模型清单中的中性模型名为准（见模型列表），不要填写某家来源的私有模型名。
密钥状态。 请求返回 401 多为密钥缺失或格式不正确；返回 403 / 404 多为该密钥未授权调用所请求的模型。详见快速接入指南 · 常见接入问题。
额度联动。 全部子账户共用一层汇总信用额度，达额时全部密钥一并暂停，请求返回 429。额度说明详见额度管理。

章节	内容
模型列表	获取当前密钥可调用的模型清单
统一计价词元计数	发起查询前对给定文本预先计数、用于对账复算
快速接入指南	从拿到密钥到发出第一个查询的最短上手路径
用量明细与计量说明	统一计价词元 6 档计量口径与逐条调用记录字段

消息接口（Anthropic 兼容）

端点

请求

响应

与对话补全接口的字段对照

一次查询在平台内部的流转

流式查询

注意事项

相关链接

On this page