天枢星通Docs
模型接口

消息接口(Anthropic 兼容)

平台数据平面 /v1/messages 的 Anthropic Messages 兼容形态——请求与响应结构、与对话补全接口的字段对照、流式与计量字段,已用 Anthropic 官方 SDK 的应用改地址即可接入

平台数据平面在兼容 OpenAI 规范之外,同时兼容 Anthropic Messages 形态。如果您的应用已经基于 Anthropic 官方 SDK 编写,无需改写任何 Messages 调用代码——只要把客户端的请求地址指向平台统一入口、把密钥换成平台下发的密钥,即可接入平台,同样获得智能查询路由聚合、安全护栏与统一计价词元计量。

本页说明 /v1/messages 端点的请求与响应结构、与对话补全接口(/v1/chat/completions)的字段对照、流式形态以及计量字段。两类接口共用同一套智能研判、择优路由与计量口径,您可按既有 SDK 习惯任选其一。

端点

POST /v1/messages

Anthropic Messages 兼容的统一查询入口。请求进入平台后,经智能研判、择优路由与安全护栏处置后转发至最合适的模型,响应在标准 Messages 结构之上,于 usage 中携带本次请求的统一计价词元用量信息。

认证方式与数据平面其余端点一致:请求头携带 API 密钥(Authorization: Bearer <密钥>),逐请求鉴权并归属到对应子账户分账。

请求

参数必填含义
model模型名,取自平台模型清单(见 模型列表
messages对话消息数组,每项含 roleuser / assistant)与 content
max_tokens最大输出词元数;Messages 形态要求显式给出
system系统提示(独立字段,区别于对话补全接口中作为一条 system 消息)
stream是否流式返回;默认 false
temperature其余标准采样参数,按所选模型透传

关于模型名。 model 字段填写平台模型清单中的中性模型名,平台据此与复杂度研判结果共同决定本次实际路由的模型。可调用清单见 模型列表 或控制台。

请求示例

curl https://<平台入口地>/v1/messages \
  -H "Authorization: Bearer <您的 API 密钥>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "<模型名>",
    "max_tokens": 1024,
    "system": "你是一名严谨的企业知识助手。",
    "messages": [
      { "role": "user", "content": "请帮我归纳这段会议纪要的三条关键决议。" }
    ],
    "stream": false
  }'

已使用 Anthropic 官方 SDK 的应用,通常只需修改客户端初始化时的两个参数即可接入:

base_url  →  https://<平台入口地址>
api_key   →  <您的平台 API 密钥>

其余 Messages 调用代码(构造 messages、读取 content、处理流式事件等)保持不变。

响应

请求成功后,平台返回标准 Anthropic Messages 兼容结构。除生成内容外,usage 字段在标准基础上扩展,携带本次请求的统一计价词元计量信息:

{
  "id": "<响应标识>",
  "type": "message",
  "role": "assistant",
  "model": "<本次实际路由的模型名>",
  "content": [
    { "type": "text", "text": "..." }
  ],
  "stop_reason": "end_turn",
  "usage": {
    "input_tokens": 0,
    "output_tokens": 0,
    "cached_input_tokens": 0,
    "price_tier": "<本次适用单价档>",
    "thinking": false
  }
}

usage 中各字段的含义:

字段含义
input_tokens本次输入的统一计价词元数
output_tokens本次输出的统一计价词元数
cached_input_tokens命中上游模型供应商缓存的输入词元数
price_tier本次适用的单价档(6 档计量口径之一)
thinking本次是否走深度推理(thinking)档

计量口径速读。 平台按「输入·缓存命中 / 输入·缓存未命中 / 输出」三类计量项,各自再分 thinking 与 no-thinking 档,合计 6 档统一计价词元口径。缓存命中档的计价更低,thinking(深度推理)档相对溢价;缓存是否命中以上游模型供应商返回为准。各档计量字段与逐条调用记录的完整说明详见 用量明细与计量说明

与对话补全接口的字段对照

/v1/messages(Anthropic 形态)与 /v1/chat/completions(OpenAI 形态)是同一推理能力的两种协议外观,背后共用同一套路由、护栏与计量。两种形态的主要字段对照如下,便于您在两者之间迁移:

维度对话补全(OpenAI 形态)消息接口(Anthropic 形态)
端点POST /v1/chat/completionsPOST /v1/messages
系统提示messages 中一条 role: "system"顶层独立字段 system
用户 / 助手消息messagesrole + contentmessagesrole + content
最大输出max_tokens(可选)max_tokens(必填)
流式开关streamstream
响应主体choices[].message.contentcontent[].text
停止原因choices[].finish_reasonstop_reason
输入计量usage.prompt_tokensusage.input_tokens
输出计量usage.completion_tokensusage.output_tokens
缓存命中输入usage.cached_input_tokensusage.cached_input_tokens
适用单价档usage.price_tierusage.price_tier
深度推理档usage.thinkingusage.thinking

两种形态的计量字段口径完全一致:无论走哪个端点,统一计价词元的计量结果、适用单价档与逐条调用记录都按同一口径生成,对账时数字同源。

一次查询在平台内部的流转

无论从 /v1/messages 还是对话补全接口进入,每一次查询都经过相同的研判、路由与护栏流程后返回:

消息查询进入 /v1/messages 智能研判 按复杂度确定模型档位 择优路由 异常时自动重试与切换 安全护栏 注入防护 脱敏 应拒答拦截 返回 Messages 结构 附统一计价词元用量

整个过程对您的应用透明:您只需以熟悉的 Messages 调用方式发起查询,平台负责研判、路由、护栏与计量。

流式查询

将请求体中的 stream 设为 true,平台以 Anthropic 兼容的事件流形态逐段返回。每个事件块同样经平台护栏逐块处置后下发,整条流在结束时汇总为一条统一计价词元计量记录:

curl https://<平台入口地>/v1/messages \
  -H "Authorization: Bearer <您的 API 密钥>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "<模型名>",
    "max_tokens": 1024,
    "messages": [
      { "role": "user", "content": "用三句话介绍一下你的能力。" }
    ],
    "stream": true
  }'

流式形态下,计量在流末汇总;本次查询整体落为一条逐条调用记录,字段口径与非流式一致。逐条记录的读法详见 用量明细与计量说明

注意事项

  • 入口地址。 Anthropic 官方 SDK 会在客户端 base_url 之后自动拼接 /v1/messages,请确保最终请求落在 <平台入口地址>/v1/messages 上。
  • max_tokens 必填。 Messages 形态要求显式给出 max_tokens,接入平台后该约束不变。
  • 模型名用平台模型名。 请以平台模型清单中的中性模型名为准(见 模型列表),不要填写某家来源的私有模型名。
  • 密钥状态。 请求返回 401 多为密钥缺失或格式不正确;返回 403 / 404 多为该密钥未授权调用所请求的模型。详见 快速接入指南 · 常见接入问题
  • 额度联动。 全部子账户共用一层汇总信用额度,达额时全部密钥一并暂停,请求返回 429。额度说明详见 额度管理

相关链接

章节内容
模型列表获取当前密钥可调用的模型清单
统一计价词元计数发起查询前对给定文本预先计数、用于对账复算
快速接入指南从拿到密钥到发出第一个查询的最短上手路径
用量明细与计量说明统一计价词元 6 档计量口径与逐条调用记录字段

本页中的统一入口地址、模型名均以您控制台「账户设置 · 接入参数」中的实际信息为准;具体单价、信用额度等商务数值不在文档中固化,以服务协议与控制台实时口径为准

On this page