天枢星通Docs
模型接口

统一计价词元计数

数据平面 POST /v1/token-count 的用法——对给定文本按统一计价词元口径确定性计数,用于发起查询前的费用预判与事后对逐条调用记录的复算核对

统一计价词元计数接口让您在正式发起查询前,对给定的文本或消息按平台统一计价词元口径预先计数。它是一项确定性计数能力:对相同输入返回相同结果,因此既可用于发起查询前的容量预估与费用预判,也可用于事后将逐条调用记录中的词元数与本接口复算核对,确保计量可验证。

本页说明该接口的请求与响应结构、确定性承诺,以及如何用它对账复算。计量口径的完整说明详见 用量明细与计量说明 · 可核验计数,两处口径同源。

端点

POST /v1/token-count

对给定文本 / 消息按平台统一计价词元口径计数,返回各计量项的词元数、适用单价档与当期计量口径版本号。本接口不发起推理、不消耗生成,仅做计数。

认证方式与数据平面其余端点一致:请求头携带 API 密钥(Authorization: Bearer <密钥>)。

请求

参数必填含义
model模型名(不同模型的计数口径可能不同),取自 模型列表
messages待计数的消息数组(role + content);亦可用 text 传入纯文本
thinking是否按深度推理(thinking)档计数,影响适用单价档判定;默认 false

请求示例

curl https://<平台入口地>/v1/token-count \
  -H "Authorization: Bearer <您的 API 密钥>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "<模型名>",
    "messages": [
      { "role": "user", "content": "请帮我归纳这段会议纪要的要点" }
    ],
    "thinking": false
  }'

响应

返回按统一计价词元口径计得的输入词元数、输出词元数预估、缓存与推理档标识、适用单价档,并附当期计量口径版本号:

{
  "input_tokens": 0,
  "output_tokens_estimate": 0,
  "cache_hit": false,
  "thinking": false,
  "price_tier": "<本次适用单价档(6 档之一)>",
  "metering_version": "<当期计量口径版本号>"
}
字段含义
input_tokens按统一计价词元口径计得的输入词元数(确定性,可对相同文本复算核对)
output_tokens_estimate输出词元数预估(实际以查询返回的逐条记录为准)
cache_hit是否命中上游缓存(布尔)
thinking是否按深度推理档计数(布尔)
price_tier适用单价档,对应统一计价词元 6 档之一
metering_version当期计量口径版本号,与用量明细 / 结算单口径一致

缓存命中口径。 此处 cache_hit上游模型供应商提示缓存命中——以上游模型返回为准、据实透传,命中时落更低的输入计价档,并不跳过上游调用;它不是平台本地缓存。该口径与 用量明细与计量说明 中一致。

确定性承诺

本接口对相同输入给出确定的输入词元数。这意味着:

  • 同一段文本、同一模型、同一计量口径版本下,多次调用本接口返回的 input_tokens 始终一致;
  • 逐条调用记录中的 input_tokens 可经本接口对相应文本复算核对,两者在同一计量口径版本下一致;
  • output_tokens_estimate预估,最终输出计量以实际查询返回的逐条记录为准——输出取决于生成内容,无法在调用前确定。

为什么计数能确定。 输入词元数由文本内容与计量口径决定,与是否真正发起推理无关;只要计量口径版本不变,相同文本必得相同结果。这是计数可用于对账复算的前提。

用于对账复算

您可以把本接口作为对账工具,与逐条调用记录、月度结算单逐项核对:

  1. 发起查询前预判。 对待发送的提示词或对话调用本接口,得到 input_tokens 与适用单价档,预估本次输入侧的统一计价词元规模与费用量级。
  2. 事后复算核对。 对某条历史调用记录中的输入文本,调用本接口复算 input_tokens,与逐条记录中的 input_tokens 比对——在同一计量口径版本下应当一致。
  3. 口径版本对齐。 比对时确认两侧的 metering_version 一致;若用量明细页页脚或结算单标注的版本号与计数响应不同,请以同一版本口径重新核对。

同源约束。 逐条调用记录中的输入 / 输出词元数、用量明细页的合计、月度结算单的应付金额三处口径同源、数字同源。本接口是您自行核对这条同源链的工具:对相同输入复算得到相同的输入词元数,即可验证计量未失真。同源关系的完整说明详见 用量明细与计量说明 · 逐条调用记录

计量口径版本

本接口的响应随返回当期 metering_version(如 计费口径 v2026.06),便于您将自行核算与平台口径对齐到同一版本:

  • 计量与计价规则按版本化管理,每一期对应一个计量口径版本号;
  • 口径版本若调整,将按服务协议约定的方式通知;调整前已产生的用量按当时生效版本计量,不追溯重算;
  • 复算核对时,请确保计数响应的版本号与待核对记录所属期的版本号一致。

注意事项

  • 不消耗生成。 本接口只计数、不发起推理,不产生生成内容、不计入信用额度。
  • 模型口径差异。 不同模型的计数口径可能不同,复算时请使用与原查询一致的 model
  • thinking 影响档位。 thinking 取值会影响 price_tier 的判定(thinking 档为单价溢价档),复算时请与原查询的推理档一致。
  • 输出仅为预估。 output_tokens_estimate 不构成承诺,最终输出计量以查询返回的逐条记录为准。

相关链接

章节内容
用量明细与计量说明统一计价词元 6 档计量口径、逐条调用记录字段与可核验计数的完整说明
消息接口(Anthropic 兼容)以 Anthropic Messages 形态发起查询
模型列表获取当前密钥可调用的模型清单
账单与结算月度服务费用结算单读法、含税口径与确认流程

本页中的模型名以您控制台「账户设置 · 接入参数」中的实际信息为准;具体单价、信用额度等商务数值不在文档中固化,以服务协议与控制台实时口径为准

On this page