统一计价词元计数

数据平面 POST /v1/token-count 的用法——对给定文本按统一计价词元口径确定性计数，用于发起查询前的费用预判与事后对逐条调用记录的复算核对

统一计价词元计数接口让您在正式发起查询前，对给定的文本或消息按平台统一计价词元口径预先计数。它是一项确定性计数能力：对相同输入返回相同结果，因此既可用于发起查询前的容量预估与费用预判，也可用于事后将逐条调用记录中的词元数与本接口复算核对，确保计量可验证。

本页说明该接口的请求与响应结构、确定性承诺，以及如何用它对账复算。计量口径的完整说明详见用量明细与计量说明 · 可核验计数，两处口径同源。

端点

POST /v1/token-count

对给定文本 / 消息按平台统一计价词元口径计数，返回各计量项的词元数、适用单价档与当期计量口径版本号。本接口不发起推理、不消耗生成，仅做计数。

认证方式与数据平面其余端点一致：请求头携带 API 密钥（Authorization: Bearer <密钥>）。

请求

参数	必填	含义
`model`	是	模型名（不同模型的计数口径可能不同），取自模型列表
`messages`	是	待计数的消息数组（`role` + `content`）；亦可用 `text` 传入纯文本
`thinking`	否	是否按深度推理（thinking）档计数，影响适用单价档判定；默认 `false`

请求示例

curl https://<平台入口地址>/v1/token-count \
  -H "Authorization: Bearer <您的 API 密钥>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "<模型名>",
    "messages": [
      { "role": "user", "content": "请帮我归纳这段会议纪要的要点" }
    ],
    "thinking": false
  }'

响应

返回按统一计价词元口径计得的输入词元数、输出词元数预估、缓存与推理档标识、适用单价档，并附当期计量口径版本号：

{
  "input_tokens": 0,
  "output_tokens_estimate": 0,
  "cache_hit": false,
  "thinking": false,
  "price_tier": "<本次适用单价档（6 档之一）>",
  "metering_version": "<当期计量口径版本号>"
}

字段	含义
`input_tokens`	按统一计价词元口径计得的输入词元数（确定性，可对相同文本复算核对）
`output_tokens_estimate`	输出词元数预估（实际以查询返回的逐条记录为准）
`cache_hit`	是否命中上游缓存（布尔）
`thinking`	是否按深度推理档计数（布尔）
`price_tier`	适用单价档，对应统一计价词元 6 档之一
`metering_version`	当期计量口径版本号，与用量明细 / 结算单口径一致

缓存命中口径。 此处 cache_hit 指上游模型供应商提示缓存命中——以上游模型返回为准、据实透传，命中时落更低的输入计价档，并不跳过上游调用；它不是平台本地缓存。该口径与用量明细与计量说明中一致。

确定性承诺

本接口对相同输入给出确定的输入词元数。这意味着：

同一段文本、同一模型、同一计量口径版本下，多次调用本接口返回的 input_tokens 始终一致；
逐条调用记录中的 input_tokens 可经本接口对相应文本复算核对，两者在同一计量口径版本下一致；
output_tokens_estimate 为预估，最终输出计量以实际查询返回的逐条记录为准——输出取决于生成内容，无法在调用前确定。

为什么计数能确定。 输入词元数由文本内容与计量口径决定，与是否真正发起推理无关；只要计量口径版本不变，相同文本必得相同结果。这是计数可用于对账复算的前提。

用于对账复算

您可以把本接口作为对账工具，与逐条调用记录、月度结算单逐项核对：

发起查询前预判。 对待发送的提示词或对话调用本接口，得到 input_tokens 与适用单价档，预估本次输入侧的统一计价词元规模与费用量级。
事后复算核对。 对某条历史调用记录中的输入文本，调用本接口复算 input_tokens，与逐条记录中的 input_tokens 比对——在同一计量口径版本下应当一致。
口径版本对齐。 比对时确认两侧的 metering_version 一致；若用量明细页页脚或结算单标注的版本号与计数响应不同，请以同一版本口径重新核对。

同源约束。 逐条调用记录中的输入 / 输出词元数、用量明细页的合计、月度结算单的应付金额三处口径同源、数字同源。本接口是您自行核对这条同源链的工具：对相同输入复算得到相同的输入词元数，即可验证计量未失真。同源关系的完整说明详见用量明细与计量说明 · 逐条调用记录。

计量口径版本

本接口的响应随返回当期 metering_version（如 计费口径 v2026.06），便于您将自行核算与平台口径对齐到同一版本：

计量与计价规则按版本化管理，每一期对应一个计量口径版本号；
口径版本若调整，将按服务协议约定的方式通知；调整前已产生的用量按当时生效版本计量，不追溯重算；
复算核对时，请确保计数响应的版本号与待核对记录所属期的版本号一致。

注意事项

不消耗生成。 本接口只计数、不发起推理，不产生生成内容、不计入信用额度。
模型口径差异。 不同模型的计数口径可能不同，复算时请使用与原查询一致的 model。
thinking 影响档位。 thinking 取值会影响 price_tier 的判定（thinking 档为单价溢价档），复算时请与原查询的推理档一致。
输出仅为预估。 output_tokens_estimate 不构成承诺，最终输出计量以查询返回的逐条记录为准。

章节	内容
用量明细与计量说明	统一计价词元 6 档计量口径、逐条调用记录字段与可核验计数的完整说明
消息接口（Anthropic 兼容）	以 Anthropic Messages 形态发起查询
模型列表	获取当前密钥可调用的模型清单
账单与结算	月度服务费用结算单读法、含税口径与确认流程

统一计价词元计数

端点

请求

响应

确定性承诺

用于对账复算

计量口径版本

注意事项

相关链接

On this page