统一计价词元计数
数据平面 POST /v1/token-count 的用法——对给定文本按统一计价词元口径确定性计数,用于发起查询前的费用预判与事后对逐条调用记录的复算核对
统一计价词元计数接口让您在正式发起查询前,对给定的文本或消息按平台统一计价词元口径预先计数。它是一项确定性计数能力:对相同输入返回相同结果,因此既可用于发起查询前的容量预估与费用预判,也可用于事后将逐条调用记录中的词元数与本接口复算核对,确保计量可验证。
本页说明该接口的请求与响应结构、确定性承诺,以及如何用它对账复算。计量口径的完整说明详见 用量明细与计量说明 · 可核验计数,两处口径同源。
端点
POST /v1/token-count对给定文本 / 消息按平台统一计价词元口径计数,返回各计量项的词元数、适用单价档与当期计量口径版本号。本接口不发起推理、不消耗生成,仅做计数。
认证方式与数据平面其余端点一致:请求头携带 API 密钥(Authorization: Bearer <密钥>)。
请求
| 参数 | 必填 | 含义 |
|---|---|---|
model | 是 | 模型名(不同模型的计数口径可能不同),取自 模型列表 |
messages | 是 | 待计数的消息数组(role + content);亦可用 text 传入纯文本 |
thinking | 否 | 是否按深度推理(thinking)档计数,影响适用单价档判定;默认 false |
请求示例
curl https://<平台入口地址>/v1/token-count \
-H "Authorization: Bearer <您的 API 密钥>" \
-H "Content-Type: application/json" \
-d '{
"model": "<模型名>",
"messages": [
{ "role": "user", "content": "请帮我归纳这段会议纪要的要点" }
],
"thinking": false
}'响应
返回按统一计价词元口径计得的输入词元数、输出词元数预估、缓存与推理档标识、适用单价档,并附当期计量口径版本号:
{
"input_tokens": 0,
"output_tokens_estimate": 0,
"cache_hit": false,
"thinking": false,
"price_tier": "<本次适用单价档(6 档之一)>",
"metering_version": "<当期计量口径版本号>"
}| 字段 | 含义 |
|---|---|
input_tokens | 按统一计价词元口径计得的输入词元数(确定性,可对相同文本复算核对) |
output_tokens_estimate | 输出词元数预估(实际以查询返回的逐条记录为准) |
cache_hit | 是否命中上游缓存(布尔) |
thinking | 是否按深度推理档计数(布尔) |
price_tier | 适用单价档,对应统一计价词元 6 档之一 |
metering_version | 当期计量口径版本号,与用量明细 / 结算单口径一致 |
缓存命中口径。 此处
cache_hit指上游模型供应商提示缓存命中——以上游模型返回为准、据实透传,命中时落更低的输入计价档,并不跳过上游调用;它不是平台本地缓存。该口径与 用量明细与计量说明 中一致。
确定性承诺
本接口对相同输入给出确定的输入词元数。这意味着:
- 同一段文本、同一模型、同一计量口径版本下,多次调用本接口返回的
input_tokens始终一致; - 逐条调用记录中的
input_tokens可经本接口对相应文本复算核对,两者在同一计量口径版本下一致; output_tokens_estimate为预估,最终输出计量以实际查询返回的逐条记录为准——输出取决于生成内容,无法在调用前确定。
为什么计数能确定。 输入词元数由文本内容与计量口径决定,与是否真正发起推理无关;只要计量口径版本不变,相同文本必得相同结果。这是计数可用于对账复算的前提。
用于对账复算
您可以把本接口作为对账工具,与逐条调用记录、月度结算单逐项核对:
- 发起查询前预判。 对待发送的提示词或对话调用本接口,得到
input_tokens与适用单价档,预估本次输入侧的统一计价词元规模与费用量级。 - 事后复算核对。 对某条历史调用记录中的输入文本,调用本接口复算
input_tokens,与逐条记录中的input_tokens比对——在同一计量口径版本下应当一致。 - 口径版本对齐。 比对时确认两侧的
metering_version一致;若用量明细页页脚或结算单标注的版本号与计数响应不同,请以同一版本口径重新核对。
同源约束。 逐条调用记录中的输入 / 输出词元数、用量明细页的合计、月度结算单的应付金额三处口径同源、数字同源。本接口是您自行核对这条同源链的工具:对相同输入复算得到相同的输入词元数,即可验证计量未失真。同源关系的完整说明详见 用量明细与计量说明 · 逐条调用记录。
计量口径版本
本接口的响应随返回当期 metering_version(如 计费口径 v2026.06),便于您将自行核算与平台口径对齐到同一版本:
- 计量与计价规则按版本化管理,每一期对应一个计量口径版本号;
- 口径版本若调整,将按服务协议约定的方式通知;调整前已产生的用量按当时生效版本计量,不追溯重算;
- 复算核对时,请确保计数响应的版本号与待核对记录所属期的版本号一致。
注意事项
- 不消耗生成。 本接口只计数、不发起推理,不产生生成内容、不计入信用额度。
- 模型口径差异。 不同模型的计数口径可能不同,复算时请使用与原查询一致的
model。 thinking影响档位。thinking取值会影响price_tier的判定(thinking 档为单价溢价档),复算时请与原查询的推理档一致。- 输出仅为预估。
output_tokens_estimate不构成承诺,最终输出计量以查询返回的逐条记录为准。
相关链接
| 章节 | 内容 |
|---|---|
| 用量明细与计量说明 | 统一计价词元 6 档计量口径、逐条调用记录字段与可核验计数的完整说明 |
| 消息接口(Anthropic 兼容) | 以 Anthropic Messages 形态发起查询 |
| 模型列表 | 获取当前密钥可调用的模型清单 |
| 账单与结算 | 月度服务费用结算单读法、含税口径与确认流程 |
本页中的模型名以您控制台「账户设置 · 接入参数」中的实际信息为准;具体单价、信用额度等商务数值不在文档中固化,以服务协议与控制台实时口径为准。