用量明细与计量说明
统一计价词元 6 档计量口径的读法、逐条调用记录字段含义、计量口径版本说明,以及如何用计数接口自行核对用量
本页说明平台如何以统一计价词元为单位计量您的每一次查询:6 档计量结构如何读、逐条调用记录每个字段的含义、计量口径如何版本化,以及如何用计数接口在调用前自行核对用量。
具体单价、信用额度等商务数值不在本文档中固化,以服务协议价格表与控制台实时口径为准;本页只讲计量结构与读法。
1. 统一计价词元
平台对外以统一计价词元为统一计量单位。您每一次查询消耗的输入与输出,均按统一计价词元口径计量,并据此计费与计入信用额度。
- 用量在控制台与结算单中以统一计价词元为单位呈现;大额时可按"百万词元"聚合显示,但底层计量始终为词元原值。
- 单价矩阵以"元 / 百万词元(含税)"为单位,各档单价以服务协议价格表为准。
- 同一笔用量在请求响应、用量明细、月度结算单三处口径一致、数字同源——您在任一处看到的数字,逐项比对时都对得上。
2. 6 档计量结构
平台按两个维度切分计量项:计量方向(输入 / 输出)与档位修饰(是否命中上游缓存、是否深度推理)。组合后共 6 档:
| 档位 | 计量方向 | 缓存 | 推理档 | 相对计价 |
|---|---|---|---|---|
| 档 1 | 输入 | 缓存命中 | no-thinking | 命中档,计价更低 |
| 档 2 | 输入 | 缓存命中 | thinking | 命中档,thinking 溢价 |
| 档 3 | 输入 | 缓存未命中 | no-thinking | 标准输入档 |
| 档 4 | 输入 | 缓存未命中 | thinking | 标准输入档,thinking 溢价 |
| 档 5 | 输出 | —(不区分缓存) | no-thinking | 标准输出档 |
| 档 6 | 输出 | —(不区分缓存) | thinking | 标准输出档,thinking 溢价 |
几条结构性规则,决定您在用量明细里看到的分档:
- 输入分缓存命中 / 未命中。 命中上游模型供应商缓存的输入词元,按更低的命中档计价;是否命中以上游模型返回为准,平台据实透传标注,不由本地预设。
- 输出不区分缓存档。 输出词元只按推理档分 thinking / no-thinking 两档,不存在"输出缓存命中"档——故 6 档 = 输入 4 档 + 输出 2 档。
- thinking 为档位溢价。 深度推理(thinking)档相对常规档为单价溢价;平台不另行计量对您不可见的推理过程词元,溢价仅体现为单价档位的差异。
缓存命中口径。 此处缓存特指上游模型供应商缓存命中,并非平台本地缓存。一次查询是否命中,以上游模型返回结果为准,逐条记录中以
cache_hit标识真实命中态。
3. 逐条调用记录
每一次查询都会落为一条独立的调用记录。您可在控制台"用量明细"页按时间、密钥、模型、推理档、缓存命中、护栏处置结果等维度筛选查询,也可通过控制平面接口程序化拉取。
3.1 查询逐条记录
curl "https://<平台入口地址>/api/v1/usage/records?start=2026-06-01&end=2026-06-30&page=1&page_size=20" \
-H "Authorization: Bearer <您的控制台凭证>"响应为"顶部汇总 + 分页 + 逐条数组"结构:顶部 summary 给出当前筛选范围内的合计,items 为逐条记录。
{
"total": 0,
"page": 1,
"page_size": 20,
"summary": {
"total_input_tokens": 0,
"total_output_tokens": 0,
"total_amount": 0
},
"items": [
{
"call_id": "<调用唯一标识>",
"api_key_id": "<所属密钥子账户>",
"timestamp": "2026-06-15 10:24:31",
"call_hash": "<调用信息哈希(脱敏,不含原文)>",
"routed_model": "<本次实际路由的模型名>",
"complexity": "<复杂度研判结果(简单 / 复杂)>",
"cache_hit": false,
"thinking": false,
"input_tokens": 0,
"output_tokens": 0,
"price_tier": "<本次适用单价档(6 档之一)>",
"charge_amount": 0,
"guardrail_result": "<本次护栏处置结果(通过 / 拦截 / 脱敏 / 误拒)>"
}
]
}3.2 逐条字段含义
| 字段 | 含义 |
|---|---|
call_id | 调用唯一标识,可据此查询单条详情 |
api_key_id | 本次调用所属的密钥子账户,用量按此自动归属、独立分账 |
timestamp | 调用时间,格式 YYYY-MM-DD HH:mm:ss |
call_hash | 调用信息哈希,用于追溯与去重;为脱敏值,不含请求原文 |
routed_model | 本次智能查询路由聚合实际择优转发到的模型名 |
complexity | 平台对本次查询的复杂度研判结果,决定择优路由的目标档位 |
cache_hit | 是否命中上游缓存(布尔),命中按更低的命中档计价 |
thinking | 是否深度推理档(布尔),thinking 档为单价溢价 |
input_tokens | 本次输入统一计价词元数 |
output_tokens | 本次输出统一计价词元数 |
price_tier | 本次适用单价档,对应第 2 节 6 档之一 |
charge_amount | 本次折算金额(含税),= 各档词元数 × 对应单价 |
guardrail_result | 本次请求的护栏处置结果(通过 / 拦截 / 脱敏 / 误拒),可据此筛选复核该次安全护栏处置;逐类定义见 安全防护 与 护栏处置类别参考 |
3.3 查询单条详情
curl "https://<平台入口地址>/api/v1/usage/records/<call_id>" \
-H "Authorization: Bearer <您的控制台凭证>"单条详情返回该次调用的完整字段,包含各档词元数、适用单价档与该次金额,便于您逐条核对计费。
同源约束。 逐条记录之和 = 按密钥分项小计之和 = 当期合计;用量明细页的合计、概览展板的当月用量、月度结算单的应付金额三处同源。任一处对不上,请以控制台与服务协议口径为准并联系我们核对。
4. 训练期与折扣标识
部分调用可能带有折扣或减免标识,逐条记录与结算单会据实标注,便于您理解金额构成。具体适用范围、比例与生效期间以服务协议为准;此处仅说明读法:
- 折扣类标识会在逐条记录与月度结算单中以可读标签呈现,并已计入该次 / 当期的应付金额。
- 涉及评测用途、不向您计费的调用,会单列标注、不计入应付金额。
5. 计量口径版本
平台的计量口径是版本化的:每一期计量与计价规则对应一个计量口径版本号(如 计费口径 v2026.06)。
- 控制台"用量明细"页页脚、月度结算单均会标注当期生效的计量口径版本号。
- 计数接口(见第 6 节)的响应也随返回当期版本号,便于您将自行核算与平台口径对齐到同一版本。
- 口径版本若调整,将按服务协议约定的方式通知;调整前已产生的用量按当时生效版本计量,不追溯重算。
6. 可核验计数(调用前自行核对)
平台提供统一计价词元计数接口,您可在正式发起查询前,对给定文本或消息按平台统一计价词元口径预先计数,用于复算核对、容量预估与费用预判。
curl https://<平台入口地址>/v1/token-count \
-H "Authorization: Bearer <您的 API 密钥>" \
-H "Content-Type: application/json" \
-d '{
"model": "<模型名>",
"messages": [
{ "role": "user", "content": "请帮我归纳这段会议纪要的要点" }
],
"thinking": false
}'响应按 6 档口径分列返回各档词元数与适用单价档,并附当期计量口径版本号:
{
"input_tokens": 0,
"output_tokens_estimate": 0,
"cache_hit": false,
"thinking": false,
"price_tier": "<本次适用单价档(6 档之一)>",
"metering_version": "<当期计量口径版本号>"
}| 字段 | 含义 |
|---|---|
input_tokens | 按统一计价词元口径计得的输入词元数(确定性,可对相同文本复算核对) |
output_tokens_estimate | 输出词元数预估(实际以查询返回的逐条记录为准) |
cache_hit | 是否命中上游缓存(布尔) |
thinking | 是否按深度推理档计数(布尔) |
price_tier | 适用单价档,对应第 2 节 6 档之一 |
metering_version | 当期计量口径版本号,与用量明细 / 结算单口径一致 |
确定性承诺。 对相同输入,计数接口给出确定的输入词元数;逐条调用记录中的
input_tokens可经本接口对相应文本复算核对,两者在同一计量口径版本下一致。output_tokens_estimate为预估,最终输出计量以实际查询返回的逐条记录为准。