用量明细与计量说明

统一计价词元 6 档计量口径的读法、逐条调用记录字段含义、计量口径版本说明，以及如何用计数接口自行核对用量

本页说明平台如何以统一计价词元为单位计量您的每一次查询：6 档计量结构如何读、逐条调用记录每个字段的含义、计量口径如何版本化，以及如何用计数接口在调用前自行核对用量。

具体单价、信用额度等商务数值不在本文档中固化，以服务协议价格表与控制台实时口径为准；本页只讲计量结构与读法。

1. 统一计价词元

平台对外以统一计价词元为统一计量单位。您每一次查询消耗的输入与输出，均按统一计价词元口径计量，并据此计费与计入信用额度。

用量在控制台与结算单中以统一计价词元为单位呈现；大额时可按"百万词元"聚合显示，但底层计量始终为词元原值。
单价矩阵以"元 / 百万词元（含税）"为单位，各档单价以服务协议价格表为准。
同一笔用量在请求响应、用量明细、月度结算单三处口径一致、数字同源——您在任一处看到的数字，逐项比对时都对得上。

2. 6 档计量结构

平台按两个维度切分计量项：计量方向（输入 / 输出）与档位修饰（是否命中上游缓存、是否深度推理）。组合后共 6 档：

档位	计量方向	缓存	推理档	相对计价
档 1	输入	缓存命中	no-thinking	命中档，计价更低
档 2	输入	缓存命中	thinking	命中档，thinking 溢价
档 3	输入	缓存未命中	no-thinking	标准输入档
档 4	输入	缓存未命中	thinking	标准输入档，thinking 溢价
档 5	输出	—（不区分缓存）	no-thinking	标准输出档
档 6	输出	—（不区分缓存）	thinking	标准输出档，thinking 溢价

几条结构性规则，决定您在用量明细里看到的分档：

输入分缓存命中 / 未命中。 命中上游模型供应商缓存的输入词元，按更低的命中档计价；是否命中以上游模型返回为准，平台据实透传标注，不由本地预设。
输出不区分缓存档。 输出词元只按推理档分 thinking / no-thinking 两档，不存在"输出缓存命中"档——故 6 档 = 输入 4 档 + 输出 2 档。
thinking 为档位溢价。 深度推理（thinking）档相对常规档为单价溢价；平台不另行计量对您不可见的推理过程词元，溢价仅体现为单价档位的差异。

缓存命中口径。 此处缓存特指上游模型供应商缓存命中，并非平台本地缓存。一次查询是否命中，以上游模型返回结果为准，逐条记录中以 cache_hit 标识真实命中态。

3. 逐条调用记录

每一次查询都会落为一条独立的调用记录。您可在控制台"用量明细"页按时间、密钥、模型、推理档、缓存命中、护栏处置结果等维度筛选查询，也可通过控制平面接口程序化拉取。

3.1 查询逐条记录

curl "https://<平台入口地址>/api/v1/usage/records?start=2026-06-01&end=2026-06-30&page=1&page_size=20" \
  -H "Authorization: Bearer <您的控制台凭证>"

响应为"顶部汇总 + 分页 + 逐条数组"结构：顶部 summary 给出当前筛选范围内的合计，items 为逐条记录。

{
  "total": 0,
  "page": 1,
  "page_size": 20,
  "summary": {
    "total_input_tokens": 0,
    "total_output_tokens": 0,
    "total_amount": 0
  },
  "items": [
    {
      "call_id": "<调用唯一标识>",
      "api_key_id": "<所属密钥子账户>",
      "timestamp": "2026-06-15 10:24:31",
      "call_hash": "<调用信息哈希（脱敏，不含原文）>",
      "routed_model": "<本次实际路由的模型名>",
      "complexity": "<复杂度研判结果（简单 / 复杂）>",
      "cache_hit": false,
      "thinking": false,
      "input_tokens": 0,
      "output_tokens": 0,
      "price_tier": "<本次适用单价档（6 档之一）>",
      "charge_amount": 0,
      "guardrail_result": "<本次护栏处置结果（通过 / 拦截 / 脱敏 / 误拒）>"
    }
  ]
}

3.2 逐条字段含义

字段	含义
`call_id`	调用唯一标识，可据此查询单条详情
`api_key_id`	本次调用所属的密钥子账户，用量按此自动归属、独立分账
`timestamp`	调用时间，格式 `YYYY-MM-DD HH:mm:ss`
`call_hash`	调用信息哈希，用于追溯与去重；为脱敏值，不含请求原文
`routed_model`	本次智能查询路由聚合实际择优转发到的模型名
`complexity`	平台对本次查询的复杂度研判结果，决定择优路由的目标档位
`cache_hit`	是否命中上游缓存（布尔），命中按更低的命中档计价
`thinking`	是否深度推理档（布尔），thinking 档为单价溢价
`input_tokens`	本次输入统一计价词元数
`output_tokens`	本次输出统一计价词元数
`price_tier`	本次适用单价档，对应第 2 节 6 档之一
`charge_amount`	本次折算金额（含税），= 各档词元数 × 对应单价
`guardrail_result`	本次请求的护栏处置结果（通过 / 拦截 / 脱敏 / 误拒），可据此筛选复核该次安全护栏处置；逐类定义见安全防护与护栏处置类别参考

3.3 查询单条详情

curl "https://<平台入口地址>/api/v1/usage/records/<call_id>" \
  -H "Authorization: Bearer <您的控制台凭证>"

单条详情返回该次调用的完整字段，包含各档词元数、适用单价档与该次金额，便于您逐条核对计费。

同源约束。 逐条记录之和 = 按密钥分项小计之和 = 当期合计；用量明细页的合计、概览展板的当月用量、月度结算单的应付金额三处同源。任一处对不上，请以控制台与服务协议口径为准并联系我们核对。

4. 训练期与折扣标识

部分调用可能带有折扣或减免标识，逐条记录与结算单会据实标注，便于您理解金额构成。具体适用范围、比例与生效期间以服务协议为准；此处仅说明读法：

折扣类标识会在逐条记录与月度结算单中以可读标签呈现，并已计入该次 / 当期的应付金额。
涉及评测用途、不向您计费的调用，会单列标注、不计入应付金额。

5. 计量口径版本

平台的计量口径是版本化的：每一期计量与计价规则对应一个计量口径版本号（如 计费口径 v2026.06）。

控制台"用量明细"页页脚、月度结算单均会标注当期生效的计量口径版本号。
计数接口（见第 6 节）的响应也随返回当期版本号，便于您将自行核算与平台口径对齐到同一版本。
口径版本若调整，将按服务协议约定的方式通知；调整前已产生的用量按当时生效版本计量，不追溯重算。

6. 可核验计数（调用前自行核对）

平台提供统一计价词元计数接口，您可在正式发起查询前，对给定文本或消息按平台统一计价词元口径预先计数，用于复算核对、容量预估与费用预判。

curl https://<平台入口地址>/v1/token-count \
  -H "Authorization: Bearer <您的 API 密钥>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "<模型名>",
    "messages": [
      { "role": "user", "content": "请帮我归纳这段会议纪要的要点" }
    ],
    "thinking": false
  }'

响应按 6 档口径分列返回各档词元数与适用单价档，并附当期计量口径版本号：

{
  "input_tokens": 0,
  "output_tokens_estimate": 0,
  "cache_hit": false,
  "thinking": false,
  "price_tier": "<本次适用单价档（6 档之一）>",
  "metering_version": "<当期计量口径版本号>"
}

字段	含义
`input_tokens`	按统一计价词元口径计得的输入词元数（确定性，可对相同文本复算核对）
`output_tokens_estimate`	输出词元数预估（实际以查询返回的逐条记录为准）
`cache_hit`	是否命中上游缓存（布尔）
`thinking`	是否按深度推理档计数（布尔）
`price_tier`	适用单价档，对应第 2 节 6 档之一
`metering_version`	当期计量口径版本号，与用量明细 / 结算单口径一致

确定性承诺。 对相同输入，计数接口给出确定的输入词元数；逐条调用记录中的 input_tokens 可经本接口对相应文本复算核对，两者在同一计量口径版本下一致。output_tokens_estimate 为预估，最终输出计量以实际查询返回的逐条记录为准。

章节	内容
快速接入指南	从拿到密钥到发出第一个查询的最短上手路径
API 密钥管理	子账户密钥申请、变更、注销与按部门 / 业务线分账
账单与结算	月度服务费用结算单读法、含税口径与确认流程
额度管理	信用额度使用、预警阈值与提额方式
安全防护	护栏四类防护能力与处置结果（逐条记录 `guardrail_result` 的逐类含义）