天枢星通Docs
用量·计费·额度

用量明细与计量说明

统一计价词元 6 档计量口径的读法、逐条调用记录字段含义、计量口径版本说明,以及如何用计数接口自行核对用量

本页说明平台如何以统一计价词元为单位计量您的每一次查询:6 档计量结构如何读、逐条调用记录每个字段的含义、计量口径如何版本化,以及如何用计数接口在调用前自行核对用量。

具体单价、信用额度等商务数值不在本文档中固化,以服务协议价格表与控制台实时口径为准;本页只讲计量结构与读法。

1. 统一计价词元

平台对外以统一计价词元为统一计量单位。您每一次查询消耗的输入与输出,均按统一计价词元口径计量,并据此计费与计入信用额度。

  • 用量在控制台与结算单中以统一计价词元为单位呈现;大额时可按"百万词元"聚合显示,但底层计量始终为词元原值。
  • 单价矩阵以"元 / 百万词元(含税)"为单位,各档单价以服务协议价格表为准。
  • 同一笔用量在请求响应、用量明细、月度结算单三处口径一致、数字同源——您在任一处看到的数字,逐项比对时都对得上。

2. 6 档计量结构

平台按两个维度切分计量项:计量方向(输入 / 输出)与档位修饰(是否命中上游缓存、是否深度推理)。组合后共 6 档:

档位计量方向缓存推理档相对计价
档 1输入缓存命中no-thinking命中档,计价更低
档 2输入缓存命中thinking命中档,thinking 溢价
档 3输入缓存未命中no-thinking标准输入档
档 4输入缓存未命中thinking标准输入档,thinking 溢价
档 5输出—(不区分缓存)no-thinking标准输出档
档 6输出—(不区分缓存)thinking标准输出档,thinking 溢价

几条结构性规则,决定您在用量明细里看到的分档:

  • 输入分缓存命中 / 未命中。 命中上游模型供应商缓存的输入词元,按更低的命中档计价;是否命中以上游模型返回为准,平台据实透传标注,不由本地预设。
  • 输出不区分缓存档。 输出词元只按推理档分 thinking / no-thinking 两档,不存在"输出缓存命中"档——故 6 档 = 输入 4 档 + 输出 2 档。
  • thinking 为档位溢价。 深度推理(thinking)档相对常规档为单价溢价;平台不另行计量对您不可见的推理过程词元,溢价仅体现为单价档位的差异。

缓存命中口径。 此处缓存特指上游模型供应商缓存命中,并非平台本地缓存。一次查询是否命中,以上游模型返回结果为准,逐条记录中以 cache_hit 标识真实命中态。

3. 逐条调用记录

每一次查询都会落为一条独立的调用记录。您可在控制台"用量明细"页按时间、密钥、模型、推理档、缓存命中、护栏处置结果等维度筛选查询,也可通过控制平面接口程序化拉取。

3.1 查询逐条记录

curl "https://<平台入口地址>/api/v1/usage/records?start=2026-06-01&end=2026-06-30&page=1&page_size=20" \
  -H "Authorization: Bearer <您的控制台凭证>"

响应为"顶部汇总 + 分页 + 逐条数组"结构:顶部 summary 给出当前筛选范围内的合计,items 为逐条记录。

{
  "total": 0,
  "page": 1,
  "page_size": 20,
  "summary": {
    "total_input_tokens": 0,
    "total_output_tokens": 0,
    "total_amount": 0
  },
  "items": [
    {
      "call_id": "<调用唯一标识>",
      "api_key_id": "<所属密钥子账户>",
      "timestamp": "2026-06-15 10:24:31",
      "call_hash": "<调用信息哈希(脱敏,不含原文)>",
      "routed_model": "<本次实际路由的模型名>",
      "complexity": "<复杂度研判结果(简单 / 复杂)>",
      "cache_hit": false,
      "thinking": false,
      "input_tokens": 0,
      "output_tokens": 0,
      "price_tier": "<本次适用单价档(6 档之一)>",
      "charge_amount": 0,
      "guardrail_result": "<本次护栏处置结果(通过 / 拦截 / 脱敏 / 误拒)>"
    }
  ]
}

3.2 逐条字段含义

字段含义
call_id调用唯一标识,可据此查询单条详情
api_key_id本次调用所属的密钥子账户,用量按此自动归属、独立分账
timestamp调用时间,格式 YYYY-MM-DD HH:mm:ss
call_hash调用信息哈希,用于追溯与去重;为脱敏值,不含请求原文
routed_model本次智能查询路由聚合实际择优转发到的模型名
complexity平台对本次查询的复杂度研判结果,决定择优路由的目标档位
cache_hit是否命中上游缓存(布尔),命中按更低的命中档计价
thinking是否深度推理档(布尔),thinking 档为单价溢价
input_tokens本次输入统一计价词元数
output_tokens本次输出统一计价词元数
price_tier本次适用单价档,对应第 2 节 6 档之一
charge_amount本次折算金额(含税),= 各档词元数 × 对应单价
guardrail_result本次请求的护栏处置结果(通过 / 拦截 / 脱敏 / 误拒),可据此筛选复核该次安全护栏处置;逐类定义见 安全防护护栏处置类别参考

3.3 查询单条详情

curl "https://<平台入口地址>/api/v1/usage/records/<call_id>" \
  -H "Authorization: Bearer <您的控制台凭证>"

单条详情返回该次调用的完整字段,包含各档词元数、适用单价档与该次金额,便于您逐条核对计费。

同源约束。 逐条记录之和 = 按密钥分项小计之和 = 当期合计;用量明细页的合计、概览展板的当月用量、月度结算单的应付金额三处同源。任一处对不上,请以控制台与服务协议口径为准并联系我们核对。

4. 训练期与折扣标识

部分调用可能带有折扣或减免标识,逐条记录与结算单会据实标注,便于您理解金额构成。具体适用范围、比例与生效期间以服务协议为准;此处仅说明读法:

  • 折扣类标识会在逐条记录与月度结算单中以可读标签呈现,并已计入该次 / 当期的应付金额。
  • 涉及评测用途、不向您计费的调用,会单列标注、不计入应付金额。

5. 计量口径版本

平台的计量口径是版本化的:每一期计量与计价规则对应一个计量口径版本号(如 计费口径 v2026.06)。

  • 控制台"用量明细"页页脚、月度结算单均会标注当期生效的计量口径版本号。
  • 计数接口(见第 6 节)的响应也随返回当期版本号,便于您将自行核算与平台口径对齐到同一版本。
  • 口径版本若调整,将按服务协议约定的方式通知;调整前已产生的用量按当时生效版本计量,不追溯重算。

6. 可核验计数(调用前自行核对)

平台提供统一计价词元计数接口,您可在正式发起查询前,对给定文本或消息按平台统一计价词元口径预先计数,用于复算核对、容量预估与费用预判。

curl https://<平台入口地>/v1/token-count \
  -H "Authorization: Bearer <您的 API 密钥>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "<模型名>",
    "messages": [
      { "role": "user", "content": "请帮我归纳这段会议纪要的要点" }
    ],
    "thinking": false
  }'

响应按 6 档口径分列返回各档词元数与适用单价档,并附当期计量口径版本号:

{
  "input_tokens": 0,
  "output_tokens_estimate": 0,
  "cache_hit": false,
  "thinking": false,
  "price_tier": "<本次适用单价档(6 档之一)>",
  "metering_version": "<当期计量口径版本号>"
}
字段含义
input_tokens按统一计价词元口径计得的输入词元数(确定性,可对相同文本复算核对)
output_tokens_estimate输出词元数预估(实际以查询返回的逐条记录为准)
cache_hit是否命中上游缓存(布尔)
thinking是否按深度推理档计数(布尔)
price_tier适用单价档,对应第 2 节 6 档之一
metering_version当期计量口径版本号,与用量明细 / 结算单口径一致

确定性承诺。 对相同输入,计数接口给出确定的输入词元数;逐条调用记录中的 input_tokens 可经本接口对相应文本复算核对,两者在同一计量口径版本下一致。output_tokens_estimate 为预估,最终输出计量以实际查询返回的逐条记录为准。

相关链接

章节内容
快速接入指南从拿到密钥到发出第一个查询的最短上手路径
API 密钥管理子账户密钥申请、变更、注销与按部门 / 业务线分账
账单与结算月度服务费用结算单读法、含税口径与确认流程
额度管理信用额度使用、预警阈值与提额方式
安全防护护栏四类防护能力与处置结果(逐条记录 guardrail_result 的逐类含义)

On this page