文档中心

天枢智能查询路由聚合平台是什么、统一 AI 查询入口与智能路由聚合如何工作，以及统一计价词元计量口径的读法

天枢智能查询路由聚合平台是一个面向企业的统一 AI 查询入口：您的应用以一套兼容主流大模型协议的接口接入，平台智能研判每一次查询的复杂度、择优路由至最合适的模型，并以统一计价词元口径完成计量、计费与额度管理——您无需自行对接和维护多家模型、无需关心背后如何聚合与切换。

本文档面向接入平台的企业客户，帮助您从拿到密钥、发出第一个查询，到读懂用量、账单、额度与服务质量报表，完成端到端的接入与日常使用。

平台一句话定位

一个入口，统一接入；智能路由，择优聚合；统一计价词元，逐条可核。

统一 AI 查询入口。 一套接口接入，兼容主流大模型协议，您既有的客户端 SDK 大多可直接复用。
智能查询路由聚合。 平台按查询复杂度自动研判，将每一次请求择优转发至最合适的模型，并在异常时自动重试与切换，对您的应用透明。
统一计价词元计量。 所有用量以统一计价词元为单位逐条计量，输入与输出、缓存命中与未命中、深度推理（thinking）与常规档分别计价，逐条记录可复算核对。

能力速览

能力	一句话说明	详见
统一查询入口	一套兼容主流大模型协议的接口，发起推理请求无需感知背后聚合	快速接入指南
子账户密钥分账	按部门 / 业务线 / 成本中心申请独立密钥，用量自动归属、独立分账	API 密钥管理
模型清单与入库标准	已纳入路由池的模型清单、综合智能水平指数与入库标准	模型清单与入库标准
模型评测	护栏能力基线与通用能力评测的目标线与实测对照	模型评测说明
AI 模型接口	OpenAI / Anthropic 兼容的查询、模型列表、词元计数与流式接口，统一入口逐字段参考	接口总览
进阶能力	深度推理、工具调用、结构化输出与提示缓存等接入侧进阶用法	进阶能力
统一计价词元计量	6 档计量口径逐条计量，逐条调用记录可核验、可复算	用量明细与计量说明
月度结算单	按结算月出具服务费用结算单，按密钥分项、含税合计、可确认	账单与结算
信用额度管理	单层汇总信用额度约束全部密钥，达额预警与提额	额度管理
安全防护	注入防护、敏感信息脱敏、应拒答拦截、访问控制等护栏处置	安全防护
数据保留与隐私	查询内容留存口径、不用于模型训练、数据不出境与删除导出机制	数据保留与隐私
服务质量	可用率、响应、恢复、延时等各项服务质量指标的月度达成	服务质量（SLA）说明

平台如何工作

您的每一次查询进入平台后，并非被直接转发给某个固定模型，而是经过平台的智能查询路由聚合处理后，择优转发至最合适的模型，再带着完整的计量结果返回：

您的查询
   │
   ▼
① 智能研判      按查询复杂度自动研判，确定最合适的模型档位
   │
   ▼
② 择优路由      在候选模型中择优转发，异常时自动重试与切换
   │
   ▼
③ 安全护栏      注入防护 / 敏感信息脱敏 / 应拒答拦截 / 访问控制
   │
   ▼
返回结果（附本次统一计价词元用量）

整个过程对您的应用透明：您只需调用统一入口，平台负责研判、路由、护栏与计量。

一次最简单的调用

平台对外暴露两类接口：数据平面（/v1/*，发起查询）与控制平面（/api/v1/*，查用量、管配置）。一次最简单的查询调用如下（数据平面，OpenAI 兼容形态）：

curl https://<平台入口地址>/v1/chat/completions \
  -H "Authorization: Bearer <您的 API 密钥>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "<模型名>",
    "messages": [
      { "role": "user", "content": "请帮我归纳这段会议纪要的要点" }
    ],
    "stream": false
  }'

响应在标准 OpenAI 兼容结构之上，于 usage 中携带本次请求的统一计价词元用量信息：

{
  "object": "chat.completion",
  "model": "<本次实际路由的模型名>",
  "choices": [
    {
      "index": 0,
      "message": { "role": "assistant", "content": "..." },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 0,
    "completion_tokens": 0,
    "total_tokens": 0,
    "cached_input_tokens": 0,
    "price_tier": "<本次适用单价档>",
    "thinking": false
  }
}

计量口径速读。 平台按"输入·缓存命中 / 输入·缓存未命中 / 输出"三类计量项，各自再分 thinking 与 no-thinking 档，合计 6 档统一计价词元口径。缓存命中档的计价更低，thinking（深度推理）档相对溢价；是否命中上游缓存以上游模型返回为准。具体单价、信用额度等商务数值不在本文档中固化，以服务协议与控制台实时口径为准。

文档导航

文档按由浅入深组织：快速上手 → 模型 → 模型接口 → 进阶能力 → 用量·计费·额度 → 安全·合规·质量。

主题	章节	内容
快速上手	快速接入指南	从拿到密钥到发出第一个查询的最短上手路径，统一入口地址与协议兼容说明
快速上手	API 密钥管理	子账户密钥的申请、变更、注销，按部门 / 业务线分账，单方暂停与恢复
模型	模型清单与入库标准	已纳入路由池的模型清单、综合智能水平指数与基本属性、入库标准
模型	模型评测说明	护栏能力基线与通用能力评测维度、目标线与快照口径的读法
模型接口	AI 模型接口	数据平面 `/v1/*` 全部接口：对话补全、消息接口、流式、模型列表、词元计数与错误码
进阶能力	进阶能力	深度推理、工具调用、结构化输出与提示缓存的接入侧用法与计量口径
用量·计费·额度	用量明细与计量说明	统一计价词元 6 档计量口径、逐条调用记录字段、计量口径版本与可核验计数
用量·计费·额度	账单与结算	月度服务费用结算单的读法、含税口径、确认流程与对账日
用量·计费·额度	额度管理	信用额度使用、预警阈值、达额暂停与提额方式
安全·合规·质量	安全防护	平台护栏能力（注入防护 / 脱敏 / 访问控制）与误拒说明
安全·合规·质量	数据保留与隐私	查询内容留存口径、不用于模型训练、数据不出境与删除导出机制
安全·合规·质量	服务质量（SLA）说明	各服务质量指标的目标值、统计口径、排除项与未达情形处理

平台一句话定位

能力速览

平台如何工作

一次最简单的调用

文档导航

On this page