天枢星通Docs

文档中心

天枢智能查询路由聚合平台是什么、统一 AI 查询入口与智能路由聚合如何工作,以及统一计价词元计量口径的读法

天枢智能查询路由聚合平台是一个面向企业的统一 AI 查询入口:您的应用以一套兼容主流大模型协议的接口接入,平台智能研判每一次查询的复杂度、择优路由至最合适的模型,并以统一计价词元口径完成计量、计费与额度管理——您无需自行对接和维护多家模型、无需关心背后如何聚合与切换。

本文档面向接入平台的企业客户,帮助您从拿到密钥、发出第一个查询,到读懂用量、账单、额度与服务质量报表,完成端到端的接入与日常使用。

平台一句话定位

一个入口,统一接入;智能路由,择优聚合;统一计价词元,逐条可核。

  • 统一 AI 查询入口。 一套接口接入,兼容主流大模型协议,您既有的客户端 SDK 大多可直接复用。
  • 智能查询路由聚合。 平台按查询复杂度自动研判,将每一次请求择优转发至最合适的模型,并在异常时自动重试与切换,对您的应用透明。
  • 统一计价词元计量。 所有用量以统一计价词元为单位逐条计量,输入与输出、缓存命中与未命中、深度推理(thinking)与常规档分别计价,逐条记录可复算核对。

能力速览

能力一句话说明详见
统一查询入口一套兼容主流大模型协议的接口,发起推理请求无需感知背后聚合快速接入指南
子账户密钥分账按部门 / 业务线 / 成本中心申请独立密钥,用量自动归属、独立分账API 密钥管理
模型清单与入库标准已纳入路由池的模型清单、综合智能水平指数与入库标准模型清单与入库标准
模型评测护栏能力基线与通用能力评测的目标线与实测对照模型评测说明
AI 模型接口OpenAI / Anthropic 兼容的查询、模型列表、词元计数与流式接口,统一入口逐字段参考接口总览
进阶能力深度推理、工具调用、结构化输出与提示缓存等接入侧进阶用法进阶能力
统一计价词元计量6 档计量口径逐条计量,逐条调用记录可核验、可复算用量明细与计量说明
月度结算单按结算月出具服务费用结算单,按密钥分项、含税合计、可确认账单与结算
信用额度管理单层汇总信用额度约束全部密钥,达额预警与提额额度管理
安全防护注入防护、敏感信息脱敏、应拒答拦截、访问控制等护栏处置安全防护
数据保留与隐私查询内容留存口径、不用于模型训练、数据不出境与删除导出机制数据保留与隐私
服务质量可用率、响应、恢复、延时等各项服务质量指标的月度达成服务质量(SLA)说明

平台如何工作

您的每一次查询进入平台后,并非被直接转发给某个固定模型,而是经过平台的智能查询路由聚合处理后,择优转发至最合适的模型,再带着完整的计量结果返回:

您的查询


① 智能研判      按查询复杂度自动研判,确定最合适的模型档位


② 择优路由      在候选模型中择优转发,异常时自动重试与切换


③ 安全护栏      注入防护 / 敏感信息脱敏 / 应拒答拦截 / 访问控制


返回结果(附本次统一计价词元用量)

整个过程对您的应用透明:您只需调用统一入口,平台负责研判、路由、护栏与计量。

一次最简单的调用

平台对外暴露两类接口:数据平面/v1/*,发起查询)与控制平面/api/v1/*,查用量、管配置)。一次最简单的查询调用如下(数据平面,OpenAI 兼容形态):

curl https://<平台入口地>/v1/chat/completions \
  -H "Authorization: Bearer <您的 API 密钥>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "<模型名>",
    "messages": [
      { "role": "user", "content": "请帮我归纳这段会议纪要的要点" }
    ],
    "stream": false
  }'

响应在标准 OpenAI 兼容结构之上,于 usage 中携带本次请求的统一计价词元用量信息:

{
  "object": "chat.completion",
  "model": "<本次实际路由的模型名>",
  "choices": [
    {
      "index": 0,
      "message": { "role": "assistant", "content": "..." },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 0,
    "completion_tokens": 0,
    "total_tokens": 0,
    "cached_input_tokens": 0,
    "price_tier": "<本次适用单价档>",
    "thinking": false
  }
}

计量口径速读。 平台按"输入·缓存命中 / 输入·缓存未命中 / 输出"三类计量项,各自再分 thinking 与 no-thinking 档,合计 6 档统一计价词元口径。缓存命中档的计价更低,thinking(深度推理)档相对溢价;是否命中上游缓存以上游模型返回为准。具体单价、信用额度等商务数值不在本文档中固化,以服务协议与控制台实时口径为准

文档导航

文档按由浅入深组织:快速上手 → 模型 → 模型接口 → 进阶能力 → 用量·计费·额度 → 安全·合规·质量。

主题章节内容
快速上手快速接入指南从拿到密钥到发出第一个查询的最短上手路径,统一入口地址与协议兼容说明
快速上手API 密钥管理子账户密钥的申请、变更、注销,按部门 / 业务线分账,单方暂停与恢复
模型模型清单与入库标准已纳入路由池的模型清单、综合智能水平指数与基本属性、入库标准
模型模型评测说明护栏能力基线与通用能力评测维度、目标线与快照口径的读法
模型接口AI 模型接口数据平面 /v1/* 全部接口:对话补全、消息接口、流式、模型列表、词元计数与错误码
进阶能力进阶能力深度推理、工具调用、结构化输出与提示缓存的接入侧用法与计量口径
用量·计费·额度用量明细与计量说明统一计价词元 6 档计量口径、逐条调用记录字段、计量口径版本与可核验计数
用量·计费·额度账单与结算月度服务费用结算单的读法、含税口径、确认流程与对账日
用量·计费·额度额度管理信用额度使用、预警阈值、达额暂停与提额方式
安全·合规·质量安全防护平台护栏能力(注入防护 / 脱敏 / 访问控制)与误拒说明
安全·合规·质量数据保留与隐私查询内容留存口径、不用于模型训练、数据不出境与删除导出机制
安全·合规·质量服务质量(SLA)说明各服务质量指标的目标值、统计口径、排除项与未达情形处理

On this page