文档中心
天枢智能查询路由聚合平台是什么、统一 AI 查询入口与智能路由聚合如何工作,以及统一计价词元计量口径的读法
天枢智能查询路由聚合平台是一个面向企业的统一 AI 查询入口:您的应用以一套兼容主流大模型协议的接口接入,平台智能研判每一次查询的复杂度、择优路由至最合适的模型,并以统一计价词元口径完成计量、计费与额度管理——您无需自行对接和维护多家模型、无需关心背后如何聚合与切换。
本文档面向接入平台的企业客户,帮助您从拿到密钥、发出第一个查询,到读懂用量、账单、额度与服务质量报表,完成端到端的接入与日常使用。
平台一句话定位
一个入口,统一接入;智能路由,择优聚合;统一计价词元,逐条可核。
- 统一 AI 查询入口。 一套接口接入,兼容主流大模型协议,您既有的客户端 SDK 大多可直接复用。
- 智能查询路由聚合。 平台按查询复杂度自动研判,将每一次请求择优转发至最合适的模型,并在异常时自动重试与切换,对您的应用透明。
- 统一计价词元计量。 所有用量以统一计价词元为单位逐条计量,输入与输出、缓存命中与未命中、深度推理(thinking)与常规档分别计价,逐条记录可复算核对。
能力速览
| 能力 | 一句话说明 | 详见 |
|---|---|---|
| 统一查询入口 | 一套兼容主流大模型协议的接口,发起推理请求无需感知背后聚合 | 快速接入指南 |
| 子账户密钥分账 | 按部门 / 业务线 / 成本中心申请独立密钥,用量自动归属、独立分账 | API 密钥管理 |
| 模型清单与入库标准 | 已纳入路由池的模型清单、综合智能水平指数与入库标准 | 模型清单与入库标准 |
| 模型评测 | 护栏能力基线与通用能力评测的目标线与实测对照 | 模型评测说明 |
| AI 模型接口 | OpenAI / Anthropic 兼容的查询、模型列表、词元计数与流式接口,统一入口逐字段参考 | 接口总览 |
| 进阶能力 | 深度推理、工具调用、结构化输出与提示缓存等接入侧进阶用法 | 进阶能力 |
| 统一计价词元计量 | 6 档计量口径逐条计量,逐条调用记录可核验、可复算 | 用量明细与计量说明 |
| 月度结算单 | 按结算月出具服务费用结算单,按密钥分项、含税合计、可确认 | 账单与结算 |
| 信用额度管理 | 单层汇总信用额度约束全部密钥,达额预警与提额 | 额度管理 |
| 安全防护 | 注入防护、敏感信息脱敏、应拒答拦截、访问控制等护栏处置 | 安全防护 |
| 数据保留与隐私 | 查询内容留存口径、不用于模型训练、数据不出境与删除导出机制 | 数据保留与隐私 |
| 服务质量 | 可用率、响应、恢复、延时等各项服务质量指标的月度达成 | 服务质量(SLA)说明 |
平台如何工作
您的每一次查询进入平台后,并非被直接转发给某个固定模型,而是经过平台的智能查询路由聚合处理后,择优转发至最合适的模型,再带着完整的计量结果返回:
您的查询
│
▼
① 智能研判 按查询复杂度自动研判,确定最合适的模型档位
│
▼
② 择优路由 在候选模型中择优转发,异常时自动重试与切换
│
▼
③ 安全护栏 注入防护 / 敏感信息脱敏 / 应拒答拦截 / 访问控制
│
▼
返回结果(附本次统一计价词元用量)整个过程对您的应用透明:您只需调用统一入口,平台负责研判、路由、护栏与计量。
一次最简单的调用
平台对外暴露两类接口:数据平面(/v1/*,发起查询)与控制平面(/api/v1/*,查用量、管配置)。一次最简单的查询调用如下(数据平面,OpenAI 兼容形态):
curl https://<平台入口地址>/v1/chat/completions \
-H "Authorization: Bearer <您的 API 密钥>" \
-H "Content-Type: application/json" \
-d '{
"model": "<模型名>",
"messages": [
{ "role": "user", "content": "请帮我归纳这段会议纪要的要点" }
],
"stream": false
}'响应在标准 OpenAI 兼容结构之上,于 usage 中携带本次请求的统一计价词元用量信息:
{
"object": "chat.completion",
"model": "<本次实际路由的模型名>",
"choices": [
{
"index": 0,
"message": { "role": "assistant", "content": "..." },
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 0,
"completion_tokens": 0,
"total_tokens": 0,
"cached_input_tokens": 0,
"price_tier": "<本次适用单价档>",
"thinking": false
}
}计量口径速读。 平台按"输入·缓存命中 / 输入·缓存未命中 / 输出"三类计量项,各自再分 thinking 与 no-thinking 档,合计 6 档统一计价词元口径。缓存命中档的计价更低,thinking(深度推理)档相对溢价;是否命中上游缓存以上游模型返回为准。具体单价、信用额度等商务数值不在本文档中固化,以服务协议与控制台实时口径为准。
文档导航
文档按由浅入深组织:快速上手 → 模型 → 模型接口 → 进阶能力 → 用量·计费·额度 → 安全·合规·质量。
| 主题 | 章节 | 内容 |
|---|---|---|
| 快速上手 | 快速接入指南 | 从拿到密钥到发出第一个查询的最短上手路径,统一入口地址与协议兼容说明 |
| 快速上手 | API 密钥管理 | 子账户密钥的申请、变更、注销,按部门 / 业务线分账,单方暂停与恢复 |
| 模型 | 模型清单与入库标准 | 已纳入路由池的模型清单、综合智能水平指数与基本属性、入库标准 |
| 模型 | 模型评测说明 | 护栏能力基线与通用能力评测维度、目标线与快照口径的读法 |
| 模型接口 | AI 模型接口 | 数据平面 /v1/* 全部接口:对话补全、消息接口、流式、模型列表、词元计数与错误码 |
| 进阶能力 | 进阶能力 | 深度推理、工具调用、结构化输出与提示缓存的接入侧用法与计量口径 |
| 用量·计费·额度 | 用量明细与计量说明 | 统一计价词元 6 档计量口径、逐条调用记录字段、计量口径版本与可核验计数 |
| 用量·计费·额度 | 账单与结算 | 月度服务费用结算单的读法、含税口径、确认流程与对账日 |
| 用量·计费·额度 | 额度管理 | 信用额度使用、预警阈值、达额暂停与提额方式 |
| 安全·合规·质量 | 安全防护 | 平台护栏能力(注入防护 / 脱敏 / 访问控制)与误拒说明 |
| 安全·合规·质量 | 数据保留与隐私 | 查询内容留存口径、不用于模型训练、数据不出境与删除导出机制 |
| 安全·合规·质量 | 服务质量(SLA)说明 | 各服务质量指标的目标值、统计口径、排除项与未达情形处理 |