文档

检测原理

API放大镜 不把「自称的模型名」当结论。引擎按层级独立采集信号,再汇总为诚实度评分与 finding 列表;深度档位决定本轮实际跑哪些层,你可以在检测页选择「快速 / 标准 / 深度」。

三层使用姿势

  • 快速体检:网络 + 协议 + 元数据,适合日常抽查。
  • 标准体检:增加 Tokenizer、能力标尺与性能基线。
  • 深度体检:覆盖全部可用层级(含号池与一致性),耗时更长、证据更完整。

层级一览

下列为概念说明;具体探针与阈值随版本迭代,以报告内 findings 为准。

L1网络与可达性
DNS、TLS、延迟与连通性基线,排除「假在线」与明显的网络欺骗。
L2协议层
OpenAI 兼容端点的请求 / 响应形状、流式协议与错误语义校验。
L3元数据
响应头、模型字段、版本信息与声明一致性,发现「挂羊头卖狗肉」的早期信号。
L4Tokenizer 指纹
本地 tiktoken 与返回内容的 token 统计对齐,模型「计数习惯」难以伪造。
L5概率与分布
在支持 logprobs 时采样概率结构,与参考分布做交叉比对(如 KL 风格度量)。
L6能力标尺
受控探针任务衡量推理、知识与指令遵循,区分「能答题」与「像某模型」。
L7风格与口吻
输出层面的文体、偏好与安全边界痕迹,辅助判别是否同一族模型。
L8架构信号
从工具调用、结构化输出与内部路由痕迹推断后端架构是否匹配声称。
L9性能画像
TTFT、TPS、流式分块节奏等物理特性;缓存命中与号池切换常体现在这里。
L10一致性
重复请求下的稳定性与漂移,识别路由抖动、降级或偷偷换模型。
L11计费与经济信号
用量 / 计费相关响应与行为是否与声称的模型档位、定价一致。
L12号池与渠道
system_fingerprint 多样性、Tier 推断与降级率等,将渠道归入可解释的档位。
L13对抗与稳健性
轻量对抗探针观察模型是否出现异常捷径或防护不一致。
L14综合验证
贝叶斯框架在所有层证据汇总后做最终一致性判定,给出统一诚实度评分。