文档

检测原理

API放大镜不把「自称的模型名」当结论。引擎按层级独立采集信号，再汇总为诚实度评分与 finding 列表。检测深度仅两种：标准体检与深度体检（检测页可选），满足不同耗时与证据完整度。

两种检测深度

标准体检（L2）：网络 + 协议 + 元数据 + Tokenizer 指纹 + 能力标尺 + 性能基线，约 2 分钟，适合日常判断模型真伪。

深度体检（L3）：在上述基础上跑齐全部可用层级（含号池与一致性等），耗时更长，约 8 分钟，证据更完整。

层级一览

下列为概念说明；具体探针与阈值随版本迭代，以报告内 findings 为准。

L1网络与可达性: DNS、TLS、延迟与连通性基线，排除「假在线」与明显的网络欺骗。
L2协议层: OpenAI 兼容端点的请求 / 响应形状、流式协议与错误语义校验。
L3元数据: 响应头、模型字段、版本信息与声明一致性，发现「挂羊头卖狗肉」的早期信号。
L4Tokenizer 指纹: 本地 tiktoken 与返回内容的 token 统计对齐，模型「计数习惯」难以伪造。
L5概率与分布: 在支持 logprobs 时采样概率结构，与参考分布做交叉比对（如 KL 风格度量）。
L6能力标尺: 受控探针任务衡量推理、知识与指令遵循，区分「能答题」与「像某模型」。
L7风格与口吻: 输出层面的文体、偏好与安全边界痕迹，辅助判别是否同一族模型。
L8架构信号: 从工具调用、结构化输出与内部路由痕迹推断后端架构是否匹配声称。
L9性能画像: TTFT、TPS、流式分块节奏等物理特性；缓存命中与号池切换常体现在这里。
L10一致性: 重复请求下的稳定性与漂移，识别路由抖动、降级或偷偷换模型。
L11计费与经济信号: 用量 / 计费相关响应与行为是否与声称的模型档位、定价一致。
L12号池与渠道: system_fingerprint 多样性、Tier 推断与降级率等，将渠道归入可解释的档位。
L13对抗与稳健性: 轻量对抗探针观察模型是否出现异常捷径或防护不一致。
L14综合验证: 贝叶斯框架在所有层证据汇总后做最终一致性判定，给出统一诚实度评分。

去检测返回首页