API放大镜 不把「自称的模型名」当结论。引擎按层级独立采集信号,再汇总为诚实度评分与 finding 列表;深度档位决定本轮实际跑哪些层,你可以在检测页选择「快速 / 标准 / 深度」。
- L1网络与可达性
- DNS、TLS、延迟与连通性基线,排除「假在线」与明显的网络欺骗。
- L2协议层
- OpenAI 兼容端点的请求 / 响应形状、流式协议与错误语义校验。
- L3元数据
- 响应头、模型字段、版本信息与声明一致性,发现「挂羊头卖狗肉」的早期信号。
- L4Tokenizer 指纹
- 本地 tiktoken 与返回内容的 token 统计对齐,模型「计数习惯」难以伪造。
- L5概率与分布
- 在支持 logprobs 时采样概率结构,与参考分布做交叉比对(如 KL 风格度量)。
- L6能力标尺
- 受控探针任务衡量推理、知识与指令遵循,区分「能答题」与「像某模型」。
- L7风格与口吻
- 输出层面的文体、偏好与安全边界痕迹,辅助判别是否同一族模型。
- L8架构信号
- 从工具调用、结构化输出与内部路由痕迹推断后端架构是否匹配声称。
- L9性能画像
- TTFT、TPS、流式分块节奏等物理特性;缓存命中与号池切换常体现在这里。
- L10一致性
- 重复请求下的稳定性与漂移,识别路由抖动、降级或偷偷换模型。
- L11计费与经济信号
- 用量 / 计费相关响应与行为是否与声称的模型档位、定价一致。
- L12号池与渠道
- system_fingerprint 多样性、Tier 推断与降级率等,将渠道归入可解释的档位。
- L13对抗与稳健性
- 轻量对抗探针观察模型是否出现异常捷径或防护不一致。
- L14综合验证
- 贝叶斯框架在所有层证据汇总后做最终一致性判定,给出统一诚实度评分。