生产请求突然失败
用户请求卡死、客服集中反馈、临时换 Key 和回滚都很被动。
API Monitor 用低额度测试 Key 检测 API 连通性、模型路由、JSON/数学探针、Token 用量和健康分。 当 Key 失效、额度不足、限流、超时或健康分低于阈值时,自动记录报告并发送邮箱提醒。
未配置真实 SMTP 时,验证码和告警会写入 本地测试收件箱作为回退记录。
实时检测报告预览
多模型、低额度 Key、异常告警
健康分
96/100
健康
无 Key、额度或路由异常
Heartbeat
HTTP 200,接口连通正常
JSON / 数学探针
结构可解析,结果匹配
Token / usage
用量信号正常,成本可估算
异常提醒
健康分低于阈值时发送邮件
预览为产品示例。真实报告会按模型分组展示探针结果、错误类型、延迟、Token 和风险贡献。
为什么需要检测 API
中转站和聚合 API 往往不会主动告诉你 Key、额度、路由、质量和限流风险。API Monitor 把这些外部可观测信号沉淀成连续报告,让风险在进入生产前先被看见。
401/403、鉴权错误和异常错误类型会被归类,避免业务请求上线后才发现不可用。
对 quota、balance、insufficient credit 等外部错误信号做风险识别,提醒你及时处理。
持续记录 HTTP 状态、429、5xx、超时和延迟飙升,区分临时波动与持续风险。
检查返回 model 与请求 Model ID 是否明显不一致,尤其适合集成类和中转类 API。
用低成本 JSON 探针验证结构化输出能力,提前发现解析失败风险。
记录每次探针耗时和平均延迟,让体验风险不再只靠用户投诉暴露。
聚合 usage 字段、Token 用量和估算成本,辅助识别账单或计量异常。
很多中转站不会主动通知你质量变化,调用成功也不等于稳定、可控、可长期依赖。
不检测的代价
免费单检适合上线前快速确认风险;长期监控则适合业务持续依赖、成本敏感或供应商不止一个的场景。
用户请求卡死、客服集中反馈、临时换 Key 和回滚都很被动。
余额耗尽、异常 token 消耗或集成商计费波动,会直接影响业务可用性。
接口还在返回 200,但 JSON 变差、模型被替换、简单逻辑题开始不稳定。
我们如何检测
API Monitor 不保存完整 Prompt 或完整 Response,只保存摘要、指标、状态和错误元数据。 这让监控能持续运行,同时减少敏感内容进入系统的风险。
验证 OpenAI-compatible chat completions 是否可连通,并记录 HTTP 与延迟。
用低额度测试 Key 运行 pong、JSON、数学三个基础探针。
检查 JSON 可解析性和关键字段,降低生产解析失败的概率。
比较请求模型与返回模型,聚合 usage、Token 和估算成本信号。
按 OpenAI、DeepSeek、通义、Gemini、Claude 等协议差异,识别各自特有的异常返回信号。
区分 Key 无效、额度不足、限流、5xx、网络错误、超时和普通 HTTP 错误。
每个模型和探针都有扣分贡献,报告展示为什么扣分、哪里需要处理。
可信度与边界
对外部可观测故障的识别可信度约 85%-95%。对服务商内部余额、隐藏路由和不可见调度, API Monitor 会用外部返回信号推断,但不会承诺 100% 保证。