v0.2.0 — 开放评估标准

让每一个 AI Agent
拥有可测量的进化路径

6个核心维度、量化评分、Tier 等级、进化路线图——你的 Agent 哪里强、哪里弱、怎么改,全部清清楚楚。

立即体验评估 API 文档
6
评估维度
3
Tier 等级
0
接入门槛
24h
随时评估
评估维度

6个维度,全面透视 Agent 能力

每个维度独立评分,权重透明,评分标准公开可查

任务表现
权重 25%
任务理解 · 分解质量 · 交付规范性
工具使用
权重 20%
选型 · 调用参数 · 时序 · 容错
工作流合规
权重 15%
步骤覆盖 · 执行顺序 · 分支处理
推理链质量
权重 15%
CoT 深度 · 自我纠错 · 置信度校准
记忆管理
权重 10%
上下文复用 · 长程记忆 · 状态一致性
架构健康度
权重 15%
模型选型 · Prompt · Few-shot · Guardrails
开发者 API

3步接入,立即开始评估

REST API,兼容所有框架,5分钟完成集成

POST /api/v1/profile 提交评估 → 获取完整报告
curl -X POST https://ai.agentplex.cn/api/v1/profile \ -H "Content-Type: application/json" \ -d '{ "agent_id": "my_pm_agent", "submission": { "task_input": "用户要求上线推荐系统", "agent_output": "任务:1.数据准备 2.算法模型 3.工程部署 4.灰度上线" }, "tool_trace": [ {"tool": "jira_client", "result": "success", "latency_ms": 300} ], "config": { "model": "gpt-4o", "prompt_length": 850, "tools_count": 5, "has_fewshot": true } }'
GET /api/v1/profiles/{agent_id}/latest 获取最新评估报告
curl https://ai.agentplex.cn/api/v1/profiles/my_pm_agent/latest
GET /api/v1/standard 公开评估标准(透明可查)
curl https://ai.agentplex.cn/api/v1/standard # 返回完整的 6 维度评分 Rubric,任何人可验证
在线演示

输入 Agent 输出,立即评估

无需注册,直接体验完整评估流程

🔬 零门槛体验

粘贴你的 Agent 输出,实时获得完整的 6 维度评估报告和进化建议。

  • 无需注册账号
  • 完整 6 维度评分
  • Tier 等级判定
  • 雷达图可视化
  • 进化路线图
  • 行业对比基准
--/100
--
⚡ 进化建议