Updated 2025-12-12
Python
概览
从 AIOpsChallenge 原始 judge 中抽离出的可独立运行评测程序:用于对参赛提交进行打分,并提供 ground truth 转换与评测命令。
我做了什么
- 将赛题评测脚本整理为可独立运行的仓库,沉淀稳定的评测入口与数据格式
- 补充使用文档与评测命令,便于团队/同学复现与迭代评测流程
技术要点
- 数据处理:支持 ground truth 转换为统一的 jsonl 格式
- 评测逻辑:封装 evaluate 脚本与可复现的命令行工作流