人形机器人障碍场景应用挑战赛
目录
1.规则概述
1.1 竞赛内容
本赛项聚焦九格大模型与强化学习的协同创新,要求参赛队通过九格大模型决策驱动人形机器人在格物仿真环境中完成全自主军用体能训练任务。比赛重点考核大模型在复杂运动控制中的决策能力、强化学习算法设计能力以及军事训练场景的技术适应性,最终实现人形机器人从零学习到精准执行的全过程控制。
2.比赛场地及道具要求
比赛基于格物具身智能仿真平台,并配有相机视角以便进行观察。
参赛队伍需要使用九格大模型对环境状态进行分析,并为人形机器人提供当前状态的最优动作策略,以确保人形机器人在各项训练科目中都能高效执行,有效得分,其中环境状态和环境动作的具体使用方法可见格物仿真平台的官方文档。
比赛形式为人形机器人障碍赛,参赛队控制1个人形智能体完成六项连续训练科目。参赛队员必须使用九格大模型控制人形机器人进行决策,人形机器人使用格物仿真环境中的人形机器人配置,同时参赛队伍可自行设计强化学习算法进一步优化九格大模型的控制效果。功能区包括起点区、物体拾取区、S形绕杆、平衡木区域、踩梅花桩区域、穿越门窗区域、物体放置区。
图4-1 人形机器人障碍赛比赛场地立体图
3.参赛要求
3.1 参赛人数
每队≤10人,指导教师≤2人。
3.2 设备规范
(1)主办方提供格物仿真环境,选手无需自备硬件。
(2)严禁更换九格大模型,仅允许完善优化算法、奖励函数设计及环境感知策略(主办方提供基础demo及培训)。
3.3 机器人技术要求
(1)机器人数量
每支参赛队可以用于比赛的机器人数量为一个。
(2)独立性
参加比赛的人形机器人必须是通过强化学习自主训练的,比赛中的任何手动控制行为都视为犯规,将会被取消比赛资格。当人形机器人开始执行任务后,参赛队将不能再次干预,之后的所有任务都将由人形机器人自主完成,直到比赛结束。
参赛队伍需要独立进行编码工作,并生成可加载运行的策略程序(.py文件等)。全场比赛一共进行七轮射门。
策略提交。参赛队伍需在规定时间内在比赛平台提交规定格式的策略文件,提交后系统会对策略文件进行格式、接口、重复度三项检测,三项检测全部通过即代表提交成功,策略提交成功方可进行自动比赛与排位。
策略查重。主办方会对队伍提交的策略文件进行相似度审核,若文件出现以下情况:1.策略与互联网上的开源策略相似度过高;2.策略与官方提供的样例策略相似度过高;3.不同参赛选手的策略互相之间相似度过高(一般策略相似度≥80%视为策略重复)。若出现策略重复,由仲裁委员会公布处理办法。
策略故障。若比赛中有一方队伍策略出现加载失败、报错、异常等情况,先出现故障的一方判负,比分显示为“异常”。
4.比赛过程
4.1 赛程赛制
(1)根据参赛队伍的数量,决定比赛的轮次。在时间允许的前提下,可进行两轮比赛(如果时间不允许,则比赛为一轮)。在比赛前各队进行抽签,所抽顺序决定参赛队在两轮比赛中的上场顺序。
(2)比赛环节中以裁判的命令为开始信号。
(3)比赛限时15分钟。
(4)比赛最后的名次按照任务得分的总和来排列(如果是两轮比赛,取各队两轮比赛的最高分进行排列),如果出现任务得分相同的队伍,则按照比赛用时来进行排定:任务得分相同的数只队伍,比赛用时短的名次排在前面。比赛过程中参赛队可以主动要求放弃比赛来获得较短的比赛终止时间。
(5)参赛队伍应准备好技术讲解PPT来对自己的策略技术进行讲解;比赛结束后需将完整比赛录制视频、源代码、汇报PPT、PPT讲解视频上传,上传压缩文件夹命名格式为项目名称_团队名称_EICON2025。
4.2 比赛任务
要求参赛队伍通过Unity ML-Agents框架训练人形机器人,使用九格大模型进行每步决策,在跑道中完成全自主体能训练任务。机器人需依托九格大模型的决策推理能力(必选,未使用直接判0分),结合强化学习算法从零开始学习,通过Unity物理引擎实现精准的运动控制,在标准化训练环境中依次完成拾取物体、S形绕杆、过平衡木、踩梅花桩、穿越门窗、放置物体六项军用体能科目。
具体任务要求如表4-2所示:
表4-2人形机器人障碍赛竞赛流程
任务序号 | 训练科目 | 任务要求 |
---|---|---|
任务一 | 拾取物体 | 拿到桌面上的爆破物 |
任务二 | S形绕杆 | 从起点出发绕杆跑到终点 |
任务三 | 平衡木 | 在平衡木上行走,不得落地 |
任务四 | 踩梅花桩 | 踩踏立桩中心,保持平衡通过 |
任务五 | 穿越门窗 | 穿越圆形门窗,不得碰撞 |
任务六 | 防止物体 | 将爆破物放置在目标区域 |
4.3 评分标准(共100分)
(1)最终比赛形式为线上比赛,最终得分障碍赛成绩70分,技术汇报30分加权计算总成绩。总成绩=障碍赛成绩+技术汇报得分。其中技术汇报包括比赛录制视频、源代码、汇报PPT、PPT讲解视频共计30分。
(2)比赛将按照每队机器人在各任务中的完成情况打分,若机器人在执行任务时未在规定时间穿过规定任务区域则视作任务执行失败,按0分计做此任务成绩,若机器人在执行任务时在规定时间内穿过任务区域则视作任务执行成功,按表4-3的评分标准进行判断。
表4-3 人形机器人障碍赛评分标准
任务 | 训练科目 | 得分规则 | 扣分项 |
---|---|---|---|
任务1 | 拾取物体 | 拿到爆破物+10分 | 未拿到得0分 |
任务2 | S形绕杆 | 绕过所有立杆+10分 | 未绕过所有立杆得0分 |
任务3 | 平衡木 | 通过平衡木+10分 | 从平衡木跌落得0分 |
任务4 | 踩梅花桩 | 成功通过所有梅花桩+10分 | 跌落立桩得0分(漏踩不扣分) |
任务5 | 穿越门窗 | 成功穿越门窗+10分 | 未能穿越得0分 |
任务6 | 放置物体 | 将爆破物放到指定区域+10分 | 未能放到指定区域得0分 |
(3)比赛将按照选手成绩(即任务总分)进行排名,如果出现比分相同的队伍,则按照完成比赛时间(即若机器人完赛则为各任务的总时间,若机器人未完赛则为完成任务的总时间)决定先后顺序(比分相同的数只队伍,确定时间较短的名次排在前面)。
以下为人形机器人障碍赛计分表:
表4-4 人形机器人障碍赛计分表
任务 | 是否完成 | 用时 | 备注 |
---|---|---|---|
任务一 | |||
任务二 | |||
任务三 | |||
任务四 | |||
任务五 | |||
任务六 | |||
技术汇报得分: |
4.4 违规处理
(1)技术违规:擅自修改禁止项,直接取消成绩。
(2)操作违规:未及时报告环境异常或干扰他队,扣10分/次。
(3)安全违规:人形机器人异常行为导致环境崩溃,一次扣5分,最多扣4次。
(4)重复率过高:若是最终提交策略重复率超过80%,直接取消比赛成绩。
5.其他说明
出现争议的情况以裁判判定为准。