Offline Motion Tracking
这个教程使用 root project 里的 tracking policy 和离线动作参考。
Sim2Sim
先启动 MuJoCo 执行进程:
uv run sim2real/sim_env/base_sim.py --robot g1
在第二个终端启动 tracking policy:
uv run sim2real/rl_policy/tracking.py \
--robot g1 \
--policy_config checkpoints/lafan-aa/policy-ec592bb4_lafan_100style_student-5000.yaml
两个进程各自负责:
sim2real/sim_env/base_sim.py在 MuJoCo 里执行low_cmd,并发布low_statesim2real/rl_policy/tracking.py消费low_state,跑导出的 policy,再发出下一帧low_cmd
两个进程都起来后,在 policy 终端按 ] 开始跟踪,然后在 MuJoCo viewer 里按 9 关闭虚拟 gantry。
Sim2Real
把 MuJoCo 执行进程换成 real bridge:
uv run scripts/real_bridge.py
在第二个终端运行同一个 tracking policy:
uv run sim2real/rl_policy/tracking.py \
--robot g1 \
--policy_config checkpoints/lafan-aa/policy-ec592bb4_lafan_100style_student-5000.yaml
两个进程各自负责:
scripts/real_bridge.py把 Unitree DDS 的low_state/low_cmd接到统一 ZMQ runtimesim2real/rl_policy/tracking.py在 sim2sim 和 sim2real 两种模式下保持不变