微信扫码实时跟踪AI前沿
如果你的模拟器是生成式AI,它可以实现零-shot迁移机器人策略!DeepMind和同事的这项工作解决了强化学习通常无法推广到训练环境之外的挑战。如果我们把所有东西都作为训练环境,那么就没有必要进行推广了。
在机器人行业中,一个机器人的策略是指引其行为的算法。这种策略通常与其任务特定型的机器人紧密相连,这使得机器人很难进行适应性修改。然而,谷歌最新的工作研究推出了一种单一的策略,这一策略包含550亿个参数,...