漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-29 talkingdev

DittoGym:学习控制柔性变形机器人技术

柔性机器人由于其大量的控制空间而具有挑战性。这项工作引入了一个模拟器,其中包含用于操作柔性“Ditto”对象的各种任务。它包含实用程序、可视化和一些强大的基准。

Read More
2023-12-13 talkingdev

FamO2O框架,提高状态自适应平衡的RL算法

研究人员引入了FamO2O框架,旨在通过确定基于状态的最佳平衡来改进和约束当前的离线到在线RL算法的能力。该框架可自适应地根据环境状态调整平衡,以确保算法在不同的环境下都能得到最优的表现。FamO2O框架可以在多种...

Read More
2023-11-28 talkingdev

RLHF的替代方案,DPO实现方案开源

直接偏好优化是使用非常相似的数据的RLHF的稳定替代方法。该存储库包含一个实现,用于学习该技术。虽然DPO是一种新兴的技术,但它在许多情况下都能够提供比强化学习更好的结果。它非常适合解决一些现实世界中的问题...

Read More
2023-10-19 talkingdev

Mujoco3开源,物理仿真器速度更快稳定性更高

最新版本的Mujoco——一款流行的基于物理的仿真器已经发布。这个版本的仿真速度更快,稳定性得到了大大提升,可以更好地帮助用户模拟各种物理现象。Mujoco是一种专门用于机器人学习的仿真器,它通过计算机模拟现实世界...

Read More
2023-07-31 talkingdev

谷歌机器人新突破:transformer模型助力机器人性能全面提升

transformer模型帮助机器人看,帮助机器人计划,甚至帮助机器人控制?看起来,变形金刚正在继续吞噬世界,这是谷歌在机器人技术方面的最新尝试,利用强大的预训练模型改善机器人的各种性能。这一新的尝试使得机器人...

Read More
2023-06-21 talkingdev

DeepMind发布新的机器人控制

Gato于一年前发布,立即成为热门话题。建立在Gato之上的RoboCat是一个具有语言能力的机器人系统,可以在不到100个步骤中学习新任务。这似乎是语言能力机器人领域迈出的一大步。

Read More