Gym Retro是一个用于游戏强化学习研究的平台,提供了超过1,000款游戏,包括多个游戏主机的经典游戏,可用于研究RL算法的泛化能力和解决不同游戏之间的挑战。
Dopamine 是一个由谷歌开发的强化学习研究框架,旨在快速原型化和测试新的算法,适合学术研究和实际应用。
rllab 是一个强大的强化学习框架,提供了从环境实现到算法开发的全套工具,支持与 OpenAI Gym 的集成,并且能够在 EC2 上高效运行计算任务,适合科研、教育和企业应用。
Sparrow是一款先进的信息寻求型对话代理,通过人类反馈的强化学习,提供更有用、准确和无害的对话体验。
Reinforcement Learning Coach 是一个模块化的 Python 框架,用于建模智能体与环境的互动,支持多种环境和算法,具有强大的数据收集和可视化功能。