强化学习 | 未来百科

强化学习

Gym Retro是一个用于游戏强化学习研究的平台，提供了超过1,000款游戏，包括多个游戏主机的经典游戏，可用于研究RL算法的泛化能力和解决不同游戏之间的挑战。

Dopamine 是一个由谷歌开发的强化学习研究框架，旨在快速原型化和测试新的算法，适合学术研究和实际应用。

rllab 是一个强大的强化学习框架，提供了从环境实现到算法开发的全套工具，支持与 OpenAI Gym 的集成，并且能够在 EC2 上高效运行计算任务，适合科研、教育和企业应用。

Deepmind Sparrow AI

Sparrow是一款先进的信息寻求型对话代理，通过人类反馈的强化学习，提供更有用、准确和无害的对话体验。

Reinforcement Learning Coach 是一个模块化的 Python 框架，用于建模智能体与环境的互动，支持多种环境和算法，具有强大的数据收集和可视化功能。