强化学习必修课：引领人工智能新时代

强化学习必修课：引领人工智能新时代 - 果核剥壳

2024年6月19日下午12:12 • 学习视频

【氮气AI】果核旗下AI聚合聊天工具，支持GPT4.0等多种模型和绘画【免费体验】

ch*tg*t的大火让很多人见识到了强化学习的强大,一个简单的rlhf原来可以做到这么牛逼!这恰恰就是强化学习的魅力了.本课程大家将了解到强化学习在机器人控制、自动驾驶、推荐系统等领域的应用和前景。同时，梗直哥瞿炜还将带领大家探讨强化学习与其他人工智能技术的结合，如自然语言处理、计算机视觉等，这些技术的结合将为智能时代带来更加广阔的发展空间

课程目录

强化学习必修课：引领智能新时代
├─ 1_1-1-课程内容和理念.mp4
├─ 1_10-1-基于模型的强化学习核心思想和原理.mp4
├─ 1_11-1模仿学习.mp4
├─ 1_12-1-项目实战：Gym游戏.mp4
├─ 1_2-1-线性代数.mp4
├─ 1_3-1-CUDA+Anaconda深度学习环境配置.mp4
├─ 1_4-1-序列建模与概率图模型.mp4
├─ 1_5-1-动态回归核心思想和原理.mp4
├─ 1_6-1-蒙特卡洛方法.mp4
├─ 1_7-1-深度Q网络核心思想和原理.mp4
├─ 1_8-1-策略梯度核心思想和原理.mp4
├─ 1_9-1-演员评论家算法核心思想和原理.mp4
├─ 2_1-2-认识强化学习.mp4
├─ 2_10-2-Dyna-Q算法.mp4
├─ 2_11-2-博弈论与强化学习.mp4
├─ 2_12-2-项目实战：大模型RLHF.mp4
├─ 2_2-2-微积分.mp4
├─ 2_3-2-conda使用命令.mp4
├─ 2_4-2-马尔可夫观测过程：学会“看”.mp4
├─ 2_5-2-策略迭代.mp4
├─ 2_6-2-时序差分方法.mp4
├─ 2_7-2-DQN-代码实现.mp4
├─ 2_8-2-蒙特卡洛策略梯度.mp4
├─ 2_9-2-改进型演员评论家算法.mp4
├─ 3_1-3-课程使用的技术栈.mp4
├─ 3_10-3-Dyna-Q算法代码实现.mp4
├─ 3_11-3-多智能体强化学习.mp4
├─ 3_12-3-强化学习最新发展趋势.mp4
├─ 3_2-3-概率.mp4
├─ 3_3-3-Jupyter-Notebook快速上手.mp4
├─ 3_4-3-马尔可夫决策过程：试着-“干”.mp4
├─ 3_5-3-价值迭代.mp4
├─ 3_6-3-蒙特卡洛方法和时序差分代码实现.mp4
├─ 3_7-3-常见问题改进和扩展.mp4
├─ 3_8-3-策略梯度方法代码实现.mp4
├─ 3_9-3-演员评论家算法代码实现.mp4
├─ 4_10-4-基于模型的策略优化.mp4
├─ 4_11-4-MADDP的代码实现.mp4
├─ 4_12-4-下一步的学习建议.mp4
├─ 4_3-4-仿真环境Gym安装.mp4
├─ 4_4-4-马尔可夫奖励过程：懂得“想”.mp4
├─ 4_5-4-动态规划代码实现.mp4
├─ 4_6-4-广义策略迭代.mp4
├─ 4_7-4-DQN改进算法代码实现.mp4
├─ 4_8-4-近端策略优化算法.mp4
├─ 4_9-4-深度确定性策略梯度.mp4
├─ 5_10-5-MBPO的代码实现.mp4
├─ 5_11-5-AlphaStar系统.mp4
├─ 5_3-5-深度学习库PyTorch的安装.mp4
├─ 5_4-5-贝尔曼方程：迭代求解价值函数.mp4
├─ 5_6-5-Q-Learning算法.mp4
├─ 5_8-5-近端策略优化（PPO）代码实现.mp4
├─ 5_9-5-DDPG算法代码实现.mp4
├─ 6_11-6-基于人类反馈大强化学习.mp4
├─ 6_4-6-模型分类与选择itdjs_com.mp4
├─ 6_6-6-SARSA算法.mp4
├─ 6_9-6-软性演员评论家算法.mp4
├─ 7_4-7-常见问题解析.mp4
├─ 7_6-7-Q-Learning&SARSA代码实现.mp4
├─ 7_9-7-SAC代码实现.mp4
└─ 8_4-8-马尔可夫过程代码实现.mp4

下载地址

隐藏内容，VIP可见

如果您喜欢本站，点击这儿不花一分钱捐赠本站

这些信息可能会帮助到你：下载帮助 | 报毒说明 | 进站必看

修改版本安卓软件，加群提示为修改者自留，非本站信息，注意鉴别

发表回复

hujun 2024年10月22日

太酷啦

评论于【WordPress主题】CoreNext v1.6.8
hujun 2024年10月22日

太酷啦

评论于【正版特惠】桌面悬浮浏览器 - Floweb
123926 2024年10月22日

歌词显示乱码

评论于 SimMusic(音乐播放器) v0.2.1 绿色版
ikochina 2024年10月22日

我这报错代码是184

评论于 Adobe Photoshop 2025 (26.0.0.26) 特别版
Carl 2024年10月22日

很棒，可以用到明年五月份。五月之后能有新的激活码吗？

评论于金山PDF专业版 v12.8.0.15662
3988977 2024年10月22日

共享不正常，死活访问不了局域网内其他的电脑

评论于【果核】Windows11 LTSC 26100.2033 优化版
ikochina 2024年10月22日

关闭了华为乾坤和wd，安装到最后失败，发现已经安装上，不过使用过程闪退

评论于 Adobe Photoshop 2025 (26.0.0.26) 特别版
大汉小将军 2024年10月22日

我现在小一点的软件就用这个下载，希望能支持下，穷逼，买不了会员

评论于 ReName(文件重命名工具) v1.0 绿色版
2738343138 2024年10月22日

没源

评论于 SimMusic(音乐播放器) v0.2.1 绿色版
Mr.P 2024年10月22日

QQ直接塞了个游戏引擎进去。

评论于 WinZip v29.0 中文注册版

强化学习必修课：引领人工智能新时代 - 果核剥壳

课程目录

下载地址

相关推荐

发表回复