English
全部
搜索
图片
视频
短视频
地图
资讯
更多
购物
航班
旅游
笔记本
报告不当内容
请选择下列任一选项。
无关
低俗内容
成人
儿童性侵犯
时长
全部
短(小于 5 分钟)
中(5-20 分钟)
长(大于 20 分钟)
日期
全部
过去 24 小时
过去一周
过去一个月
去年
清晰度
全部
低于 360p
360p 或更高
480p 或更高
720p 或更高
1080p 或更高
源
全部
Dailymotion
Vimeo
Metacafe
Hulu
VEVO
Myspace
MTV
CBS
Fox
CNN
MSN
价格
全部
免费
付费
清除筛选条件
安全搜索:
中等
严格
中等(默认)
关闭
筛选器
RLHF: Understanding Reinforcement Learning from Hu
…
已浏览 3242 次
2024年9月18日
coursera.org
2:44
What is Reinforcement Learning from Human Feedback (RLHF)? |
…
2023年4月20日
techtarget.com
Understanding RLHF From Scratch
已浏览 2 次
5 个月之前
substack.com
3:27
1.1K views · 101 reactions | A new short course on Reinforcement...
已浏览 1147 次
1 个月前
Facebook
DeepLearning.AI
45:51
RLHF Visualizer | Hands-on Reinforcement Learning
已浏览 3048 次
4 个月之前
YouTube
Vizuara
6:25
Reinforcement Learning from Human Feedback (RLHF) - Beginn
…
已浏览 1972 次
2024年7月13日
YouTube
AI Foundation Learning
59:15
Reinforcement Learning with Human Feedback (RLHF)
已浏览 2511 次
2024年1月31日
YouTube
AI Makerspace
19:39
Reinforcement Learning, RLHF, & DPO Explained
已浏览 1.6万 次
2024年6月12日
YouTube
Mark Hennings
0:57
How RLHF Creates Human-Like AI
已浏览 2221 次
2025年2月7日
YouTube
SCALER
1:18:00
RLHF Explained & Coded (feat. PPO)
已浏览 230 次
6 个月之前
YouTube
AIArchives
[Interesting content] InstructGPT, RLHF and SFT
已浏览 1 次
2023年1月24日
substack.com
4:06
Reinforcement Learning with Human Feedback (RLHF) in 4 minutes
已浏览 1.2万 次
2025年2月8日
YouTube
Sebastian Raschka
9:44
RLAIF Reinforcement Learning with AI Feedback or Aligning Large La
…
已浏览 1335 次
2023年9月6日
YouTube
AI WITH Rithesh
15:31
Reinforcement Learning with Human Feedback (RLHF) - How to train an
…
已浏览 3.2万 次
2024年2月12日
YouTube
Serrano.Academy
1:01:01
Mastering RLHF with AWS: A Hands-on Workshop on Reinforce
…
已浏览 2.5万 次
2023年8月3日
YouTube
DeepLearningAI
11:29
Reinforcement Learning from Human Feedback (RLHF) Explained
已浏览 7.7万 次
2024年8月7日
YouTube
IBM Technology
6:31
Reinforcement Learning: ChatGPT and RLHF
已浏览 2.4万 次
2023年8月14日
YouTube
Graphics in 5 Minutes
3:14:37
RLHF from scratch, step-by-step, in code
已浏览 129 次
8 个月之前
YouTube
Ashwani Kumar
22:44
RLHF Workflow: From Reward Modeling to Online RLHF
已浏览 158 次
2024年5月14日
YouTube
Arxiv Papers
8:21
RLHF: The Secret Sauce of AI
已浏览 2 次
5 个月之前
YouTube
ShorbornoLABS
11:30
挑战11分钟搞定,AI大模型之RLHF全流程解析
已浏览 47 次
2 个月之前
bilibili
AI大模型入门教学
5:07
What Is RLHF? Simple Guide (2025)
已浏览 7 次
4 个月之前
YouTube
Allow AI
24:31
DPO Meets PPO: Reinforced Token Optimization for RLHF
已浏览 171 次
2024年4月30日
YouTube
Arxiv Papers
13:17
RLHF大模型加强学习机制原理介绍
已浏览 1.9万 次
2023年9月8日
bilibili
AI大实话
36:14
How to Code RLHF on LLama2 w/ LoRA, 4-bit, TRL, DPO
已浏览 1.7万 次
2023年8月31日
YouTube
Discover AI
20:28
RLHF: Training Language Models to Follow Instructions with Human F
…
已浏览 2127 次
2024年3月22日
YouTube
DataMListic
7:51
Generative Reward Models: Merging the Power of RLHF and RLAIF for
…
已浏览 2115 次
2024年10月27日
YouTube
AI Papers Academy
10:17
Reinforcement Learning through Human Feedback - EXPLAINED! |
…
已浏览 2.9万 次
2023年12月11日
YouTube
CodeEmporium
Reinforcement Learning from Human Feedback From Zero to Ch
…
已浏览 2.2万 次
2022年12月13日
YouTube
HuggingFace
0:58
Exploring how RLHF improves AI systems beyond alignment – creat
…
已浏览 98 次
4 个月之前
YouTube
Doom Machine
观看更多视频
更多类似内容
反馈