English
全部
搜索
图片
视频
短视频
地图
资讯
更多
购物
航班
旅游
笔记本
报告不当内容
请选择下列任一选项。
无关
低俗内容
成人
儿童性侵犯
时长
全部
短(小于 5 分钟)
中(5-20 分钟)
长(大于 20 分钟)
日期
全部
过去 24 小时
过去一周
过去一个月
去年
清晰度
全部
低于 360p
360p 或更高
480p 或更高
720p 或更高
1080p 或更高
源
全部
Dailymotion
Vimeo
Metacafe
Hulu
VEVO
Myspace
MTV
CBS
Fox
CNN
MSN
价格
全部
免费
付费
清除筛选条件
安全搜索:
中等
严格
中等(默认)
关闭
筛选器
17:06
从经典PPO到PPO-RLHF(一) 构建RL到LLM的概念映射
已浏览 4364 次
2 个月之前
bilibili
东川路第一可爱猫猫虫
0:28
【Agent搭建】下班回家无聊整理了我实践过的10个Agent项目合集,好
…
已浏览 468 次
1 个月前
bilibili
大模型老杨
24:33
[Agentic RL] 12 verl infra AgentLoop 基本概念及流程,AgentLoopMan
…
已浏览 4329 次
1 个月前
bilibili
五道口纳什
7:35
Agent-R1: Reinforcement Learning for Autonomous LLM Agents
已浏览 124 次
2 个月之前
YouTube
AI Paper Review
1:19:21
Dhruv Rathee Exposes BJP IT Cell, Propaganda Films, Godi Media &
…
已浏览 724.4万 次
2 周前
YouTube
Learn By KK Create
Quick start: Build and deploy an agent
3 个月之前
ibm.com
Poster making on "SAVE THE ENVIRONMENT" in MS Word 2010
已浏览 3.3万 次
2019年8月23日
YouTube
Orchids eLearning
15:55
Policy Optimization & TRPO & PPO | RL原理讲解系列 #3
已浏览 11 次
5 个月之前
YouTube
Up-Fei
1:02:45
【LLM与LORA微调策略解读】大模型AI Agent入门到精通实战教程!包含
…
已浏览 246 次
4 个月之前
bilibili
什么都想学一点的喵
9:07
强推!2025最新版AI Agent(Agent langchain LLM LORA RAG)零基
…
已浏览 3141 次
1 年前
bilibili
大模型官方讲堂
25:30
【OPENAI-LLM模型优化总结】大模型AI Agent全方位实战教程:从入门到
…
已浏览 205 次
4 个月之前
bilibili
squirrel叽叽
4:46
【2025最新版】一个能让你彻底吃透Agent智能体的教程,包括(LLM Pr
…
已浏览 226 次
4 个月之前
bilibili
Agent大模型教程
5:19:47
【B站首发】这绝对是B站讲的最好的Agent智能体教程包含所有知识点(Ag
…
已浏览 1189 次
6 个月之前
bilibili
聚客Ai联盟
11:16
21.实验:RL agent→environment交互接口
已浏览 241 次
2023年8月3日
bilibili
大勇任卷舒
20:25
【Agent开发】B站最全最新的大模型AI Agent入门到精通实战教程!包含
…
已浏览 316 次
5 个月之前
bilibili
大模型Agent
1:48:27
【B站首推】这绝对是把Agent和多Agent的工作流开发讲的最透彻的教
…
已浏览 299 次
8 个月之前
bilibili
大模型有温度
15:14
[Agentic RL] 02 策略梯度基础,从 PG 到 TRPO 到 PPO-Clip 核心公式简
…
已浏览 4383 次
5 个月之前
bilibili
五道口纳什
0:55
Agent RL新框架 显著提升LLM多轮决策能力
已浏览 564 次
7 个月之前
bilibili
我不是AI科研的内鬼啊
16:08
RAG Agent RL实战指南(上):数据准备、模型下载与知识库构建|搭
…
已浏览 1445 次
5 个月之前
bilibili
唐国梁Tommy
2:17:32
【RLChina 2020】第9讲 Multi-agent Systems
已浏览 3238 次
2020年8月6日
bilibili
RLChina强化学习社区
13:47
Agent is all you need,verl自定义Agent Loop(python code交互)
…
已浏览 5406 次
2 个月之前
bilibili
偷星九月333
20:39
RAG Agent RL实战指南(下):从0到1部署检索服务,启动分布式强化学
…
已浏览 1061 次
5 个月之前
bilibili
唐国梁Tommy
11:14
B站强推!Agent工作流开发 从入门到精通实战教程!包含所有知识点(R
…
已浏览 115 次
10 个月之前
bilibili
monesyya
8:12
颠覆轨迹级RL!ARPO如何捕捉LLM工具交互的高熵时刻
已浏览 62 次
2 个月之前
bilibili
不忘初心6m6
15:22
【2025最新版】全网最强的的应用开发全套教程,包括(LLM RAG Flow
…
已浏览 779 次
5 个月之前
bilibili
仙人AI大模型
3:53
【B站首推】这绝对是把Agent和多Agent的工作流开发讲的最透彻的教
…
已浏览 317 次
5 个月之前
bilibili
跟着小张学大模型
1:00:30
[EP-6] ARPO: 初探Agent-RL算法
已浏览 3095 次
6 个月之前
bilibili
东一门饭桶
24:13
[RL4LLM] PPO workflow 及 OpenRLHF、veRL 初步介绍,ray d
…
已浏览 1.2万 次
1 年前
bilibili
五道口纳什
19:54
【Agent学习路线】2025最强的Agent从入门到精通教程!零基础
…
已浏览 378 次
6 个月之前
bilibili
AI产品经理学习路线
11:37
Power Apps Environments Explained
已浏览 6.3万 次
2021年3月1日
YouTube
Lisa Crosbie
观看更多视频
更多类似内容
反馈