查看: 266|回复: 1

[聊技术] 吧友有用纯RL方法grpo训练医疗数据集或者金融股票数据集的吗

[复制链接]

4

主题

17

回帖

41

积分

一年会员

Rank: 2

积分
41
发表于 2025-3-20 11:10:45 | 显示全部楼层 |阅读模式
目前想让本地部署的deepseek用纯RL方法grpo在医疗领域或者其他领域训练,但我目前在github上看到的用grpo训练的基本都是用数学数据集,没看到用grpo训练医疗或者其他领域数据集的,拜托各位帮忙
吧友有用纯RL方法grpo训练医疗数据集或者金融股票数据集的吗-1.png



吧友有用纯RL方法grpo训练医疗数据集或者金融股票数据集的吗-4.jpg
回复

使用道具 举报

3

主题

12

回帖

31

积分

新手上路

Rank: 1

积分
31
发表于 2025-3-20 11:41:32 | 显示全部楼层
懂了谢谢大佬
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

特惠

限量优惠活动

正在火热进行

站长

添加站长微信

领取运营礼包

下载

便携运营智库

立即下载APP

工具

运营工具导航

AI工具导航

帮助

帮助中心

常见问题

顶部