查看: 263|回复: 3

[聊技术] 求救啊有没有会用ai的我们要求从海量的数据里提取出出行链

[复制链接]

8

主题

21

回帖

65

积分

注册会员

Rank: 2

积分
65
发表于 2025-3-20 08:58:18 | 显示全部楼层 |阅读模式
我们要求从内容里提取出行链但是只能几条几条的让ai提取生成,数量一多就无法生成而且错误也很多,有没有什么直接的ai模型和指令让他能直接大量提取且不犯错啊
求救啊有没有会用ai的我们要求从海量的数据里提取出出行链-1.jpg
求救啊有没有会用ai的我们要求从海量的数据里提取出出行链-2.jpg
回复

使用道具 举报

4

主题

16

回帖

42

积分

新手上路

Rank: 1

积分
42
发表于 2025-3-20 08:59:18 | 显示全部楼层
这种有多种方法。例如,可以长文分割成交叉覆盖的512或更大窗口尺寸的标准长度文样本,类似于向量数据库的分割法与上下文关联法,再用transformers小模型微调分类器集群分类筛选有行程的样本,再用微调后的大模型对有限的样本及上下文提炼行程。小模型集群可以灵活分工组织分类任务,就象RAID那样可省时间也可提高可靠性。
回复 支持 反对

使用道具 举报

4

主题

14

回帖

35

积分

新手上路

Rank: 1

积分
35
发表于 2025-3-20 09:00:08 | 显示全部楼层
传统NLP分类器也行,快是快,但质量比小模型还差些,分类后再用大模型对正样本加上有限上下文提取。
回复 支持 反对

使用道具 举报

3

主题

20

回帖

45

积分

一年会员

Rank: 2

积分
45
发表于 2025-3-22 08:01:18 | 显示全部楼层
支持支持再支持
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

特惠

限量优惠活动

正在火热进行

站长

添加站长微信

领取运营礼包

下载

便携运营智库

立即下载APP

工具

运营工具导航

AI工具导航

帮助

帮助中心

常见问题

顶部