查看: 200|回复: 5

[聊技术] 单4060ti16G运行qwq-32b-gptq-int4

[复制链接]

5

主题

19

回帖

50

积分

一年会员

Rank: 2

积分
50
发表于 4 天前 | 显示全部楼层 |阅读模式
生成质量确实好,但耗时不能忍。
回复

使用道具 举报

5

主题

14

回帖

39

积分

新手上路

Rank: 1

积分
39
发表于 4 天前 | 显示全部楼层
只截了部分图,中间多个部分没截省了。

单4060ti16G运行qwq-32b-gptq-int4-1.jpg

单4060ti16G运行qwq-32b-gptq-int4-2.jpg

单4060ti16G运行qwq-32b-gptq-int4-3.jpg

单4060ti16G运行qwq-32b-gptq-int4-4.jpg

单4060ti16G运行qwq-32b-gptq-int4-5.jpg

单4060ti16G运行qwq-32b-gptq-int4-6.jpg

单4060ti16G运行qwq-32b-gptq-int4-7.jpg

单4060ti16G运行qwq-32b-gptq-int4-8.jpg
回复 支持 反对

使用道具 举报

1

主题

11

回帖

20

积分

新手上路

Rank: 1

积分
20
发表于 4 天前 | 显示全部楼层
是4096截断token
回复 支持 反对

使用道具 举报

4

主题

9

回帖

24

积分

新手上路

Rank: 1

积分
24
发表于 4 天前 | 显示全部楼层
我的主板较老,AMD20年的CPU和微星主板,不支持PCIE4.0,显存内存间传输会较慢,用内存暂存显存内容时,数据页交换会很吃亏,而内存也只是DDR4。
回复 支持 反对

使用道具 举报

4

主题

15

回帖

37

积分

一年会员

Rank: 2

积分
37
发表于 4 天前 | 显示全部楼层
期盼国产算力突破,早日万元出头能买到接近4090的卡,添5千48G显存。
回复 支持 反对

使用道具 举报

3

主题

19

回帖

44

积分

新手上路

Rank: 1

积分
44
发表于 昨天 13:22 来自手机 | 显示全部楼层
楼主,我这人不太会说话,如果有什么冒犯的地方,你他妈来打我啊!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

特惠

限量优惠活动

正在火热进行

站长

添加站长微信

领取运营礼包

下载

便携运营智库

立即下载APP

工具

运营工具导航

AI工具导航

帮助

帮助中心

常见问题

顶部