2026-04-03 08:01:26

一篇论文让我停下来看了半小时 S0 Tuning

核心idea：不改模型权重，只调一个初始状态矩阵，就能大幅提升模型coding能力。
在Qwen3.5-4B上，只用48个HumanEval训练样本（不是48K，是48个），S0 tuning把pass@1提升了23.6个百分点。
对比LoRA，S0高了10.8个百分点。p值<0.001，统计显著。
在FalconH1-7B上，S0达到71.8%。
这意味调完之后模型速度不变，大小不变，只是"起跑位置"更好了。
对做本地模型部署的人来说，这打开了一扇门：拿一个通用模型，用几十个领域样本把它调成专用模型，不付任何性能代价。
论文在arxiv: 2604.01168。做模型适配的人应该读一下

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

请输入评论内容

暂无评论

热门话题
查看更多
#
Gate广场四月发帖挑战
10.1万热度
#
加密市场行情震荡
9.66万热度
#
国际油价走高
15.43万热度
#
伊朗标志性桥梁遭轰炸
45.51万热度
#
SpaceXIPO冲刺2万亿美元估值
35.83万热度

热门 Gate Fun
查看更多

1
LELE
乐乐
市值:$2224.13持有人数:1
0.00%
2
op
op
市值:$2234.48持有人数:1
0.00%
3
火箭
HJ
市值:$2231.03持有人数:0
0.00%
4
SHRK
BABY SHARK O
市值:$2246.35持有人数:2
0.24%
5
￥
rmb
市值:$2238.35持有人数:2
0.00%

一篇论文让我停下来看了半小时 S0 Tuning

热门话题

Gate广场四月发帖挑战

加密市场行情震荡

国际油价走高

伊朗标志性桥梁遭轰炸

SpaceXIPO冲刺2万亿美元估值

热门 Gate Fun

LELE

乐乐

op

op

火箭

HJ

SHRK

BABY SHARK O

￥

rmb

置顶