Articles
165
Tags
34
Categories
0
Home
Archives
Tags
Categories
List
Music
Movie
Link
About
ALTNT's Hexo Blog
Home
Archives
Tags
Categories
List
Music
Movie
Link
About
大模型技术原理第四章
Created
2025-02-12
|
Updated
2025-02-25
|
Post Views:
Hey, password is required here.
Author:
ALTNT
Link:
http://blog.705553939.xyz/2025/02/12/%E8%B5%84%E6%96%99/%E5%A4%A7%E6%A8%A1%E5%9E%8B/%E7%AC%AC%E5%9B%9B%E7%AB%A0/
Copyright Notice:
All articles in this blog are licensed under
CC BY-NC-SA 4.0
unless stating additionally.
资料
大模型
LLM
Previous
Boosting crop classification by hierarchically fusing satellite, rotational, and contextual data
Next
大模型技术原理第三章
Related Articles
2025-02-10
大模型技术原理第一章
2025-02-10
大模型技术原理第二章
2025-03-10
大模型技术原理第五章
2025-03-25
大模型技术原理第六章
2025-02-12
大模型技术原理第三章
2024-11-11
命令
ALTNT
Articles
165
Tags
34
Categories
0
Follow Me
Announcement
This is my Blog
Contents
1.
大模型技术原理第四章——参数高效微调
1.1.
参数高效微调简介
1.1.1.
监督微调
1.1.1.1.
全量监督微调的挑战
1.1.1.2.
解决挑战的办法——PEFT
1.1.1.2.1.
参数附加方法
1.1.1.2.2.
参数选择方法
1.1.1.2.3.
低秩适配方法
1.2.
参数附加方法
1.2.1.
加在输入
1.2.1.1.
Prompt-tuning
1.2.1.1.1.
软提示
1.2.2.
加在模型
1.2.2.1.
prefix-tuning
1.2.2.2.
Adapter-tuning
1.2.3.
加在输出
1.2.3.1.
代理微调
1.3.
参数选择方法(在大模型上其实用的不多,见后面)
1.3.1.
基于规则的方法
1.3.1.1.
(1)BitFit 方法
1.3.2.
基于学习的方法
1.3.2.1.
Child-tuning
1.3.3.
参数选择方法优缺点
1.4.
低秩适配方法(LoRA)
1.4.1.
lora 性能影响因素
1.4.1.1.
影响因素 1:权重初始化
1.4.1.2.
影响因素 2:秩的影响
1.4.1.3.
影响因素 3:施加位置影响
1.4.2.
LoRA 参数效率分析
1.4.3.
LoRA 相关变体
1.4.3.1.
变体 1: AdaLoRA
1.4.3.2.
变体 2: LoRAHub
1.4.3.3.
变体 3:QLoRA
1.4.3.4.
变体 4: S-LoRA
1.5.
参数微调的应用
1.5.1.
应用 1
1.5.2.
应用 2
1.5.3.
应用 3
1.5.4.
应用 4
1.5.5.
应用 5
Recent Post
周报2025年6月8日
2025-06-09
The 20 m Africa rice distribution map of 2023
2025-06-04
DCM————DeepCropMapping: A multi-temporal deep learning approach with improved spatial generalizability for dynamic corn and soybean mapping
2025-06-04
重新复现CACM记录
2025-06-04
机器学习相关概念
2025-05-26