Articles
165
Tags
34
Categories
0
Home
Archives
Tags
Categories
List
Music
Movie
Link
About
ALTNT's Hexo Blog
Home
Archives
Tags
Categories
List
Music
Movie
Link
About
大模型技术原理第五章
Created
2025-03-10
|
Updated
2025-03-25
|
Post Views:
Hey, password is required here.
Author:
ALTNT
Link:
http://blog.705553939.xyz/2025/03/10/%E8%B5%84%E6%96%99/%E5%A4%A7%E6%A8%A1%E5%9E%8B/%E7%AC%AC%E4%BA%94%E7%AB%A0/
Copyright Notice:
All articles in this blog are licensed under
CC BY-NC-SA 4.0
unless stating additionally.
资料
大模型
LLM
Previous
ai工具在数据获取中的应用
Next
CROMA: Remote Sensing Representations with Contrastive Radar-Optical Masked Autoencoders
Related Articles
2025-02-10
大模型技术原理第一章
2025-02-10
大模型技术原理第二章
2025-03-25
大模型技术原理第六章
2025-02-12
大模型技术原理第四章
2025-02-12
大模型技术原理第三章
2024-11-11
命令
ALTNT
Articles
165
Tags
34
Categories
0
Follow Me
Announcement
This is my Blog
Contents
1.
大模型技术原理第五章
1.1.
一、模型编辑介绍
1.1.1.
问题背景
1.1.2.
可能的解决方案
1.1.3.
模型编辑的思想
1.1.4.
模型编辑的挑战
1.1.5.
模型编辑关键性质
1.1.5.1.
1、准确性
1.1.5.2.
2、泛化性
1.1.5.3.
3、可迁移性
1.1.5.4.
4、局部性
1.1.5.5.
5、高效性
1.1.6.
模型编辑常见数据集
1.2.
二、模型编辑方法
1.2.1.
两个总大类——外部拓展法和内部修改法
1.2.2.
外部拓展法
1.2.2.1.
知识缓存法
1.2.2.1.1.
SERAC
1.2.2.2.
附加参数法
1.2.2.2.1.
CALINET
1.2.2.2.2.
T-Patcher
1.2.2.2.2.1.
损失函数需要保证准确性和局部性
1.2.3.
内部修改法
1.2.3.1.
元学习法
1.2.3.1.1.
MEND
1.2.3.2.
定位编辑法
1.2.3.2.1.
KN
1.2.3.2.2.
ROME(当前比较火)
1.2.3.2.2.1.
通过因果跟踪实验和阻断实验定位知识所在
1.2.3.2.2.2.
因果跟踪实验
1.2.3.2.2.3.
T-patcher 和 ROME 的区别
1.2.3.2.2.4.
损失函数
1.2.3.2.3.
MEMIT(一次关注多个 ffn)
1.3.
三、模型编辑的应用
Recent Post
周报2025年6月8日
2025-06-09
The 20 m Africa rice distribution map of 2023
2025-06-04
DCM————DeepCropMapping: A multi-temporal deep learning approach with improved spatial generalizability for dynamic corn and soybean mapping
2025-06-04
重新复现CACM记录
2025-06-04
机器学习相关概念
2025-05-26