avatar
Articles
200
Tags
38
Categories
0

Home
Archives
Tags
Categories
List
  • Music
  • Movie
Link
About
ALTNT's Hexo Blog
Home
Archives
Tags
Categories
List
  • Music
  • Movie
Link
About

Learning the Optimal Stopping for Early Classification within Finite Horizons via Sequential Probability Ratio Test

Created2025-09-15|Updated2025-09-15
|Post Views:
Author: ALTNT
Link: http://blog.705553939.xyz/2025/09/15/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/%E5%9B%BE%E5%83%8F%E5%A4%84%E7%90%86/2024-DINOv2/
Copyright Notice: All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.
图像处理自监督
Previous
Deep learning with multi-scale temporal hybrid structure for robust crop mapping
Next
周报2025年9月14日
avatar
ALTNT
Articles
200
Tags
38
Categories
0
Follow Me
Announcement
This is my Blog
Contents
  1. 1. DINOv2: Learning Robust Visual Features without Supervision
    1. 1.1. 一、研究背景与目标
    2. 1.2. 二、核心技术方案
      1. 1.2.1. (一)数据处理:构建LVD-142M数据集
      2. 1.2.2. (二)自监督预训练方法
      3. 1.2.3. (三)高效训练优化
    3. 1.3. 三、实验验证与结果
      1. 1.3.1. (一)消融实验:关键组件有效性
      2. 1.3.2. (二)基准测试结果
      3. 1.3.3. (三)定性分析
    4. 1.4. 四、公平性与环境影响
      1. 1.4.1. (一)公平性分析
      2. 1.4.2. (二)碳足迹(表14)
    5. 1.5. 五、结论与未来工作
    6. 1.6. 六、关键资源
    7. 1.7. 摘要
    8. 1.8. 1 引言
    9. 1.9. 2 相关工作
      1. 1.9.1. 2.1 图像内自监督训练
      2. 1.9.2. 2.2 判别式自监督学习
      3. 1.9.3. 2.3 自监督预训练的规模扩展
      4. 1.9.4. 2.4 自动化数据精选
    10. 1.10. 3 数据处理
      1. 1.10.1. 3.1 数据源
      2. 1.10.2. 3.2 去重(Deduplication)
      3. 1.10.3. 3.3 自监督图像检索(Self-supervised image retrieval)
      4. 1.10.4. 3.4 实现细节(Implementation Details)
    11. 1.11. 4 判别式自监督预训练
      1. 1.11.1. 4.1 图像级目标(Image-level objective,Caron等人,2021)
      2. 1.11.2. 4.2 图像块级目标(Patch-level objective,Zhou等人,2022a)
      3. 1.11.3. 4.3 解耦两类目标的头部权重(Untying head weights between both objectives)
      4. 1.11.4. 4.4 Sinkhorn-Knopp中心化(Sinkhorn-Knopp centering,Caron等人,2020)
      5. 1.11.5. 4.5 KoLeo正则化(KoLeo regularizer,Sablayrolles等人,2019)
      6. 1.11.6. 4.6 分辨率适配(Adapting the resolution,Touvron等人,2019)
    12. 1.12. 5 高效实现方案
      1. 1.12.1. 5.1 快速且内存高效的注意力机制(Fast and memory-efficient attention)
      2. 1.12.2. 5.2 序列打包(Sequence packing)
      3. 1.12.3. 5.3 高效随机深度(Efficient stochastic depth)
      4. 1.12.4. 5.4 全分片数据并行(Fully-Sharded Data Parallel, FSDP)
      5. 1.12.5. 5.5 模型蒸馏(Model distillation)
    13. 1.13. 6 消融实验
      1. 1.13.1. 6.1 改进的训练方案(Improved Training Recipe)
      2. 1.13.2. 6.2 预训练数据源(Pretraining Data Source)
      3. 1.13.3. 6.3 模型规模与数据规模(Model Size and Data)
      4. 1.13.4. 6.4 损失组件(Loss Components)
      5. 1.13.5. 6.5 知识蒸馏的影响(Impact of Knowledge Distillation)
      6. 1.13.6. 6.6 分辨率的影响(Impact of Resolution)
    14. 1.14. 7 实验结果
      1. 1.14.1. 7.1 基准模型选择(Baselines)
      2. 1.14.2. 7.1 ImageNet分类任务(ImageNet Classification)
        1. 1.14.2.1. 与自监督模型对比
        2. 1.14.2.2. 与弱监督模型对比
        3. 1.14.2.3. 骨干网络微调可行性
      3. 1.14.3. 7.2 额外图像与视频分类基准测试(Additional Image and Video Classification Benchmarks)
        1. 1.14.3.1. 细粒度图像分类
        2. 1.14.3.2. 视频动作分类
        3. 1.14.3.3. 12项迁移分类任务
      4. 1.14.4. 7.3 实例识别任务(Instance Recognition)
      5. 1.14.5. 7.4 密集识别任务(Dense Recognition Tasks)
        1. 1.14.5.1. 语义分割
          1. 1.14.5.1.1. 冻结骨干网络在最优分割流程中的应用
        2. 1.14.5.2. 单目深度估计
      6. 1.14.6. 7.5 定性分析结果(Qualitative Results)
        1. 1.14.6.1. 语义分割与深度估计
        2. 1.14.6.2. 分布外泛化
        3. 1.14.6.3. patch特征PCA分析
        4. 1.14.6.4. 跨图像patch匹配
    15. 1.15. 8 公平性与偏差分析
      1. 1.15.1. 8.1 地理公平性(Geographical Fairness)
      2. 1.15.2. 8.2 性别、肤色与年龄偏差(Gender, Skintones and Age)
    16. 1.16. 10 未来工作与讨论
Recent Post
周报2025年12月7日2025-12-08
周报2025年11月30日2025-11-30
LP-FT2025-11-23
周报2025年11月22日2025-11-22
In-season crop progress in unsurveyed regions using networks trained on synthetic data2025-11-16
©2020 - 2025 By ALTNT
Framework Hexo|Theme Butterfly