avatar
Articles
165
Tags
34
Categories
0

Home
Archives
Tags
Categories
List
  • Music
  • Movie
Link
About
ALTNT's Hexo Blog
Home
Archives
Tags
Categories
List
  • Music
  • Movie
Link
About

STraT代码阅读

Created2024-11-19|Updated2025-02-28
|Post Views:
Author: ALTNT
Link: http://blog.705553939.xyz/2024/11/19/sequence-processing/STraTs%E4%BB%A3%E7%A0%81%E9%98%85%E8%AF%BB/
Copyright Notice: All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.
Image Processing
Previous
周报11月18日
Next
巴基斯坦
Related Articles
2024-10-15
ImageNet Large Scale Visual Recognition Challenge
2024-10-28
Context Encoders:Feature Learning by Inpainting
2025-02-04
AN IMAGE IS WORTH 16X16 WORDS——TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE
2025-02-07
Deep Sets
2024-10-28
CDAM-Net:Channel shuffle dual attention based multi-scale CNN for efficient glaucoma detection using fundus images
2025-03-03
BERT Pre-training of Deep Bidirectional Transformers for Language Understanding
avatar
ALTNT
Articles
165
Tags
34
Categories
0
Follow Me
Announcement
This is my Blog
Contents
  1. 1. STraTs 代码阅读
    1. 1.1. 一、数据预处理
      1. 1.1.1. read_ts函数
        1. 1.1.1.1. (1)下面的操作是遍历每一个文件读取内容到 data,然后将 data append 到ts 数组中:
        2. 1.1.1.2. (2)处理 ts 数组
        3. 1.1.1.3. (3)重新设置时间参数和重命名变量名
      2. 1.1.2. 合并由 set-a和 set-b 和 set-c 的 ts 数组
      3. 1.1.3. 读取标签:
        1. 1.1.3.1. (1) 使用 pd.read_csv读取数据:
        2. 1.1.3.2. (2)重新设置参数
        3. 1.1.3.3. (3)合并 set-a,set-b,set-c的标签
        4. 1.1.3.4. (4)将 ts_id列(即 RecordID)中的唯一值进行排序
        5. 1.1.3.5. (5)筛选出oc中ts_id列的值在ts_ids中的行
      4. 1.1.4. 将分类转换为数字
        1. 1.1.4.1. (1)(感觉就是将变量“variable"为 ICUType 的行的 value 值都设置为 1,不过根据原来 value 为 1,2,3,4 将这些行的 Variable 的名字由”ICUType"改为“ICUType_1"等字段)
        2. 1.1.4.2. (2)生成训练和验证集的 id
      5. 1.1.5. 保存所有的训练集、验证集、测试集
    2. 1.2. 二、模型训练
      1. 1.2.1. 加载数据集
        1. 1.2.1.1. 加载刚刚保存的预训练数据:
        2. 1.2.1.2. 加载变量名(就是刚刚的 variable 名)
        3. 1.2.1.3. 从data中删除ts_id在test_ids中的行
        4. 1.2.1.4. 生成 val_ids
        5. 1.2.1.5. 生成 ts_id(即 RecorderID)到索引 id 的映射:
        6. 1.2.1.6. 这里就是添加了一个ts_ind列,把ts_id映射到索引,这个 ts_ind后面三元组会用
        7. 1.2.1.7. 保存训练集和验证集的索引
        8. 1.2.1.8. 正则化变量(重点)
        9. 1.2.1.9. 生成 不同variable 对应的唯一值
        10. 1.2.1.10. 初始化values, times, varis 三元组
        11. 1.2.1.11. 对 data 使用 minute 进行排序
        12. 1.2.1.12. 遍历 data 为三元组进行赋值,因为 data 已经按minute排序,所以这里可以保证 values, times, varis 中的数据是按时间顺序的
        13. 1.2.1.13. 去除 self.times中的重复值并保存到self.timestamps中
        14. 1.2.1.14. 保留入院 12 小时后的序列
      2. 1.2.2. 模型初始化
        1. 1.2.2.1. Strafs 初始化
        2. 1.2.2.2. TimeSeriesModel初始化
        3. 1.2.2.3. CVE初始化
        4. 1.2.2.4. variable_emb
        5. 1.2.2.5. Transformer初始化
        6. 1.2.2.6. FusionAtt
      3. 1.2.3. 设置预训练的 Evaluator
        1. 1.2.3.0.1. Pretraindataset 的 get_batch方法来获取多个 batch 的数据
      4. 1.2.3.1. STraTs 数据的正向传播过程
        1. 1.2.3.1.1. time 和 value 嵌入:
        2. 1.2.3.1.2. varis 变量名嵌入
        3. 1.2.3.1.3. 三元组 emb 计算
        4. 1.2.3.1.4. 将三元组 emb 投入 transformer 获取上下文 emb
        5. 1.2.3.1.5. fusion_att
        6. 1.2.3.1.6. 计算时间序列提取出来的 emb
        7. 1.2.3.1.7. 进行预测任务
Recent Post
周报2025年6月8日2025-06-09
The 20 m Africa rice distribution map of 20232025-06-04
DCM————DeepCropMapping: A multi-temporal deep learning approach with improved spatial generalizability for dynamic corn and soybean mapping2025-06-04
重新复现CACM记录2025-06-04
机器学习相关概念2025-05-26
©2020 - 2025 By ALTNT
Framework Hexo|Theme Butterfly