1.李宏毅2023机器学习作业HW04解析和代码分享
2.COVID-19 X光医疗数据可视化的冠军冠军笔记
李宏毅2023机器学习作业HW04解析和代码分享
MLSpring - HW4 相关信息:课程主页、课程视频、源码Kaggle链接、代码Sample代码、冠军冠军GitHub、源码Gitee、代码原始密源码GitCode。冠军冠军即便Kaggle截止时间已过,源码你仍可在其上提交并查看分数。代码但需注意,冠军冠军应于截止前选择两个结果进行最后的源码Private评分。每年数据集大小与特性虽有细微差别,代码但基本一致,冠军冠军旧代码适用于新一年的源码作业。
任务目标:多类分类,代码性能指标:分类准确度。
数据解析:数据来自VoxCeleb2子集,随机选取了个演讲者。
基线:简单基线(0.),eletron源码中等基线(0.),在total_steps=时,public_score达到0.。简单参考Optuna进行模型自动调参。
强基线(0.)、Boss基线(0.)。未在PDF中给出Boss基线具体分数,分数来源于Kaggle。模块未显著提升效果,mtklogger 源码代码中使用全局变量决定是否使用,欢迎大家提出改进意见。
消融研究:Self-Attention Pooling与AMSoftmax在epoch=,下的实验。AMSoftmax接受pred_layer输出,尝试接受encoder输出并重新训练全连接层,但效果不佳,可能为代码问题。
成绩:使用Transformers变体完成Strong基线的提示是转变为Conformer。简单介绍了其模型架构,asiagaming 源码推荐Pytorch版本源代码。架构包括:SpecAug、Convolution Subsampling、Linear & Dropout、Conformer Block。每个Module使用了残差连接。
COVID- X光医疗数据可视化的笔记
在全球COVID-危机中,前线医护人员的辛勤付出令人敬佩。非医学背景的源码吾爱我,希望能尽一份力,于是我在知名数据平台KAGGLE上挖掘了关于COVID- X光医疗的数据,并以此为基础,制作了一篇关于X光肺炎识别的可视化笔记。
首先,我利用高效的算力赞助平台Featurize,该平台提供了经济实惠的GPU资源,并集成了方便的vscode编辑器,解决了我在使用jupyter时的编辑需求。
进入正题,数据集检查是关键。annotations包含了关于X光图像的重要信息,通过可视化数据分布,我们可以了解数据的均衡性,可能需要调整进一步处理中的权重分配。
接着,我们直观地展示了负样本X光,以帮助理解它们的特性,为数据增强提供方向。在构建基础模型时,我参考了arxiv.org/abs/....这篇论文。
训练过程中,我特别关注了损失函数和准确率的变化,尤其是在医疗任务中,召回率往往比精度更为重要,因为我们不希望漏掉任何潜在的病例。
最后,附上源代码链接:featurize.cn/notebooks/...,包括数据集,考虑到KAGGLE下载速度问题,一并分享。期待各位专业人士的宝贵意见,无论是修改代码、贡献想法还是提出建议,我都非常欢迎。
让我们共同努力,世界和平,战胜疫情。