第30期 Datawhale 组队学习活动马上就要开始啦!
本次组队学习的内容为:
- 吃瓜教程——西瓜书+南瓜书
- 李宏毅机器学习(含深度学习)
- 深入浅出Pytorch
- 时间序列分析
- 机器学习数学基础
- 树模型与集成学习
- CV中的Transformer
- 青少年编程(Scratch 三级)
大家可以根据我们的开源内容进行自学,也可以加入我们的组队学习一起来学。
- 航路开辟者:谢文睿、秦州
- 领航员:邱振波
- 航海士:谢文睿、秦州
- 开源内容:https://github.com/datawhalechina/pumpkin-book
- B 站视频:https://www.bilibili.com/video/BV1Mh411e7VU
- 内容属性:机器学习(理论)专题
- 内容说明:周志华老师的“西瓜书”是机器学习经典入门教材,值得反复阅读,配合“南瓜书”从本科数学基础的视角进行讲解,一起打好基础!
- 定位人群:有本科数学基础(高等数学、线性代数、概率论与数理统计)的同学。
- 特别提示:吃瓜教程学习形式为直播+社群答疑,旨在促进更多人动手学习。
- 学习周期:18天
- 任务路线:以《机器学习》西瓜书为主线,配合南瓜书攻克疑难点。
- 0. 导学
- 1. 一元线性回归
- 2. 多元线性回归
- 3. 对数几率回归
- 4. 二分类线性判别分析
- 5. 决策树
- 6. 神经网络
- 7. 支持向量机
- 8. 软间隔与支持向量回归
- 9. 集成学习(上)
- 10. 集成学习(下)
- 航路开辟者:王茂霖、陈安东,刘峥嵘,李玲
- 领航员:初晓宇
- 航海士:王茂霖
- 开源内容:https://github.com/datawhalechina/leeml-notes
- 开源内容:https://gitee.com/datawhalechina/leeml-notes
- B 站视频:https://www.bilibili.com/video/BV1Ht411g7Ef
- B 站视频:https://www.bilibili.com/video/BV1JA411c7VT
- 内容属性:深度学习(理论)专题
- 内容说明:辅助大家更好学习李宏毅老师机器学习视频,并加入相关补充资料,相信你会对机器学习有更加深刻的理解。
- 定位人群:深度学习初学者,有微积分,线性代数基础。
- 特别提示:本教程为深度学习教程
- 学习周期:14天
- 任务路线:李宏毅视频+解读辅助。
- 航路开辟者:李嘉骐、牛志康、刘洋、陈安东
- 领航员:叶志雄
- 航海士:李嘉骐、牛志康、刘洋、陈安东
- 开源内容:https://github.com/datawhalechina/thorough-pytorch
- 内容属性:深度学习(实践)专题
- 内容说明:PyTorch理论与实践结合,由基础知识到项目实战。
- 定位人群:具备《高等数学》、《线性代数》、《概率论与数理统计》基础,有一定的机器学习和深度学习基础,熟悉常见概念,会使用Python。
- 特别提示:学习形式为课程材料学习+直播答疑。
- 学习周期:10天
- 航路开辟者:李岳昆、易远哲
- 领航员:王洲烽
- 航海士:李岳昆、易远哲
- 开源内容:https://github.com/datawhalechina/team-learning-data-mining/tree/master/TimeSeries
- 内容属性:打磨课程
- 内容说明:时间序列是数据分析中的重要部分,本次学习旨在从基础的概率论统计知识入手,从零开始时间序列分析,内容涵盖了简单的时间序列模型如移动平均法以及较为复杂的ARMA复合时间序列分析。学好本课程可以为更加复杂的时间序列统计学模型打好基础,以解决更为困难的实际问题。
- 定位人群:有本科数学基础(高等数学、线性代数、概率论与数理统计)的同学。
- 特别提示:学习形式为课程材料学习+在线答疑。
- 学习周期:11天
- 航路开辟者:李祖贤
- 领航员:张智涵
- 航海士:李祖贤、戴治旭、黄浩霖、邱广坤
- 开源内容:https://github.com/datawhalechina/team-learning-data-mining/tree/master/Mathematics
- 直播平台:https://www.bilibili.com/video/BV1H54y1J7Ka/
- 内容属性:打磨课程
- 内容说明:本课程主要针对希望系统学习大学数学,或者是想为深造机器学习补充数学基础的的同学,考研的同学也可一起来学,前提是必须要跟上节奏,不能掉队。
- 定位人群:补充数学基础的同学。
- 特别提示:坚持到最后,你已经击败了80%的对手!
- 学习周期:30天
- 任务路线:从8月份贯穿到12月份带着同学们一起复习高等数学、线性代数、概率论与数理统计的知识点,以及一起进行刷题练习。
10月份的内容如下:
- 航路开辟者:耿远昊
- 领航员:姜萌
- 航海士:耿远昊
- 开源内容:https://github.com/datawhalechina/machine-learning-toy-code
- 内容属性:打磨课程
- 内容说明:本课程将对机器学习中的集成学习模型进行理论讲解和代码实践,涵盖了决策树、集成模式、随机森林、孤立森林、adaboost、GBDT、XGBoost与LightGBM内容的详细介绍,带领读者使用numpy构建相关模块,深入理解算法原理与实现。
- 定位人群:有本科数学基础(高等数学、线性代数、概率论与数理统计)和numpy基础的同学。
- 特别提示:每个task的第2天晚20:30直播。
- 学习周期:27天
- 航路开辟者:安晟
- 领航员:尚育鹏
- 航海士:安晟、袁明坤、闫永强
- 开源内容:https://github.com/datawhalechina/dive-into-cv-pytorch [第六章]
- 内容属性:打磨课程
- 内容说明:17年在NLP领域横空出世的transformer,近期在CV方向也火热起来,分类、检测、分割三大方向均有相应研究并取得了不错的成果。本次组队学习内容大致分为两个部分,第一部分介绍Transformer本身的原理和实现,第二部分会介绍如何利用Transformer进行OCR字符识别,目的是通过这样一个独特的视角来带领大家了解Transformer是如何应用到CV领域中的。
- 定位人群:有一定深度学习基础,了解pytorch的基本使用。
- 特别提示:自主学习+社群答疑,计划会有一次直播讲解。
- 学习周期:14天
- 航路开辟者:王思齐、马燕鹏
- 领航员:马燕鹏
- 航海士:王思齐、马燕鹏
- 开源内容:https://github.com/datawhalechina/team-learning-program/tree/master/Scratch
- 内容属性:打磨课程
- 内容说明:抽取电子学会青少年编程能力等级测试图形化三级的真题来组成试卷,在做题目的过程中掌握图形化编程的基本知识。由于测试题目为往年电子学会Scratch三级考试的真题,所以通过做题来掌握Scratch三级考试的知识点,为通过考试做准备。
- 定位人群:对图形化编程感兴趣的小朋友。
- 特别提示:小学3年级及以上。
- 学习周期:15天
- 任务打卡入口:开源学习小程序 -> 组队学习 -> 自己所学的课程 -> 任务。
- 在任务打卡的“任务学习总结或心得”处写入自己的学习总结【必填】。
- 在CSDN、简书等平台撰写技术博客【鼓励】。
- 在任务打卡的“打卡链接”处填写自己原创内容的技术博客网址【选填】。
- 我们会邀请船长一起查看填写技术博客网址的博文并给予反馈。
- 打卡完成后,可以进入打卡圈,查看所有学习者的打卡内容,支持点赞,评论。
具体操作见:如何使用开源学习小程序?
- 打卡内容包括但不限于对理论知识的理解、扩展、代码实现、公式推导等等,也可直播分享自己的学习过程。不需要复制粘贴教程原文。
- 如果笔记中需要引用教程内容或其他重要资料,希望注明出处,并附上来源链接,避免版权纠纷。
- 打卡截止时间是每次任务规定时间的第二天凌晨3:00,需要在睡觉前打卡,不是第二天起床后。
- 符合任意一条不规范打卡规定(字数少于50、复制粘贴教程内容、与本任务无关内容)或没有及时打卡的同学,将由领航员“抱出学习群”,监督金不予退还,并关闭后续打卡。
组队学习之余,来读读组队学习中发生的故事!
- 钱振:助教的那些事
- 红星:队长的那些事
- 代硕:学习者的那些事
- 田瑶:学习者的那些事
- 红星:学习者的那些事
- 姚行志:助教的那些事
- 姚昱君:助教的那些事
- 陈长沙:助教的那些事
- 王彦淳:助教的那些事
- 肖明远:队长的那些事
- 王岳泽:学习者的那些事
- 范宸尧:学习者的那些事
- 张海腾:学习者的那些事
- 迟语寒:学习者的那些事
- 邓林权:学习者的那些事
- 罗如意:课程设计者的那些事
希望参与活动的学习者,来读读组队学习的注意事项!