第26期 Datawhale 组队学习活动马上就要开始啦!
本次组队学习的内容为:
- 动手学数据分析
- 图神经网络
- Linux教程
- 编程实践(Django网站开发)
- 编程实践(Python办公自动化)
大家可以根据我们的开源内容进行自学,也可以加入我们的组队学习一起来学。
- 论坛版块:http://datawhale.club/c/team-learning/25-category/25
- 开源内容:https://github.com/datawhalechina/hands-on-data-analysis
了解数据分析中基本库的操作(比如:pandas,numpy和matplotlib);熟悉数据分析的操作流程,建立数据分析思维,入门数据建模。
- 贡献人员:陈安东、金娟娟、杨佳达、老表、李玲、张文涛、高立业、叶前坤、伊雪、刘天硕
- 学习周期:11天
- 学习形式:理论+实践
- 人群定位:懂一些python,希望入门数据分析的学习者。
- 难度系数:中
- 组队、修改群昵称
- 熟悉打卡规则。
- 主要学习内容是:课程的第一章
- 了解数据加载以及数据观察
- 掌握pandas基础
- 完成探索性数据分析
- 主要学习内容是:课程的第二章的第一部分(数据清洗及特征处理)
- 掌握数据清洗的方法
- 了解特征观察与处理
- 主要学习内容是:课程的第二章第二和第三部分(数据重构)
- 了解数据重构的方法
- 使用groupby做数据运算
- 主要学习内容是:课程的第二章第四部分(数据可视化)
- 了解可视化的目的
- 知道各种图形可用于的场景
- 实战数据可视化的基本库
- 主要学习内容是:课程的第三章(数据建模及模型评估)
- 了解数据建模
- 使用sklearn完成分类模型的建模
- 了解模型评估
- 使用sklearn完成模型评估
- 论坛版块:http://datawhale.club/c/team-learning/27-category/27
- 开源内容:https://github.com/datawhalechina/team-learning-nlp/tree/master/GNN
通过此次图神经网络组队学习,我们将学习并掌握1)简单图论知识,2)实现图神经网络的通用范式,3)分别用于节点、边、图预测的经典图神经网络,以及4)图神经网络的编程实践。
- 贡献人员:陈荣钦、周郴莲、刘洋、戴治旭
- 学习周期:22天
- 学习形式:理论+实践
- 人群定位:有机器学习、Python语言编程基础,对图神经网络有需求的学员。
- 难度系数:难
- 组队、修改群昵称;
- 熟悉打卡规则;
- 了解学习目标与学习要求。(见第1节)
- 学习简单图论知识、了解常规的图预测任务;(见第2节)
- 基于PyG包的图数据的表示与使用;(见第3节)
- 实现图神经网络的通用范式,即消息传递范式;
- PyG中的消息传递(
MessagePassing
)基类的属性、方法和运行流程; - 如何自定义一个消息传递图神经网络。(见第4节)
- 基于图神经网络的节点表征学习的一般过程;
- 图神经网络为什么强于普通的MLP神经网络,以及GCN和GAT的差别;(见第5节)
- 如何构造一个数据全部存于内存的数据集类;(见第6-1节)
- 基于节点表征学习的图节点预测任务和边预测任务的实践。(见第6-2节)
- 在超大图上进行节点表征学习面临着的挑战;
- 应对挑战的一种解决方案;
- 通过实践学习超大图节点预测任务。(见第7节)
- 基于图神经网络的图表征学习的一般过程;(见第8节)
- 样本按需获取的数据集类的构造方法;(见第9-1节)
- 基于图表征学习的图预测任务的实践。(见第9-2节)
- 总结此次组队学习。(见第10节)
- 论坛版块:http://datawhale.club/c/team-learning/27-category/27
- 开源内容:https://github.com/datawhalechina/team-learning-program/tree/master/Linux
学习基本的linux操作系统理论和操作
- 贡献人员:陈玉林、梁家晖、刘宇
- 学习周期:12天
- 学习形式:理论学习 + 练习
- 人群定位:对Linux系统使用有需求的学员。
- 难度系数:简单
- 组队、修改群昵称
- 熟悉打卡规则。
- 了解Linux的历史
- 了解Linux基本特性
- 安装好Linux系统
- 安装好Linux系统下常用开发工具
- 掌握Linux用户和组管理方法
- 理解Linux文件和目录管理的原理
- 掌握Linux文件和目录管理基本命令
- 理解Linux磁盘管理的原理
- 掌握磁盘管理基本命令
- 论坛版块:http://datawhale.club/c/team-learning/28-category/28
- 开源内容:https://github.com/datawhalechina/team-learning-program/tree/master/Django
从零开始搭建一个个人博客网站,掌握Django项目开发核心内容。
- 贡献人员:牛宝华、孙子涵、杨晓栋、张晋、黎佳佳
- 学习周期:22天
- 学习形式:理论学习 + 练习
- 人群定位:有Python语言编程基础,对网站开发有需求的学员。
- 难度系数:中
- 组队、修改群昵称
- 熟悉打卡规则。
- Python基础
- 前端基础(HTML,CSS,JavaScript)
- Django环境的搭建
- 简单的文章发布网站
- 基础的Django网站运行流程
- 博客网站的搭建(一个完整的项目)
- Markdown功能集成
- 网站发布
- 网站备案相关
- 其他和网站开发相关的扩充知识
- 学习过程中的问题答疑与总结
- 论坛版块:http://datawhale.club/c/team-learning/29-category/29
- 开源内容:https://github.com/datawhalechina/team-learning-program/tree/master/OfficeAutomation
了解通过python进行word、excel、pdf的相关操作,了解通过python进行文件批量处理、电子邮件收发、数据爬取;熟悉自动化办公的相关流程,力求在平时的工作中应用提高工作效率。
- 贡献人员:牧小熊、刘雯静、张晓东、吴争光、隆军、曹志宾
- 学习周期:14天
- 学习形式:理论学习 + 练习
- 人群定位:有Python语言编程基础,对自动化办公有需求的学员。
- 难度系数:中
- 组队、修改群昵称
- 熟悉打卡规则。
- 文件路径识别、处理、文件夹的操作理论学习
- 文件自动化处理实践
- 邮件自动发送理论学习,使用python发送邮件附带excel附件
- Excel读取与写入
- Excel样式调整
- 综合练习
- python与word相关的理论知识学习
- 使用python进行邀请函批量生成实践
- python与pdf相关的理论知识学习
- 使用python进行pdf操作实践
- requests库的理论与实践
- HTML页面解析与提取方法
- 自如公寓数据抓取
- 36kr信息抓取与邮件发送
- 注册 CSDN、Github 或 B站等账户。
- 按照任务安排进行学习,完成后写学习笔记Blog 或 进行视频直播。
- 在每次任务截止之前在群内填写问卷打卡,遇到问题在群内讨论。
- 未按时打卡的同学视为自动放弃,被抱出学习群。