【组队学习】【26期】Datawhale组队学习内容介绍

本次组队学习的内容为:

  1. 动手学数据分析
  2. 图神经网络
  3. Linux教程
  4. 编程实践(Django网站开发)
  5. 编程实践(Python办公自动化)

1. 动手学数据分析

  • 论坛版块:http://datawhale.club/c/team-learning/25-category/25
  • 开源内容:https://github.com/datawhalechina/hands-on-data-analysis

学习目标

了解数据分析中基本库的操作(比如:pandas,numpy和matplotlib);熟悉数据分析的操作流程,建立数据分析思维,入门数据建模。

基本信息

  • 贡献人员:陈安东、金娟娟、杨佳达、老表、李玲、张文涛、高立业、叶前坤、伊雪、刘天硕、邓林权
  • 学习周期:11天
  • 学习形式:理论+实践
  • 人群定位:懂一些python,希望入门数据分析的学习者。
  • 难度系数:中

任务安排

Task00:熟悉规则(1天)

  • 组队、修改群昵称
  • 熟悉打卡规则。

Task01:数据加载及探索性数据分析(2天)

  • 主要学习内容是:课程的第一章
  • 了解数据加载以及数据观察
  • 掌握pandas基础
  • 完成探索性数据分析

Task02:数据清洗及特征处理(2天)

  • 主要学习内容是:课程的第二章的第一部分(数据清洗及特征处理)
  • 掌握数据清洗的方法
  • 了解特征观察与处理

Task03:数据重构(2天)

  • 主要学习内容是:课程的第二章第二和第三部分(数据重构)
  • 了解数据重构的方法
  • 使用groupby做数据运算

Task04:数据可视化(2天)

  • 主要学习内容是:课程的第二章第四部分(数据可视化)
  • 了解可视化的目的
  • 知道各种图形可用于的场景
  • 实战数据可视化的基本库

Task05:数据建模及模型评估(2天)

  • 主要学习内容是:课程的第三章(数据建模及模型评估)
  • 了解数据建模
  • 使用sklearn完成分类模型的建模
  • 了解模型评估
  • 使用sklearn完成模型评估

2. 图神经网络

  • 论坛版块:http://datawhale.club/c/team-learning/27-category/27
  • 开源内容:https://github.com/datawhalechina/team-learning-nlp/tree/master/GNN

学习目标

通过此次图神经网络组队学习,我们将学习并掌握1)简单图论知识,2)实现图神经网络的通用范式,3)分别用于节点、边、图预测的经典图神经网络,以及4)图神经网络的编程实践。

基本信息

  • 贡献人员:陈荣钦、周郴莲、刘洋、戴治旭
  • 学习周期:27天
  • 学习形式:理论+实践
  • 人群定位:有机器学习、Python语言编程基础,对图神经网络有需求的学员。
  • 难度系数:难

任务安排

Task00:熟悉规则(1天)

  • 组队、修改群昵称;
  • 熟悉打卡规则;
  • 了解学习目标与学习要求。(见第1节)

Task01:简单图论与环境配置与PyG库(2天)

  • 学习简单图论知识、了解常规的图预测任务;(见第2节)
  • 基于PyG包的图数据的表示与使用;(见第3节)

Task02:消息传递范式(3天)

  • 实现图神经网络的通用范式,即消息传递范式;
  • PyG中的消息传递(MessagePassing)基类的属性、方法和运行流程;
  • 如何自定义一个消息传递图神经网络。(见第4节)

Task03:基于图神经网络的节点表征学习(4天)

  • 基于图神经网络的节点表征学习的一般过程;
  • 图神经网络为什么强于普通的MLP神经网络,以及GCN和GAT的差别;(见第5节)

Task04:数据完整存储与内存的数据集类+节点预测与边预测任务实践(4天)

  • 如何构造一个数据全部存于内存的数据集类;(见第6-1节)
  • 基于节点表征学习的图节点预测任务和边预测任务的实践。(见第6-2节)

Task05:超大图上的节点表征学习(4天)

  • 在超大图上进行节点表征学习面临着的挑战;
  • 应对挑战的一种解决方案;
  • 通过实践学习超大图节点预测任务。(见第7节)

Task06:基于图神经网络的图表示学习(4天)

  • 基于图神经网络的图表征学习的一般过程;(见第8节)

Task07:图预测任务实践(4天)

  • 样本按需获取的数据集类的构造方法;(见第9-1节)
  • 基于图表征学习的图预测任务的实践。(见第9-2节)

Task08:总结(1天)

  • 总结此次组队学习。(见第10节)

3. Linux教程

  • 论坛版块:http://datawhale.club/c/team-learning/27-category/27
  • 开源内容:https://github.com/datawhalechina/team-learning-program/tree/master/Linux

学习目标

学习基本的linux操作系统理论和操作

基本信息

  • 贡献人员:陈玉林、梁家晖、刘宇
  • 学习周期:12天
  • 学习形式:理论学习 + 练习
  • 人群定位:对Linux系统使用有需求的学员。
  • 难度系数:简单

任务安排

Task00:熟悉规则(1天)

  • 组队、修改群昵称
  • 熟悉打卡规则。

Task01:Linux简介(1天)

  • 了解Linux的历史
  • 了解Linux基本特性

Task02:Linux系统安装(2天)

  • 安装好Linux系统
  • 安装好Linux系统下常用开发工具

Task03:Linux用户和组管理(3天)

  • 掌握Linux用户和组管理方法

Task04:Linux文件和目录管理(3天)

  • 理解Linux文件和目录管理的原理
  • 掌握Linux文件和目录管理基本命令

Task05:Linux磁盘管理(3天)

  • 理解Linux磁盘管理的原理
  • 掌握磁盘管理基本命令

4. 编程实践(Django网站开发)

  • 论坛版块:http://datawhale.club/c/team-learning/28-category/28
  • 开源内容:https://github.com/datawhalechina/team-learning-program/tree/master/Django

学习目标

从零开始搭建一个个人博客网站,掌握Django项目开发核心内容。

基本信息

  • 贡献人员:牛宝华、孙子涵、杨晓栋、张晋、黎佳佳
  • 学习周期:22天
  • 学习形式:理论学习 + 练习
  • 人群定位:有Python语言编程基础,对网站开发有需求的学员。
  • 难度系数:中

任务安排

Task00:熟悉规则(1天)

  • 组队、修改群昵称
  • 熟悉打卡规则。

Task01:基础知识回顾(3天)

  • Python基础
  • 前端基础(HTML,CSS,JavaScript)

Task02:快速搭建一个简单的文章发布网站(4天)

  • Django环境的搭建
  • 简单的文章发布网站
  • 基础的Django网站运行流程

Task03:从零开始搭建个人博客网站(7天)

  • 博客网站的搭建(一个完整的项目)
  • Markdown功能集成
  • 网站发布

Task04:个人博客系统的扩展与补充(7天)

  • 网站备案相关
  • 其他和网站开发相关的扩充知识
  • 学习过程中的问题答疑与总结

5. 编程实践(Python办公自动化)

  • 论坛版块:http://datawhale.club/c/team-learning/29-category/29
  • 开源内容:https://github.com/datawhalechina/team-learning-program/tree/master/OfficeAutomation

学习目标

了解通过python进行word、excel、pdf的相关操作,了解通过python进行文件批量处理、电子邮件收发、数据爬取;熟悉自动化办公的相关流程,力求在平时的工作中应用提高工作效率。

基本信息

  • 贡献人员:牧小熊、刘雯静、张晓东、吴争光、隆军、曹志宾
  • 学习周期:14天
  • 学习形式:理论学习 + 练习
  • 人群定位:有Python语言编程基础,对自动化办公有需求的学员。
  • 难度系数:中

任务安排

Task00:熟悉规则(1天)

  • 组队、修改群昵称
  • 熟悉打卡规则。

Task01:文件自动化处理&邮件批量处理 (3天)

  • 文件路径识别、处理、文件夹的操作理论学习
  • 文件自动化处理实践
  • 邮件自动发送理论学习,使用python发送邮件附带excel附件

Task02:python与excel (2天)

  • Excel读取与写入
  • Excel样式调整
  • 综合练习

Task03:python与word (2天)

  • python与word相关的理论知识学习
  • 使用python进行邀请函批量生成实践

Task04:python与pdf(3天)

  • python与pdf相关的理论知识学习
  • 使用python进行pdf操作实践

Task05:爬虫入门与综合应用(3天)

  • requests库的理论与实践
  • HTML页面解析与提取方法
  • 自如公寓数据抓取
  • 36kr信息抓取与邮件发送

6. 具体规则

  • 注册 CSDN、Github 或 B站等账户。
  • 按照任务安排进行学习,完成后写学习笔记Blog 或 进行视频直播。
  • 在每次任务截止之前在群内填写问卷打卡,遇到问题在群内讨论。
  • 未按时打卡的同学视为自动放弃,被抱出学习群。

(0)

相关推荐