NJU Master Course Big Data Mining and Analysis
- 授课人:王成军
- 联系方式:[email protected]
- 计算传播网:http://computational-communication.com
大数据挖掘与分析 050302D01
- 72学时,4学分
- 南京大学仙林校区新闻传播学院201
- 周四1-2节课 & 周五 5-6节课
- 一、计算新闻传播学简介 [课程要求、 常见问题 、Jupyter Notebook使用、 Slides制作方法]
- 二、大数据简介
- 三、数据科学的编程工具:Python使用简介(3h) [Graphlab、rpy2]
- 四、数据抓取:抓取政府工作报告、Beautifulsoup
- 五、数据抓取:抓取音乐评论
- 六、数据清洗:清洗推特数据
- 七、数据清洗:清洗占中新闻、清洗天涯论坛帖子
- 八、统计初步:
- 九、机器学习
- 十、文本挖掘简介
- 十一、文本挖掘:基于机器学习的情感分析
- 十二、文本挖掘:主题模型 [graphlab]
- 十三、计算传播应用:推荐系统简介
- 十四、计算传播应用:推荐系统实践 [音乐推荐、 电影推荐、隐含语义模型]
- 十五、网络科学理论简介
- 十六、网络科学模型
- 十七、网络科学:使用NetworkX分析网络结构
- 十八、课程总结 回帖网络分析
https://github.com/computational-class/bigdata/wiki/
http://nbviewer.jupyter.org/github/computational-class/bigdata/blob/gh-pages/code/
- 下载后,打开slides文件夹浏览
- 【推荐】通过nbviewer浏览,打开http://nbviewer.jupyter.org/github/computational-class/bigdata/blob/gh-pages/code/ ,选取需要浏览的slides,点击上方的view as slides🎁图标
在线浏览链接见:https://computational-class.github.io/ccbook/
- Introduction to Python Programming for Data Science https://github.com/computational-class/datascience
- Foundations of Data Science https://www.inferentialthinking.com/chapters/intro.html
- Principles and Techniques of Data Science https://www.textbook.ds100.org/intro
- Mining massive datasets http://www.mmds.org/
- 计算传播学
- Python编程
- 数据抓取 无
- 数据清洗 无
- 社会统计
- 机器学习
- 文本挖掘
- 推荐系统
- 网络科学