数据分析实战45讲

你将获得

1.数据分析核心概念和工具;

2.数据采集、清洗、分析方法论:

3.10大数据挖掘算法精讲

4.Kaggle实战项目练习。

讲师介绍

陈肠,清华大学计算机博士,前IBM中国研究院工程师。IEEE & ACM Member,中国人工智能协会成员,中国计算机协会CCF大数据专委。

课程介绍

数据一直都有,但我们从未像现在这样需要数据,渴望数据,因为大数据已经改变了我们思考和决策的方式,并正在创造未来.

当下,几乎每个人和每个公司都需要具备数据分析的能力,只有这样,我们才能真正参与到这个海量数据崛起的时代。

但是,说到数据分析和数据挖掘,很多人都是心向往之,却总是望而却步:

要学的东西太多了,从统计学到SQL,从Python到R语言,听着就累:

感觉太难了,数据挖掘算法根本学不明白,真叫人头大;

也学了不少东西,但觉得很理论,完全不知道该怎么用

确实,数据挖掘和数据分析有一些门槛,但是和学习任何新东西一样,它也需要更加高效的方法。事实上,你只需要熟悉数据从采集、清洗到集成的准备过程,掌握最核心的十个数据挖掘算法,重视对工具的熟练使用,从一个个小项目做起,快速积累经验,你就能拥有数据分析这项新技能,有能力真正把数据转化成财富,创造价值。

为此,我们邀请了陈肠来为你讲解数据分析,帮你攻破它。

陈,清华大学计算机博士,前1BM中国研究院工程师。IEEE & ACM Member,中国人工智能协会成员,中国计算机协会CCF大数据专委。

在这个专栏里,他将结合自己的学习体会和实践经验,带你由浅入深掌握数据分析的核心知识点,并且结合案例手把手教你从源头上认识数据分析,熟悉对应的工具操作。同时,为了帮助你融会贾通,专栏还设计了专属题库,保证你能够即学即用。

专栏分为5大模块。

预习篇

个绍数据分析的全景图和最佳学习路径,此外还有3篇Pthon入门内容,分别是Python的基本语法和两大工具NumPy、Pandas,帮助你快速上手。

基础篇

帮你梳理数据分析的流程,了解数据分析的方方面面。包括数据分析的基础概念、数据采集、数据处理以及数据可视化

算法篇

算法是数据挖掘的精华所在,也是专栏的重点内容。专栏精选10大算法,包括分类、聚类和预测三大类型。每个算法都从原理和

案例两个角度学习,帮助你快速理解和应用。

实战篇

理论是铠甲,落实在项目,进行实战才是我们的终极目标。专栏里精选了5个项目,让你在实操中深入理解数据分析,体验数据思维

工作篇

面试通向数据分析工程师的最后一步,所以这一模块会告诉你面试时需要注意什么,职位的晋升路径又是怎样的?帮你打通最后关

课程目录

预习篇

01 数据分析全景图及修炼指南

02学习数据挖掘的最佳学习路径

03 Python基础语法:开始你的Python之旅

04 Python科学计算:用NumPy快速处理数据

05 Python科学计算: Pandas

基础篇

06学习数据分析要掌握哪些基本概念?

07用户画像:标签化就是数据的抽象能力

08数据采集:如何自动化采集数据?

09 数据采集:如何用八爪鱼采集微博上的“D&G”评论?

10 Pvthon爬虫:如何自动化下载王祖贤海报?

11数据清洗:数据科学家80%时间都花费在了这里?

12数据集成:这些大号一共20亿粉丝?

13数据变换:大学成绩要求正态分布合理么?

14数据可视化:掌握数据领域的万金油技能

15一次学会Python数据可视化的10种技能

16 基础篇热点问题答疑

算法篇

17 决策树 (上):要不要去打篮球? C4.5来告诉你

18 决策树 (中):CART,一棵是回归树,另一棵是分类树

19 决策树 (下):我们也来预测Titanic乘客生存率

20朴素贝叶斯 (上):下意识判断要不要嫁给他?

21朴素贝叶斯 (下):如何对文档进行分类?

22 SVM(上):如何用一根棍子将蓝红两色球分开?

23 SVM (下):如何进行乳腺癌检测?

24 KNN(上):如何根据打斗和接吻次数来划分电影类型?

25KNN(下):如何对手写数字进行识别?

26 K-Means(上):如何给20支亚洲球队做聚类?

27 K-Means(下):如何使用K-Means对图像进行分割?

28 EM聚类(上):如何将一份菜等分给两个人?

29 EM聚类(下):用EM算法对王者荣耀英雄进行划分

30关联规则挖掘(上): 如何用Apriori发现用户购物规则?

31 关联规则挖掘 (下):导演如何选择演员?

32 PageRank (上):搞懂Google的PageRank算法

33 PageRank (下):分析希拉里邮件中的人物关系

34 AdaBoost(上) :如何使用AdaBoost提升分类器性能?

35 AdaBoost(下):如何使用AdaBoost对房价进行预测?

36 算法篇综合答疑

实战篇

37数据采集实战:如何自动化运营微博“加粉丝、写评论、发微博”?

38数据可视化实战:如何给毛不易的歌曲做个词云展示?

39数据挖掘实战(1):信用卡违约率分析

40数据挖掘实战(2):如何针对一个视频网站搭建视频推荐算法?

41数据挖掘实战(3):如何对比特币走势进行预测?

42当我们谈深度学习的时候,我们都在谈什么?

43如何用Keras搭建深度学习网络,做手写数字识别?

工作篇

44如何培养你的数据分析思维?

45求职简历中没有相关项目经验该怎么办?

声明:本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。