机器学习算法复习手册——决策树
本手册整理自机器学习各相关书籍、网络资料、个人的理解与实践。总体编写宗旨:
①一看就懂;
②用20%的文字,涵盖80%的内容。
至于剩下的20%,一般属于比较偏、难的部分,建议自行查询相关书籍资料学习。
而只用20%的文字,则代表手册里面几乎没有废话,也只有极少数必要的例子。……
本手册整理自机器学习各相关书籍、网络资料、个人的理解与实践。总体编写宗旨:
①一看就懂;
②用20%的文字,涵盖80%的内容。
至于剩下的20%,一般属于比较偏、难的部分,建议自行查询相关书籍资料学习。
而只用20%的文字,则代表手册里面几乎没有废话,也只有极少数必要的例子。……
决策树
◾简述决策树原理?
◾为什么要对决策树进行减枝?如何进行减枝?
◾简述决策树的生成策略
•PCA
◾简述主成分分析PCA工作原理,以及PCA的优缺点?
◾PCA中有第一主成分、第二主成分,它们分别是什么,又是如何确定的?
•逻辑回归
◾逻辑回归是线性模型么,说下原因?
◾逻辑回归算法为什么用的是sigmoid函数而不用阶跃函数?
•其他
◾分析KNN与K-means中k值如何进行选取并解释两者之间的区别?
◾对于数据异常值,我们一般如何处理?
◾什么是特征选择,为什么要进行特征选择,以及如何进行?
……
如果想从事数据科学,但是又没有数学背景,那么有多少数学知识是做数据科学所必须的?
统计学是学习数据科学绕不开的一门数学基础课程,但数据科学也经常会涉及数学中的其他领域。
数据科学使用算法进行预测,这些算法称为机器学习算法,有数百种之多。有人总结了数据科学中最常用的6种算法,已经掌握它们分别需要哪些数学知识。……
今天来看一个借助了信息论里知识的一个模型:决策树(decision tree)。
决策树是一个非常容易理解的模型,它非常像程序员所熟悉的 if else 结构。
举一个相亲见面的实例,即女生根据男生的条件来决定是否相亲见面,通过这个实例有助于理解决策树。……
Sklearn安装简介及入门示例。
定义模型:线性回归、朴素贝叶斯、决策树、支持向量机、k近邻算法……
决策树(Decision Tree)又称为判定树,是运用于分类的一种树结构,其中的每个内部节点代表对某一属性的一次测试,每条边代表一个测试结果,叶节点代表某个类或类的分布。
决策树的决策过程需要从决策树的根节点开始,待测数据与决策树中的特征节点进行比较,并按照比较结果选择选择下一比较分支,直到叶子节点作为最终的决策结果。……