决策树,逻辑回归,PCA-算法面试题

决策树
◾简述决策树原理?
◾为什么要对决策树进行减枝?如何进行减枝?
◾简述决策树的生成策略
•PCA
◾简述主成分分析PCA工作原理,以及PCA的优缺点?
◾PCA中有第一主成分、第二主成分,它们分别是什么,又是如何确定的?
•逻辑回归
◾逻辑回归是线性模型么,说下原因?
◾逻辑回归算法为什么用的是sigmoid函数而不用阶跃函数?

•其他

◾分析KNN与K-means中k值如何进行选取并解释两者之间的区别?

◾对于数据异常值,我们一般如何处理?

◾什么是特征选择,为什么要进行特征选择,以及如何进行?
……

阅读更多

数据科学中的6个基本算法,掌握它们要学习哪些知识

如果想从事数据科学,但是又没有数学背景,那么有多少数学知识是做数据科学所必须的?

统计学是学习数据科学绕不开的一门数学基础课程,但数据科学也经常会涉及数学中的其他领域。

数据科学使用算法进行预测,这些算法称为机器学习算法,有数百种之多。有人总结了数据科学中最常用的6种算法,已经掌握它们分别需要哪些数学知识。……

阅读更多

决策树基础

今天来看一个借助了信息论里知识的一个模型:决策树(decision tree)。
决策树是一个非常容易理解的模型,它非常像程序员所熟悉的 if else 结构。
举一个相亲见面的实例,即女生根据男生的条件来决定是否相亲见面,通过这个实例有助于理解决策树。……

阅读更多

Python实现决策树算法

决策树(Decision Tree)又称为判定树,是运用于分类的一种树结构,其中的每个内部节点代表对某一属性的一次测试,每条边代表一个测试结果,叶节点代表某个类或类的分布。
决策树的决策过程需要从决策树的根节点开始,待测数据与决策树中的特征节点进行比较,并按照比较结果选择选择下一比较分支,直到叶子节点作为最终的决策结果。……

阅读更多