决策树,逻辑回归,PCA-算法面试题

决策树
◾简述决策树原理?
◾为什么要对决策树进行减枝?如何进行减枝?
◾简述决策树的生成策略
•PCA
◾简述主成分分析PCA工作原理,以及PCA的优缺点?
◾PCA中有第一主成分、第二主成分,它们分别是什么,又是如何确定的?
•逻辑回归
◾逻辑回归是线性模型么,说下原因?
◾逻辑回归算法为什么用的是sigmoid函数而不用阶跃函数?

•其他

◾分析KNN与K-means中k值如何进行选取并解释两者之间的区别?

◾对于数据异常值,我们一般如何处理?

◾什么是特征选择,为什么要进行特征选择,以及如何进行?
……

阅读更多

数据科学中的6个基本算法,掌握它们要学习哪些知识

如果想从事数据科学,但是又没有数学背景,那么有多少数学知识是做数据科学所必须的?

统计学是学习数据科学绕不开的一门数学基础课程,但数据科学也经常会涉及数学中的其他领域。

数据科学使用算法进行预测,这些算法称为机器学习算法,有数百种之多。有人总结了数据科学中最常用的6种算法,已经掌握它们分别需要哪些数学知识。……

阅读更多

什么是逻辑回归?

逻辑回归虽然带有回归字样,但是逻辑回归属于分类算法。逻辑回归可以进行多分类操作,但由逻辑回归算法本身性质决定其更常用于二分类。……

阅读更多

支持向量机(SVM)Python实现

支持向量机(Support Vector Machine, SVM)是一类按监督学习(supervised learning)方式对数据进行二元分类(binary classification)的广义线性分类器(generalized linear classifier),其决策边界是对学习样本求解的最大边距超平面(maximum-margin hyperplane)……

阅读更多

Python 回归分析

回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。
运用十分广泛,回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;
按照因变量的多少,可分为简单回归分析和多重回归分析;
按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。
如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。
如果回归分析中包括两个或两个以上的自变量,且自变量之间存在线性相关,则称为多重线性回归分析。……

阅读更多