Jupyter不为人知的7个超好用功能

Jupyter由于能方便的呈现交互式的内容,深受数据分析师的喜爱。之前看到过很多介绍Jupyter使用技巧的文章,但是这些文章一般都是介绍一些插件,小编使用Jupyter已经4年多了,在使用过程中,积累了不少认为还挺实用的技巧,今天分享给大家。……

阅读更多

《机器学习基础》pdf下载

一本名为Foundations of Machine Learning(《机器学习基础》)的课在Reddit上讨论火热,这部教材足够扎实、内容足够基础,学机器学习理论,熟读这本书就足够了。

这本书是由纽约大学计算机科学教授Mehryar Mohri、Afshin Rostamizadeh和Ameet Talwalkar共同编写的,2012年曾经出版了第一版,这一版在此前基础上进行了内容的完善。……

阅读更多

机器学习算法复习手册——决策树

本手册整理自机器学习各相关书籍、网络资料、个人的理解与实践。总体编写宗旨:

①一看就懂;

②用20%的文字,涵盖80%的内容。

至于剩下的20%,一般属于比较偏、难的部分,建议自行查询相关书籍资料学习。

而只用20%的文字,则代表手册里面几乎没有废话,也只有极少数必要的例子。……

阅读更多

如何自己搭建一个机器学习框架?

过去半年,我们团队在机器学习平台上做过一些工作,因为最近看到几篇关于机器学习算法与工程方面的的文章,觉得十分有道理,萌发了总结一下这块的一些工作的念头,我最近工作主要分为两块:
1,机器学习框架的研发、机器学习平台的搭建;
2,基础NLP能力的业务支持。
本篇文章会总结下在机器学习框架这部分系统工作上的一些工作,主要也分为两部分:
1,经典框架的支持;
2,自研框架的工作;……

阅读更多

初露真容: 人工智能与机器学习

什么是人工智能?
对于人工智能的定义,学界一直有不同的表述。 在这里,我们采用一种被广 泛接受的说法:人工智能是通过机器来模拟人类认知能力的技术。……

阅读更多

AdaBoost:一个经典的自适应增强集成算法

AdaBoost(adaptive boosting)中文名叫自适应增强,它是一种能够自动根据前一个基模型对样本预测的误差率来调整样本权重,然后基于调整权重后的样本继续学习新的基模型,如此反复,直到基模型的个数达到设定的个数停止,最后将所有训练的基模型通过组合策略进行集成,得到最终的模型。……

阅读更多