数据科学中的6个基本算法,掌握它们要学习哪些知识

如果想从事数据科学,但是又没有数学背景,那么有多少数学知识是做数据科学所必须的?

统计学是学习数据科学绕不开的一门数学基础课程,但数据科学也经常会涉及数学中的其他领域。

数据科学使用算法进行预测,这些算法称为机器学习算法,有数百种之多。有人总结了数据科学中最常用的6种算法,已经掌握它们分别需要哪些数学知识。……

阅读更多

TensorFlow 的可视化工具TensorBoard

TensorBoard 是 TensorFlow 提供的实用工具(utility),可以图形化的显示 computational graph。
TensorBoard 是 TensorFlow提供的一组可视化工具(a suite of visualization tools),可以帮助开发者方便的理解、调试、优化TensorFlow 程序。……

阅读更多

TensorFlow识别验证码

卷积神经网络很强大,我们这里只是识别4位的字母+数字的验证码,如果我们有大量中文的验证码作为学习材料,识别中文也是可以的。也就是说:我们喂给模型什么东西,它就学到什么。……

阅读更多

Numpy的genfromtxt函数

What is genfromtxt?
genfromtxt函数创建数组表格数据
genfromtxt主要执行两个循环运算。第一个循环将文件的每一行转换成字符串序列。第二个循环将每个字符串序列转换为相应的数据类型。
genfromtxt能够考虑缺失的数据,但其他更快和更简单的函数像loadtxt不能考虑缺失值。……

阅读更多

Numpy 掩码数组

有时候数据集中存在缺失、异常或者无效的数值,我们可以标记该元素为被屏蔽(无效)状态。……

阅读更多

Numpy 结构化数组

之前我们操作Numpy的数组时,都是通过索引来操作的。

针对二维数组,使用索引可以完成对行、列的操作。但是这是非常不直观的。

可以把二维数组想象成一个excel表格,如果表格没有列名,操作起来会非常麻烦,针对这种情况,Numpy提供了结构化数组用来操作每列数据。……

阅读更多