GitHub深度学习架构模型tips大合集

最近,威斯康辛大学麦迪逊分校统计学助理教授、机器学习和深度学习研究者 Sabastian Raschka 在 GitHub 上创建了一个项目,包含大量深度学习架构、模型和 tips。该项目发布两天即获得了 2000 多星,目前在 GitHub Trending 上名列第一。

项目地址:https://github.com/rasbt/deeplearning-models

该项目的目录如下:
  • 传统机器学习
  • 多层感知机
  • 卷积神经网络(CNN)
  • 度量学习(Metric Learning)
  • 自编码器
  • 生成对抗网络(GAN)
  • 循环神经网络(RNN)
  • 有序回归
  • 技巧和窍门
  • PyTorch 工作流和机制
  • TensorFlow 工作流和机制

其中每个部分包含多个子部分,主要介绍了各部分相关的模型和 TensorFlow、PyTorch 实现。

以 CNN 为例,我们来看一下它包含哪些内容。

卷积神经网络

这部分首先介绍了 CNN 的基础知识和概念,然后介绍了不同的 CNN 模型,如全卷积神经网络、AlexNet、VGG、ResNet 等,每个子部分都包含示例及其 TensorFlow 和 PyTorch 实现。

技巧和窍门

除了模型,该项目还介绍了一些模型训练的技巧和窍门。

这部分主要介绍了 PyTorch 中的周期学习率(cyclical learning rate),具体涉及三项内容:

  • 简要介绍了周期学习率的基础概念;
  • 使用「LR range test」为周期学习率选择基础和最大学习率;
  • 使用周期学习率在 CIFAR-10 上训练简单的卷积神经网络。

详情参见:https://github.com/rasbt/deeplearning-models/blob/master/pytorch_ipynb/tricks/cyclical-learning-rate.ipynb

PyTorch 和 TensorFlow 的工作流和机制

该项目的最后介绍了 PyTorch 和 TensorFlow 的工作流和机制,涉及数据集、训练和预处理等内容。

《GitHub深度学习架构模型tips大合集》有一个想法

发表评论

电子邮件地址不会被公开。 必填项已用*标注