项目地址:https://github.com/rasbt/deeplearning-models
该项目的目录如下:
- 传统机器学习
- 多层感知机
- 卷积神经网络(CNN)
- 度量学习(Metric Learning)
- 自编码器
- 生成对抗网络(GAN)
- 循环神经网络(RNN)
- 有序回归
- 技巧和窍门
- PyTorch 工作流和机制
- TensorFlow 工作流和机制
其中每个部分包含多个子部分,主要介绍了各部分相关的模型和 TensorFlow、PyTorch 实现。
以 CNN 为例,我们来看一下它包含哪些内容。
卷积神经网络



这部分首先介绍了 CNN 的基础知识和概念,然后介绍了不同的 CNN 模型,如全卷积神经网络、AlexNet、VGG、ResNet 等,每个子部分都包含示例及其 TensorFlow 和 PyTorch 实现。
技巧和窍门
除了模型,该项目还介绍了一些模型训练的技巧和窍门。
这部分主要介绍了 PyTorch 中的周期学习率(cyclical learning rate),具体涉及三项内容:
- 简要介绍了周期学习率的基础概念;
- 使用「LR range test」为周期学习率选择基础和最大学习率;
- 使用周期学习率在 CIFAR-10 上训练简单的卷积神经网络。
详情参见:https://github.com/rasbt/deeplearning-models/blob/master/pytorch_ipynb/tricks/cyclical-learning-rate.ipynb
PyTorch 和 TensorFlow 的工作流和机制
该项目的最后介绍了 PyTorch 和 TensorFlow 的工作流和机制,涉及数据集、训练和预处理等内容。


《GitHub深度学习架构模型tips大合集》有一个想法