Skip to content

LOTEAT/PaperReading

Repository files navigation

PaperReading

在人工智能的学习中,我们需要掌握大量的神经网络架构。在学习这些架构的时候,我经常会看的时候掌握,但是没几天就忘记了。所以,我创建了这个仓库。我将我自己在论文学习以及代码学习的过程中掌握的知识以要点的形式写出来。

主要内容

1. Computer Vision

1. Backbone

1.1 Basic Knowlege
2.1 Backbone Networks
  • ResNet: 残差网络,其残差思想已经被广泛应用当今的网络设计中。

  • MobileNet: 采用Depthwise Separable Convolution降低计算量。

  • MobileNetV2: 采用linear layer替换ReLU,并引入残差连接,在降低参数计算量的同时提高性能。

  • MobileNetV3: 引入通道注意力机制,并采用新的激活函数,在降低参数计算量的同时提高性能。

  • EfficientNet: 探究了深度、宽度以及分辨率对性能的影响。

  • SwinTransformer: 通过多层级以及窗口注意力提升特征的表达能力。

2. 2D Detection

2.1 Basic Knowlege
  • IoU: IoU计算
  • mAP: mAP计算
  • NMS: 非极大值抑制
2.2 Two Stage
2.3 One Stage
  • DETR: 首个应用Transformer的端到端检测模型。

3. 3D Detection

3.1 Basic Knowlege
  • MMDetection3d: MMDetection3D是由MMLab编写的一款3D目标检测框架,在本文档中将简略介绍一些会用到的关键基础通用组件。
3.2 BEV
3.2.1 Basic Knowlege
  • Lift, Splat, and Shoot: 通过预测图片像素的深度信息,构建了2D到3D的空间转换,将2D图像转化为BEV图像。
3.2.2 Camera-based Method
3.2.3 LiDAR-based Method
3.2.4 Fusion-based Method

4. Occupancy Network

4.1 Basic Knowlege
4.2 Occupancy Network

2. Natural Language Processing

3. Math

4. Localization

5. Motion Planning

5.1 Basic Knowlege

5.2 Search Based Methods

  • AStar: 启发式搜索算法。

  • BFS: 宽度优先搜索。

  • DFS: 广度优先搜索。

5.3 Sampling Based Methods

  • RRT: 基于随机采样的路径搜索算法。

5.4 Motion Model

5.5 Trajectory Generation

6. MMSeries

6.1 MMEngine

6.1.1 Scheduler

6.2 MMDetection

6.2.1 Task Utils

6.3 MMDetection3D

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages