MEC: Memory-efficient Convolution for Deep Neural Network C++个人实现,论文地址
- Ubuntu18.04
- BLAS的免费版本ATLAS(安装命令:
sudo apt-get install libatlas-base-dev
) - OpenMP
- g++ -o demo1 Im2ColOrigin.cpp /usr/lib/x86_64-linux-gnu/libcblas.so.3 -fopenmp
- ./demo1
- g++ -o demo2 Im2ColMEC.cpp /usr/lib/x86_64-linux-gnu/libcblas.so.3 -fopenmp
- ./demo2
方法 | 速度 | 内存占用 |
---|---|---|
Im2Col+Origin | 35ms | 26.5M |
MEC(4线程) | 7ms | 15.7M |
MEC(1线程) | 28ms | 11.7M |