第278期 HackCV 日报

从本文可以看出业界的工作方向:高精度进行学习,低精度进行推断Inference。训练时,精度高,学习效果好;推断时,精度低,功耗低速度快。IBM最新推出的Do-It-All深度学习芯片,支持32位、16位、甚至于2位、1位精度的学习和推断。

整体印象是CVPR2018有一些新的结果,虽然不多,在作者感兴趣的领域并没有太多的突破性进展。

本文是对英伟达推断引擎(GIE)的介绍,GIE主要分两步:编译和部署。GIE在编译阶段可以对网络配置进行优化,进而生成深度神经网络前向计算的优化方法;在部署阶段则是构建成服务,而无需安装深度学习框架。