第260期 HackCV 日报

Deepmind最新的的研究进展,提出了一个生成查询网络(GQN),通过移动观察到的场景信息进行训练,可以感知周围的环境。GQN包含两部分:一个表示网络和一个生成网络,与GAN倒有些类似。

微软在CVPR2018上发表的一篇文章,基于迁移学习构建的一个CleanNet,主要用于大规模图像分类任务中的类别噪声处理,解决的是目前训练图像标记人力成本高、标记不准确的问题。

本文介绍了YOLO的基本原理,并构建了一个iOS的应用,在iPhone6s上处理单张图片可以达到0.15秒的速度。