第80期 HackCV 日报

使用IIT-5K数据集中的500张图片,对比了谷歌、微软和亚马逊的OCR识别接口的准确率,分析了各个识别接口的成功和失败的情况。就这次总体而言,谷歌的接口准确率最高,不过显然OCR这个领域还有一定的路要走。

作者探索了医疗图像数据集ChestXray14,提出了三个问题:1.这些标签有多准确?2.这些标签的含义是什么?3.这些标签对于图像分析有什么用?作者使用最原始也是最基本的探索方法,肉眼查看各个类别的一部分图片,发现标签的准确率很低,进而提出了自己的观点。文章非常长,看下最后的结论即可。

深度学习的一个hack方法实例,使用树莓派和廉价摄像头获取图像,使用YOLO进行检测。大量可用的深度学习模型,让动手实践派可玩的更多了。