第275期 HackCV 日报

阿里巴巴“图像和美”团队分享的在数据集方面的一些实践经验和总结,构建一个图像数据集,即是在一定的“用途”目的下,将“知识”与“图像”做关联,并给出评价算法的“指标”。对于数据集的构建,需要专业知识,需要数据的迭代,更需要指标来衡量。

使用LabelMe标注数据构建数据集,使用TensorFlow预训练的SSD模型进行调优完成水印的检测,使用OpenCV去除水印,文中有更详细的处理过程介绍。

本文介绍了选择正确合适的机器学习算法的流程:先要理解数据,对数据进行一些预处理,如清洗和增强等,进而明确要处理问题的类别和约束条件,最后基于这些信息,根据一定的方法就可以选择合适的机器学习算法。