第57期 HackCV 日报

这是对2016年的计算机视觉领域发展的总结。通俗来说,计算机视觉就是让计算机具备视觉能力,具体包括分类、定位、目标检测和追踪、分割、超分辨、风格变换、着色、动作识别、3D目标、姿势估计、重建、3D相关的技术、卷积神经网络架构、数据集等等。

训练机器学习模型时,一般都会先分为训练数据集和测试数据集,在训练集上训练模型,在测试集上进行模型的评估。但为了更好的模型泛化能力,还可以从训练集中再分出一份验证集,在不同的数据上对模型进行多次验证,避免模型在训练集和测试集上同时过拟合。这个方法是参加Kaggle比赛中的一个技巧。

FlashText是一个专门用于搜索和替换文档中单词的一个Python库,其快速的原因是因为使用的是Aho-Corasick算法和Trie数据结构。测试显示,当搜索和替换的词在500以上时,使用这个工具会非常快。