第120期 HackCV 日报

总结了一套NLP处理问题的流程,收集数据、处理数据、可视化、特征工程、构建模型,基本的NLP处理相关的名词都在里面了。

图像压缩,损失的图片质量,降低的是带宽成本,本文是腾讯TEG架构平台部在图片压缩方面的一些实践,简单的是webp的支持,但浏览器兼容性不足,自研的格式可以在APP端进行支持,但依旧存在兼容性的问题,而谷歌提出的guetzli是一个比较好的方法,其编码后还是jpeg,不存在兼容问题,但其编码非常复杂,腾讯在其落地化的过程中,进行了一些改进并添加到图片服务中。

特征选择是降维的一种方式,本文提出了一种条件协方差最小化的方法,选择那些协变量响应依赖最大化的特征,文中对这个问题进行了建模和实验,效果不错。