第143期 HackCV 日报

作者使用的数据集包含了一百五十多万有标注的数据,使用的模型是传统的CNN,并添加LSTM层,不同的位置有不同的结果,从实验结果看,在第一层添加LSTM层比在中间添加的效果好。作者提供了论文和代码,感兴趣的可以试一下。

本文差不多一半的篇幅在讨论PyTorch和TensorFlow的编程和设计哲学问题,简单而言,PyTorch可以看做是“Python”,而TensorFlow可以看做是“C”。之后介绍了PyTorch的API和基本的使用方法。

Slack的数据工程部门的主管对机器学习模型部署方面的一些探讨和分享,对数据科学家的看法有些意思,工程能力比工程师差,数据科学能力也比科学家要差。至于机器学习模型,训练模型是一方面,使用模型又是另一方面,监控哪些性能指标,如何接入到现有系统,如何升级部署等等都是要考虑的问题。