第178期 HackCV 日报

本文是一个非常好的数据分析实例,从100万个视频信息中,可以分析出参与度最高的视频内容,最优的视频长度,观众最常见的反应,标题合适的长度等等。

本文介绍了三种TensorFlow数据输入的格式Placeholders、Protobufs和Queues,以及出错的可能情况。

谷歌云平台的云文本语音转换的功能强大,支持12种语言和变种的32种不同的声音。而现在使用了DeepMind的WaveNet和TPU后,提速明显,使用MOS主观评价也有很明显的提升。