第111期 HackCV 日报

长短期记忆神经网络竟然已经存在了20年了!LSTM是RNN的一种特例,主要对连续数据进行建模,常用于自然语言处理任务。这篇文件对LSTM的结构进行了介绍,并使用TensorFlow进行了股票信息模型的训练。

OpenFace的一个特色是关注于在手机设备上的实时人脸识别,但从使用语言看,应该还有一段路要走。具体来说是使用Torch训练人脸特征表示的神经网络,然后使用dlib中的人脸检测器检测人脸,并对每个人脸进行预处理,之后使用前面训练的神经网络提取人脸特征,最后使用svm分类即识别是谁。

主要是对BlazingText的评测,从结果看,对比fastText,数据吞吐提升明显,准确率变化非常小,但采用batch_skipgram这种训练方式,显然数据吞吐会有提升。从成本的角度看,确实降了不少,而且使用多实例进行并行训练时,也有sub-linear的吞吐提升。