第29期 HackCV 日报

这篇文章基于几篇论文写了一个总结,讨论了集中语言模型,包括词袋模型、n-gram模型和word2vec模型,还有对softmax层的修改,让它更加高效。

本文提供了NLP中最常见的任务的相关资源,有博客、研究论文、代码等,是一篇总结性的文章。

从大规模的流数据,比如日志数据,进行快速的统计需要一定的技巧,就是分而治之,但是如何高效地分而治之呢?本文提供了一个据称是目前最好的方法。