Hacks on Computer Vision

第221期 HackCV 日报

2018.05.11

本文是计算机视觉和自然语言处理组合解决唇语识别的问题,主要包括唇语(输入是视觉,输出是文字)、图像标注(输入是视觉,输出是文字)、视觉问题回答(输入是视觉和文字,输出是文字)、基于文字图像的生成这几个方向,而本文探索的是第一个问题。文章很长,但探索的过程非常详细也很有意思。

李沐大神推出的解决NLP痛点的方案,目前的痛点是复现难、框架API变动、接口设计混乱、资源分散。推荐NLP相关的朋友关注。

卡内基梅隆大学在这个秋天将在计算机科学学院设立人工智能的本科专业。要说智能专业,国内好几年前就有了,但学的都是些导论、科普之类的。

__EOF__

本文作者HackCV
版权声明本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!
本文链接https://hackcv.com/daily/%E7%AC%AC221%E6%9C%9F-hackcv-%E6%97%A5%E6%8A%A5/

发表评论