• 本文总结了三种数据的预处理分析方法,对于结构化数据,并不用太多的预处理,已经有了足够的特征;对于自然语言处理来说,有一些通用的技巧,比如大小写转换、停用词移除等;而对于图像处理来说,预处理的情况更多更复杂,一般都与特定任务相关。
  • 理由很简单,深度学习需要大量的数据,大量的计算时间,昂贵的设备,大量的参数需要调整,而对于计算机视觉任务来说,虽然要花大量的时间在特征选择上面,但模型却更简单高效。
  • AI的火热发展有目共睹,但其有个潜在的问题是,一旦对图像、文本或者音频做很轻微的改动,这些系统就会得到不一样的结果,而这可能会带来很多潜在的问题,比如自动驾驶中的一些识别问题。另一方面,好的技术会被拿来做些坏事,像前阵子的deepfake一样。