马上注册,享用更多功能,让你轻松玩转本论坛。
您需要 登录 才可以下载或查看,没有账号?立即注册
×
科普深度学习 在这里,我要稍微深度讲一下深度学习。 深度学习是一种神经网络,与但与之前的相比,它的特点是使用了多层网络,能够学习抽象概念,同时融入自我学习,而且收敛相对快速。收敛快速可能是一种技巧,不见得是一个理论,但是有一批人通过它解决了很多重要的问题。 简单的来说,如果我们有很多笑脸,然后我们把笑脸的像素输入到一个神经网络里面去,最后你那儿希望让机器能识别这是姚明,那是马云,但是因为你这个深度学习的网络很深,要一次性学会这么多也会比较困难,所以就需要用到一个比较快速收敛的技巧——自我学习。通过自我学习,机器会逐步从大量的样本中逐层抽象出相关的概念,然后做出理解,最终做出判断和决策。 比如它可以有好几层的nodes和connection,经过这些nodes和connection,它在每一个层次会感知到不同的抽象特征,且一层比一层更为高级。这些都是通过自我学习实现的,而不是人教的。经过自我学习,从一个脸输进去再从同样的一个脸输出来,它就从里面抽象的学习到了一个人的脸重要特征。 深度学习的分层无监督训练
经过这个学习之后,我再去做监督训练,看机器是否能够识别他们,如果不能,就在训练之后做微调。例如,如果我输入了马云的脸,出来的却是王宝强,那训练系统就会告诉你的网络说这个是错误的:这不是王宝强,这是马云。那接下来就是要进行微调,以便于下一次机器看到这个脸时,能识别出是马云的概率高一些,出来王宝强的概率低一些。 分层无监督训练
但是这么一调也不能调的太过火了,要不然就会有overtraining的问题,我们就对整个数学公式做一点微调,用大量的数据,不断重复的去教它,经过不断微调,那么它就很可能在多次之后降低识别错误。 其实这一整套理论在二三十年前就已经有了,我在做我博士论文的时候,很多我的同事就在做训练神经网络的工作。 深度学习在最初的时候训练速度特别特别慢,所以比较难进入工业级别或者是应用级别,比如,你的手机是做不来这个的,因为它的速度实在太慢了。但经过这么多年,我们的计算机变的越来越快,另外也有了更多取巧的训练和识别做法,深度学习的应用可能性也发生了变化,它能被应用的领域越来越宽。多年前,我过早的进入了这一领域,但是现在,人工智能大规模应用的时机已经到了。 凭什么这么说?一个很简单的评估标准就是,我们的深度学习或者是任何的机器学习,它是不是超越人类的能力表现,如果超越的话,可能很多应用就会产生。比如在机场,如果机器识别人脸的准确度超过人,那么我们那些边防的人就可能不需要那么多。这并不是说机器不会犯错,而是说既然人不能比机器做的更好,那我不妨就用机器取代。
|