最新网址:sk.3qxsw.com

早上起来,陈然习惯性坐在电脑前,浏览几个学术网站。

就一个领域的专业知识而言,最前沿的信息来自学术会议,大佬云集,智慧的火花交流碰撞,新颖的概念层出不穷。

论文成文要晚半年,量大管饱,但要有足够的分辨能力,一般只有少数具备研究和应用的价值。

专业知识产生的流程,基本是学术研究在前、接着技术应用、最后写进教材。

比如深度学习,2006年发表论文,2010年在Image竞赛异军突起,2016年AlphaGo让它名声大噪,确定广阔前景,2017年编入中学教材,最晚。

其实,有辅脑储备的未来知识,陈然不可能从论文中汲取养份,他了解前沿信息,只是为了不像贸然解决千禧难题一样,太过超前和惊世骇俗。

室友比你更优秀,还比你还更努力,怎么办?

陆少英觉得就像龟兔赛跑,拼的是毅力,哪怕注定赢不了,也要输得好看点儿……

陆少英也十分勤奋,一大早就爬了起来,注意到陈然最近在写的《神经网络的结构细分和动态路由》,他先沾光、一睹为快了。

AI领域当前使用最广泛的是卷积神经网络,它具有分层提取特征的学习能力,在计算机视觉和语音识别方面都能取得最好的性能,缺点是运算量巨大,迁移学习能力差,池化层也丢失了大量信息。

在这篇论文中,陈然提出了一种全新的深度学习模型,将许多神经网络结构集合在一个网络中,全面模拟人脑的思维能力。

不谈其结构的复杂程度,陆少英简直无法想象,“这么庞大的运算量,服务器根本带不动吧?”

陈然的眼睛看着电脑屏幕,头也不抬,“这就不是我的事了……再说了,这个主要是复杂结构难以实现,运算量却没你想象的高,知道为什么吗?”

陈然随口一问,也没认真,但陆少英发现,自己还是被难住了……

见他答不上来,陈然也没勉强,而是认真解释,“神经网络的不同结构,比如卷积、池化、LSTM单元……都是为了提取特征,不过层数少的话,预测效果差,层数一多,又容易丢失信息。”

“但如果将网络的结构功能化,数据通过路由算法给相应的结构单元处理,运算不需要现在的神经络一样整层参与,反而会更少。”

“动态的由每个单元提取特征?”陆少英吃了一惊,他听说过类似的胶囊网络,但还是觉得……这种操作更骚!

“当然。”陈然举了个例子,“整个网络的详细信息都可以保留。比如图像中精确的目标位置、旋转、厚度、倾斜、大小等,又或者语音的语气、情绪、音调……”

“能区分、比对所有特征?”陆少英瞪大眼睛,又追问了一句,“岂不是说,机器学习的效果会更细致,更好?”

“答对了!”陈然淡淡一笑,“相当于用少量的训练数据达到更强的效果。”

“你妹……真是太强了!”陆少英简直泪流满面,亏他还把卷积神经网络当个宝,这尼玛马上可以扫进垃圾堆了,“大佬就是大佬,牛逼!”

“服不服?”

陆少英竖起拇指,“服!”

“喊爸爸!”

“……”

到了该吃早饭的时候,两人去了食堂。

同学们并不经常登陆校园论坛,走在路上,偶尔有人注目,陈然没感觉到明显的变化。

好吧,他从小自带聚光,也无从分辨就是了。

买了稀饭馒头,刚坐下,便有一个高壮的学长端着盘子走过来,后面还跟着李舒涵,学长笑着道:“然哥,早上好!今天蛮巧啊?”

陈然示意两人坐下,向陆少英介绍道:“这位是钱斌学长,硕士在读。李舒涵,你见过的,实验室的新助理。”

介绍陆少英的时候,李舒涵嘻嘻一笑,吐了吐舌头,“好巧!”

巧什么呀,陆少英心里跟明镜似的,实验室助理就是打杂,一般女孩儿哪看得上,绝对是冲着陈然去的。



本章未完 点击下一页继续阅读