公司動態(tài)
人工智能為什么這么熱? 突破難點在那里?
閱讀:352 發(fā)布時間:2017-9-12想要在某一領(lǐng)域取得重大突破,是一件容易的事情嗎?從幾位科學(xué)家的回答來看,這并非一件易事。
比如,Brian K. Kobilka說道,花費25億美元、經(jīng)歷7-12年的時間,但zui終一種新藥成功上市的概率只有10%-15%。饒毅也表示,雖然人工智能推動了神經(jīng)學(xué)的研究,但其實神經(jīng)學(xué)沒有任何概念上的突破。湯曉鷗也表示,在過去很多年里,都不好意思說自己在研究人工智能,因為什么都沒有做出來。即便目前取得了進展,但仍然困難重重。
具體來說,從50年代開始,就已經(jīng)有人在做人工智能 ,但從50年代到2011年做的都不好。2011年是一個分水嶺,主要有四方面的原因:
一是實際應(yīng)用的剛需。之前手提電腦非常多,雖然手提電腦能移動,但是大部分的情況下我們不會拎著電腦去吃飯,出去旅游時用電腦拍照。后來手機出來以后,手機上的攝像頭變成了人的第三只眼睛,我們在上發(fā)的zui多的就是照片或者是視頻。一圖勝千言,這時候產(chǎn)生了大量的數(shù)據(jù),這些數(shù)據(jù)需要智能地分析,所以有了實際應(yīng)用的剛需。
二是數(shù)據(jù)的體量有了大幅的增加。原來數(shù)據(jù)是從電腦中產(chǎn)生的,有手提電腦的人還是很少的,因為要一萬多塊錢一臺,但是紅米手機一出來,五六百塊錢一臺,任何人都可以購置兩臺。原來不到一億的用戶,一下子變成十億、二十億,體量出來了,也就產(chǎn)生了大量的訓(xùn)練和應(yīng)用數(shù)據(jù)。
三是可承受的硬件訓(xùn)練平臺。原來我們用CPU的時候,做人臉識別時會用近千個核,但還是要跑一兩個月才能把一個算法跑出來,然后調(diào)一個參數(shù),再來兩個月,又花錢又花時間。但后來用GPU,十臺機器、六個小時,同樣的東西就跑出來了。
四是算法的革命性的進步。有了前三個方面還是不夠的,zui后深度學(xué)習(xí)的框架允許我們做端到端的學(xué)習(xí),有了大量的參數(shù),以前我們是做小參數(shù)學(xué)習(xí)的。而且還要將這些小參數(shù)設(shè)計的非常復(fù)雜,因為要解決很多問題,但實際的應(yīng)用很不理想。但深度學(xué)習(xí)的網(wǎng)絡(luò)框架,允許我們用幾千個、幾萬個、幾億個參數(shù),用無窮大的數(shù)據(jù)直接覆蓋各種場景應(yīng)用。這樣就可以在一些單項、個別的應(yīng)用上超過人類,意味著可以替人類來做這個工作。
對它的研究,應(yīng)該分為三個層次,相輔相成,缺一不可。
zui高的是形而上的層面,也就是有人很討厭的哲學(xué)啦、心理學(xué)啦、精神病學(xué)啦之類的東西,同時也包括哥德爾定理、中文屋一類亂七八糟的東西;有人愿意的話,從文學(xué)、歷史、宗教中也能得到啟迪。這個層面的意義是建立基本的認識,為后面的研究打下基礎(chǔ)并提供指導(dǎo)。
中間的層次是生物學(xué)意義上的研究。就是深入探討人腦和神經(jīng)元的運作機理,研究生物學(xué)意義上的每一個生物物理學(xué)特性,并把它與形而上的研究結(jié)合對照,通過從上往下和從下往上的多次分析,把上層次的每一個現(xiàn)象和生物學(xué)特征對應(yīng)起來。比如,側(cè)抑制的原理是什么,作用是什么,和哪些外在表現(xiàn)相對應(yīng),是一對一,還是一對多或者多對多。通過這個研究,可以糾正很多原本錯誤的認識,并有很多新的發(fā)現(xiàn)。
如果能把人的所有智能和情感外在表現(xiàn)都與生物學(xué)意義上的特點起來,這個層次的研究就可以說基本成功了。對這個層次進行研究的人有,但很少。實話說,這個層次的研究zui難。上而下與下而上相結(jié)合的研究與思維方式,不是很容易。
下層的研究就是從上、中層研究向編程的轉(zhuǎn)化。這絕不僅僅是指的編程,首先要做的,是把上中層研究的結(jié)果進行等效轉(zhuǎn)換,把哲學(xué)、邏輯學(xué)和生物、物理學(xué)語言向程序語言的轉(zhuǎn)換。這個層次并不比中層的研究容易,甚至更難。因為它是對前面研究成果的一個檢驗,往往前面覺得無缺的理論,到了這里就會卡住,隨后在深入的研究中,就會牽扯出一大串的錯誤。而糾正這個錯誤,往往需要對上層和中層的研究重新進行審視。
所以,上層的研究看起來是zui容易的,很方便隨意推出一篇一篇的所謂理論。但實際上,幾乎所有錯誤的根源都可以在這里找到源頭。由于中層和下層的研究需要很專業(yè)的知識和很艱辛的探索,很多人望而生畏,就停留在“我有理論”的地步沾沾自喜起來,并以人工智能研究專家自居了。
目前人工智能在三個方面應(yīng)用的比較多:一是語音識別。這個是相對成熟,也是*個突破的。二是視覺,現(xiàn)在的主戰(zhàn)場就是在視覺領(lǐng)域,而且看的能力的場景是非常多的。三是自然語言的理解,就是要像大腦一樣解決問題,這件事情目前是*沒有解決的。現(xiàn)在這一塊很熱,很多國內(nèi)外的公司都做對話機器人,但這其實是非常難的一件事情,因為它對各種背景知識以及條件的要求是非常多的。
“條條大路通羅馬”,并不是只有一條成功的道路。務(wù)虛的久了,也必須要實干來證明和實現(xiàn)價值;實干的不停的做,發(fā)現(xiàn)前方無路,也不得不要思考下方向的問題。