技術(shù)分析:人工智能的全面科普
人們在日常生活中接觸人工智能的頻率越來越高,有可以幫用戶買菜的京東智能冰箱;可以做自動翻譯的機器;還有Siri、Alexa和Cortana這樣的機器人助理;以及無人車、AlphaGo等已經(jīng)把人工智能技術(shù)帶到了“看得到摸得著”的境地。人工智能正以前所未有的態(tài)勢洶涌而來,相關(guān)領(lǐng)域的融資總額一直在逐年穩(wěn)步增長,到2016年達到數(shù)十億美元的火爆程度。那么人工智能到底是什么?這個領(lǐng)域涉及哪些方面?人工智能要完成的目標(biāo)和任務(wù)有哪些?接下來的內(nèi)容將做一一介紹。
1.什么是人工智能
Alan Turing定義的AI是:能使計算機完成那些需要人類智力才能完成的工作的科學(xué)。斯坦福大學(xué)的學(xué)者認為AI是智能機器的科學(xué)和工程,特別是智能計算機程序。維基百科定義AI是指由人工制造出來的系統(tǒng)所表現(xiàn)出來的智能,該詞同時也指研究這樣的智能系統(tǒng)是否能夠?qū)崿F(xiàn),以及如何實現(xiàn)的科學(xué)領(lǐng)域。不管怎樣定義,都離不開智能,然而到目前為止人類還沒能統(tǒng)一地給出智能的定義,通常所說的智能也只是參考人類智慧的表現(xiàn)形式。原中國人工智能學(xué)會理事長鐘義信教授,認為人類智慧包含發(fā)現(xiàn)問題、定義問題、解決問題三方面,而人工智能目前只做到了解決問題的程度。筆者認為智能是一種有序,是信息的體現(xiàn),也是使世界朝著有序的方向發(fā)展的能力??杀氖?,根據(jù)熵增原理,無論智能體做怎樣的努力,整個宇宙總是朝著熵增加的方向發(fā)展,即越來越無序和混亂。不知道這是上帝故意的安排,還是人類觀察到的宇宙之外另有天地。
2.人工智能的歷史
1950 年代初期,人工智能聚焦在所謂的強人工智能,希望機器可以像人一樣完成任何智力任務(wù)。強人工智能的發(fā)展止步不前,導(dǎo)致了弱人工智能的出現(xiàn),即把人工智能技術(shù)應(yīng)用于更窄領(lǐng)域的問題。1980 年代之前,人工智能的研究一直被這兩種范式分割著,兩營相對。但是,1980 年左右,機器學(xué)習(xí)開始成為主流,它的目的是讓計算機具備學(xué)習(xí)和構(gòu)建模型的能力,從而它們可在特定領(lǐng)域做出預(yù)測等行為。

歷史上人工智能有三大學(xué)派:符號主義(symbolicism),又稱為邏輯主義(logicism)、心理學(xué)派(psychologism)或計算機學(xué)派(computerism),其原理主要為物理符號系統(tǒng)(即符號操作系統(tǒng))假設(shè)和有限合理性原理。連接主義(connectionism),又稱為仿生學(xué)派(bionicsism)或生理學(xué)派(physiologism),其主要原理為神經(jīng)網(wǎng)絡(luò)及神經(jīng)網(wǎng)絡(luò)間的連接機制與學(xué)習(xí)算法。行為主義(actionism),又稱為進化主義(evolutionism)或控制論學(xué)派(cyberneticsism),其原理為控制論及感知-動作型控制系統(tǒng)。
符號主義認為人工智能源于數(shù)理邏輯。其早在1956年首先采用“人工智能”這個術(shù)語。后來又發(fā)展了啟發(fā)式算法-專家系統(tǒng)-知識工程理論與技術(shù),并在20世紀80年代取得很大發(fā)展。
連接主義認為人工智能源于仿生學(xué),特別是對人腦模型的研究。20世紀60~70年代,連接主義對以感知機(perceptron)為代表的腦模型的研究出現(xiàn)過熱潮,由于受到當(dāng)時的理論模型、生物原型和技術(shù)條件的限制,腦模型研究在20世紀70年代后期至80年代初期落入低潮。直到Hopfield教授在1982年和1984年發(fā)表兩篇重要論文,提出用硬件模擬神經(jīng)網(wǎng)絡(luò)以后,連接主義才又重新抬頭。1986年,魯梅爾哈特(Rumelhart)等人提出多層網(wǎng)絡(luò)中的反向傳播算法(BP)算法。此后又有卷積神經(jīng)網(wǎng)絡(luò)(CNN)的研究,連接主義勢頭大振,從模型到算法,從理論分析到工程實現(xiàn),為神經(jīng)網(wǎng)絡(luò)計算機走向市場打下基礎(chǔ)。2006年,Hinton在《Science》和相關(guān)期刊上發(fā)表了論文,首次提出了深度信念網(wǎng)絡(luò)(DBN)的概念,將深度學(xué)習(xí)推向?qū)W術(shù)界并成為當(dāng)前人工智能領(lǐng)域非常熱門的研究方向。

行為主義認為人工智能源于控制論??刂普撍枷朐缭?0世紀40~50年代就成為時代思潮的重要部分,影響了早期的人工智能工作者。維納(Wiener)和麥克洛克(McCulloch)等人提出的控制論和自組織系統(tǒng)以及錢學(xué)森等人提出的工程控制論和生物控制論,影響了許多領(lǐng)域??刂普摪焉窠?jīng)系統(tǒng)的工作原理與信息理論、控制理論、邏輯以及計算機聯(lián)系起來。早期的研究工作重點是模擬人在控制過程中的智能行為和作用,如對自尋優(yōu)、自適應(yīng)、自鎮(zhèn)定、自組織和自學(xué)習(xí)等控制論系統(tǒng)的研究,并進行“控制論動物”的研制。到20世紀60~70年代,上述這些控制論系統(tǒng)的研究取得一定進展,播下智能控制和智能機器人的種子,并在20世紀80年代誕生了智能控制和智能機器人系統(tǒng)。行為主義是20世紀末才以人工智能新學(xué)派的面孔出現(xiàn)的,引起許多人的興趣。這一學(xué)派的代表作者首推布魯克斯(Brooks)的六足行走機器人,它被看作是新一代的“控制論動物”,是一個基于感知-動作模式模擬昆蟲行為的控制系統(tǒng)。
3.人工智能的目標(biāo)
人工智能的目標(biāo)包括:推理、知識表示、自動規(guī)劃、機器學(xué)習(xí)、自然語言理解、計算機視覺、機器人學(xué)和強人工智能八個方面。知識表示和推理包括:命題演算和歸結(jié),謂詞演算和歸結(jié),可以進行一些公式或定理的推導(dǎo)。自動規(guī)劃包括機器人的計劃、動作和學(xué)習(xí),狀態(tài)空間搜索,敵對搜索,規(guī)劃等內(nèi)容。機器學(xué)習(xí)這一研究領(lǐng)域是由AI的一個子目標(biāo)發(fā)展而來,用來幫助機器和軟件進行自我學(xué)習(xí)來解決遇到的問題。自然語言處理是另一個由AI的一個子目標(biāo)發(fā)展而來的研究領(lǐng)域,用來幫助機器與真人進行溝通交流。計算機視覺是由AI的目標(biāo)而興起的一個領(lǐng)域,用來辨認和識別機器所能看到的物體。機器人學(xué)也是脫胎于AI的目標(biāo),用來給一個機器賦予實際的形態(tài)以完成實際的動作。

人工智能、機器學(xué)習(xí)、數(shù)據(jù)挖掘這些非常相關(guān)的術(shù)語或知識我們經(jīng)常看到,也見到很多關(guān)于三者關(guān)系的文章和討論。一般來說,人工智能是一個很大的研究領(lǐng)域;機器學(xué)習(xí)是人工智能的一個目標(biāo),提供很多算法;而數(shù)據(jù)挖掘是偏向算法應(yīng)用的部分。三者相輔相成,另外也需要其他領(lǐng)域的知識支持。具體關(guān)系請參考下圖。

4.人工智能的方法
為了達到人工智能的目標(biāo),下面依次梳理一下學(xué)術(shù)和工業(yè)界研究的各種方法和成果。
4.1 知識的表示和推理
知識表示包括:基于知識的系統(tǒng),表示常識知識等。傳統(tǒng)的知識表示已經(jīng)很成熟了,包括了描述邏輯,也包括了語義網(wǎng)(資源描述框架RDF)。知識推理建立在邏輯上,首先需要龐大的數(shù)據(jù)集,比如freebase;其次需要關(guān)系抽取自動化工具;最后需要合理的知識存儲結(jié)構(gòu),比如資源描述框架RDF。谷歌提的知識圖譜概念就是一種知識工程,它有龐大的知識庫和基于知識庫的各種服務(wù)。早年業(yè)界研究的知識本體也是一種知識工程,研究成果有 FrameNet、WordNet、中文知網(wǎng)HowNet等。具體的知識本體的例子請參考下圖。

IBM在2011年研發(fā)了Watson問答系統(tǒng)。谷歌在2012年提出知識圖譜,作為谷歌的兩大重要技術(shù)儲備,一個是深度學(xué)習(xí),形成了谷歌大腦;另一個就是知識圖譜,用來支撐下一代搜索和在線廣告業(yè)務(wù)。臉譜公司利用知識圖譜技術(shù)構(gòu)建興趣圖譜,用來連接人、分享的信息等,并基于此構(gòu)建了graph search。其他的工業(yè)應(yīng)用還有:SIRI、EVI、Google Now、Dbpedia、 freebase等。一般一個知識工程的底層技術(shù)架構(gòu),請參考以下圖示。

4.2 自動規(guī)劃
首先要說一下有限狀態(tài)機(FSM),一般應(yīng)用于游戲機器人,網(wǎng)絡(luò)協(xié)議,正則表達式,詞法語法分析,自動客服等。如下圖是一個簡單的游戲機器人狀態(tài)轉(zhuǎn)移和行動圖。

其次是狀態(tài)空間搜索,最簡單粗暴的是盲目搜索,就像特斯拉評價愛迪生:“如果說有一根針掉進草垛了,讓他去找,他會毫不猶豫的,一根一根草挑出來找”。優(yōu)化改進的版本是啟發(fā)式搜索,如A*算法。這方面的應(yīng)用有國際象棋Deepblue,圍棋AlphaGo。AlphaGo 在蒙特卡洛樹搜索 (Monte Carlo Tree Search, MCTS) 基礎(chǔ)上使用了深度學(xué)習(xí),監(jiān)督學(xué)習(xí)和增強學(xué)習(xí)等方法?!懊商乜鍢渌阉鳌笔且活悊l(fā)式的搜索策略,能夠基于對搜索空間的隨機抽樣來擴大搜索樹,始終保證選取當(dāng)前抽樣中的最優(yōu)策略從而不斷接近全局最優(yōu),確定每一步棋應(yīng)該怎么走才能夠創(chuàng)造更好機會。另外還包括:計劃、動作和學(xué)習(xí),敵對搜索,基于邏輯的規(guī)劃方法,狀態(tài)演算等內(nèi)容。

4.3 機器學(xué)習(xí)
谷歌CEO桑德爾·皮蔡在一封致股東信中,把機器學(xué)習(xí)譽為人工智能和計算的真正未來,可想而知機器學(xué)習(xí)在人工智能研究領(lǐng)域的重要地位。機器學(xué)習(xí)的方式包括:有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和強化學(xué)習(xí)。其中的算法有:回歸算法(最小二乘法、LR等),基于實例的算法(KNN、LVQ等),正則化方法(LASSO等),決策樹算法(CART、C4.5、RF等),貝葉斯方法(樸素貝葉斯、BBN等),基于核的算法(SVM、LDA等),聚類算法(K-Means、DBSCAN、EM等),關(guān)聯(lián)規(guī)則(Apriori、FP-Grouth),遺傳算法,人工神經(jīng)網(wǎng)絡(luò)(PNN、BP等),深度學(xué)習(xí)(RBN、DBN、CNN、DNN、LSTM、GAN等),降維方法(PCA、PLS等),集成方法(Boosting、Bagging、AdaBoost、RF、GBDT等)。想要深入學(xué)習(xí)的同學(xué)請參考《機器學(xué)習(xí)知識表格》和《機器學(xué)習(xí)方法匯總》。
深度學(xué)習(xí)是機器學(xué)習(xí)中人工神經(jīng)網(wǎng)絡(luò)算法的延伸和發(fā)展,近期深度學(xué)習(xí)的研究非?;馃?,就在這里介紹一下神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)。先說兩層網(wǎng)絡(luò),如下圖,其中a是“單元”的值,w表示“連線”權(quán)重,g是激活函數(shù),一般為方便求導(dǎo)采用sigmoid函數(shù)。采用矩陣運算來簡化圖中公式:a(2) = g( a(1) * w(1) ), z = g( a(2) * w(2) )。設(shè)訓(xùn)練樣本的真實值為y,預(yù)測值為z,定義損失函數(shù) loss = (z – y)2,所有參數(shù)w優(yōu)化的目標(biāo)就是使對所有訓(xùn)練數(shù)據(jù)的損失和盡可能的小,此時這個問題就被轉(zhuǎn)化為一個優(yōu)化問題,常用梯度下降算法求解。一般使用反向傳播算法,從后往前逐層計算梯度,并最終求解各參數(shù)矩陣。

深度學(xué)習(xí)采用多層神經(jīng)網(wǎng)絡(luò),在求解參數(shù)矩陣時計算量隨層數(shù)呈指數(shù)上升。假設(shè)處理一張300*300像素的圖片,采用8層網(wǎng)絡(luò),每層6個節(jié)點,那么在全聯(lián)接的情況下將有300*300*6^8個參數(shù)需要計算求解。卷積神經(jīng)網(wǎng)絡(luò)(CNN)提出卷積算子和權(quán)值共享來大幅減少參數(shù)個數(shù)。另外一個問題是梯度彌散,由于sigmoid函數(shù)求導(dǎo)后的函數(shù)小于0.25,標(biāo)準化正態(tài)分布產(chǎn)生的初始隨機參數(shù)w也都在0-1之間。而各層的梯度是從后往前逐層求解,且前面層的梯度是來自后面層的值乘積。因此會有一個剃度指數(shù),一旦初始值小于1,經(jīng)過多層乘積后將會迅速變小。一個有效的解決方案是使用ReLU做激活函數(shù)。介于篇幅這里只做簡介,想要深入了解深度學(xué)習(xí)的同學(xué)請參考《一文讀懂深度學(xué)習(xí)》。

4.4 自然語言處理NLP
NLP是人工智能的另一個目標(biāo),用于分析、理解和生成自然語言,以方便人和計算機設(shè)備進行交流,以及人與人之間的交流。它的應(yīng)用領(lǐng)域包括:機器翻譯,文本、語音、圖片轉(zhuǎn)換,聊天機器人,自動摘要,情感分析,文本分類,信息提取等。以下給出了自然語言處理簡要的知識架構(gòu)圖。

4.5 機器人視覺
視覺對人很重要,人類獲得訊息90% 以上是依靠眼睛的,那么對于機器人要想獲得人獲取信息的能力,重點是解決機器人視覺系統(tǒng)。目前機器視覺已經(jīng)可以做到很多事情,比如識別人臉、標(biāo)志和文字;探測物體并了解其環(huán)境的應(yīng)用,如自動駕駛無人車等;檢測的事件,對視頻監(jiān)控和人數(shù)統(tǒng)計;組織信息,如對于圖像和圖像序列的索引數(shù)據(jù)庫;造型對象或環(huán)境,醫(yī)學(xué)圖像分析系統(tǒng)或地形模型;自動檢測,如在制造業(yè)的應(yīng)用程序。
4.6 機器人學(xué)和強人工智能
機器人學(xué)是一個交叉學(xué)科,主要研究包括環(huán)境適應(yīng)機器仿生,機器人自主行為,人機協(xié)作,微納操作機器人,制造裝備機器人、科學(xué)工程機器人、服務(wù)型機器人等。目前國內(nèi)的機器人行業(yè)還沒有形成規(guī)模,商業(yè)化做得好的比如大疆、沈陽新松機器人公司。
強人工智能是人工智能研究的最主要目標(biāo)之一,強人工智能也指通用人工智能(artificial general intelligence,AGI),或具備執(zhí)行一般智慧行為的能力。強人工智能通常把人工智能和意識、感性、知識和自覺等人類的特征互相連結(jié)。實現(xiàn)強人工智能至少需要擁有以下能力:
自動推理,使用一些策略來解決問題,在不確定性的環(huán)境中作出決策;
知識表示,包括常識知識庫;
自動規(guī)劃;
學(xué)習(xí);
使用自然語言進行溝通;
整合以上這些手段來達到同一個的目標(biāo)。
目前的強人工智能主要出現(xiàn)在電影或小說里,比如斯皮爾伯格導(dǎo)演的《人工智能》里面的機器男孩大衛(wèi)。
最后,再回到人類智慧和人工智能的討論上,人類智慧是人類的“隱性智慧”與“顯性智慧”相互作用相互促進相輔相成的能力體系。其中,“隱性智慧”主要是指人類發(fā)現(xiàn)問題和定義問題從而設(shè)定工作框架的能力,由目的、知識、直覺能力、抽象能力、想象能力、靈感能力、頓悟能力和藝術(shù)創(chuàng)造能力所支持,具有很強的內(nèi)隱性,因而不容易被確切理解,更難以在機器上進行模擬;“顯性智慧”主要是指人類在隱性智慧所設(shè)定工作框架內(nèi)解決問題的能力,依賴于收集信息、生成知識和創(chuàng)生解決問題的策略并轉(zhuǎn)換為行動等能力的支持,具有較為明確的外顯性,因而有可能被逐步理解并在機器上模擬出來。目前幾乎所有的人工智能都只能模仿人類的解決問題的能力,而沒有發(fā)現(xiàn)問題、定義問題的能力。因此,“人工智能將全面超越人類智慧”的說法沒有科學(xué)根據(jù),目前的人工智能只是幫助人類提高生產(chǎn)力的工具而已。
轉(zhuǎn)自:千鋒教育