【中國安防展覽網 品牌專欄】“人們若問這個世界是一直存在呢,還是剛剛開始呢?其答案肯定是這樣:它剛剛開始,因為它是可見的、可觸的、具體的,感官所能知覺的任何東西,沒有一件像思想的對象那樣是永恒不變的。”——柏拉圖《蒂邁歐篇》
兩千多年前,柏拉圖借助蒂邁歐之口,向世人描繪了他心中的宇宙創(chuàng)立過程。而今,在依圖的德爾非聚集地(Delphi Talk),來自法蘭克福研究所的馬爾斯伯教授(Christoph Von Der Malsburg)借助柏拉圖的宇宙觀,向世人描繪了一條通往通用人工智能(Artificial General Intelligence)的路徑。
不知不覺,人工智能已經在泥濘中蹣跚發(fā)展了六十年。其中計算機視覺領域異軍突起,借助深度神經網絡、大量標注數據、強計算能力的加持,機器能夠把你從十億個人里面找出來,但卻依然不能像三歲小孩子那樣輕易學會一個新的物體類別。
1966年,馬文·明斯基(Marvin Minsky)在麻省理工學院讓他的學生用一個暑假的時間完成一個計算機視覺的課題,然而52年過去了,計算機視覺距離“通用”這兩個字,依然有著山海不可平的距離。
通用計算機視覺與人的視覺系統(tǒng)類似。這意味著,它不僅得分辨出動態(tài)環(huán)境下的所有物體,還得能理解它們。它可以分析出它們之間的邏輯關系,甚至得要有記憶功能。而不只是簡單地反饋一個結果,盡管這個結果在限定的條件下準確率很高。
馬爾斯伯教授認為,現在主流人工智能領域分為兩大陣營,一個是基于傳統(tǒng)算法,另一個則基于人工神經系統(tǒng)(Artificial Neural System)。
基于傳統(tǒng)算法的人工智能屬于狹義人工智能范疇。程序員需要總結某個特定問題來理解它的本質,然后將這個本質融合到一個算法中。雖然在發(fā)展過程中發(fā)明了大量的實用軟件工具,諸如文字處理、計算機代數、會計、計算機圖形學、建筑設計等工具,但從本質來說它只是罐裝的人類智能而已。
基于傳統(tǒng)算法的人工智能科學家也在努力設想通用人工智能的解決之道,但是馬爾斯伯教授認為除非建立了一個普遍完備的數據結構,以及重新正視示例學習的重要性,否則很難觸及通用的本質。
馬爾斯伯教授提到的示例學習的對象,正是人類的大腦,這也是人工神經系統(tǒng)(Artificial Neural System)陣營具魅力的靈感源泉。以深度神經網絡(Deep Neural Network)為代表,也是形成了這次人工智能浪潮的主要原因。
然而它的缺陷也是顯而易見的——任何經過標注數據訓練的深度學習系統(tǒng)都是針對特定領域的,什么樣的數據集決定了它所能解決的領域和問題。換句話來說,它就好像是人類智慧的微小切片。
為了解決通用問題,馬爾斯伯教授提出了另一條模仿大腦與人類視覺系統(tǒng)的探索路徑。
他認為,大腦是人類智能的核心,而視覺是大腦的典型功能,它有認知和觀察相一致的特點,與大腦的神經系統(tǒng)緊密糾纏在一起,是具備驗證和模仿條件的。正如科學是一個反問題一樣——你首先要發(fā)明一個概念,然后得用實驗驗證它。視覺也是一個反問題,這意味著你可以輕而易舉地利用視覺看到所有的物體,但是要回溯視覺能力的基礎架構、找到產生當時視覺畫面的所有輸入卻并不容易。
當你通過視覺系統(tǒng)看見一只貓或者是一條狗的時候,你可能并不需要看清它的全貌就能夠做出正確的判斷,你甚至可能會有99%的輸入內容是由記憶中提取。所以馬爾斯伯教授認為,對視覺輸入系統(tǒng)的建立,需要同時依賴于記憶片段和投影模式的集合。
為了模擬視覺能力,馬爾斯伯教授開創(chuàng)性地提出了自組織動態(tài)圖模型系統(tǒng)的概念。
就好像在柏拉圖宇宙觀中,時間是永恒的映像,物理世界的一切都是真理的投射。馬爾斯伯教授的動態(tài)圖模型系統(tǒng)構成了這個永恒映像的本體,它是一個通用視圖庫,由一張張動態(tài)圖片的基本構建構成。
馬爾斯伯教授詳細描述了這個視圖庫的創(chuàng)建過程,每一張圖片,會根據圖片的內容歸類為不同的部件,諸如顏色、材料、陰影、幾何圖形、邊緣等。當有足夠多的圖片,就會形成通用的不同種類的部件屬性,這些屬性用神經系統(tǒng)的方式形成一個視圖庫。
當需要識別圖像時,圖像上的某些部件特征形成信號源,能夠激活這個通用視圖庫相應的部件,這個視圖庫會產生動態(tài)變化,自然運動到一個恰當的位置而進行識別。由于這個視圖庫對圖像中的不同部件、不同的特征、空間屬性有分類的能力,每一次激活和搜索都變得非常有效率。
馬爾斯伯教授強調了這個系統(tǒng)是一個自組織的系統(tǒng),這個靈感同樣來源于大腦。
一方面,人類的大腦是一個僅僅建立在1GB遺傳信息上的有機體。另一方面,人類的大腦又是包含了800億個神經元的復雜有機體。它既輕巧又復雜,集合這兩種矛盾為一體,主要依賴于它強大的基于自我交互的組織機制。
從大腦系統(tǒng)的初始結構開始,它歷經的每個狀態(tài)所生成的活動都能對它的結構起反作用,大腦系統(tǒng)能對自己進行修改和區(qū)分,形成了大腦網絡的自組織。大腦的這種連接機制,在搜索信息時,能夠形成無限的認知空間和穩(wěn)定的自我交互。
而在視圖庫中模擬出這種自組織的能力,正是讓計算機視覺擺脫簡單地輸入信息和反饋結果的機制,具備記憶和動態(tài)變化,解決物理世界的組合爆炸問題,進而具有通用能力的基礎。
現在,馬爾斯伯教授和他位于法蘭克福的初創(chuàng)公司 PLATONITE 正在致力于這項激動人心的研究。在他的實驗室里,這種新穎的自組織動態(tài)圖模型系統(tǒng)已經能夠開始識別簡單的物體。
這位研究智能四十余年之久的科學家,面對已經停滯不前數十年之久的人工智能基礎理論研究,并未回避實現智能的根本性問題,而是以一種公正的態(tài)度走到了德爾非聚集地的講臺上,分享他的新觀點。這是我們的榮幸!