本質上來說,數據只是一些人為的記錄信息的符號,如果我們要追溯數據的起源,幾乎可以回溯到人類文明很久遠的原始時期,當人類學會用符號來記錄一些信息,為有朝一日能派上用場,這時數據毫無疑問就已經出現了。
回首信息技術的發展史,時代走到大數據已經走過了很多步臺階,每一步都有其深遠的意義,都體現了人類認知能力的提升,也體現了人類文明的進步。而數據出現的第一步,是人類祖先的認知方式從動物界中分化出來,初步具備了與其他動物不同的思維能力。從生命的角度,認識能力應該是生命體中普遍具備的,即使是最早的單細胞生命形態,都是在和外部環境適應性互動的過程中維持,對外部環境的認知是生命與生而來的本能,是什么讓人類與其他生物顯著地區分呢?
根據何克抗老師的創造性思維理論研究,人的認知過程具體包括注意、感知、記憶、想象、分析、綜合、抽象、概括、判斷、推理等心理操作過程,包括“空間結構思維”和“時間結構思維”這兩大思維過程。思維,心理學家與哲學家都認為這是人腦經過長期進化而形成的一種特有機能,并把它定義為:“人腦對客觀事物的本質屬性和事物之間內在聯系的規律性所作出的概括與間接的反映”。根據巴甫洛夫的學說,想象(尤其是創造想象)是兩種信號系統協同活動的結果。通常把感覺器官直接從外部刺激接收信號,稱為第一信號系統,語言則被稱為第二信號系統。
任何思維過程(不管是何種形式的思維過程)都離不開四個要素:思維加工對象(即思維的材料)、思維加工的手段或方法(如分析、綜合、抽象、概括、判斷、推理、想象等)、思維加工緩存區(也叫“工作記憶”,用于暫存思維加工對象及加工結果)和思維加工機制。思維的根本目的,就是為了解決人類面臨的各種問題。換句話說,思維總是和“問題求解”不可分割地聯系在一起,甚至不少心理學家認為,思維就是“問題求解”。而解決問題的前提是要能夠作出正確的判斷對各種不同事物進行辨別、對事物的某種性質進行判定、對所處境遇作出決策、對面臨問題確定處理或解決的方案……等等,都是不同情況下要求作出“判斷”的不同表現形式。因此,能否作出正確判斷,也就成為是具有問題解決能力、即思維能力的主要標志。
由此觀點出發,許多心理學家認為,動物也有類似人類的思維,并列舉了大量的例證。各種事例也的確有力地證明許多動物(尤其是和人類同屬靈長目的動物)具有一定的解決問題能力,即具有剛才思維定義的能力。但是我們認為,這種動物的思維和人類的思維還是兩碼事,因為這二者之間存在一個本質上的區別:動物思維是完全建立在直接感知的基礎上,所使用的思維材料(思維加工對象)只能是當前感知事物的具體形象。當前的事物一旦消失,感知的形象即不復存在,相應的思維過程也就中斷。而人類的思維,不僅可以使用當前感知事物的具體形象作為思維材料,還可以使用可以脫離當前的具體事物而獨立存在的思維材料,有別于當前感知事物而得到的“物理思維材料”,我們可以把這種思維材料定義為“虛擬思維材料”,在“虛擬思維材料”的基礎上,人類可以對它作進一步的思維加工(例如分析、綜合、抽象、感慨和想象等),得到比當前感知更加深入的預測性感知和判斷能力,僅僅利用當前感知事物的具體形象來思維,就不可能進行這一類更高級的思維加工,這是人類認知向智力邁進的關鍵性一步。
科學家為了證明這一點做了大量的實驗和艱辛的探索。著名的心理學家科勒(W. Kohler)曾在特納里夫島上用 4 年時間對黑猩猩作過有關動物思維能力的大量實驗。他的實驗設計是這樣的:在一個鐵籠子的頂上懸吊著香蕉或其他食物,然后給黑猩猩提供一定的條件,讓它利用這些條件把食物弄到手。這類條件可以是一根長竹桿,或幾段能連接起來的短竹桿,也可以是一些能夠堆起來和爬上去的箱子。經過一段時間的摸索、試探、失敗、思考后,黑猩猩最終學會通過用長竹桿(或是把幾段短竹桿連接起來,或是把幾只箱子壘在一起再爬上去)等方式來獲取吊在籠子頂上的食物。
上述實驗證明,雖然黑猩猩的確具有運用簡單工具來解決問題的思維能力,但是在實驗過程中出現一個使科勒感到很困惑的問題是,他始終無法讓黑猩猩學會把樹上正在生長著的一根樹枝折下來,用于勾取它夠不著的食物。原因在哪里呢?科勒沒有找到答案。半個世紀過去了,很多心理學家仍無法對此現象作出令人信服的解釋。其實,原因很簡單,就是因為黑猩猩運用的思維材料是對事物直接感知的具體形象,在黑猩猩當前的感知覺中,樹枝和樹干是連成一體的,若不運用更進一步的想象力來進行思維,就決不可能在它的大腦中對“樹”的形象進行分解(把樹枝的形象從一棵樹的整體中分解出來);而對于人來說,由于他可以使用不受當前具體感知對象限制的“虛擬思維材料”作為思維加工對象,因而能夠很容易地作到這一點,只需對“樹”這個概念進行“結構分析”這類簡單的心理操作就可以完成,需要注意的是,人類對"樹"這種外部事物的符號化表示必然是建立“樹”這個概念的基礎。
這正是人類思維與動物思維的根本不同之處。長期以來,國內外心理學界在關于動物有沒有思維,以及動物思維與人類思維有何區別的問題上產生過多次激烈的爭論,有關論著汗牛充棟;各種似是而非甚至很荒謬的觀點(例如曾經有人認為,松鼠為過冬而儲存硬殼果,是動物具有超前計劃性這類高級思維能力的例證),也不勝枚舉。究其根源概出于此各種爭論大都圍繞一些事實、現象和行為表現來進行,而未能緊緊抓住問題的實質思維材料,因而就總也弄不明白二者的聯系與區別所在。
十八世紀文藝復興時期意大利哲學家維柯(Vico)指出,從哲學傳統出發,人類完全不同于其他動物,使人類獨一無二的是文化,人類文明是文化在人類群體間傳承和發展文化而逐漸形成。誠如馬克思對人的定義,人是一切社會關系的總和,社會關系是由人類個體間傳播文化內容而形成的,對于群體而言,這是不斷建構文明大廈的磚塊,對予個體而言,是不斷建構內心精神世界的工具,可以說,正是以符號為中介的認知方式讓人類具有了思維這種復雜而獨特的心理過程。
維柯在其出版的著作《新科學》中指出,即使在原始社會,“原始”人對世界的反應也不是幼稚無知和野蠻的,而是“富有詩意”的,他認為,人生而具有一種本能的、獨特的“詩性的智慧",指引他們以隱喻、象征和神話的形式對周圍環境作出反應。這里靖笙想補充的是,不可忽視符號在其中所扮演的催化劑作用,維柯所描述的這種本能的、獨特的“詩性的智慧"應該就是人類經過幾百萬年進化而成的群體間符號化溝通和交流“虛擬思維材料”的能力,動物可能也有語言能力,而只有人類進化到具有“虛擬思維材料”并通過符號進行群體間的溝通交流是動物所不具備的,符號化可以讓“虛擬思維材料”更加長期和穩定地保留下來,流變的物質世界由于“虛擬思維材料”的符號固化而逐步建構成富有無限自由想象力的人類精神世界,這是文化得以形成的物質基礎,所以,人類歷史涉及文化的傳承和發展過程,而同時也是人類自我創造的過程。
從前面的分析我們可以知道,沒有“虛擬思維材料”,人類對外部世界客觀事物的本質屬性和事物之間內在聯系的規律性認知是無法完成的,認知過程中的“虛擬思維材料”的獨立存在,揭示了關于這個世界的所有“真實”都是人類在頭腦中建構出來的概念,要解釋這個道理,大家看看左邊這張圖,到底畫的是一位少女還是一位老婦,這取決于您怎么看。而“真實是在頭腦的想象中建構出來的”,這是具有革命性意義的啟示!
一方面告訴我們,世界上不存在絕對和不變的終極真理,誠如大數學家懷特海100多年前的箴言,“對有限知識中的任何一次感到完全自我滿足是犯了獨斷論的根本錯誤。每一項知識與無限宇宙這一背景有不可分割的聯系,各項知識的真實性及其意義就是由此導出的”,人類認知追求真理永遠在路上;另外一方面這也解釋了人的創造性,人類為了自身的生存發展認知能力的同時,也一直都在根據自己的想象來創造未來,從認識自然到改造自然就是讓“虛擬思維材料”成為物理世界中的真實事物,人能成為萬物之靈,是因為人的思維對宇宙萬事萬物演變過程的創造性反映,這種反映建構了真實,也賦予了意義。
從認知的角度,數據首先是人類社會歷史文化的產物,然后也是推動人類文明發展的媒介和紐帶,所有涉及到大數據的問題,我們都可以從文化的層面,從人類認知和思維發展規律上找到源頭,今天我們理解大數據概念,如果離開了這個歷史視野則大數據則是無源之水,信息科技也是無本之木,從認知的角度理解大數據,我們可以得到更進一步的啟發。
數據脫胎于人類頭腦中的“虛擬思維材料”,雖然固化成符號(數據)資源后可以物理化長期保持,但這些材料沒有思維的應用就沒有任何意義,從這個層面,數據的價值離不開認知的主體------人,雖說我們現在希望更多讓數據說話,但這并不代表要削弱人的主體性,我們在大數據面前不能喪失這種主體意識,反而是要通過大數據資源能更好地提升人的認知水平和思維能力,所以才用數據來說話。人工智能可能是另外一種完全建構在大數據基礎上的思維和心智系統,數據就是這個人工大腦的思維材料,但是就目前來看,不管人工智能的機器學習能力已經多么強大,Watson贏了多少次智力問答比賽或者AlphaGo打敗了多少位頂級的人類棋手,由于人工智能還遠沒有完成人類社會經歷了幾百萬年的文化建構和文明進化歷程所必須的智慧“虛擬思維材料”積累,因此人工智能還遠不能具備獨立的價值建構和判斷能力,也遠不具備創造性的“虛擬思維材料”加工能力,機器可以取代一些人類的工作,但是不可能取代人類的價值。
思維是為了解決問題,而只有知行合一和實事求是才能解決現實中的問題,大數據時代讓我們了解客觀真實擁有了比傳統更多的方法和手段,數據的意義在于其“真實”性,就是說,有價值的數據應該是記錄“客觀事實”或者“客觀規律”的符號,大數據的價值在于能從中發掘出還原真實的線索,讓決策更加切合實際。這是利用大數據的根本,換句話說,我們用大數據來擴展了知行合一、實事求是的廣度和深度,人類是一種思維決定行為的智慧生物,怎么看影響怎么干,而人類隨著生產力的發展擁有了越來越多改變自然演變過程的能力,怎么干影響怎么樣,我們可以越來越看到,心想事成在未來不再僅僅是良好的祝愿。
人類追求的終極理想是文化中真善美的概念,而今天,科學求真、道德求善、藝術求美都離不開人類世界日益數據化的大趨勢。讓虛擬空間(Cyber Space)越來越主導物理空間(PhysicalSpace)的活動和變化是新工業革命的主旋律, 未來很可能是先在虛擬空間完成建構再到物理空間生產建造成實物,這是智能制造的前提。這場新工業革命(工業4.0)定義了數字孿生(Digital Twin)的概念:是充分利用物理模型、傳感器更新、運行歷史等數據,集成多學科、多物理量、多尺度、多概率的仿真過程,在虛擬空間中完成映射,從而反映相對應的實體裝備的全生命周期過程。 正如數字孿生突然賦予了新工業時代的創客們以全新的夢想,它正在引導人們,穿越那虛實界墻,在物理與數字模型之間自由交互與行走。數字孿生對我們最為重要的啟發意義在于,人們試圖將數字空間中的思考決定在物理世界的一切行為,而物理世界發生的一切,也同時塞回到數字空間中再加工。源頭于“虛擬思維材料”的數據,只有帶有回路反饋的持續加工,才是真正的全生命周期概念,這樣就可以真正在全生命周期范圍內,保證數字與物理世界的協調一致。各種基于數字化模型進行的各類仿真、分析、數據積累、挖掘,甚至人工智能的應用,都能確保它與現實物理系統的適用性,這就是數字孿生可以賦予智能制造的意義所在。
我們從認知的角度來理解大數據,那么大數據時代就不僅僅是一個技術上的革命,更應該是一個文化層面的革命,大數據讓人類社會的文明從隱喻和朦朧走向公開和明晰,創新、協調、綠色、開放、共享的理念深入人心離不開信息技術對人類社會生活無孔不入的滲透和融合,大數據將成為一種全新的“世界語”帶來一場全新的波及全人類命運的認知自我革命,將重新建構人們的內心世界的認知、情感、態度和價值觀,進而成就新的文明。
本文節選自靖笙個人專著《企業大數據資產管理業務頂層設計參考手冊》,本專著其他內容敬請繼續關注。