- 熱門推薦
瑞見——投資人說
2024年07月08日
瑞見——動態(tài)
2024年07月08日
瑞見——瑞鵬行研
2024年07月08日
瑞見——瑞鵬行研
2024年07月08日
瑞見——動態(tài)
2024年07月08日
瑞見——瑞鵬行研
2024年07月08日
瑞見——瑞鵬行研
瀏覽次數(shù):574
發(fā)布時(shí)間:2024-07-08
返回列表
最后的半子
瑞鵬資產(chǎn) 戴勝藍(lán)
(一)
機(jī)器學(xué)習(xí)先驅(qū)者Rich Sutton在2019年發(fā)表了《苦澀的教訓(xùn)》,Rich Sutton認(rèn)為,從長遠(yuǎn)來看,對AI的訓(xùn)練使用通用計(jì)算方法往往比直接灌輸人類經(jīng)驗(yàn)知識的特定方法更加有效。它揭示了過去人工智能研究中的一個(gè)關(guān)鍵誤區(qū):過度依賴人類設(shè)計(jì)的特定領(lǐng)域知識和規(guī)則,而忽視了通用計(jì)算和大規(guī)模學(xué)習(xí)的長遠(yuǎn)深度和力量。后來,《苦澀的教訓(xùn)》被OpenAI的工程師們奉為“圣經(jīng)”。結(jié)合AI的發(fā)展歷史,從早期的專家系統(tǒng),到SVM及其核方法,再到深度神經(jīng)網(wǎng)絡(luò),以及現(xiàn)在的大語言模型,工程師們已逐步認(rèn)知到這個(gè)教訓(xùn),走出誤區(qū)。1934年10月,由于王明、博古等同志“左”傾冒險(xiǎn)主義的錯(cuò)誤領(lǐng)導(dǎo),加之外部敵強(qiáng)我弱,中央革命根據(jù)地第五次反“圍剿”遭到失敗,紅軍第一方面軍(中央紅軍)主力開始長征。但在出發(fā)之前,沒有人明確知道該往哪兒走、走多遠(yuǎn)、走到何時(shí)休。只是基本確定向西與紅二、六軍團(tuán)會合。年輕的教員同志因受到排擠,差點(diǎn)沒有被允許加入長征隊(duì)伍。在一路反復(fù)的戰(zhàn)術(shù)錯(cuò)誤之后,中央紅軍付出了極其慘重的代價(jià),從長征出發(fā)時(shí)的8.6萬人銳減到3萬余人。1935年1月,中央政治局在遵義召開了擴(kuò)大會議,將教員同志增選為中央政治局常委,并以其杰出的遠(yuǎn)見和正確的主張被認(rèn)可為新的領(lǐng)導(dǎo)人。敵人40萬重兵已在長江沿線布下,勢要將中央紅軍圍困,徹底一鍋端。《苦澀的教訓(xùn)》強(qiáng)調(diào),從長遠(yuǎn)來看,依靠大規(guī)模計(jì)算和通用學(xué)習(xí)方法的AI系統(tǒng)將更具優(yōu)勢。這使系統(tǒng)不受限于特定領(lǐng)域的規(guī)則和知識,能夠通過海量數(shù)據(jù)和自我優(yōu)化,不斷提升自我性能。早期的AlphaGo結(jié)合了人類棋譜數(shù)據(jù)和深度學(xué)習(xí)、蒙特卡羅樹搜索算法——它是依賴人類專家經(jīng)驗(yàn)和策略知識進(jìn)行訓(xùn)練的典型成功案例。2016年,AlphaGo擊敗了世界圍棋冠軍李世石,展示了人類知識結(jié)合機(jī)器學(xué)習(xí)的強(qiáng)大能力。DeepMind的二代產(chǎn)品AlphaZero,完全不依賴任何人類玩家的數(shù)據(jù)或先驗(yàn)知識,只利用深度神經(jīng)網(wǎng)絡(luò)來預(yù)測每個(gè)游戲狀態(tài)的價(jià)值和最優(yōu)行動,然后通過自我對弈的方式進(jìn)行訓(xùn)練,利用強(qiáng)化學(xué)習(xí)算法不斷優(yōu)化策略。在比AlphaGo更短的訓(xùn)練時(shí)間內(nèi),AlphaZero在包含圍棋在內(nèi)的各種棋類游戲中都取得了超過AlphaGo在圍棋領(lǐng)域的成績。并且AlphaZero所使用的訓(xùn)練數(shù)據(jù)量遠(yuǎn)小于AlphaGo。語音識別技術(shù)最早起源于20世紀(jì)50年代的美國貝爾實(shí)驗(yàn)室,過去的語音識別訓(xùn)練依賴于手工設(shè)計(jì)的特征提取和規(guī)則,結(jié)合隱馬爾可夫模型等統(tǒng)計(jì)方法。這類訓(xùn)練需要工程師們預(yù)先對語音特征和語言模型的深入理解和設(shè)計(jì),效率非常低下。現(xiàn)代語音識別系統(tǒng)采用深度學(xué)習(xí),通過大規(guī)模數(shù)據(jù)訓(xùn)練、卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò),完全脫離工程師對語言模型的手工特征設(shè)計(jì)。當(dāng)前的語音識別系統(tǒng)可以在上百個(gè)語言和環(huán)境下流暢運(yùn)行,且顯著提升了識別準(zhǔn)確率和適應(yīng)性。訓(xùn)練效率指數(shù)增長。急功近利的自動駕駛廠商將自動駕駛的訓(xùn)練依賴于人工設(shè)計(jì)的規(guī)則和特征,如路徑規(guī)劃、雷達(dá)和傳感器數(shù)據(jù)處理等。這類自動駕駛技術(shù)在簡單和受控環(huán)境中非常有效,但在復(fù)雜和動態(tài)環(huán)境中可能造成未知后果。長期主義的自動駕駛廠商通過深度學(xué)習(xí)模型進(jìn)行端到端訓(xùn)練,從大量駕駛數(shù)據(jù)中自動學(xué)習(xí)駕駛行為和環(huán)境理解。長期來看,這類訓(xùn)練將有望推動自動駕駛系統(tǒng)在處理幾乎所有道路環(huán)境中交出完美答卷。人類積累數(shù)百萬年的知識,可能抵不過大模型毫秒級的運(yùn)算決策。如果通用大模型可以通吃一切,那么站在時(shí)間延長線上看人類當(dāng)下的文明史,依靠人類經(jīng)驗(yàn)和知識快速成長的垂直AI,是否會成為偽命題?短期內(nèi),垂直細(xì)分領(lǐng)域的AI應(yīng)用通過整合人類的知識和經(jīng)驗(yàn),能夠迅速取得顯著成果。在特定領(lǐng)域,這類AI系統(tǒng)可以在有限的任務(wù)范圍內(nèi)表現(xiàn)得非常出色,如醫(yī)學(xué)影像分析、工業(yè)自動化、量化交易等。由此可見,垂直細(xì)分領(lǐng)域的AI仍然具有價(jià)值,因?yàn)樗鼈兛梢钥焖俳鉀Q實(shí)際問題,帶來直接收益。有收益才能吸引更多的人才進(jìn)入,才能反哺通用大模型的訓(xùn)練。但從長期來看,依靠通用大模型的AI系統(tǒng)的確會表現(xiàn)出更強(qiáng)的適應(yīng)性和效率,這與《苦澀的教訓(xùn)》觀點(diǎn)一致。隨著技術(shù)、算力和清潔能源的發(fā)展,通用模型的優(yōu)勢將越來越明顯。AI研究和應(yīng)用需要在短期收益與長期潛力之間找到平衡,才能推動技術(shù)和應(yīng)用的更優(yōu)結(jié)合與迭代。偉大的馬克思主義哲學(xué)早就解釋了這一段AI發(fā)展史:“量變與質(zhì)變、辯證與統(tǒng)一”。我不知道AI怎么看世界,但從數(shù)理上說,世界一定程度上是一個(gè)隨機(jī)性和波動性的組合,宇宙也是。在量子物理中,基本粒子的行為表現(xiàn)出本質(zhì)的隨機(jī)性。這意味著,即便我們知道所有的初始條件,也無法精確預(yù)測一個(gè)量子系統(tǒng)的未來狀態(tài)。從更大尺度去看,現(xiàn)代宇宙學(xué)模型一直在試圖研究宇宙中暗物質(zhì)和暗能量的作用,以及宇宙的加速膨脹現(xiàn)象,其底層邏輯都是想要解釋宇宙在大尺度上的動態(tài)變化和不確定性。人類處于這樣一個(gè)狹小的三維空間中,幾乎沒有任何對抗宏觀尺度隨機(jī)性和波動性的能力,只能在相對平整的安全時(shí)間周期中生存、繁衍。依靠碳基生物自身的條件和有限的生命時(shí)長,想要去搞清楚微觀粒子或宇宙尺度的隨機(jī)性和波動性,我看不到任何可能。世界本身的隨機(jī)性就是對人類文明進(jìn)步甚至生存的最大干擾。但是超級通用人工智能可以處理和過濾大量的干擾和波動,找出隱藏在背后的模式和規(guī)律,或許將大幅度提升人類處理復(fù)雜問題的能力,幫助人類更好地理解和應(yīng)對復(fù)雜系統(tǒng)中的不確定性和波動性。長遠(yuǎn)來看,這是否必將強(qiáng)化我們面對未知事件的脆弱,增強(qiáng)文明長久生存的概率?因?yàn)槌壨ㄓ萌斯ぶ悄艿某霈F(xiàn),本身就是一件巨大的隨機(jī)性和波動性事件。當(dāng)人類面對一個(gè)毫秒級運(yùn)算就能碾壓你所有知識的強(qiáng)大存在,還有何勝算?盡管迄今為止無人知曉造物主的動機(jī)和設(shè)計(jì)機(jī)制,但好在這位偉大的神并未像設(shè)計(jì)其他抽象物體一樣設(shè)計(jì)人類。遵義會議之后,中央紅軍只有16個(gè)團(tuán)、3.5萬人。而敵軍調(diào)集了中央軍薛岳兵團(tuán)和黔軍全部,滇軍主力和川、湘、桂軍各一部,總兵力達(dá)到150個(gè)團(tuán)、40萬人。川黔地區(qū)地形復(fù)雜,山高水深,對于機(jī)械化幾乎為零的中央紅軍來說,交通條件險(xiǎn)惡萬分。此外,中央紅軍面臨糧食、藥品和武器彈藥等物資的極度短缺,無從補(bǔ)給。遵義會議后,如何團(tuán)結(jié)內(nèi)部力量、制定正確戰(zhàn)略、鞏固領(lǐng)導(dǎo)地位、重塑革命信念,更是擺在教員同志面前無比棘手的難題。絕境之下,教員同志展現(xiàn)出了超凡的軍事才能和智慧。通過巧妙的戰(zhàn)略布局和靈活機(jī)動,不斷變換作戰(zhàn)方向,充分利用地形和敵情,隱藏真實(shí)意圖,迷惑、牽制敵軍,打亂其部署,選擇有利于己方的戰(zhàn)場進(jìn)行戰(zhàn)斗,奪取戰(zhàn)略主動。最后,教員同志打出了震古爍今的“四渡赤水”戰(zhàn)術(shù),一舉將紅軍帶離絕境,前往陜北甘南地區(qū)建立新的革命根據(jù)地,至此展開了中國革命運(yùn)動波瀾壯闊的新畫卷。新中國成立后,面對越過三八線的美軍,面對國內(nèi)一片畏戰(zhàn)之聲,面對中美兩國實(shí)力的巨大差距,教員同志高瞻遠(yuǎn)矚,力排眾議,人民志愿軍義無反顧奔赴前線,迎擊來犯之?dāng)场?/span>1950年,美國GDP約為3000億美元,中國250億美元。美國鋼產(chǎn)量8700萬噸,石油5.4億桶,中國鋼產(chǎn)量60萬噸,石油3萬桶。美國參戰(zhàn)3000輛坦克,1500架飛機(jī),外加11艘航母、大量驅(qū)逐艦和巡洋艦。中國僅有100輛坦克,200架飛機(jī)。美國有強(qiáng)大的后勤保障、先進(jìn)的補(bǔ)給和醫(yī)療體系、快捷且強(qiáng)大的??者\(yùn)輸、投送能力。中國只有少量卡車和純?nèi)肆Α?/span>在當(dāng)時(shí),沒有任何國家看好人民志愿軍取得勝利。我相信,再強(qiáng)大的通用大模型,面對這樣的戰(zhàn)前數(shù)據(jù)對比,也不會做出“出兵”的決策,更不會預(yù)測人民志愿軍將取得最后的勝利。同樣,再“毫秒級”的人工智能也打不出“四渡赤水”戰(zhàn)術(shù)。人類似乎有一個(gè)特別的法寶,能在絕境中爆發(fā)不可思議的力量。我找不到合適的詞語概括,暫且就叫它“Humanity(人性)”吧。憑借堅(jiān)韌的意志和不滅的希望,“人性”總能在絕境中熠熠生輝,喚醒深度隱藏的勇氣、魄力、膽識、信念與力量,如破曉的晨曦,如凜冬的暖陽,如旱地的甘霖,如黎明的曙光,指引個(gè)體走向新生。通過復(fù)雜的情感學(xué)習(xí)算法,人工智能未來一定可以模擬和表達(dá)類似人類的情感反應(yīng):快樂、悲傷、憤怒等,甚至可以與人類進(jìn)行復(fù)雜的互動,表現(xiàn)出同理心、幽默感和“社交情商”。但真正的人性不僅僅是行為的表現(xiàn),還涉及底層的復(fù)雜意識、信念和情感。即使超級人工智能最終完全“復(fù)制”了你,但這種“復(fù)制”依舊是基于統(tǒng)計(jì)和概率,而不是基于真正的情感、意識、信念、倫理。更甚,超級人工智能同樣可以做出某些“道德”決策,但這些決策依舊是基于預(yù)設(shè)的規(guī)則和參數(shù),而不是基于真正的道德觀念或情感判斷。憑借“人性”的超強(qiáng)傍身,人類依舊有希望在某些時(shí)刻的對弈上勝機(jī)器半子。克里斯托弗·諾蘭的《星際穿越》,其實(shí)就是一部人性與萬物對弈,并最終勝出的電影。面對人類生死存亡之抉擇,老邁的Brand博士選擇隱藏自己的人性,寧背一世之罵名,也要給絕境中的人類強(qiáng)行刷出一個(gè)PLAN B選項(xiàng),哪怕潛在的代價(jià)是放棄地球上現(xiàn)有的所有人類,包括他自己。Do not go gentle into that good night(不要溫和地進(jìn)入那個(gè)良夜),Old age should burn and rave at close of day(暮年也應(yīng)在黃昏時(shí)燃燒咆哮),Rage, rage against the dying of the light(怒斥吧,怒斥光明的消逝)。當(dāng)Doctor Mann降落在一個(gè)冰冷、不宜居、表面常年覆蓋著凍雪和液氨、環(huán)境極其惡劣的星球上時(shí),為了逃離,Mann偽造數(shù)據(jù),損毀機(jī)器,持續(xù)冬眠35年,終于等到重返地球的機(jī)會。當(dāng)Mann與空間站對接失敗,引發(fā)爆炸,Cooper毫不猶豫啟動引擎,加速追趕。機(jī)器人Tars立即勸阻,Cooper一個(gè)字母都聽不進(jìn)去,立刻命令Tars分析永恒號的旋轉(zhuǎn)狀態(tài),接下來二者展開了本片中最為精彩震撼的對話:Tars: Cooper, there is no point using fuel to chase…Cooper: Analyze the Endurance’s spin(分析永恒號的旋轉(zhuǎn)狀態(tài)).Cooper: Get ready to match our spin with the retro thrusters(利用反向推進(jìn)器讓我們跟永恒號實(shí)現(xiàn)同步).Cooper: No…it’s necessary.Tars可以瞬間分析出永恒號的旋轉(zhuǎn)狀態(tài),可以瞬間擬合出一條追擊路線,可以瞬間跟蹤每一塊碎片的飛行路徑以作最優(yōu)躲避策略,也可以完成高速旋轉(zhuǎn)引起的離心力狀態(tài)下的完美對接,但它始終無法理解——機(jī)器只會做出當(dāng)下最優(yōu)的選擇,它無法理解“人性”被激發(fā)出強(qiáng)大意志力和信念后“不可理喻”的操作。Cooper與Tars共同完成的這次向死而生的Docking,才有了人類最終的生存機(jī)會。在絕境時(shí)刻,只有最硬核的情感、信念、意志、對家人不棄的愛,才敢于勇闖絕境。或許,在看到Cooper帶著女兒Murph誤入NASA的那一刻,Brand博士心里就已經(jīng)有了最優(yōu)的宇航員人選——Brand為團(tuán)隊(duì)湊齊了星際穿越之旅的最后拼圖:人性。我穿越引力,跨越光年,追逐了幾個(gè)星系,只為回到你的身邊。機(jī)器不會了解,“半子”不是一個(gè)可以模仿的程序或行為。
瑞見——瑞鵬行研
瑞見——投資人說