從“傻白甜”到“杠精” AI有了認知智能萌芽_科技

從“傻白甜”到“杠精” AI有了認知智能萌芽

張佳星發布時間：2019-01-07 08:56:00來源：科技日報

　　每個(ge) 人身體(ti) 裏都有一個(ge) “杠精”：“這可不一定”“我可不這麽(me) 認為(wei) ”“那可說不準”……這些“杠”詞要麽(me) 在心裏默念、要麽(me) 在口中碎碎念、要麽(me) 大聲講出來，無論是否表達，“杠”的意識出現均是人類獨立思維的表現，所基於(yu) 的正是人類的綜合分析能力。

　　如今，人工智能（AI）也開始“杠”得有條理、有邏輯、有思路起來。日前，在百分點舉(ju) 辦的無界智能發布會(hui) 現場，IBM大中華區全球信息科技服務部總經理謝少毅介紹了人工智能做辯論的項目，“杠精”們(men) 大愛的口頭禪出現在了IBM的人工智能係統 “Project Debater”口中，這背後是機器學習(xi) 、自然語言處理、海量數據搜索處理、識別情緒等大量人工智能技術的應用。

　　越來越多的人工智能研究者發明新的技術讓AI向人類“偷師”，一定程度上習(xi) 得觸類旁通、獨立思考的能力。從(cong) “傻白甜”到“杠精”，AI向真實的“人”又貼近了一步，從(cong) “感知智能”慢慢走向“認知智能”，哪些技術是AI不可或缺的？還有哪些仍待攻堅呢？

　　從(cong) 理解語義(yi) 到“讀心術”，認知智能初現

　　“你告訴一個(ge) AI自己有減肥計劃，AI如果每天建議你吃沙拉，你就會(hui) 說它不好，不符合心意；如果它天天讓你吃蛋糕，你也會(hui) 說它不好，不符合減肥需求。”上海紐約大學商學部主任陳宇新教授舉(ju) 了個(ge) 連真正的人類都難以把握的兩(liang) 難抉擇，充分說明理解語義(yi) 並不一定能夠真正把握要義(yi) 。

　　“雖然主人說這是我想要的，但AI做了之後，主人仍會(hui) 說這不是他想要的……”擁有“認知智能”的未來AI將充分理解這句堪比繞口令的實質，陳宇新認為(wei) ，當數據足夠多、算法足夠強大、模型足夠優(you) 秀之後，AI將從(cong) 理解語義(yi) 到擁有“讀心術”，分析推測出人類當時可能都不確定的真正想法，在人心裏矛盾時給出“撓到癢處”的答案。

　　將這個(ge) “減肥吃什麽(me) ”的難題放大來看，就是對正反的“兩(liang) 難”進行一係列諸如身體(ti) 指征、愛好、時間等多維度的數據綜合分析後，用到大量的人類學、心理學、社會(hui) 學的內(nei) 容和方法，通過一係列探索性地問答獲得數據，給出結果。

　　這種探索性的分析將使AI得到進化，並擁有更廣闊的“職業(ye) ”選擇。據介紹，美國有公司做出了第一個(ge) 人工智能律師ROSS，美國一個(ge) 律師以往用上百上千個(ge) 小時做一個(ge) 案例的分析和調查，現在用了ROSS和人一起合作，時間減少到28分鍾，ROSS，可以提供正反雙方的意見讓律師做決(jue) 策。

　　“正反意見的博弈還可以幫高層做決(jue) 策，可以通過一個(ge) 機器人提供正反兩(liang) 麵意見的辯論，幫助高層綜合分析做更好的決(jue) 策。”謝少毅認為(wei) ，這方麵的研究才剛剛開始。進化的AI將被用在更多需要做信息分析或做決(jue) 策的領域，例如高級銷售、經濟分析師、企業(ye) 高級管理人員等。

　　數據動態融合，AI走進認知智能的“基石”

　　從(cong) 海量數據中“摘出”與(yu) 當前任務關(guan) 聯的數據，是AI擁有綜合分析能力的第一步。百分點董事長兼CEO蘇萌表示，AI走進認知智能首先建立在數據融合的基礎上。

　　以辯論項目為(wei) 例，沃森化身的這位“女性”辯手，和另一位人類辯手就“是否應該把體(ti) 育博彩合法化”的議題展開辯論時，能在聽懂人類長達4分鍾的快速陳述（700—900個(ge) 單詞）後，進行迅速反應，搜集資料、選取角度，給出旁征博引的辯駁；在短兵相接的短辯交鋒中也能很快理解對方的觀點、組織語句並做出有針對性的論述。

　　蘇萌表示，數據目前來看仍然是人工智能的基石。不久前，德國商業(ye) 軟件巨頭SAP以80億(yi) 美元收購全球最大在線調查公司Qualtrics，說明了數據融合的重要性。2017年，百分點也並購了中國最大的在線調研服務商極速洞察，使得百分點同時擁有高達380萬(wan) 的中國最大用戶樣本庫，將雙方的行為(wei) 數據和態度數據進行融合。

　　數據融合包括擁有海量數據和實現高效融合兩(liang) 方麵。

　　蘇萌表示，數據融合指的是打破業(ye) 務係統的煙囪融合海量的多元異構的數據，它既是一次企業(ye) 內(nei) 外部數據的融合，也是大小數據的融合，同時也是曆史數據和實時數據的融合，隻有數據融合了之後，才能洞見真相避免偏見，才能明智決(jue) 策避免武斷。

　　“知識圖譜是我們(men) 讓機器去了解、認識人類世界的核心，它把我們(men) 的知識構建成網狀的知識結構，再通過人機交互直接輸出。”蘇萌進一步解釋，數據融合意味著知識需要不斷更新，但在更新一個(ge) 知識點的時候往往需要更新整個(ge) 知識係統，操作非常繁瑣。

　　“出版行業(ye) 或者媒體(ti) ，甚至公安行業(ye) ，所涉及的知識都需要實時動態理解，某一個(ge) 知識不是固定不變的，所以知識圖譜未來的發展方向是動態知識圖譜。” 蘇萌解釋，這個(ge) 世界由很多的東(dong) 西構成，比如人、事、地，這些可以理解為(wei) 本體(ti) ，本體(ti) 發生變化或者本體(ti) 間的關(guan) 係發生變化後，動態知識圖譜能夠迅速自動重構，高效地實現對一個(ge) 行業(ye) 的知識圖譜的構建。

　　攻堅在路上，來自小數據的挑戰

　　新的領域、沒有海量樣本、訓練速度不夠，是不是每遇到一個(ge) 特殊場景，都要重新建模，輸入大量的樣本讓機器重新學習(xi) 一次呢？條件並不允許。

　　“很多客戶的實際應用場景是數據量不夠甚至是比較少的，在這種情況下我們(men) 結合遷移學習(xi) 技術，解決(jue) 了小樣本的模型訓練問題，標注量隻有以往的10%。”百分點首席算法科學家蘇海波說。

　　從(cong) 小數據中獲得學習(xi) 能力，也是人工智能走向認知智能的一個(ge) 重要部分。人工智能專(zhuan) 家經常用貓舉(ju) 例：小孩子認得貓隻要指給他看一兩(liang) 次就夠了，AI卻需要成百上千張圖片，才能掌握貓的特征。

　　為(wei) 此，人工智能科學家嚐試結合遷移學習(xi) 開發一係列算法，節約人工標注樣本的時間，讓模型在少量的標注數據上，也能取得好的效果，可以理解為(wei) 賦予AI“舉(ju) 一反三”的能力。“例如像電商評論情感分類這樣一個(ge) 任務，用傳(chuan) 統的深度學習(xi) 模型需要數萬(wan) 條數據才能達到85%左右的效果，但是如果采用深度遷移學習(xi) 技術，數百條數據就能達到同樣的效果。”蘇海波說，我們(men) 判斷認知智能未來會(hui) 迎來黃金十年的發展，為(wei) 此百分點成立了認知智能實驗室。除了深度遷移學習(xi) 技術，實驗室還會(hui) 重點研發多語種自然語言處理技術，幫助認知智能實現跨種族、國際化。

　　“未來我們(men) 會(hui) 與(yu) 各大高校和研究機構開展合作，建立聯合實驗室，共同探索更多前沿的認知智能技術，包括各個(ge) 重點行業(ye) 的知識圖譜構建、自動問答等等。基於(yu) 這些技術，實驗室會(hui) 研發出更多行業(ye) 落地的應用產(chan) 品，為(wei) 客戶創造價(jia) 值，用認知智能推動社會(hui) 進步。”蘇海波說。

（責編：郭爽）

從“傻白甜”到“杠精” AI有了認知智能萌芽

相關閱讀

歐盟AI道德準則草案出爐

AI醫生進村記

AI治堵濟南“交通大腦”上線

用AI解析配方，化妝品的“私人定製”時代要來了

專題推薦

微觀

賞閱

資料雲

即時新聞