人工智能現在能有多“聰明”？_新聞

人工智能現在能有多“聰明”？

發布時間：2023-05-29 08:55:00來源：北京青年報

　　柔性物流四向車“一車跑全倉(cang) ”AR眼鏡可“同聲傳(chuan) 譯”

　　正在召開的2023中關(guan) 村論壇上，“人工智能”無疑是最熱門的關(guan) 鍵詞。無論是自動駕駛還是智能穿戴，是量子計算還是5G通信，甚至碳中和，眾(zhong) 多前沿科技的背後都離不開人工智能技術的支持。可以說，未來十年，人工智能將繼續改變各行各業(ye) 以及普通人的生活。在本次論壇國際技術交易大會(hui) 板塊、科博會(hui) 展覽板塊，以及人工智能相關(guan) 平行論壇上，北京青年報記者注意到，各大公司都帶來了最新人工智能科技成果，包括視覺通用分割模型SegGPT、5G音視頻交互應用、雙語數智人等等。

　　5G通信新應用

　　可視自助服務帶來交互新體(ti) 驗

　　最新數據顯示，我國5G用戶已達5.61億(yi) ，我國累計建成開通5G基站 231.2萬(wan) 個(ge) ，全球占比均超過60%。而一季度全國平均5G下載網速為(wei) 334.98Mbps，峰值下載速率為(wei) 472.92Mbps。如此快的網速，再加上人工智能的支持，除了用來刷社交網絡、日常辦公學習(xi) ，還可以用來做什麽(me) ？

　　中國聯通此次展出的“5G新通信智能交互平台”，就應用了5G“大帶寬、低時延、泛連接”的特點，運用5G音視頻交互與(yu) AI原子能力，結合AR&VR、三維建模、智能交互等先進技術，做到了5G內(nei) 生服務下的音視頻交互應用。平台運用多媒體(ti) 、三維建模、實時跟蹤、傳(chuan) 感、智能交互等技術，實現端到端的可視化、智能化新通信服務，為(wei) 企業(ye) 、政府等提供5G音視頻交互、智慧虛擬形象等功能。

　　如金融行業(ye) 應用版平台，用戶可以遠程接入銀行櫃台服務，享受與(yu) 現場辦理同等的體(ti) 驗及個(ge) 人隱私保護；能源行業(ye) 應用版平台則重構了井場智能聯動係統應用體(ti) 係，實現了井場資源數字化管理、井場巡護數字化編製。交通行業(ye) 版平台以5G新通信為(wei) 基礎提供無障礙智能通信服務，為(wei) 老年乘客提供可視化交互的智慧助老服務。

　　值得一提的是，該平台在國產(chan) 化適配與(yu) 自主可控方麵實現了平台與(yu) 國產(chan) 手機芯片適配；平台端支持國產(chan) 化係統，手機側(ce) 適配華為(wei) 麒麟芯片、聯發科天璣芯片，支持華為(wei) 、小米、OPPO、VIVO、魅族係列國產(chan) 手機。

　　“數智人”更聰明

　　與(yu) 大模型融合能“聽懂你的話”

　　數智人，簡單來說就是虛擬人，借助擬人化的外表、人工智能的內(nei) 核，數智人已經開始在眾(zhong) 多行業(ye) 中商業(ye) 化落地，輔助人工服務，提升企業(ye) 運行效率。例如，數智人在金融、文旅、傳(chuan) 媒、公共服務、醫療、零售等行業(ye) 場景中，可擔任坐席客服、理財顧問、播報主持、導遊導覽角色；在文化娛樂(le) 場景，可以作為(wei) 虛擬偶像、虛擬歌手等形成IP資產(chan) ；在智能車載、智能交通、智能家居等場景，可以通過與(yu) 智能設備結合，為(wei) 用戶提供智能化服務。

　　騰訊雲(yun) 智能小樣本數智人生產(chan) 平台近日首次對外發布，隻需要3分鍾真人口播視頻、100句語音素材，平台便可通過音頻、文本多模態數據輸入，實時建模並生成高清人像，在24小時內(nei) 製作出與(yu) 真人近似的“數智人”。相較於(yu) 照片生成、僅(jin) 能呈現麵部形態的數字人，小樣本數智人可根據文本設計手勢，唇動、口型、表情複現真人風格。

　　本屆中關(guan) 村論壇，北青報記者也嚐試用數智人虛擬主播，代替真人主播出鏡，進行7×24小時的直播服務，吸引了諸多觀眾(zhong) 關(guan) 注。

　　不過，以往的數智人，比起真人來，他們(men) 的思考能力明顯更弱。此次中關(guan) 村論壇上，由智譜AI推出的 “智譜AI腦數智人”則更加聰明，它不再拘泥於(yu) 固定的互動方式，而是初具理解人類指令意圖的能力。智譜AI由清華大學計算機係的技術成果轉化而來，公司於(yu) 2022年合作研發了雙語千億(yi) 級超大規模預訓練模型GLM-130B，並主導構建了高精度通用知識圖譜，把兩(liang) 者有機融合為(wei) 數據與(yu) 知識雙輪驅動的認知引擎，並基於(yu) 此千億(yi) 基座模型打造ChatGLM。通過認知大模型鏈接物理世界的億(yi) 級用戶、賦能元宇宙數字人、成為(wei) 具身機器人的基座，賦予機器像人一樣“思考”的能力。此外，它還是一個(ge) 既會(hui) 中文又會(hui) 英文的雙語數智人。

　　“無人駕駛”上街

　　最新行人預測模型呼之欲出

　　如今在亦莊等地，已經可以打到百度自動駕駛的車輛。未來，隨著技術發展和政策批準後，車上的安全員將會(hui) 撤出，自動駕駛車輛會(hui) 實現真正的無人化。

　　據百度公司介紹，無人駕駛技術核心是“百度汽車大腦Apollo平台”，包括高精度地圖、定位、感知、智能決(jue) 策與(yu) 控製四大模塊。最新的Apollo已經進化到引入多個(ge) 基於(yu) 深度學習(xi) 的模型、發布了基於(yu) 語義(yi) 地圖的低速行人預測模型、引入了基於(yu) 語義(yi) 地圖的模仿學習(xi) 。

　　在本次中關(guan) 村論壇上，曠視科技發布了自研智能托盤四向穿梭車係統。曠視智能托盤四向車作為(wei) 柔性物流係統中的離散型設備，可以實現“一車跑全倉(cang) ”。為(wei) 什麽(me) 說是“柔性物流”？曠視表示，主要是因為(wei) 它具有離散型設備、分布式控製兩(liang) 大特點，用戶企業(ye) 可以像搭積木一樣，根據需要靈活組合，柔性部署。其次，柔性則體(ti) 現在整個(ge) 係統的“動態可擴展”，用戶企業(ye) 可以根據淡旺季以及業(ye) 務增長等變化，隨時增減四向車數量，提升係統承載能力。

　　智慧城市更低碳

　　AI“管家”水電空調全都管

　　在智慧城市建設中，AI扮演著越來越重要的角色。例如，AI可以用於(yu) 城市的基礎設施管理，例如自動監測道路、橋梁和建築物的結構健康狀況，以及檢測和修複道路上的裂縫和坑窪；AI可以幫助城市管理能源，例如通過分析能源使用數據來實現更高效的能源使用，以及優(you) 化城市的能源係統；AI也可以幫助城市保護環境，例如通過空氣質量監測、垃圾處理和水資源管理等方麵，提高城市的環境質量。

　　那麽(me) ，如何利用AI給樓宇減碳來實現碳中和碳達峰的目標呢？恒華數元展示的基於(yu) 樓宇大腦神經網絡係統碳管理平台，從(cong) 充分利用清潔能源的角度出發，集中引用性價(jia) 比較高的技術產(chan) 品應用，遍及樓宇末端傳(chuan) 感感知節點和主要用能設備傳(chuan) 感感知節點，通過樓宇大腦邊緣計算服務器統一協調管理，使樓宇用能設備高效運轉，盡可能排除不必要的能源浪費，根據邊緣計算模型分析，樓宇各用能子係統能耗曲線處於(yu) 平穩運行狀態下，整體(ti) 能耗是最低的。

　　其中，樓宇電力能耗應該占樓宇能耗的首位，針對樓宇弱電係統的特點，在不增加裝修施工的基礎上，研發出體(ti) 積更小、計量準確、安裝便捷的一套弱電監測及AI控製係統，可以對樓宇的電力係統進行動態的監控，確保無人區及時斷電，避免不必要的電力浪費。而樓宇空調係統耗能占到樓宇總能耗的40%，恒華數元通過和高校成立產(chan) 學研基地深度合作研發出針對樓宇冷、熱源係統調優(you) 的策略算法，形成了成熟的數據算法模型，使得空調係統節能率達到10%以上。目前，這一項目已在廣東(dong) 、天津、江西、四川、湖北、安徽等省份落地。未來，居住小區、寫(xie) 字樓、商場等，都將向著綠色低碳的方向“進化”。

　　AR眼鏡“同聲傳(chuan) 譯”

　　智能穿戴設備助力無障礙

　　隨著人工智能融入生活的方方麵麵，搭載人工智能的設備也趨於(yu) 小型化，如智能手表可接聽電話、回微信、監測運動情況等；智能眼鏡外形如普通眼鏡，戴上後可以接打電話、聽音樂(le) 等。

　　不過，中關(guan) 村論壇上展示的這一智能眼鏡，則更實用。這款名為(wei) “亮亮聽語者智能眼鏡”是一款雙目光波導AR智能眼鏡。

　　VR眼鏡戴上後會(hui) 沉浸在虛擬世界，AR眼鏡則不會(hui) 阻擋視線，其將現實世界與(yu) 虛擬世界進行融合，從(cong) 而實現一些在現實世界中無法做到的功能。如聽力受損人群常常因“聽不清”、“聽不見”聲音而在工作、社交、學習(xi) 過程中遇到困難，這款眼鏡可以將聲音信息轉換成文字在眼前顯示出來。它還具有同聲傳(chuan) 譯功能，可以識別不同國家的語言，同時轉換成漢字或者其他國家的文字呈現前，幫助用戶在國際語言交流的環境中方便理解。這款眼鏡輕巧便攜，機身僅(jin) 重79g，相比於(yu) 目前市麵上200-300g的AR眼鏡，其自重非常適合長時間佩戴；還可以適配近視、遠視、散光、老花眼等情況的鏡片；眼鏡外側(ce) 不漏光，保護隱私，內(nei) 容僅(jin) 自己可見；這款眼鏡還搭載了毫秒級實時字幕，降噪算法，5米內(nei) 精準收音，轉譯準確率最高可達95%以上。據悉，該款產(chan) 品目前已經具備量產(chan) 能力。

　　隱私保護計算技術開源

　　應用於(yu) 金融醫療保險等領域

　　隱私計算，也叫隱私保護計算，是指在保證數據提供方不泄露原始數據的前提下，對數據進行分析計算的一係列信息技術，實現數據在流通與(yu) 融合過程中的“可用不可見”，從(cong) 而實現數據價(jia) 值的轉化和釋放。隱私保護計算對隱私數據提供了未來行業(ye) 亟須的保護能力。本次中關(guan) 村論壇展覽（科博會(hui) ）上，螞蟻集團首次公布以關(guan) 鍵基礎軟件為(wei) 核心的開源完整版圖，9大核心技術全部開源，其中就包括隱私計算技術“隱語”。也就是說，這一技術平台麵向全球用戶開放，可無需調用和開發代碼，直接使用產(chan) 品功能，幫助用戶低成本探索隱私計算應用場景。

　　據介紹，隱語目前已經在金融、醫療、保險等場景應用。如浦發銀行聯合螞蟻集團隱語平台，識別出超過14.5萬(wan) 名高風險用戶，阻止了數十億(yi) 人民幣的高風險貸款的發放。在醫療方麵，螞蟻隱私計算平台和阿裏雲(yun) 數字醫療團隊合作，為(wei) 醫院搭建了麵向醫院運營管理的數據融合平台，為(wei) 管理者提供數字化績效管理分析，幫助醫院建立精細化運營管理體(ti) 係，減少醫院的經濟風險或臨(lin) 床風險。此外，過往保險機構在理賠過程中，通過向醫療機構明文（即數據不加密）查詢被保險人的診療情況，將會(hui) 獲得不必要的原始數據。而螞蟻的解決(jue) 方案通過設定數據邏輯查詢，利用多方安全計算等隱私計算技術，使得保險公司隻獲得是否理賠的查詢結果，不會(hui) 獲得各種原始數據，保護理賠用戶隱私。

　　聲音

　　大模型將改變世界開發的同時應研究控製技術

　　ChatGPT是2023年最引人關(guan) 注的科技界新事物之一，它的發布也引發了語言大模型狂潮，百度、阿裏、知乎、商湯、京東(dong) 等多個(ge) 公司紛紛推出了其大模型。AI另一個(ge) 重大領域——視覺GPT也亮相本屆中關(guan) 村論壇：智源研究院視覺團隊正式推出通用分割模型 SegGPT，這是首個(ge) 利用視覺提示完成任意分割任務的通用視覺模型。

　　據介紹，SegGPT使用時，擯棄語言類大模型的傳(chuan) 統思維，與(yu) 機器交互時不使用文字而是使用圖像。比如用戶給出SegGPT一張圖並在上麵將“彩虹”圈了起來，當用戶再給許多張包含有彩虹的圖片時，SegGPT就能自動識別上麵的彩虹，並將這些部分圈出來。可以說，SegGPT “一通百通”：給出一個(ge) 或幾個(ge) 示例圖像和意圖掩碼，模型就能get用戶意圖，“有樣學樣”地完成類似分割任務。此外，SegGPT還“一觸即通”：通過一個(ge) 點或邊界框，在待預測圖片上給出交互提示，識別分割畫麵上的指定物體(ti) 。利用這個(ge) 特性，可以實現諸多功能，比如機器人機械手去拿西紅柿等物件時，機器人就可以迅速知道西紅柿的邊緣在哪裏，既能拿起西紅柿，又不會(hui) 捏碎，十分精準。

　　目前，國內(nei) 大模型處在百花齊放、百家爭(zheng) 鳴的狀態下。百度創始人、董事長兼CEO李彥宏在中關(guan) 村論壇上表示，人工智能再次成為(wei) 人類創新的焦點，越來越多的人認可第四次產(chan) 業(ye) 革命正在到來。他強調：“大模型改變了人工智能，大模型即將改變世界。”中國工程院院士、中國人工智能學會(hui) 理事長戴瓊海也表示，人工智能將帶來多個(ge) 方麵的應用變革：麵向科學研究新範式（宇宙起源、自然規律、生命奧秘）；麵向人民生命健康（AI藥物研發、遠程虛擬手術）；麵向經濟主戰場（虛擬創造、工業(ye) 製造、靈境交互）；麵向國防重大需求（多源態勢分析、AI地空戰線部署）等等。

　　值得關(guan) 注的是，麵對新變化，也有人提出了警示。創新工場董事長、首席執行官李開複表示，“AI仍會(hui) 出錯，會(hui) 一本正經地胡說八道，它隻能被應用於(yu) 生成內(nei) 容初稿、開拓想法，而不能作為(wei) 最終版本，AI需要持續的人工幹預，避免謬誤或災難發生。此外，AI可能還存在一些法律及倫(lun) 理問題，因此，AI並非適合所有的領域，隻能應用於(yu) 容錯度較高的應用中。”李開複強調，“AI可能製造虛假信息，可能被不法分子利用來做針對性的欺騙用戶，因此，開發時，需要同時研究控製AI的技術和管理的法律法規。”（李娜溫婧）

（責編：郭爽）

人工智能現在能有多“聰明”？

相關閱讀

專題推薦

微觀

賞閱

資料雲

即時新聞