生物數據利用別再“出口轉內銷”
“目前我國發表在國際期刊上的文章,幾乎一半與(yu) 生命科學有關(guan) 。要在頂級期刊發表論文,將研究數據提交給歐美幾大生物數據中心,是國際通行的做法。”中科院上海營養(yang) 與(yu) 健康研究所研究員、生物醫學大數據中心主任李亦學初略估計,多達數千TB的生物學數據目前存儲(chu) 在國外生物數據中心,背後則是成百億(yi) 元的國家科技投入。
另一個(ge) “怪象”是,通過“出口轉內(nei) 銷”,國內(nei) 同行在國際平台上實現了國內(nei) 難以實現的數據共享。
“除了缺乏共享平台,我們(men) 更缺乏共享文化。”全國人大代表、中科院上海生命科學研究院院長、中科院院士李林14日在接受科技日報記者采訪時呼籲,我國應建立自己的生物醫學大數據管治體(ti) 係。
我國生物數據利用基本是“出口轉內(nei) 銷”
“我國是名副其實的生物‘數據大國’。”李林告訴記者,自開展人類基因組研究以來,我國已產(chan) 出大量與(yu) 人類及醫學相關(guan) 的基因組及其他組學研究數據,僅(jin) 存貯在國際基因數據庫的組學數據中,就有30%以上來自中國。
一方麵是最大生物數據輸出國,另一方麵我國卻嚴(yan) 重依賴國際數據開展研究。
我國大量生命科學研究的基礎計算工作,不僅(jin) 依賴國外的分析軟件,還往往依賴國外數據中心存儲(chu) 的大規模科研數據。2006年,14條海底光纜受地震影響,中美間國際通訊受阻,國內(nei) 一時不能訪問美國國立生物技術信息中心(NCBI)網站,導致嚴(yan) 重依賴國外數據資源的我國生命科學研究受到極大影響。
李林說,我國有若幹運行較好的數據庫,但真正能夠整合大量國內(nei) 數據的公共數據庫不多,而且規模有限,基本不具備相互共享、整合並提供大規模數據服務的能力。
國內(nei) 生物數據共享文化缺乏,被認為(wei) 是造成“出口轉內(nei) 銷”現象的重要原因。海量的生物醫學大數據散落於(yu) 機構甚至個(ge) 人手中,碎片化或孤島化嚴(yan) 重,狀況已持續數十年。
“在生物大數據領域,我國缺乏從(cong) 國家層麵對生物大數據進行有效管理、利用的體(ti) 製、機製和支撐環境,這已經嚴(yan) 重威脅我國生物數字主權。”李亦學在查閱國家已公布的6項與(yu) 人類遺傳(chuan) 資源管理相關(guan) 的行政處罰決(jue) 定書(shu) 後發現,某些機構、企業(ye) 為(wei) 了一己眼前利益,漠視國家管理規範,違規將大量基因資源和檢測數據輸送境外。
應平衡共享應用與(yu) 隱私保護
“造成上述現象的原因很多,核心問題,是缺乏國家級公益性、規模化、權威性的數據標準管理創新服務技術體(ti) 係及配套的基礎設施。”李林說。
2016年12月,國家發改委聯合8部門發布的《國家重大科技基礎設施“十三五”規劃》,將“國家生物醫學大數據基礎設施”建設方案列入5個(ge) 後備項目之一。
“一個(ge) 人身上大約有300萬(wan) 個(ge) 單核苷酸多態性(SNP)位點,隨著基因檢測技術的發展,理論上隻需大概75個(ge) ,換言之,隻需要1/40000的SNP位點信息,就可鎖定某個(ge) 人。”李林坦言,生物醫學大數據的共享應用與(yu) 隱私保護相互博弈,麵臨(lin) 技術與(yu) 倫(lun) 理挑戰。“好比‘雞’和‘蛋’的關(guan) 係,希望依托平台建設,結合國際經驗與(yu) 我國現狀,建立我國生物醫學大數據管治體(ti) 係,從(cong) 國家層麵上抓落實,做到既保證數據安全,又促進共享應用。”
按照設想,李林認為(wei) 體(ti) 係包括完善基於(yu) 數據安全與(yu) 隱私權益的法律法規與(yu) 政策標準;加強國家數據相關(guan) 管理部門與(yu) 設施技術體(ti) 係的合作與(yu) 協同;同時要設置數據安全與(yu) 倫(lun) 理委員會(hui) 及各級單位的信息安全部門,督導、引領並落實國內(nei) 生物醫學大數據的數據安全與(yu) 隱私保護。
李亦學也希望,通過平台建設,能夠慢慢培養(yang) 國內(nei) 科研圈的科學數據共享文化。
版權聲明:凡注明“來源:新利平台”或“新利平台文”的所有作品,版權歸高原(北京)文化傳(chuan) 播有限公司。任何媒體(ti) 轉載、摘編、引用,須注明來源新利平台和署著作者名,否則將追究相關(guan) 法律責任。
-
萬建民委員:加強農業生物技術研發
全國政協委員、中國工程院院士、中國農業科學院副院長萬建民建議,加強農業生物技術研發,搶占農業生物技術發展製高點。[詳細] -
為古生物化石科研開辟“綠色通道”
有媒體報道,我國科學家在青藏高原中部發現了一片距今2500萬年的棕櫚葉化石。根據對這一化石的研究,科學家推測出了青藏高原年輕時的模樣,同時也將青藏高原中部的抬升史推後了至少約1000萬年。[詳細]