首頁 > 20+8產業(yè)動態(tài) > 電子信息
記者19日從國家區(qū)塊鏈技術創(chuàng)新中心獲悉,由國家區(qū)塊鏈技術創(chuàng)新中心、北京能源集團牽頭,聯(lián)合新華社國家重點實驗室、人民網(wǎng)、高等教育出版社、中國通用技術集團等10余家國內語料數(shù)據(jù)重點單位共同打造的高價值語料可信流通基礎設施正式啟動建設。
高價值語料數(shù)據(jù)是訓練人工智能大模型的關鍵因素。長期以來,高價值語料數(shù)據(jù)存在跨單位、跨行業(yè)、跨地區(qū)分布的特點,部分領域還暴露出濫用語料數(shù)據(jù)、泄露語料隱私等問題。以區(qū)塊鏈、隱私計算為代表的新一代信息技術,憑借可信存證、不可篡改、易確權等性能,可以保障語料數(shù)據(jù)可信安全地流通、使用和管理,有效破解上述難題。
國家區(qū)塊鏈技術創(chuàng)新中心相關負責為人介紹,高價值語料可信流通基礎設施將運用我國自主可控、性能領先的區(qū)塊鏈軟硬件技術,搭建起覆蓋全國的分布式語料數(shù)據(jù)互聯(lián)互通橋梁,鏈接語料供給方、加工方、需求方,實現(xiàn)全國分布式語料數(shù)據(jù)可信接入,跨地域可發(fā)現(xiàn)、可訪問,形成高質量語料數(shù)據(jù)集;同時,運用創(chuàng)新隱私計算技術,通過“數(shù)據(jù)不出域、可用不可見”的方式,保障大模型高價值語料數(shù)據(jù)在處理加工和模型訓練過程中無法二次非授權傳播。
在高價值語料可信流通基礎設施的支撐下,國家語料數(shù)據(jù)的重點單位還將開展基于區(qū)塊鏈與隱私計算的語料數(shù)據(jù)可信安全流通規(guī)范制定,形成高價值語料數(shù)據(jù)流通與增值的可持續(xù)生態(tài)。
- 上一篇:北京發(fā)布“人工智能+”行動計劃
- 下一篇:兩部門開展全國重點城市IPv6流量