人民網(wǎng)
人民網(wǎng)>>北京頻道

北京人工智能數(shù)據(jù)運(yùn)營平臺(tái)發(fā)布 已匯聚700萬億字節(jié)通用數(shù)據(jù)集

2024年06月15日13:11 | 來源:人民網(wǎng)-北京頻道
小字號(hào)

人民網(wǎng)北京6月15日電 (記者董兆瑞)6月14日下午,作為2024北京智源大會(huì)主題論壇之一,“人工智能+數(shù)據(jù)新基建”主題論壇召開。論壇上,北京人工智能數(shù)據(jù)運(yùn)營平臺(tái)正式發(fā)布。記者了解到,目前平臺(tái)已匯聚超過700萬億字節(jié)的通用數(shù)據(jù)集和4.33萬億字節(jié)的行業(yè)數(shù)據(jù)集,為大模型行業(yè)發(fā)展提供數(shù)據(jù)支撐。

據(jù)介紹,北京人工智能數(shù)據(jù)運(yùn)營平臺(tái)是在國家發(fā)展改革委、國家數(shù)據(jù)局指導(dǎo)下,由北京市發(fā)展改革委主導(dǎo),在市委網(wǎng)信辦、市科委、市經(jīng)信局、海淀區(qū)政府、中國網(wǎng)絡(luò)空間安全協(xié)會(huì)人工智能安全治理專委會(huì)等單位支持下,由智源研究院牽頭與京能數(shù)產(chǎn)等單位共建推動(dòng)成立開放型數(shù)據(jù)運(yùn)營平臺(tái)。

數(shù)據(jù)平臺(tái)在實(shí)現(xiàn)數(shù)據(jù)的匯聚管理、處理與加工等功能基礎(chǔ)上,能夠提供多種模態(tài)的數(shù)據(jù)標(biāo)注功能,支持多種數(shù)據(jù)匯聚和使用形式。目前平臺(tái)已匯聚超過700萬億字節(jié)的通用數(shù)據(jù)集和4.33萬億字節(jié)的行業(yè)數(shù)據(jù)集,未來將不斷擴(kuò)充數(shù)據(jù)規(guī)模,為大模型行業(yè)發(fā)展提供堅(jiān)實(shí)的數(shù)據(jù)支撐。

目前,數(shù)據(jù)運(yùn)營平臺(tái)支持“開源開放”“積分共享”“數(shù)算一體”三種數(shù)據(jù)運(yùn)營模式。“開源開放”模式允許用戶在遵守使用協(xié)議的前提下自由下載使用;“積分共享”模式面向數(shù)據(jù)工作組內(nèi)的成員,根據(jù)數(shù)據(jù)貢獻(xiàn)實(shí)行積分制,即成員單位貢獻(xiàn)數(shù)據(jù),按照計(jì)分標(biāo)準(zhǔn)獲取相應(yīng)積分,同時(shí)獲得共享數(shù)據(jù)的權(quán)益;“數(shù)算一體”模式針對(duì)高價(jià)值數(shù)據(jù),僅在平臺(tái)上進(jìn)行數(shù)據(jù)加工、訓(xùn)練使用,保證數(shù)據(jù)不出安全域。

海淀區(qū)相關(guān)負(fù)責(zé)人表示,依托數(shù)據(jù)運(yùn)營平臺(tái),海淀區(qū)會(huì)同智源研究院等單位積極推動(dòng)政務(wù)、社會(huì)與企業(yè)數(shù)據(jù)開放共享,打破數(shù)據(jù)孤島。同時(shí)探索建設(shè)北京數(shù)據(jù)基礎(chǔ)制度先行區(qū),統(tǒng)籌布局算力與數(shù)據(jù)存儲(chǔ)基礎(chǔ)設(shè)施,為數(shù)據(jù)資源創(chuàng)新應(yīng)用提供技術(shù)與制度保障。

(責(zé)編:董兆瑞、高星)

分享讓更多人看到

返回頂部