亞洲資本網(wǎng) > 資訊 > 焦點 > 正文
北京發(fā)布大模型高質(zhì)量數(shù)據(jù)集 新視野
2023-07-06 12:02:06來源: 人民日報海外版


【資料圖】

人民日報海外版電 (記者賀勇)首批“北京市人工智能大模型高質(zhì)量數(shù)據(jù)集”近日發(fā)布,10家單位的18個高質(zhì)量訓練數(shù)據(jù)集入選,包括人民日報語料數(shù)據(jù)集、國家法律法規(guī)語料數(shù)據(jù)集、兩會參政議政建言數(shù)據(jù)集、“科情頭條”全球科技動態(tài)數(shù)據(jù)集、中國科學引文數(shù)據(jù)庫數(shù)據(jù)集、科技文獻挖掘語義標注數(shù)據(jù)集等,涵蓋經(jīng)濟、政治、文化、社會、生態(tài)等不同領(lǐng)域,總規(guī)模超過500T,將為通用大模型和行業(yè)大模型訓練提供有力保障。

為更好把握這次通用人工智能發(fā)展的歷史性機遇,近期北京市連續(xù)出臺了《加快建設(shè)具有全球影響力的人工智能創(chuàng)新策源地實施方案》《北京市促進通用人工智能創(chuàng)新發(fā)展的若干措施》《北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計劃》等多項支持政策,釋放明確信號、搭建伙伴平臺、聚攏行業(yè)資源,助力人工智能技術(shù)賦能千行百業(yè)數(shù)智化轉(zhuǎn)型。

目前,針對大模型訓練的高質(zhì)量中文語料占比較少,不利于中文語境表達及產(chǎn)業(yè)應(yīng)用。為此,北京啟動實施“通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計劃”,其中一個重要領(lǐng)域就是針對大模型訓練所需的高質(zhì)量數(shù)據(jù),發(fā)揮數(shù)據(jù)提供方海量數(shù)據(jù)資源優(yōu)勢,基于數(shù)據(jù)交易方搭建的流通交易平臺和數(shù)據(jù)服務(wù)方的技術(shù)支撐,實現(xiàn)訓練數(shù)據(jù)的有效供給及合規(guī)高效、安全有序的流動。

關(guān)鍵詞:

專題新聞
  • 魯南制藥集團榮登中國醫(yī)藥制造業(yè)百強榜、中國醫(yī)藥自主創(chuàng)新先鋒企業(yè)榜
  • 仰韶酒飄香聯(lián)合國教科文組織,讓世界聆聽中國白酒聲音!
  • 2023百合婚禮年中盤點丨年輕人婚禮呈現(xiàn)全新審美趨勢
  • 主打旗艦品質(zhì),江鈴福特新款輕客將重塑輕客市場新標桿
  • 蒙牛集團與浙商銀行戰(zhàn)略合作再升級 首推“奶牛信用卡”助力鄉(xiāng)村振興
  • 本土化戰(zhàn)略開新局 賽
熱點新聞
最近更新

京ICP備2021034106號-51

Copyright © 2011-2020  亞洲資本網(wǎng)   All Rights Reserved. 聯(lián)系網(wǎng)站:55 16 53 8 @qq.com