亞洲資本網(wǎng) > 資訊 > 熱播 > 正文
數(shù)據(jù)標(biāo)注師:化“人工”為“智能”
2023-08-26 01:55:37來源: 中國青年報(bào)

人工智能訓(xùn)練師于2020年正式成為新職業(yè)并納入國家職業(yè)分類目錄。2021年,《人工智能訓(xùn)練師國家職業(yè)技能標(biāo)準(zhǔn)(2021年版)》發(fā)布,數(shù)據(jù)標(biāo)注員是人工智能訓(xùn)練師的工種之一。


(資料圖片)

——————————

4年前,陳霞還是一名全職媽媽,也從沒想到自己會(huì)成為人工智能領(lǐng)域中的一員。如今,31歲的她已經(jīng)是一名資深的數(shù)據(jù)標(biāo)注師了。

她參與的是無人駕駛項(xiàng)目,負(fù)責(zé)在電腦上對(duì)車在道路上采集的現(xiàn)實(shí)交通場景的原始數(shù)據(jù)進(jìn)行處理,將其轉(zhuǎn)化為機(jī)器學(xué)習(xí)可識(shí)別的專業(yè)數(shù)據(jù)。

“比如道路上的各種障礙物、建筑、綠植,各類車道線以及行人等,我們要把這些人、物標(biāo)出來,我們就是無人駕駛車的眼睛,告訴它們看見的東西是什么,應(yīng)該怎么去行駛。”陳霞這樣描述著她的工作。

有多少智能,就有多少人工

“數(shù)據(jù)標(biāo)注是機(jī)器感知現(xiàn)實(shí)世界的起點(diǎn),是大部分人工智能算法得以有效運(yùn)行的關(guān)鍵環(huán)節(jié)?!卑俣戎悄茉茢?shù)據(jù)標(biāo)注基地業(yè)務(wù)產(chǎn)品負(fù)責(zé)人胡馳說,簡單來說,數(shù)據(jù)標(biāo)注是對(duì)未經(jīng)處理的語音、圖片、文本、視頻等數(shù)據(jù)進(jìn)行特征標(biāo)簽,將非結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)變?yōu)闄C(jī)器可識(shí)別的結(jié)構(gòu)化數(shù)據(jù),使機(jī)器通過大量學(xué)習(xí)這些數(shù)據(jù),化“人工”為“智能”。

數(shù)據(jù)標(biāo)注師是伴隨人工智能發(fā)展誕生的新職業(yè),人工智能的進(jìn)步離不開數(shù)據(jù)的標(biāo)注。隨著中國人工智能產(chǎn)業(yè)的高速發(fā)展,數(shù)據(jù)標(biāo)注師這個(gè)新職業(yè)的需求及人數(shù)也在壯大。作為人工智能的“啟蒙老師”,數(shù)據(jù)標(biāo)注行業(yè)流行著一句話,“有多少智能,就有多少人工”。

目前,數(shù)據(jù)標(biāo)注不僅服務(wù)于自動(dòng)駕駛行業(yè),還服務(wù)于醫(yī)療保健、智能安防、新零售等場景。

帥雙雙是一名醫(yī)療數(shù)據(jù)標(biāo)注師,他的工作主要是對(duì)醫(yī)療類問答進(jìn)行標(biāo)注,糾正生成式人工智能對(duì)醫(yī)療相關(guān)問題的解答,主要用于在線問診等場景。他介紹說,“比如向AI提問心臟病的并發(fā)癥有哪些,我們要從它的多個(gè)回答中標(biāo)注出符合問題的選項(xiàng)。有時(shí),AI的回答雖然正確,但是語句不通順、不清晰,我們也要對(duì)此進(jìn)行標(biāo)注,通過這些操作,綜合培養(yǎng)AI的回答系統(tǒng)?!?/p>

AI技術(shù)的落地應(yīng)用在很大程度上緩解了醫(yī)療資源緊張、地區(qū)分布不均等問題,提升了醫(yī)療體系的整體運(yùn)行效率。數(shù)據(jù)標(biāo)注有望在增強(qiáng)人工智能在醫(yī)療保健領(lǐng)域的應(yīng)用方面發(fā)揮重要作用。

胡馳表示,目前,人工智能技術(shù)不斷演化、技術(shù)與行業(yè)場景融合不斷泛化,這些都需要大量的數(shù)據(jù)支撐,會(huì)對(duì)數(shù)據(jù)產(chǎn)生許多新的需求。數(shù)據(jù)標(biāo)注也從早期的相對(duì)通用數(shù)據(jù)向?qū)I(yè)化、復(fù)雜化方向演進(jìn)。越來越多的細(xì)分場景,需要更多定制化模型進(jìn)行迭代訓(xùn)練,這也讓數(shù)據(jù)標(biāo)注師面臨更多考驗(yàn),“未來,數(shù)據(jù)標(biāo)注師會(huì)伴隨人工智能的發(fā)展不斷成長與變化,具備較長的職業(yè)生命周期與上升空間?!?/p>

數(shù)據(jù)標(biāo)注師需求多元化 門檻高低各不同

天眼查數(shù)據(jù)顯示,目前我國有2000余家與“數(shù)據(jù)標(biāo)注”相關(guān)的公司。其中,成立1-5年的占比24.2%,成立10年以上的占比50.8%。

人工智能訓(xùn)練師于2020年正式成為新職業(yè)并納入國家職業(yè)分類目錄。2021年,《人工智能訓(xùn)練師國家職業(yè)技能標(biāo)準(zhǔn)(2021年版)》發(fā)布,數(shù)據(jù)標(biāo)注員是人工智能訓(xùn)練師的工種之一。

德勤發(fā)布的《2022年人工智能基礎(chǔ)數(shù)據(jù)服務(wù)白皮書》顯示,2022年中國人工智能基礎(chǔ)數(shù)據(jù)服務(wù)市場規(guī)模為45億元,預(yù)計(jì)2027年市場規(guī)模將達(dá)到130億-160億元。胡馳認(rèn)為,人工智能技術(shù)的迅猛發(fā)展,帶來了大量AI算法的訓(xùn)練需求,這推動(dòng)了數(shù)據(jù)標(biāo)注產(chǎn)業(yè)的快速增長,人工智能訓(xùn)練師的規(guī)模也由此快速增長。

數(shù)據(jù)標(biāo)注工具使用戶能夠通過向數(shù)據(jù)添加屬性標(biāo)簽或?qū)ζ溥M(jìn)行標(biāo)記來提高數(shù)據(jù)的價(jià)值。使用標(biāo)注工具的主要好處是數(shù)據(jù)屬性的組合使用戶能夠在單個(gè)位置管理數(shù)據(jù)定義,而無需在多個(gè)地方重寫類似的規(guī)則。

大數(shù)據(jù)的興起和大型數(shù)據(jù)集數(shù)量的激增,也需要使用人工智能數(shù)據(jù)標(biāo)注領(lǐng)域的技術(shù)。螞蟻公益基金會(huì)副秘書長黃慶委表示,數(shù)據(jù)標(biāo)注行業(yè)有望受益于對(duì)機(jī)器學(xué)習(xí)改進(jìn)需求的不斷增長,以及對(duì)先進(jìn)自動(dòng)駕駛技術(shù)投資的不斷增加。

對(duì)于未來,帥雙雙表示,隨著數(shù)據(jù)行業(yè)的發(fā)展,未來行業(yè)的門檻會(huì)越來越高。人工智能應(yīng)用場景在不斷細(xì)分,數(shù)據(jù)分類也更加精細(xì)化、復(fù)雜化,作為數(shù)據(jù)標(biāo)注師必須不斷學(xué)習(xí)以滿足行業(yè)發(fā)展需求。

胡馳表示,數(shù)據(jù)標(biāo)注行業(yè)對(duì)人才需求具有多元性,不同的標(biāo)注數(shù)據(jù)與場景,對(duì)人員要求也呈現(xiàn)出一定的梯度分布的特征。較為低階的標(biāo)注如標(biāo)點(diǎn)、劃線等,對(duì)標(biāo)注人員的要求往往不高,普通人經(jīng)過培訓(xùn)即可勝任;中高階的標(biāo)注,如對(duì)自動(dòng)駕駛、大模型等的標(biāo)注,則對(duì)標(biāo)注人員的要求更高、更專業(yè)。而一些細(xì)分復(fù)雜場景可能會(huì)需要更專業(yè)、更高學(xué)歷的數(shù)據(jù)標(biāo)注師來提供數(shù)據(jù)服務(wù)。胡馳認(rèn)為,“未來,隨著人工智能的不斷發(fā)展,數(shù)據(jù)標(biāo)注可能將從勞動(dòng)密集型產(chǎn)業(yè)轉(zhuǎn)向技術(shù)型產(chǎn)業(yè)。”

中青報(bào)·中青網(wǎng)記者 高蕾 來源:中國青年報(bào)

關(guān)鍵詞:

專題新聞
  • 恒天海龍(000677.SZ)發(fā)布上半年業(yè)績,凈利潤2507.46萬元,同比下降17.25%
  • 希荻微:擬使用超募資金回購公司股份
  • 2022年我國經(jīng)濟(jì)發(fā)展新動(dòng)能指數(shù)比上年增長28.4%
  • dnf強(qiáng)化武器需要什么材料(dnf強(qiáng)化武器技巧)
  • pws簡稱是什么意思(pws)
  • 《裝甲核心6》登錄平臺(tái)匯總
最近更新

京ICP備2021034106號(hào)-51

Copyright © 2011-2020  亞洲資本網(wǎng)   All Rights Reserved. 聯(lián)系網(wǎng)站:55 16 53 8 @qq.com