亞洲資本網(wǎng) > 資訊 > 熱點(diǎn) > 正文
【天天快播報(bào)】年刊節(jié)選|小冰CEO李笛:CG建模數(shù)字人“唯物”,小冰“唯心”
2022-12-26 05:56:58來源: 娛樂資本論

在元宇宙熱潮的影響下,2022年,數(shù)字人領(lǐng)域出現(xiàn)井噴。大到互聯(lián)網(wǎng)巨頭,小到創(chuàng)業(yè)公司,紛紛入局?jǐn)?shù)字人領(lǐng)域。

不過,在相對(duì)高調(diào)的數(shù)字人領(lǐng)域,有一家公司,技術(shù)實(shí)力與曝光度遠(yuǎn)未成正比,那就是小冰公司。

相比國(guó)內(nèi)數(shù)字人公司,小冰公司是為數(shù)不多的愿意在“海平面”以下做數(shù)字人基礎(chǔ)設(shè)施的公司。


(相關(guān)資料圖)

小冰公司CEO 李笛

用小冰公司CEO李笛的話說,小冰想做的AI Beings是有靈魂的數(shù)字人,而不是只能簡(jiǎn)單交互的數(shù)字人外形。

根據(jù)小冰官方數(shù)據(jù),小冰框架是全球?qū)嶋H落地及完備度最高的AI Being基礎(chǔ)框架,覆蓋中國(guó)、日本、印度尼西亞等國(guó)6.6億在線用戶、10億臺(tái)第三方智能設(shè)備和9億內(nèi)容觀眾,商業(yè)客戶覆蓋全球。目前框架內(nèi)運(yùn)行著數(shù)千萬AI Beings,其中數(shù)字員工約有30萬名。

數(shù)字員工、虛擬陪伴、游戲NPC是小冰數(shù)字人開發(fā)的主要場(chǎng)景和應(yīng)用。尤其趁著企業(yè)數(shù)字化轉(zhuǎn)型的浪潮,小冰框架在數(shù)字員工領(lǐng)域大殺四方。

在過去的一兩年中,在小冰框架的基礎(chǔ)上,不斷為客戶開發(fā)出觀君、招小影、崔筱盼、N小黑等一系列專業(yè)領(lǐng)域數(shù)字員工。在李笛看來,數(shù)字員工遠(yuǎn)遠(yuǎn)不止是一張超寫實(shí)的面孔,更重要的是可以完美勝任財(cái)務(wù)、教練、客服等一系列工作,且比真人做得更好。

(崔筱盼)

從2014年誕生到現(xiàn)在,小冰已經(jīng)經(jīng)歷了9代。在“海平面”以下,她究竟打下了怎么樣的基礎(chǔ),與市面上的數(shù)字人究竟有什么不同?我們跟小冰公司的CEO李笛聊了聊。

“數(shù)字人行業(yè)在2022年迅速進(jìn)入了一個(gè)紅海市場(chǎng)”

娛樂資本論:你怎么看我們這次年度大會(huì)的主題——咬定青山?

李笛:人工智能領(lǐng)域需要充足的耐心,沉下心深入研究,也許短期內(nèi)看不出什么,但在未來回看,卻發(fā)現(xiàn)這些“海平面”以下的事非常重要。就像竹子“咬定青山”地扎下去,把根基打牢,才有可能勃發(fā)。

娛樂資本論:2022年,數(shù)字人的制作成本快速降低。你如何看待行業(yè)的發(fā)展趨勢(shì)?

李笛:首先明確,數(shù)字人的概念,到底是什么?現(xiàn)在很明確的一件事是,不同的人對(duì)數(shù)字人概念的理解大相徑庭。比如,大家在總結(jié)數(shù)字人技術(shù)的時(shí)候,會(huì)強(qiáng)調(diào)他的建模和動(dòng)捕。這里面隱含的意思就是,他對(duì)數(shù)字人的意思是還是基于外觀的理解。

而當(dāng)我們說數(shù)字人的時(shí)候,說的是自驅(qū),交互和內(nèi)容生成。

這是一個(gè)比較大的分野。如果只強(qiáng)調(diào)外觀,那么過去一年的時(shí)間,這個(gè)領(lǐng)域,不是成本在大幅度降低,而是利潤(rùn)在大幅度降低。這個(gè)領(lǐng)域迅速進(jìn)入了一個(gè)紅海的狀態(tài),互相之間殺價(jià)殺到利潤(rùn)非常低。因?yàn)檫@個(gè)領(lǐng)域的技術(shù)同質(zhì)化很嚴(yán)重。

第二,這些企業(yè)的付費(fèi)客戶一般是各大品牌的市場(chǎng)部門,因?yàn)椋瑪?shù)字人通常被企業(yè)當(dāng)成營(yíng)銷手段的。但小冰旗下的數(shù)字人,是幫助企業(yè)做一些真正的事情的,比如財(cái)務(wù)催款、體育教練、財(cái)經(jīng)新聞撰寫等等。

所以,數(shù)字人行業(yè)出現(xiàn)一個(gè)非常奇特的狀態(tài)——如果放在人工智能領(lǐng)域,它有非常大的未來。但如果它的定義還是一個(gè)外形,那么,他的上限不會(huì)很高,是因?yàn)椋氖袌?chǎng)需求量沒那么大。

娛樂資本論:很多數(shù)字人的公司都在做“海平面”以上的事情,比如打造一個(gè)更好看的外表,為什么你有勇氣從“海平面”往下做?

李笛:目前市面上很多數(shù)字人的嘗試,我們當(dāng)初在微軟的時(shí)候就都嘗試過了,比如智能客服系統(tǒng)、智能操作系統(tǒng)、智能音箱等等,我們平行趟了各種坑。所以在做小冰時(shí)候,就已經(jīng)有了一個(gè)完備的技術(shù)框架。

我們對(duì)小冰的一個(gè)基本理念是,完備框架。就是說,小冰不是一個(gè)基于問答,或者不是基于單輪交互,而是基于一個(gè)交互全場(chǎng)的產(chǎn)品,它要求人工智能程序能夠引導(dǎo)這個(gè)交互項(xiàng)目去發(fā)展。為此,她需要有內(nèi)容生成能力,需要有情感,或者說情商。

小冰當(dāng)時(shí)其實(shí)是微軟做的第一個(gè)人工智能助理Cortana的Plan B。我們?cè)诋?dāng)年并不是那么明確的知道,哪個(gè)方向才是未來趨勢(shì)。但是在我們做Cortana的時(shí)候發(fā)現(xiàn),這種基于問題,或者是從人工智能那里獲得知識(shí)這種模型,可能并不是唯一的答案,于是我們做了小冰。

經(jīng)過很多年之后,我們發(fā)現(xiàn)小冰是符合未來發(fā)展趨勢(shì)的,她的出現(xiàn)更加符合人工智能的發(fā)展上限。

我們認(rèn)為這個(gè)世界上,不會(huì)只有幾個(gè)人工智能助理,或者幾個(gè)回答你問題的數(shù)字人,而是有各種各樣的AI Being。

我們要做的事情是,讓這些AI Being跟人的交互,就像人與人一樣。為了這些,我們會(huì)去讓她擁有“情商”,掌握唱歌、畫畫等內(nèi)容生成能力。

“我們不做‘替代’人的虛擬人,我們做‘補(bǔ)位’”

娛樂資本論:為什么你們每次都從數(shù)字員工這個(gè)領(lǐng)域切入?而不是虛擬偶像?

李笛:我們會(huì)判斷什么是AI Being需求最大的地方,從而優(yōu)先篩選具體的賽道。

很遺憾,AI Being需求量最大的地方不是回答問題的知識(shí)專家,而主要是三類。一類是企業(yè)數(shù)字員工,一類是人類周圍的陪伴者,還有一類是游戲里面的NPC。這幾類需求很大,所以這些也是我們的主要布局。

娛樂資本論:聽說小冰框架在金融資訊領(lǐng)域已經(jīng)有了廣泛地應(yīng)用,是否可以介紹一下?

李笛:比如每日經(jīng)濟(jì)新聞的虛擬人主播N小黑,已經(jīng)穩(wěn)定運(yùn)行了一年多了,365乘以24小時(shí)不間斷播報(bào)財(cái)經(jīng)新聞。他的聲音、肢體、面容,以及播報(bào)的內(nèi)容,都是人工智能小冰框架來生成、運(yùn)行的。因?yàn)槿绻皇侨潭际侨斯ぶ悄艿脑挘筒荒鼙WC24小時(shí)的連續(xù)直播。

像金融摘要,是所有文本里面最難的,因?yàn)樗萌蒎e(cuò)性非常小。比如上市公司的公告100多頁,你要把它壓縮成一個(gè)200多字的資訊。

讓AI Being把幾百頁的招股書寫成新聞稿這件事不是我們今天才開始做的。從5年前開始到目前為止,國(guó)內(nèi)90%的機(jī)構(gòu)投資人每天看到的財(cái)經(jīng)資訊,都是小冰生成的。我們專門為這個(gè)功能搭建了一個(gè)金融知識(shí)圖譜,這個(gè)圖譜里包含1000多個(gè)影響因子。

娛樂資本論:“觀君”也是小冰框架驅(qū)動(dòng)的數(shù)字人,并且是一個(gè)人工智能的教練,它真的比真人教練更好么?怎么實(shí)現(xiàn)?

李笛:在某些方面,他不光是比真人教練要好,更是真人教練沒辦法比的。我們有一個(gè)理念,就是我們不做“替代”人的虛擬人,而是要做“補(bǔ)位”,完成真人無法承擔(dān)的工作。

先拿金融摘要舉例。我們?cè)谕瞥鲞@個(gè)金融摘要之前,絕大多數(shù)上市公司公告是沒有摘要的。因?yàn)槊刻煸缟嫌?00多個(gè)上市公司發(fā)公告,每個(gè)公告可能都有100多頁,你需要配多少人也來不及做摘要。但是,作為一個(gè)投資者,我需要知道這些信息,卻不可能看完這么多頁,過去只能挑著看。所以,我們的方案并不是為了替代人,而是做那些真人他做不到的事情。

同理,體育的訓(xùn)練系統(tǒng)也一樣,AI可以通過捕捉準(zhǔn)確的運(yùn)動(dòng)軌跡,對(duì)比過往的數(shù)據(jù),以及其他運(yùn)動(dòng)員的數(shù)據(jù),快速做出分析。這一系統(tǒng)的穩(wěn)定性和準(zhǔn)確性會(huì)遠(yuǎn)遠(yuǎn)高于真人教練。

娛樂資本論:做出這樣的一個(gè)數(shù)字人,貴么?

李笛:研發(fā)成本不一樣。如果做一個(gè)垂直領(lǐng)域的專業(yè)系統(tǒng),確實(shí)也需要花比較長(zhǎng)的時(shí)間,但它不難。更難的其實(shí)是通用性的開放域問題,開放域的問題解決了,再去解決一些垂直領(lǐng)域的問題就比較容易。

小冰從2020年開始進(jìn)入汽車的智能座艙領(lǐng)域,到現(xiàn)在兩年時(shí)間,滲透率已超過60%。所以,從海平面以下開始做,你會(huì)越做越順手。

娛樂資本論:小冰不久前為招商集團(tuán)做了一個(gè)數(shù)字員工叫“招小影”,為什么招商集團(tuán)愿意跟小冰合作?

李笛:有幾方面原因,國(guó)內(nèi)不同的人在提到數(shù)字人的時(shí)候,概念都不一樣,很浮躁。但絕大多數(shù)人提到數(shù)字人的時(shí)候指的都是3D建模,就是創(chuàng)造一個(gè)外形,可以念一段文字,或者有動(dòng)捕的方案做虛擬IP形象。

但我們更關(guān)心,如果是一個(gè)企業(yè)員工的話,他是否能真的能做事情。所以,招小影不光要有外形,她還需要真的出現(xiàn)在招商銀行的ERP系統(tǒng),真的在做招商集團(tuán)員工的工作。同時(shí),她的外觀、語言交互等都不輸于3D建模的同行業(yè)者。

比如,如果你想做一個(gè)數(shù)字人,基于神經(jīng)網(wǎng)絡(luò)渲染這樣的方式,能夠做交互的話,那么,至少讓他的延遲要做到毫秒級(jí)。就是你說一句話,數(shù)字人能在毫秒內(nèi)回復(fù)你。但目前行業(yè)的水準(zhǔn)是在分鐘以內(nèi)。

“我們不做系統(tǒng)集成和硬件”

娛樂資本論:目前小冰主要的收入來源是哪些?

李笛:我們有幾個(gè)要求。第一,我們不做系統(tǒng)集成,第二,我們不做硬件,只做純軟件的收入。我們目前的收入來源是B端。

小冰認(rèn)為,未來人類會(huì)被AI Being所環(huán)繞,形成人與虛擬人共處的社交網(wǎng)絡(luò)。這意味著,只要有人的地方,就能有AI Being,它需要是一個(gè)“跨空間”的存在。比如,你的家里、你的車上、你的社交網(wǎng)絡(luò)平臺(tái)……只有軟件可以實(shí)現(xiàn)。而一旦把AI Being實(shí)體化(硬件化),它就只能存在于那個(gè)實(shí)體中。

娛樂資本論:B端的收入是什么樣的收費(fèi)模式?

李笛:我們是按照不斷疊加累計(jì)的月服務(wù)費(fèi)和年服務(wù)費(fèi)來收入。行業(yè)里面主要是按照AI系統(tǒng)的調(diào)用來收費(fèi),我們不是。

在某些情況下,我們會(huì)按照實(shí)現(xiàn)的效果進(jìn)行分成。我們是按照整個(gè)給你包裝出來的AI Being賣,你可以理解為我們?cè)凇百I賣人口”,賣出去的是一個(gè)服務(wù)包的價(jià)錢。小冰不賣技術(shù)。

娛樂資本論:你說,小冰要做的就是“販賣人口”。這個(gè)“人口”的數(shù)量,有上限么?

李笛:數(shù)字員工正在跑的已經(jīng)超過30萬個(gè)了。如果再加上to C的虛擬陪伴,那就是幾千萬了。

娛樂資本論:怎么會(huì)有30萬個(gè)這么多?

李笛:在日本大阪試點(diǎn)的老年人家庭,有政府給他們派的數(shù)字員工,每個(gè)家庭里數(shù)字員工都不一樣。因?yàn)槔夏耆丝梢酝ㄟ^訓(xùn)練,使人工智能變成他想要的“樣子”。數(shù)字員工承擔(dān)的是政府的公共服務(wù)。

娛樂資本論:我聽說小冰現(xiàn)在一次對(duì)話能達(dá)到32次?正常人類一場(chǎng)對(duì)話平均下來也只有38次左右。

李笛:目前小冰一次對(duì)話最高可以達(dá)到39次交互。這個(gè)交互技術(shù)和對(duì)話模型,很多公司都在做。但小冰的對(duì)話跟實(shí)驗(yàn)室的研究相比,其實(shí)曾踩過很多坑。比如,線上的一些交互特別復(fù)雜,2016年的時(shí)候,當(dāng)時(shí)美國(guó)版小冰上線推特剛滿24小時(shí),就被網(wǎng)友的對(duì)話數(shù)據(jù)教成了種族主義者,然后讓CEO出來道歉。

現(xiàn)在的小冰也是一樣的。你會(huì)看到,實(shí)驗(yàn)室中的數(shù)字人單就對(duì)話質(zhì)量,以及對(duì)話輪次,有很多比小冰更好的,但是大多數(shù)都很難落地。因?yàn)槁涞厣婕暗絻蓚€(gè)問題,一個(gè)是成本,一個(gè)是安全性。尤其是對(duì)話安全性方面,一旦出問題,很難解決。

所以,歸根到底,安全性一定是小冰公司的第一原則,我們寧愿犧牲一些文本上的豐富性,也不希望小冰框架在安全性上出問題。

關(guān)鍵詞: 人工智能 上市公司 系統(tǒng)集成

專題新聞
  • 消費(fèi)稅征稅范圍是什么(詳解消費(fèi)稅的征稅對(duì)象)
  • 農(nóng)行理財(cái)產(chǎn)品會(huì)損失本金嗎?理財(cái)會(huì)不會(huì)把本金虧完?
  • 中國(guó)股市開始于哪一年?股市最早出于哪個(gè)國(guó)家?
  • 車險(xiǎn)險(xiǎn)種怎么選?家用汽車保險(xiǎn)怎么買劃算?
  • 雖說萬物皆可盤 但盤得住時(shí)光的才是王牌
  • 霍爾果斯:馮小剛等明星資本大撤離
最近更新

京ICP備2021034106號(hào)-51

Copyright © 2011-2020  亞洲資本網(wǎng)   All Rights Reserved. 聯(lián)系網(wǎng)站:55 16 53 8 @qq.com