揭秘撒貝寧“孿生”AI虛擬主持人:用約30分鐘打造
2019-02-11 07:41:28 來源: 科技日?qǐng)?bào)
關(guān)注新華網(wǎng)
微博
Qzone
評(píng)論
圖集

  30分鐘,打造撒貝寧的“孿生”AI主持人

  近日,觀眾欣喜地看到在央視網(wǎng)絡(luò)春晚舞臺(tái)上,撒貝寧有了個(gè)虛擬孿生兄弟“小小撒”,這是AI虛擬主持人首次上崗與原型同臺(tái)秀技,這讓小撒很是感慨——正在直面自己的未來職業(yè)危機(jī)。

  據(jù)透露,打造這樣一個(gè)AI孿生主播,僅需約30分鐘。那么,究竟其中有何奧妙之處?

  如同原型孿生般逼真

  是否見過,讓撒貝寧“無(wú)話可說”的主持對(duì)手?

  只見,小小撒一出場(chǎng),小撒就忍不住說:“我的天,感覺像照鏡子一樣。”甚至從外貌上看,直呼簡(jiǎn)直就是“失散多年的孿生兄弟”。

  而小小撒也并非花瓶擺設(shè),很能掌控現(xiàn)場(chǎng),妙語(yǔ)連珠,幾乎不留余地。以至于一旁的小撒“委屈”地插話:“能給我說一句嗎?”

  顯然,與以前僵硬、機(jī)械形象的虛擬人技術(shù)相比,引入人工智能,按真人原型架構(gòu)出的虛擬主持人,在技術(shù)上有了相當(dāng)大的提升。

  “為了與真實(shí)的主持人有所區(qū)分,技術(shù)團(tuán)隊(duì)在形象設(shè)計(jì)上做了一定程度的變化。比如,這次可愛的‘小小撒’個(gè)頭要高一點(diǎn),更健談些?!泵绹?guó)人工智能公司偶邦(ObEN)聯(lián)合創(chuàng)始人鄭毅向科技日?qǐng)?bào)記者介紹說。

  當(dāng)然,小小撒也并非獨(dú)家打造,因?yàn)楣?jié)目中除了虛擬孿生撒貝寧,其他主持人朱迅、高博、龍洋的孿生AI主持人也都紛紛亮相。

  本世紀(jì)初,英國(guó)廣播公司發(fā)布第一個(gè)虛擬主持人Anaova之后,虛擬主持人成了一個(gè)科技研究熱點(diǎn)?!澳苈勂渎?,也見其人”,今年網(wǎng)絡(luò)春晚可謂是這一技術(shù)在國(guó)內(nèi)首次大規(guī)模應(yīng)用。

  用數(shù)據(jù)“喂養(yǎng)”長(zhǎng)大

  常言道,“臺(tái)上一分鐘,臺(tái)下十年功”。而此次培養(yǎng)虛擬主持人的過程卻大大提速。

  記者了解到,打造這樣一個(gè)AI虛擬孿生主播的技術(shù)叫作PAI(Personal AI),在20多項(xiàng)專利申請(qǐng)技術(shù)的支撐下,只需撒貝寧等主持人的面部掃描和半小時(shí)的錄音數(shù)據(jù),即可生成形象和聲音模型。

  “在AI語(yǔ)音技術(shù)的基礎(chǔ)上,無(wú)需主持人錄入大量文本建立語(yǔ)音數(shù)據(jù)庫(kù)。只需其較短的幾十句標(biāo)準(zhǔn)原聲,通過特征參數(shù)提取,利用遷移學(xué)習(xí)算法即可建立其獨(dú)特發(fā)聲模型。由此,任何輸入的文字都可用主持人的聲音讀或唱出來,甚至能運(yùn)用中日英韓四種語(yǔ)言?!编嵰阏f。

  據(jù)介紹,隨著越來越多的數(shù)據(jù)“喂養(yǎng)”,小小撒在成長(zhǎng)中會(huì)掌握更多技能,甚至包括小撒的喜好、說話方式等,在另一層面上與其更為相似。再加上動(dòng)作捕捉訓(xùn)練,以及傳感器及運(yùn)動(dòng)跟蹤設(shè)備,更突顯了原型主持人的個(gè)性化特色,大大增強(qiáng)辨識(shí)度。

  “現(xiàn)在的深度學(xué)習(xí)和機(jī)器學(xué)習(xí),是在原有自動(dòng)化規(guī)則上多了學(xué)習(xí)能力——自己發(fā)現(xiàn)規(guī)律。換言之,由于人類很難發(fā)現(xiàn)規(guī)律中的細(xì)節(jié),而AI可通過大量訓(xùn)練讓電腦學(xué)習(xí)去發(fā)現(xiàn)內(nèi)在規(guī)律及細(xì)節(jié)?!比A為人工智能算法工程師張侗冬告訴記者。 在某種意義上,正如主持人朱迅所言,“通過數(shù)據(jù)載體的形式,跟真實(shí)世界親密互動(dòng),我們實(shí)現(xiàn)了‘永生’?!?/p>

  從數(shù)字世界到人類世界的鴻溝

  未來的世界是平行的數(shù)據(jù)世界,社會(huì)的主角是人,數(shù)據(jù)世界的主角是數(shù)字化的人。那么,在人工智能時(shí)代,虛擬主持人有什么發(fā)展瓶頸?

  鄭毅指出,“‘情感’是人類的專利。從語(yǔ)音模擬到語(yǔ)意模擬,虛擬主持人面臨從數(shù)字世界到人類世界的鴻溝,盡管其在模仿音色、語(yǔ)速、停頓時(shí)都沒問題,但是知道意思、怎么回答,卻不理解感情內(nèi)涵,要做到抑揚(yáng)頓挫目前還很難?!?/p>

  據(jù)介紹,語(yǔ)意學(xué)習(xí),雖然也有“興奮”“悲傷”“著急”等情感模型,但在模擬過程中,虛擬主持人不能及時(shí)調(diào)動(dòng),需要人工參與。虛擬人仍然像個(gè)嗷嗷待哺的嬰兒,人類如何孕育它成長(zhǎng),為其構(gòu)筑怎樣的世界觀,將是未來深入探索的方向。

  鄭毅表示,相信AI虛擬主持人不僅是一個(gè)技術(shù)產(chǎn)生到技術(shù)落地的過程,也是一個(gè)信任交接的過程。當(dāng)初攻關(guān)虛擬主持人技術(shù)的一大初衷,是想通過主持人、明星這樣有一定公信力人物的帶動(dòng),增加人們對(duì)人工智能的信任。因?yàn)槲覀冞€處于技術(shù)成長(zhǎng)階段,而未來人與人工智能的相處也應(yīng)從信任開始,例如未來像公務(wù)繁雜的職場(chǎng)人,如果擁有一個(gè)數(shù)字化的另一個(gè)自己,模擬自身意愿,便可代勞成為貼心助手,打理日?,嵤拢遣皇菚?huì)讓生活省心很多?相信人工智能可以給我們帶來更多生活便利,創(chuàng)造更好的生活。

  有業(yè)內(nèi)人士評(píng)價(jià)說,今年網(wǎng)絡(luò)春晚中AI應(yīng)用的一小步,可能將會(huì)帶來掀開虛擬主持人時(shí)代的一大步。“當(dāng)然若虛擬人上崗,工資依然發(fā)給我們?nèi)祟惥秃??!庇腥藨蚍Q。(記者 華 凌 通訊員 閆 欣)

+1
【糾錯(cuò)】 責(zé)任編輯: 韓家慧
新聞評(píng)論
加載更多
雪落合肥景色美
雪落合肥景色美
“兒童村”里最美的光
“兒童村”里最美的光
山西太原:科技館里樂享假期
山西太原:科技館里樂享假期
江山如畫,想把春的故事講給你聽
江山如畫,想把春的故事講給你聽

?
010020020110000000000000011198061124097349