借助這一期訪談,我們預(yù)熱性地做一次低調(diào)的官宣,【元界】與【商界】集團(tuán)戰(zhàn)略牽手了。
作者|王俞現(xiàn)
身份|中移聯(lián)元宇宙產(chǎn)業(yè)委副秘書長、中國文產(chǎn)協(xié)元宇宙專委會(huì)高級(jí)專家
4月18日,全球元宇宙大會(huì)北京站。下午,在大廠、上市公司扎堆的數(shù)字人專場論壇上,他最后一位出場。
沒有真正的金剛鉆,主辦方的這種安排,對他來說,簡直意味著作死,元界(ID:Metabod)為他捏了一把汗,但他乍一上臺(tái),不疾不徐,按照自我語境,一環(huán)扣一環(huán),侃侃而談。
他認(rèn)為,數(shù)字人是元宇宙時(shí)代的基礎(chǔ)設(shè)施,但這一天還沒有到來。按照他的設(shè)想,這一天的到來,還需要五年甚至更長時(shí)間。
那數(shù)字人當(dāng)下存在的價(jià)值是什么?他給出的答案是流量擔(dān)當(dāng)!他說,從2017年開始,他與小伙伴就開始思考,如何不用昂貴的設(shè)備,或者依賴特別培訓(xùn)獲得技術(shù)經(jīng)驗(yàn),讓每個(gè)人都能擁有高級(jí)別的數(shù)字人。
這一年他們研發(fā)出人工智能數(shù)字人直播平臺(tái)——賽博演猿Cybactor。經(jīng)過不斷迭代,這套系統(tǒng)可以生成最高級(jí)別、可實(shí)時(shí)驅(qū)動(dòng)、廉價(jià)的數(shù)字人。
2022年10月,他們將這套系統(tǒng)面向個(gè)人公開,用戶只需用一個(gè)普通攝像頭,就能夠?qū)崿F(xiàn)影視級(jí)別的面部、肢體及手勢動(dòng)作的精準(zhǔn)捕捉。
“在這一點(diǎn)上,我們是全世界唯一能做到的。”他做出自我評(píng)價(jià),看似主觀,卻有著深厚的技術(shù)做背景、底氣。
他如此告訴元界(ID:Metabod),“如果沒有我們的技術(shù),整個(gè)產(chǎn)業(yè)都無法想象用一個(gè)普通攝像頭去做電視臺(tái)級(jí)別的數(shù)字人直播。”
在他看來,這種高級(jí)別的數(shù)字人,在國內(nèi)數(shù)量特別少,不到300個(gè),他們正在做的,是推出降維普及方案,每月599元就,。,可以讓每位直播人,擁有達(dá)到央視虛擬主播水準(zhǔn)的數(shù)字人。
他就是趙天奇,數(shù)字人AIGC平臺(tái)全球領(lǐng)軍企業(yè)——聚力維度創(chuàng)始人兼CEO,北京郵電大學(xué)博士、清華大學(xué)博士后畢業(yè),2011-2015年師從徐大雄院士,2015-2019年師從戴瓊海院士,英特爾、高通AI榮譽(yù)技術(shù)大使。
演講畢,一圈人圍著趙天奇加微信,這是任何其他演講者沒有達(dá)到的“待遇”。本期“中國元宇宙未來產(chǎn)業(yè)100人”訪談,元界(ID:Metabod)對話趙天奇。
這是一位將“挑戰(zhàn)全世界都沒做到的技術(shù)科研”,視為創(chuàng)業(yè)以來印象最深刻事情的、具有科學(xué)家底色的創(chuàng)業(yè)者。
目前,趙天奇和聚力維度,正在不遺余力地推動(dòng)著行業(yè)向著預(yù)判的方向發(fā)展。不過,是美好想象,抑或臨界爆發(fā),還有不盡為人掌握的變量。
“中國元宇宙100人”訪談?dòng)?jì)劃
【指 導(dǎo)】
中國文化產(chǎn)業(yè)協(xié)會(huì)文化元宇宙專委會(huì)
中國移動(dòng)通信聯(lián)合會(huì)元宇宙產(chǎn)業(yè)委
【牽頭平臺(tái)】
元界、央鏈直播、河南省數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)協(xié)會(huì)、超創(chuàng)者
【聯(lián)合發(fā)起】
元宇宙共識(shí)圈、樂生活與愛IT Plus、商業(yè)認(rèn)知研究院、尋一創(chuàng)投、綺觀商業(yè)Cstories
【新加入聯(lián)合發(fā)起】
戰(zhàn)略投資家、CIBA新經(jīng)濟(jì)
一)
與時(shí)俱進(jìn),研發(fā)AI數(shù)字人直播平臺(tái)
元界:請簡要介紹一下公司發(fā)展歷程。
趙天奇:從2012年開始,聚力維度就圍繞虛擬內(nèi)容布局各個(gè)技術(shù)鏈條,開展研發(fā)工作。2016年聚力維度在3D內(nèi)容領(lǐng)域嶄露頭角,自主研發(fā)的人工智能3D內(nèi)容制作平臺(tái)“崢嶸”,獲得華為、三大運(yùn)營商等行業(yè)巨頭的一致認(rèn)可。2017年公司正式開展數(shù)字人業(yè)務(wù)線,自主研發(fā)了人工智能數(shù)字人直播平臺(tái)——“賽博演猿”,2022年10月正式推出公開版(個(gè)人版)軟件,2023年3月實(shí)現(xiàn)了云服務(wù)功能。
元界:作為公司的兩個(gè)產(chǎn)品,崢嶸、賽博演猿是公司在商業(yè)化道路上布局的兩個(gè)賽道嗎?賽博演猿的主要客戶群體是哪些?
趙天奇:崢嶸是解決3D顯示設(shè)備專有內(nèi)容不足問題的,其使3D資源從稀缺走向海量,屬于AIGC在3D顯示的賽道。賽博演猿是解決數(shù)字化內(nèi)容中高級(jí)數(shù)字人創(chuàng)作問題的,屬于AIGC在直播和視頻領(lǐng)域的賽道,后者更為通用。
賽博演猿目前定位的主要客戶群體,是需要通過直播和短視頻宣傳的主播和企業(yè)。
二)
數(shù)字人背后的流量密碼
元界:2021年全球進(jìn)入元宇宙時(shí)代,你對元宇宙在中國的發(fā)展有什么預(yù)判?你如何描述數(shù)字人在元宇宙時(shí)代的價(jià)值?數(shù)字人的發(fā)展與元宇宙的發(fā)展有什么對應(yīng)關(guān)系?你預(yù)測今年年底數(shù)字人達(dá)到10萬,其依據(jù)是什么?
趙天奇:元宇宙在中國發(fā)展會(huì)從垂直領(lǐng)域開始落地,5-10之后開始通往通用領(lǐng)域,即先產(chǎn)業(yè)、后大眾的發(fā)展模式。
作為一個(gè)自然世界中的人,我們不能進(jìn)入原始的世界里面,但數(shù)字人扮演了這樣一個(gè)角色。數(shù)字人可以讓每個(gè)人進(jìn)入元宇宙,元宇宙場景可以讓數(shù)字人技術(shù)發(fā)揮出更多價(jià)值。從長了說,數(shù)字人是元宇宙終極到來時(shí)刻的基礎(chǔ)建設(shè)。
如果我們每個(gè)人都擁有VR頭盔,不用現(xiàn)實(shí)生活中在一起,也可以完成我們生活中的絕大多數(shù)的事情、工作和娛樂,那么這個(gè)時(shí)刻就到來了,但從現(xiàn)在看,這個(gè)時(shí)間還需要五年甚至更長的時(shí)間。
但數(shù)字人技術(shù)已經(jīng)成熟,現(xiàn)在只需產(chǎn)業(yè)推廣就可以快速擴(kuò)大,因此我判斷,到年底數(shù)字人可以達(dá)到10萬人的應(yīng)用規(guī)模。
元界:現(xiàn)在數(shù)字人還不是基建,那它的價(jià)值是什么?
趙天奇:它其實(shí)是一個(gè)流量密碼。我們現(xiàn)在打開新媒體的平臺(tái),不管是抖音、快手、B站,如果你看到一個(gè)東西是你今天走在大街上、在你平時(shí)的辦公室或生活里,就能看得到的,你肯定不想看。
現(xiàn)在整個(gè)行業(yè)背后的邏輯就是流量密碼,數(shù)字人具有創(chuàng)意的無限可能,可謂是無極限。其新奇的形象、超現(xiàn)實(shí)的能力,以及整個(gè)內(nèi)容表現(xiàn)形式,可以帶來比真人多得多的流量。
元界:聚力維度也在做虛擬直播的推廣嘗試和商用,你們發(fā)現(xiàn)數(shù)字人直播里面藏著什么樣的流量密碼?哪些類型客戶正在為此買單?
趙天奇:流量密碼主要就在數(shù)字人的超越現(xiàn)實(shí)上,因?yàn)椴皇乾F(xiàn)實(shí),所以可以更好看,可以更新奇,形象可以是非人,可以有特效,可以有功能,可以遠(yuǎn)程互動(dòng)等。
這些超現(xiàn)實(shí),就是我們看數(shù)字人直播和短視頻的原因,這就是流量密碼。目前各大企業(yè),包括電視臺(tái)、品牌方、運(yùn)營商、廣告制作商以及主播,都在為此買單。
元界:你對短視頻和直播領(lǐng)域數(shù)字人的應(yīng)用發(fā)展,有什么直觀判斷?
趙天奇:我認(rèn)為短視頻和直播領(lǐng)域的數(shù)字人下一步會(huì)有指數(shù)級(jí)增長。從幾百快速發(fā)展到幾千幾萬的數(shù)量規(guī)模。
元界:價(jià)格會(huì)是數(shù)字人產(chǎn)業(yè)發(fā)展的門檻嗎?面對越來越多價(jià)格便宜的數(shù)字人出現(xiàn),會(huì)出現(xiàn)大家爭相擁有自己的數(shù)字人的場景嗎?
趙天奇:價(jià)格過去是數(shù)字人產(chǎn)業(yè)發(fā)展的主要門檻,現(xiàn)在價(jià)格便宜的數(shù)字人解決方案,很多降低了質(zhì)量。要確保質(zhì)量不降,只降低價(jià)格才行。價(jià)格只是一個(gè)方面,只要虛擬主播的流量密碼被大家發(fā)現(xiàn),需要流量的企業(yè)和主播都會(huì)爭相使用,這不是一個(gè)行業(yè),是所有需要宣傳和流量的行業(yè)都需要的。
三)
全球唯一的技術(shù)底氣
元界:數(shù)字人產(chǎn)業(yè)發(fā)展需要什么樣的技術(shù)底座?這個(gè)行業(yè)是否存在卡脖子的問題?
趙天奇:對于真人驅(qū)動(dòng)數(shù)字人產(chǎn)業(yè)來說,數(shù)字人技術(shù)底座就是建模、驅(qū)動(dòng)、渲染、交互。這個(gè)行業(yè)所謂的卡脖子問題就是技術(shù)不解決,行業(yè)無法壯大的問題。關(guān)于驅(qū)動(dòng)方面我們已經(jīng)解決了,目前還有半個(gè)問題就是模型問題。
元界:你說公司在驅(qū)動(dòng)和建模上已經(jīng)取得一些突破,是什么突破?在這兩個(gè)領(lǐng)域及其它領(lǐng)域,還存在哪些有待突破的技術(shù)瓶頸?
趙天奇:在驅(qū)動(dòng)上,我們實(shí)現(xiàn)一個(gè)普通攝像頭就能對人表情、動(dòng)作、手勢的影視級(jí)捕捉。在建模上,我們可以用AIGC來自動(dòng)生成高顏值多樣性可驅(qū)動(dòng)的數(shù)字人臉。
后邊需要繼續(xù)解決的問題還有AIGC生成非人角色問題、數(shù)字人復(fù)雜交互問題。
元界:這里面蘊(yùn)含著哪些核心技術(shù)?公司怎么進(jìn)入了這些核心技術(shù)領(lǐng)域?
趙天奇:核心在于人工智能技術(shù)與影視制作產(chǎn)業(yè)的結(jié)合創(chuàng)新,行業(yè)的發(fā)展推助我們進(jìn)入了這些技術(shù)領(lǐng)域。
我們在2017年開始研究數(shù)字人技術(shù)之前,就已經(jīng)完成了人工智能和影視結(jié)合的人工智能2D轉(zhuǎn)3D技術(shù),所以對于這種交叉賽道的創(chuàng)新,非常熟悉。
我們又針對這個(gè)專有方向,在數(shù)據(jù)采集、標(biāo)注、模型訓(xùn)練、優(yōu)化上,科研了6年時(shí)間。在每個(gè)環(huán)節(jié)都有創(chuàng)新,這才實(shí)現(xiàn)了用普通攝像頭達(dá)成和百萬級(jí)動(dòng)捕設(shè)備同等的效果。
行業(yè)水漲船高,我們不斷進(jìn)入數(shù)字人高級(jí)別市場,每一個(gè)介入這一市場的企業(yè)都面臨著高成本、高門檻的雙重壓力。成本,還主要來自于建模和驅(qū)動(dòng)。為此,聚力維度從2017年初就動(dòng)了一個(gè)念想,能不能讓每一個(gè)人都能通過一個(gè)平臺(tái),生成高級(jí)別、可實(shí)時(shí)驅(qū)動(dòng)、廉價(jià)的數(shù)字人創(chuàng)建,也不用昂貴的設(shè)備,或者特別依賴培訓(xùn)獲得技術(shù)經(jīng)驗(yàn)。
元界:這是賽博演猿的價(jià)值所在,那公司在技術(shù)上達(dá)到了怎樣的水準(zhǔn)?
趙天奇:我們能夠?qū)崿F(xiàn)影視級(jí)別的面部、肢體及手勢動(dòng)作的精準(zhǔn)捕捉。在這一點(diǎn)上,我們是全世界唯一能做到。
我一直會(huì)做一個(gè)對比,蘋果做的數(shù)字人,兩只舌頭只能往前伸,我們不僅可以往前伸,而且可以轉(zhuǎn)圈伸,可以舔到嘴邊任何一個(gè)部位。
在技術(shù)水平上,我們基于自研的人工智能算法,無需標(biāo)記點(diǎn)、無需適配,僅需單個(gè)普通RGB攝像頭,即可精準(zhǔn)捕捉上千個(gè)面部微表情,并且達(dá)到全身肢體動(dòng)態(tài)捕捉,從而實(shí)現(xiàn)用普通攝像頭達(dá)成和百萬級(jí)動(dòng)捕設(shè)備同等的效果。
該技術(shù)是目前全世界唯一的免穿戴、低成本、高質(zhì)量的單目攝像頭動(dòng)捕技術(shù),以行業(yè)領(lǐng)先水準(zhǔn)解決了數(shù)字人微表情逼真還原、無穿戴數(shù)字人動(dòng)捕等行業(yè)難題。
在建模方面,聚力維度擁有行業(yè)頂級(jí)建模技術(shù),通過真人掃描,匹配原畫雕刻,生動(dòng)呈現(xiàn)用戶最想要的人物形象。
在無特殊具象定制需求的情況下,我們采用AIGC技術(shù),可以高效率、低成本生成上百萬個(gè)行業(yè)價(jià)值在50萬元級(jí)別的數(shù)字人形象,讓每個(gè)人都可以實(shí)時(shí)控制高級(jí)別數(shù)字人,完成短視頻、直播、會(huì)議、綜藝等各類元宇宙形態(tài)的內(nèi)容生產(chǎn),滿足用戶輕量化、隨時(shí)隨地虛擬直播的需要。
四)
AI驅(qū)動(dòng)和真人驅(qū)動(dòng),是兩條賽道
元界:在你看來,數(shù)字人行業(yè)如何分類?未來走向何方?
趙天奇:數(shù)字人行業(yè)主要分為兩類:真人驅(qū)動(dòng)和AI驅(qū)動(dòng)。真人驅(qū)動(dòng)是為了解決新奇內(nèi)容,是為了流量;AI驅(qū)動(dòng)是為了解決低端工作由AI取代、節(jié)省人工的問題。
真人驅(qū)動(dòng)數(shù)字人之前,只有用傳統(tǒng)捕捉設(shè)備的方案,現(xiàn)在剛剛進(jìn)入第二階段,普通人也可以用得起,用視覺捕捉來驅(qū)動(dòng)高級(jí)別數(shù)字人。
元界:數(shù)字人市場,中外各有哪些優(yōu)勢?
趙天奇:中國數(shù)字人市場目前在AI驅(qū)動(dòng)上沒有國外的ChatGPT強(qiáng)。在真人驅(qū)動(dòng)上,我們是唯一能做到普通攝像頭捕捉,并達(dá)到影視級(jí)效果的。
我曾說,如果有第二家企業(yè)想追上聚力維度的技術(shù)水平,至少也要花費(fèi)兩三年的時(shí)間,這是從整個(gè)世界來說的。我們在這個(gè)專業(yè)領(lǐng)域早于全世界所有公司,擁有獨(dú)特的行業(yè)積累,又有5年的先發(fā)優(yōu)勢,所以我們能做到全世界斷檔式領(lǐng)先。
如果沒有我們的技術(shù),整個(gè)產(chǎn)業(yè)都無法去想象一個(gè)普通攝像頭去做電視臺(tái)級(jí)別的數(shù)字人直播。
另外,形成這種最高級(jí)別的數(shù)字人,行業(yè)價(jià)值幾十萬。我們生成的都能達(dá)到這個(gè)級(jí)別,價(jià)格不用幾十萬,而且具有多樣性。
最關(guān)鍵的是,可以驅(qū)動(dòng)現(xiàn)在用生成圖片的方式生成的美女帥哥們所形成的數(shù)字人,都是不能用的,但是我們這可以,而且發(fā)型、衣服等都可以自定義,讓每一個(gè)人真正用得起,而且是高級(jí)別的,還可以把音量、重點(diǎn)、語速、情緒、情感這些東西都保留下來。
元界:公司的數(shù)字人與英偉達(dá)的數(shù)字人有何優(yōu)劣?是否存在技術(shù)方向不一樣的問題?
趙天奇:我們的數(shù)字人主要解決驅(qū)動(dòng)、建模問題,英偉達(dá)主要是引擎和AI驅(qū)動(dòng),所以不是誰更好的問題,技術(shù)路線不同,環(huán)節(jié)不同。
過去一段時(shí)間,我們溝通了大量元宇宙企業(yè),掌握了大量具體場景下的實(shí)踐案例。有場景需求者可不吝溝通18603851537(同微信)。
五)
關(guān)于痛點(diǎn)與競爭
元界:賽博演猿還有哪些地方有待改進(jìn)?在商業(yè)化上公司的痛點(diǎn)是什么?
趙天奇:目前還需要改進(jìn)的主要是根據(jù)垂直場景的功能開發(fā),比如直播交互。目前我們公司技術(shù)上已經(jīng)解決了產(chǎn)業(yè)問題,在商業(yè)化上,聚力維度主要考慮的就是如何把顛覆性新產(chǎn)品通過用戶教育和推廣傳播給整個(gè)生態(tài),這也是公司主要的痛點(diǎn)。
元界:下一步會(huì)如何解決這一痛點(diǎn)?
趙天奇:我們會(huì)繼續(xù)采用自己直播和渠道合作的方式,加大推廣力度。我們也歡迎大家跟我們聯(lián)合,為此推出了數(shù)字人加速器計(jì)劃,第一批招募60家企業(yè)。我們還要聚焦賦能建模師,讓他們按照我們的標(biāo)準(zhǔn)去建模。CG模型網(wǎng)已經(jīng)跟我們達(dá)成戰(zhàn)略合作,它們旗下大概有200萬位建模師。
另外,整個(gè)產(chǎn)業(yè)高級(jí)別的數(shù)字人,還特別少,應(yīng)該說還不到300人。我們在思考,如何讓像央視這種高級(jí)別的虛擬主播,普通的主播也用得起。為此,我們推出每月599元就可以達(dá)到跟央視同樣水平的、人人可用的高端數(shù)字人。你想做什么樣的內(nèi)容,想擁有什么樣的流量就可以了。只有創(chuàng)意能夠能夠阻擋你,其它東西都阻擋不了。
元界:大元宇宙階段,所有人都擁有數(shù)字人,真正實(shí)現(xiàn)生活、娛樂、工作等方方面面都在元宇宙。除了空間不同,在你看來,這與我們當(dāng)下都離不開微信生態(tài)圈,有什么根本不同?
趙天奇:大元宇宙階段,我們都帶上VR頭盔,在一個(gè)數(shù)字世界里娛樂和工作。互相傳輸?shù)男畔⑹?D沉浸的,所以可以做除了物理接觸以外所有的事。而目前手機(jī)微信時(shí)代只能傳輸小屏幕的圖像文字信息,所以有根本不同。
元界:公司會(huì)深耕數(shù)字人,還是也會(huì)向其它元宇宙領(lǐng)域發(fā)展?單純發(fā)展數(shù)字人會(huì)不會(huì)面臨被其它公司降維打擊的可能性?
趙天奇:我們會(huì)深耕數(shù)字人方向,應(yīng)用在直播元宇宙生態(tài)上。在大元宇宙到來的時(shí)候我們應(yīng)該是與做VR設(shè)備、社交軟件等公司形成組合關(guān)系,除非是對手的數(shù)字人技術(shù)和生態(tài)比我更強(qiáng),否則不會(huì)被降維打擊。
六)
初衷、使命、商業(yè)哲學(xué)與融資
元界:你創(chuàng)業(yè)的初衷是什么?目前如何定位聚力維度?有什么愿景、使命?
趙天奇:我的初衷是,用人工智能讓藝術(shù)創(chuàng)作也能插上科技的翅膀飛向自動(dòng)化。具體來說就是讓每個(gè)人只要有創(chuàng)作能力就可以完成影視內(nèi)容的直播和視頻。目前在技術(shù)上已經(jīng)達(dá)到了,下一步要在產(chǎn)業(yè)上海量落地。
聚力維度定位是數(shù)字人AIGC平臺(tái)全球領(lǐng)軍者,愿景是成為元宇宙時(shí)代的數(shù)字人頭部服務(wù)商,服務(wù)超百萬個(gè)人消費(fèi)者,使命是讓每個(gè)人用上新奇、有流量的數(shù)字人。
元界:創(chuàng)業(yè)以來你印象最為深刻的事情是什么?你信奉什么樣的商業(yè)哲學(xué),并怎么體現(xiàn)在企業(yè)內(nèi)部?
趙天奇:最深刻的事就是挑戰(zhàn)全世界都沒做到的技術(shù)科研,但還遲遲做不出來,但有一天終于迎來關(guān)鍵突破的時(shí)刻。
我信奉的商業(yè)哲學(xué)是價(jià)值,是科研。人類走到今天就是靠科學(xué)的發(fā)展,不斷的創(chuàng)造前所未有的新價(jià)值,這不僅是我的商業(yè)哲學(xué),也是人生的意義。我們企業(yè)的小伙伴也都以創(chuàng)造前所未有的科技創(chuàng)新價(jià)值,為使命和榮譽(yù)。
元界:目前公司團(tuán)隊(duì)情況如何?是否還在融資?你希望提醒投資者關(guān)注公司的哪些點(diǎn)、線或面?
趙天奇:公司目前人員規(guī)模80人,企業(yè)研發(fā)人員占比超過一半,團(tuán)隊(duì)分為科研、開發(fā)、測試、業(yè)務(wù)以及運(yùn)營團(tuán)隊(duì)。
我們主要是看哪些投資公司理解并認(rèn)可真人驅(qū)動(dòng)數(shù)字人賽道,我們希望組合更多資源,一起把這個(gè)產(chǎn)業(yè)數(shù)字人數(shù)量從百級(jí)發(fā)展到百萬級(jí)。
@元界(ID:Metabod)出品
元界傳播矩陣:微信公眾號(hào)、今日頭條、百家號(hào)、東方財(cái)富等
訪談:18603851537
商務(wù):13512311158
評(píng)論
全部評(píng)論(6)
-
最新最熱
行業(yè)資訊 -
訂閱欄目
效率閱讀 -
音頻新聞
通勤最愛