omniture

新一代智能視頻云發(fā)展現(xiàn)狀分析:五大要素成關(guān)鍵

2018-07-27 15:23 8510
近日, 由Gartner和七牛云聯(lián)合發(fā)布了一份《Five Key Essentials for the New Generation of Intelligent Video Cloud》 白皮書報(bào)告。

上海2018年7月27日電 /美通社/ -- 近日,由 Gartner 和七牛云聯(lián)合發(fā)布了一份《Five Key Essentials for the New Generation of Intelligent Video Cloud》白皮書報(bào)告,報(bào)告中針對(duì)各行業(yè)在視頻應(yīng)用領(lǐng)域升級(jí)過(guò)程中面臨的技術(shù)痛點(diǎn)及挑戰(zhàn),提出了構(gòu)建新一代視頻云的5個(gè)關(guān)鍵要素和相關(guān)參考標(biāo)準(zhǔn),并描述了智能視頻云如何以更便捷的服務(wù)和更低的成本幫助客戶加速升級(jí)。本文則對(duì) Gartner 和七牛云的白皮書報(bào)告進(jìn)行了詳細(xì)編譯。

以下為譯文:

一、導(dǎo)語(yǔ)

過(guò)去十年里,中國(guó)移動(dòng)互聯(lián)網(wǎng)的高速發(fā)展,帶動(dòng)了各個(gè)產(chǎn)業(yè)IT基礎(chǔ)架構(gòu)的擴(kuò)展和升級(jí):

  • 2017年,大陸地區(qū)用戶平均帶寬達(dá)到52M,已經(jīng)追平甚至超越了許多發(fā)達(dá)國(guó)家水平;
  • 移動(dòng)互聯(lián)網(wǎng)終端數(shù)超過(guò)14億臺(tái),其中超過(guò)60%的設(shè)備接入了4G網(wǎng)絡(luò);
  • 5G時(shí)代也即將到來(lái),視頻的內(nèi)容和展現(xiàn)形式將更加多元化,在直播、點(diǎn)播等基礎(chǔ)場(chǎng)景上,又增加了短視頻和實(shí)時(shí)音視頻互動(dòng)的新浪潮,同時(shí)視頻技術(shù)也在安防、醫(yī)療、教育、司法、廣電等領(lǐng)域有著全新的應(yīng)用。

本文介紹各行業(yè)在視頻應(yīng)用領(lǐng)域的升級(jí)過(guò)程中,主要面臨的技術(shù)痛點(diǎn)和挑戰(zhàn),并提出了構(gòu)建新一代視頻云的5個(gè)關(guān)鍵要素和相關(guān)參考標(biāo)準(zhǔn),描述了智能視頻云如何以更便捷的服務(wù)和更低的成本幫助客戶加速升級(jí)。未來(lái)視頻的應(yīng)用的場(chǎng)景和領(lǐng)域可能會(huì)成為企業(yè)產(chǎn)品或營(yíng)銷服務(wù)中核心的環(huán)節(jié),而且它本身的規(guī)模變化也非常符合互聯(lián)網(wǎng)中的馬太效應(yīng),因此企業(yè)都需要提前為自己未來(lái)海量的富媒體素材做好充分準(zhǔn)備,避免數(shù)據(jù)失控。

二、各行業(yè)在視頻時(shí)代的新興場(chǎng)景

1、安防監(jiān)控

根據(jù) Markets&Markets 的調(diào)查結(jié)果,2017年至2022年期間,全球監(jiān)控視頻市場(chǎng)年復(fù)合增長(zhǎng)率將達(dá)15.4%,2022年將增至約756億美元的規(guī)模。視頻監(jiān)控廣泛應(yīng)用于各類場(chǎng)合,包括:

  • 道路交通監(jiān)控
  • 城市安全監(jiān)控
  • 公共區(qū)域監(jiān)控
  • 家庭安防監(jiān)控

最近兩年來(lái),以幼兒園、學(xué)校代表的公共區(qū)域場(chǎng)所監(jiān)控提出了更高的要求:

  • 過(guò)去無(wú)需外網(wǎng)訪問(wèn)的監(jiān)控,現(xiàn)在需要做到全網(wǎng)實(shí)時(shí)觀看;
  • 過(guò)去無(wú)需長(zhǎng)期儲(chǔ)存監(jiān)控畫面,現(xiàn)在需要做到可隨時(shí)查閱、長(zhǎng)期存檔。

而道路交通和城市安全的監(jiān)控,除了傳統(tǒng)的車輛違章監(jiān)控和識(shí)別,行人的違章也逐步納入到了監(jiān)控的體系中,如:

  • 智能識(shí)別畫面中行人的違章行為;
  • 實(shí)時(shí)識(shí)別人臉信息,快速確定違章行人身份;
  • 自動(dòng)錄制違章畫面,保存證據(jù),上傳至云端保存。

由此可以看到,視頻監(jiān)控領(lǐng)域正在面臨著產(chǎn)業(yè)升級(jí),如何做到公網(wǎng)穩(wěn)定地訪問(wèn),產(chǎn)生的海量的圖像和視頻數(shù)據(jù)如何更好地存儲(chǔ)、分析和檢索,是一項(xiàng)巨大的挑戰(zhàn)。

2、在線教育

近年來(lái),在線教育發(fā)展異常火熱,利用互聯(lián)網(wǎng)音視頻技術(shù),解決了優(yōu)質(zhì)教育資源傳遞的時(shí)空限制,主要體現(xiàn)形式如下:

  • 直播課堂:直播授課,講師可以更自然地提供在線輔導(dǎo);
  • 實(shí)時(shí)互動(dòng):低延時(shí)音視頻傳輸,幫助教師實(shí)現(xiàn)和學(xué)生的實(shí)時(shí)在線交流;搭配使用聊天室功能:文字、語(yǔ)音、圖片、包括自定義消息等,有效地提升了課堂氛圍;
  • 點(diǎn)播回放:通過(guò)云端錄制以及在線回放,學(xué)生可以隨時(shí)查看錄播視頻,對(duì)知識(shí)點(diǎn)進(jìn)行查缺補(bǔ)漏,加深對(duì)知識(shí)的理解。

如何解決學(xué)生觀看直播的卡頓問(wèn)題,如何進(jìn)一步降低視頻互動(dòng)的延時(shí),提高老師和學(xué)生的體驗(yàn),顯得至關(guān)重要。另外,隨著人工智能的發(fā)展,視頻技術(shù)如何更好地借助 AI 技術(shù),也成為在線教育領(lǐng)域大家更為關(guān)注的方向,如:

  • 智能視頻標(biāo)簽:根據(jù)學(xué)生上課狀態(tài),設(shè)置獎(jiǎng)杯、小紅花等獎(jiǎng)勵(lì)元素,截屏記錄孩子優(yōu)秀表現(xiàn)的狀態(tài),并保存,集錦視頻分享給家長(zhǎng);
  • 智能視頻推薦:智能推薦適合學(xué)生的學(xué)習(xí)內(nèi)容,包括教學(xué)視頻、講義、習(xí)題及習(xí)題講解、測(cè)試題等。

3、廣電新媒體

隨著互聯(lián)網(wǎng)直播興起,各類廣電平臺(tái)想要做出一檔可看且互動(dòng)性強(qiáng)的直播節(jié)目,除了要精心編排節(jié)目?jī)?nèi)容,還要特別重視音視頻及互動(dòng)方式的呈現(xiàn)。顯然,在新媒體時(shí)代下,傳統(tǒng)的廣電方案具有一定的局限性:

  • 傳統(tǒng)廣電接入互聯(lián)網(wǎng),既要混編傳統(tǒng)的音視頻流,又要混編 PPT 文檔共享等新興數(shù)據(jù)流,保證多路畫面實(shí)時(shí)切換;
  • 采用專屬線路傳輸,三網(wǎng)合一方案進(jìn)展緩慢;
  • 分辨率與碼率較低,難以滿足日漸普及的4K電視需求;
  • 線性播出,內(nèi)容無(wú)法回放,互動(dòng)形式較為單一;
  • 缺乏對(duì)視頻內(nèi)容的分析能力,僅能通過(guò)固定群體樣本,推斷出收視率等較為粗放的參考數(shù)據(jù)。

面對(duì)這些局限,廣電行業(yè)迫切需要全新的視頻系統(tǒng),為消費(fèi)者提供高畫質(zhì)、強(qiáng)互動(dòng)的視頻娛樂(lè)體驗(yàn)和可量化的精確數(shù)據(jù)管理:

  • 在直播導(dǎo)播方面,云端進(jìn)行音畫混編服務(wù),并在云端切換視頻,快速形成導(dǎo)播效果;
  • 在媒資管理方面,可對(duì)圖像、視頻進(jìn)行智能拆條、智能審核和智能編目等,實(shí)現(xiàn)內(nèi)容匯聚的生產(chǎn)、審核、管理等全套環(huán)節(jié)的智能處理,極大提升內(nèi)容制作效率;
  • 在內(nèi)容運(yùn)營(yíng)方面,利用大數(shù)據(jù)能力和算法,實(shí)現(xiàn)用戶行為數(shù)據(jù)標(biāo)簽管理,實(shí)現(xiàn)內(nèi)容與廣告的千家千面投放,提升廣告價(jià)值;
  • 在終端播放方面,傳輸層基于寬帶網(wǎng)絡(luò)的4K超高清視頻傳輸,保證電視畫面的自定義時(shí)移、回看,開(kāi)放場(chǎng)景下的也可跨屏互動(dòng)、多屏互通,提升終端用戶和電視交互的便捷性和趣味性。

如何實(shí)現(xiàn)導(dǎo)播內(nèi)容的實(shí)時(shí)切換,如何保證廣電內(nèi)容實(shí)時(shí)傳輸,如何讓廣電傳媒的廣告價(jià)值較大化,如何制作低成本、高質(zhì)量的節(jié)目,這對(duì)廣電新媒體來(lái)說(shuō)均是急需解決的難題。

4、智慧法庭

2016年7月1日起,較高人民法院所有公開(kāi)開(kāi)庭案件均有網(wǎng)上直播,所有直播視頻均有視頻存檔,公眾可在線觀看。截至2018年3月,全國(guó)范圍內(nèi)的庭審直播共累計(jì)66萬(wàn)余場(chǎng),累計(jì)訪問(wèn)近50億人次。智慧法庭充分運(yùn)用互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算、人工智能等先進(jìn)信息技術(shù),支持全業(yè)務(wù)網(wǎng)上辦理、全流程依法公開(kāi)、全方位智能服務(wù):

基于視頻及文書,結(jié)合人工智能計(jì)算機(jī)視覺(jué)技術(shù),讀取、分析電子化卷宗,抓取重要因素,并分類標(biāo)注。例如把犯罪動(dòng)機(jī)、犯罪時(shí)間、犯罪工具等 -- 以不同顏色打上標(biāo)簽,并予以比對(duì)分析。

建設(shè)智慧法庭,如何保障開(kāi)庭審訊直播視頻的實(shí)時(shí)傳輸,如何存儲(chǔ)海量直播視頻用于點(diǎn)播回放,如何基于廣泛的視頻內(nèi)容進(jìn)行智能分析,對(duì)視頻基礎(chǔ)設(shè)施的可靠性提出了更高的要求和挑戰(zhàn)。

5、遠(yuǎn)程醫(yī)療

當(dāng)前醫(yī)療資源還存在著地區(qū)分布不均問(wèn)題,醫(yī)療專家可以通過(guò)在線直播、實(shí)時(shí)音視頻進(jìn)行跨區(qū)域互動(dòng)會(huì)診:

  • 臨床交互式會(huì)診:利用視頻會(huì)議系統(tǒng),患者可以和醫(yī)生“面對(duì)面”的交流,醫(yī)生現(xiàn)場(chǎng)實(shí)時(shí)解答患者的各種問(wèn)題;
  • 遠(yuǎn)程影像會(huì)診:患者通過(guò)主視頻與醫(yī)生交流,同時(shí)可通過(guò)視頻傳送病歷資料和數(shù)據(jù),包括放射檢查影像、病理檢查圖像、心電圖、血壓圖、化驗(yàn)單或保存的錄像等,還原線下會(huì)診真實(shí)場(chǎng)景;
  • 遠(yuǎn)程醫(yī)療培訓(xùn):通過(guò)遠(yuǎn)程醫(yī)療培訓(xùn)系統(tǒng)開(kāi)展專題講座,傳授最新醫(yī)療信息和診療經(jīng)驗(yàn),現(xiàn)場(chǎng)解答各種疑難問(wèn)題,幫助聽(tīng)課醫(yī)生拓展診療思路,提高下級(jí)醫(yī)院整體從業(yè)水平。

遠(yuǎn)程醫(yī)療這一概念被提出后,已經(jīng)被廣泛應(yīng)用。但是,如何提高視頻傳輸性能,如何確保家庭、基層醫(yī)療機(jī)構(gòu)和戶外應(yīng)急的遠(yuǎn)程醫(yī)療快速接入,是當(dāng)前的遠(yuǎn)程醫(yī)療業(yè)務(wù)系統(tǒng)面臨的主要挑戰(zhàn)。

從以上列舉的幾個(gè)行業(yè)新興場(chǎng)景可以看出,在產(chǎn)業(yè)升級(jí)的過(guò)程中,他們都面臨著巨大的技術(shù)和資源挑戰(zhàn)。大部分企業(yè)無(wú)法在短時(shí)間內(nèi)構(gòu)建有效的相關(guān)視頻服務(wù)能力,因此如何選擇和利用公有云的相關(guān)視頻服務(wù),快速滿足業(yè)務(wù)的升級(jí)需求,顯得至關(guān)重要。

三、智能視頻云的關(guān)鍵要素

為了滿足各行業(yè)在視頻時(shí)代新的需求和挑戰(zhàn),智能視頻云至少需要擁有以下5個(gè)關(guān)鍵要素:

1、穩(wěn)定的網(wǎng)絡(luò)傳輸與分發(fā):直播延遲不高于1s,互動(dòng)延遲不高于150ms

2、可擴(kuò)展的海量存儲(chǔ)服務(wù):可以實(shí)現(xiàn)業(yè)務(wù)層無(wú)感知PB級(jí)擴(kuò)容

3、云端媒體的編輯處理:可以在數(shù)秒內(nèi)創(chuàng)建獨(dú)立計(jì)算實(shí)例,執(zhí)行自定義媒體編輯操作

4、視頻內(nèi)容的智能分析:視頻內(nèi)容識(shí)別率高于95%

5、完備的權(quán)限控制:徹底杜絕非法拷貝,秒級(jí)封禁盜鏈流量

要素1:穩(wěn)定的網(wǎng)絡(luò)傳輸與分發(fā):提供流暢的觀看體驗(yàn)與低延遲的互動(dòng)

  • 內(nèi)容分發(fā)網(wǎng)絡(luò)(CDN)的優(yōu)化:在傳統(tǒng)CDN基礎(chǔ)上融合優(yōu)化,建立高質(zhì)量全球節(jié)點(diǎn),實(shí)現(xiàn)直播、點(diǎn)播內(nèi)容的加速分發(fā),進(jìn)一步提供秒級(jí)首開(kāi)、低延遲的視頻播放體驗(yàn)。
  • 實(shí)時(shí)流網(wǎng)絡(luò)(LiveNet):針對(duì)復(fù)雜的網(wǎng)絡(luò)環(huán)境、高成本的跨運(yùn)營(yíng)商服務(wù)和邊遠(yuǎn)地區(qū)基礎(chǔ)設(shè)施落后等客觀因素,基于全球節(jié)搭建全球化實(shí)時(shí)流網(wǎng)絡(luò),采用軟件定義網(wǎng)絡(luò)的方式,動(dòng)態(tài)制定線路組合并決策調(diào)度最優(yōu)線路。
  • 具備完善的客戶端SDK:智能視頻云需要一整套含推流、短視頻、播放器等多種SDK開(kāi)發(fā)套件,幫助用戶完成視頻的生產(chǎn)、編輯和消費(fèi),同時(shí)還能降低移動(dòng)端應(yīng)用的開(kāi)發(fā)難度和時(shí)間成本。
  • 利用最新的編解碼技術(shù)和傳輸協(xié)議,減少對(duì)傳輸網(wǎng)絡(luò)帶寬和質(zhì)量的要求,降低卡頓率,如P2P通信,H.265編解碼,QUIC協(xié)議等。
  • 支持標(biāo)準(zhǔn)的WebRTC協(xié)議棧,降低端到端的延時(shí),實(shí)現(xiàn)百毫秒級(jí)別的音視頻互動(dòng)體驗(yàn)。

要素2:可擴(kuò)展的海量存儲(chǔ)服務(wù):高可靠易擴(kuò)展的數(shù)據(jù)安全保障

  • 穩(wěn)健可靠的對(duì)象存儲(chǔ):通過(guò)糾刪碼存儲(chǔ)、跨數(shù)據(jù)中心的副本冗余等技術(shù)手段,提供高達(dá)16個(gè)9的數(shù)據(jù)可靠性,保證每年服務(wù)不可用時(shí)間低于30s,確保存儲(chǔ)數(shù)據(jù)的超高可用性。
  • 易擴(kuò)展的技術(shù)架構(gòu):存儲(chǔ)系統(tǒng)支持動(dòng)態(tài)擴(kuò)充存儲(chǔ)節(jié)點(diǎn),實(shí)現(xiàn)存儲(chǔ)需求的彈性收縮,保證PB級(jí)別的存儲(chǔ)內(nèi)容可動(dòng)態(tài)擴(kuò)容,確保業(yè)務(wù)系統(tǒng)聚焦業(yè)務(wù)增長(zhǎng),無(wú)后顧之憂。
  • 利用邊緣計(jì)算和邊緣存儲(chǔ):將運(yùn)算和存儲(chǔ)分散在靠近數(shù)據(jù)源的近端設(shè)備中處理,無(wú)需把數(shù)據(jù)實(shí)時(shí)回傳云端處理,減少云平臺(tái)的工作量。大幅提高效率,降低延遲,成為云平臺(tái)的有效補(bǔ)充和和優(yōu)化。
  • 支持低頻存儲(chǔ)特性:將擁有高吞吐量,較高持久性和較低訪問(wèn)延遲的數(shù)據(jù)存儲(chǔ)在云端,極大降低海量存儲(chǔ)數(shù)據(jù)的企業(yè)運(yùn)營(yíng)成本,成本比常規(guī)方案降低60%,訪問(wèn)延時(shí)可控制在50ms以內(nèi)。

要素3:端媒體的編輯處理:快捷多用途云端視頻編輯

  • 快捷輕量化處理:視頻編輯的任務(wù),本質(zhì)上是針對(duì)視頻文件的數(shù)據(jù)運(yùn)算與處理,通過(guò)部署靈活的容器化平臺(tái),視頻編輯時(shí)需要的物理資源利用率可從40%提高70%以上,發(fā)布效率提升5倍,突發(fā)業(yè)務(wù)實(shí)現(xiàn)秒級(jí)響應(yīng)。
  • 豐富的多媒體編輯能力:提供視頻轉(zhuǎn)碼、截圖、水印、旋轉(zhuǎn)、切片等多媒體數(shù)據(jù)處理服務(wù),滿足直播、點(diǎn)播等多種實(shí)時(shí)節(jié)目制作場(chǎng)景,快速完成效果制作,輸出專業(yè)制播內(nèi)容。

要素4:視頻內(nèi)容的智能分析:結(jié)合人工智能發(fā)揮視頻數(shù)據(jù)的較大價(jià)值

  • 智能多媒體內(nèi)容識(shí)別:通常包含內(nèi)容審核、OCR、場(chǎng)景識(shí)別、人臉識(shí)別、音視頻處理、圖片處理等豐富功能。同時(shí),面對(duì)每天高速增長(zhǎng)的數(shù)據(jù)處理請(qǐng)求,彈性擴(kuò)縮容的內(nèi)容識(shí)別平臺(tái)能保障服務(wù)器免受巨大壓力。
  • 深度學(xué)習(xí)平臺(tái)的數(shù)據(jù)整理:一個(gè)高性能的深度學(xué)習(xí)平臺(tái)框架可以輕松完成每日撰寫迭代訓(xùn)練腳本、新數(shù)據(jù)的增刪和管理、增量學(xué)習(xí)和迭代學(xué)習(xí)、搭建半監(jiān)督打標(biāo)系統(tǒng)、模型的比較和融合等工作,綜合下來(lái),可以減少70%的重復(fù)勞動(dòng)。
  • 海量媒資知識(shí)庫(kù)體系由視頻結(jié)構(gòu)化模塊,知識(shí)圖譜模塊和大數(shù)據(jù)檢索模塊三者組成。視頻結(jié)構(gòu)化模塊完成對(duì)視頻中基礎(chǔ)元素和內(nèi)容的提取和整理,將線性的視頻解構(gòu)成可以被碎片化使用的組件;知識(shí)圖譜用于將視頻結(jié)構(gòu)化得到的事件、人物、物體、場(chǎng)景等信息的有序梳理,并以便于檢索和關(guān)聯(lián)的形式進(jìn)行存儲(chǔ)和呈現(xiàn);大數(shù)據(jù)檢索模塊在前兩者的基礎(chǔ)上,提供海量媒資內(nèi)容的高效檢索,可以根據(jù)人物特征、人臉特征、圖像特征、視頻特征及更復(fù)雜的組合結(jié)構(gòu),快速地提供視頻數(shù)據(jù)檢索服務(wù)。

要素5:完備的權(quán)限控制:杜絕非法拷貝與盜鏈

  • 完備的防盜鏈機(jī)制:無(wú)論是直播還是點(diǎn)播,對(duì)視頻內(nèi)容的訪問(wèn),都需要有完備的防盜鏈機(jī)制,常見(jiàn)的防盜鏈方式有referer防盜鏈、時(shí)間戳防盜鏈、回源鑒權(quán)等多種,基本上能有效地降低盜鏈風(fēng)險(xiǎn)。同時(shí)視頻云還應(yīng)當(dāng)對(duì)突發(fā)性的盜鏈流量具有感知能力與報(bào)警機(jī)制,可以快速阻止盜鏈訪問(wèn)。
  • 可靠的DRM數(shù)字版權(quán)保護(hù)機(jī)制:除了防盜鏈,內(nèi)容的版權(quán)保護(hù)也是視頻云需要提供的能力。常見(jiàn)的方式是對(duì)上傳的視頻文件進(jìn)行轉(zhuǎn)碼和加密,輸出加密后的視頻文件再進(jìn)行網(wǎng)絡(luò)分發(fā),由終端播放時(shí)再解密播放,這樣即可真正實(shí)現(xiàn)對(duì)內(nèi)容的版權(quán)保護(hù),防止非法拷貝。

根據(jù)以上5個(gè)關(guān)鍵要素,七牛云認(rèn)為一套完整的智能視頻云需要由以下模塊組成:

七牛智能視頻云
七牛智能視頻云

四、智能視頻云的成本優(yōu)勢(shì):

智能視頻云不僅在技術(shù)能夠完全滿足各行業(yè)在視頻時(shí)代的新需求,相比自主研發(fā),還能為企業(yè)大幅節(jié)省研發(fā)成本和運(yùn)營(yíng)成本。

自建系統(tǒng)VS智能視頻云成本
自建系統(tǒng)VS智能視頻云成本

 

自建系統(tǒng)VS智能視頻云時(shí)間成本
自建系統(tǒng)VS智能視頻云時(shí)間成本

面對(duì)高昂的成本,視頻云服務(wù)在提供了豐富產(chǎn)品的同時(shí),還具有簡(jiǎn)單易用、可彈性擴(kuò)展、維護(hù)成本低的特點(diǎn)。智能視頻云服務(wù)通過(guò)提供通用且易于根據(jù)具體業(yè)務(wù)定制的技術(shù)系統(tǒng),大大降低了行業(yè)應(yīng)用的開(kāi)發(fā)周期與成本開(kāi)銷,同時(shí)視頻云的多個(gè)模塊均可私有或混合部署,在保障企業(yè)數(shù)據(jù)安全的同時(shí),獲得和公有云一樣的穩(wěn)定性、可靠性和靈活性。

五:AI在智能視頻云的增值應(yīng)用

在智能視頻云的技術(shù)和成本優(yōu)勢(shì)背后,人工智能,尤其是計(jì)算機(jī)視覺(jué)技術(shù)的深度應(yīng)用發(fā)揮了巨大的作用。在七牛云整個(gè)智能視頻云系統(tǒng)中,計(jì)算機(jī)視覺(jué)技術(shù)在諸多環(huán)節(jié)取代了人工操作,極大地提高了視頻內(nèi)容處理的效率。通過(guò)完全不同于傳統(tǒng)數(shù)據(jù)分析的角度,實(shí)現(xiàn)了先前難以想象的數(shù)據(jù)分析應(yīng)用。

1、視頻內(nèi)容識(shí)別:自動(dòng)識(shí)別視頻畫面信息,從標(biāo)簽庫(kù)中匹配對(duì)應(yīng)標(biāo)簽

作為計(jì)算機(jī)視覺(jué)基礎(chǔ)模型層中重要的幾項(xiàng)技術(shù),人臉識(shí)別、物體識(shí)別、場(chǎng)景識(shí)別等技術(shù)在安防、廣電、教育等領(lǐng)域的眾多場(chǎng)景中有廣泛的應(yīng)用場(chǎng)景。

例如在安防行業(yè),擁有人臉識(shí)別、動(dòng)作追蹤等功能的高清攝像頭,能根據(jù)監(jiān)控范圍內(nèi)人物的動(dòng)作并判斷其行為,對(duì)具有可疑行為的人觸發(fā)自動(dòng)報(bào)警。當(dāng)智能攝像頭與公安部門的在逃嫌犯資料庫(kù)匹配之后,能在機(jī)場(chǎng)、火車站等人流密集場(chǎng)所配合警方識(shí)別可疑人員,大幅提升破案、抓捕效率。

2、視頻內(nèi)容結(jié)構(gòu)化:可以像搜索文本文件一樣搜索視頻文件中的信息

計(jì)算機(jī)視覺(jué)視頻結(jié)構(gòu)化相比人工標(biāo)注具有識(shí)別范圍廣、準(zhǔn)確性好、學(xué)習(xí)模型不斷迭代、GPU機(jī)器效率高、成本低等一系列明顯優(yōu)勢(shì)。經(jīng)標(biāo)注后的視頻能夠在遠(yuǎn)程醫(yī)療、在線教育、廣電等行業(yè)發(fā)揮巨大作用。

例如,遠(yuǎn)程醫(yī)療行業(yè)擁有的存量和新增影像資料遠(yuǎn)遠(yuǎn)超出人工標(biāo)注的能力范圍,想要發(fā)揮醫(yī)療視頻資料的較大價(jià)值,需要根據(jù)不同類別將視頻和圖片進(jìn)行分類。通過(guò)人工智能高效完成視頻精確分類后,就能像搜索文本文件一樣搜索視頻文件中的關(guān)鍵信息,進(jìn)行更有效的利用,真正將醫(yī)療大數(shù)據(jù)變?yōu)獒t(yī)療知識(shí)圖譜。

3、視頻內(nèi)容審核:從視頻中識(shí)別敏感信息,提升審核效率

如今,圖片和視頻取代文字成為主流的傳播方式,針對(duì)圖片和視頻的內(nèi)容審核正變得越來(lái)越重要。然而人工審核不僅會(huì)造成高企的人力成本,其效率和準(zhǔn)確性也很難滿足當(dāng)下巨大的視頻數(shù)據(jù)量帶來(lái)的審核需求。

例如在廣電行業(yè),視頻內(nèi)容鑒黃、鑒暴恐、政治人物識(shí)別等工作過(guò)去均由人工完成。隨著計(jì)算機(jī)視覺(jué)技術(shù)的日漸成熟,利用機(jī)器代替人工進(jìn)行絕大部份的內(nèi)容審核工作,成為了視頻時(shí)代的提高審核效率的不二之選。憑借計(jì)算機(jī)視覺(jué)技術(shù)帶來(lái)的審核效率革命,鑒黃、鑒暴恐、政治人物識(shí)別將不再是廣電行業(yè)的難題。

4、視頻內(nèi)容推薦:可根據(jù)用戶消費(fèi)視頻習(xí)慣,實(shí)現(xiàn)精細(xì)化運(yùn)營(yíng)

除了能夠高效完成視頻結(jié)構(gòu)化和內(nèi)容審核工作,計(jì)算機(jī)視覺(jué)技術(shù)還能在業(yè)務(wù)層面成為內(nèi)容運(yùn)營(yíng)的創(chuàng)新引擎,實(shí)現(xiàn)更多個(gè)性化產(chǎn)品需求。

同樣在廣電行業(yè),例如在完成視頻內(nèi)容結(jié)構(gòu)化之后,運(yùn)營(yíng)者可以根據(jù)用戶收看行為記錄進(jìn)行智能內(nèi)容推薦,甚至在視頻的特定時(shí)間段和畫面的特定位置實(shí)現(xiàn)廣告定向投放,較大化提升廣告轉(zhuǎn)化效果。智能視頻內(nèi)容推薦能夠幫助內(nèi)容運(yùn)營(yíng)人員以較高效率實(shí)現(xiàn)高水平的用戶精細(xì)化運(yùn)營(yíng)。

六、借助靈活的智能視頻云從容面對(duì)未來(lái)產(chǎn)業(yè)升級(jí)的未知挑戰(zhàn)

未來(lái),很少有企業(yè)能脫離互聯(lián)網(wǎng)而獨(dú)立存在,因此企業(yè)數(shù)據(jù)的總量會(huì)不斷增加,對(duì)應(yīng)產(chǎn)生的數(shù)據(jù)價(jià)值甚至負(fù)擔(dān)也會(huì)同步提升。每個(gè)企業(yè)都需要擁有對(duì)于文件和富媒體素材(包含海量圖片,視頻,音頻)的使用和存儲(chǔ)的彈性能力,但只有極少數(shù)企業(yè)才需要擁有自建視頻云的能力和資源,大部分企業(yè)只需要借助一套穩(wěn)定并可持續(xù)升級(jí)的視頻云平臺(tái),迎接未來(lái)產(chǎn)業(yè)中不斷變化和升級(jí)的未知挑戰(zhàn)。

報(bào)告出處:

Gartner白皮書英文版鏈接https://www.gartner.com/technology/media-products/newsletters/qiniu/1-4UWO347/index.html
Gartner白皮書中文版鏈接:
https://www.qiniu.com/products/qavs 

消息來(lái)源:七牛云
China-PRNewsire-300-300.png
相關(guān)鏈接:
全球TMT
微信公眾號(hào)“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營(yíng)動(dòng)態(tài)、財(cái)報(bào)信息、企業(yè)并購(gòu)消息。掃描二維碼,立即訂閱!
collection