SVAC 2.0對于嵌入式智能攝像機的邊緣計算智能分析數(shù)據(jù)方面,進行了全面的改進與支持,引入實時智能分析結(jié)果描述等監(jiān)控信息,增加地理位置信息,規(guī)定了常用前端實時智能分析信息的結(jié)構(gòu)化數(shù)據(jù)格式和攜帶方式,通過專門語法與視音頻壓縮編碼數(shù)據(jù)一起傳輸和存儲,對智能分析數(shù)據(jù)進行了規(guī)范化管理,同時,存在保留空間便于兼容更多智能數(shù)據(jù)的更多形式,為大規(guī)模監(jiān)控網(wǎng)絡的智能管理提供重要技術(shù)保障。
1. SVAC 2.0的壓縮技術(shù)
SVAC 2.0標準主要技術(shù)特點包括:支持高精度視頻數(shù)據(jù)編碼,支持多樣化的幀內(nèi)及幀間預測、變換量化、二進制算術(shù)編碼等技術(shù),支持感興趣區(qū)域(ROI)變質(zhì)量編碼、可伸縮性視頻編碼(SVC)技術(shù),支持代數(shù)碼書激勵線性預測(ACELP)和變換音頻編碼(TAC)切換的雙核音頻編碼,支持聲音識別特征參數(shù)的編碼,支持時間參考信息、智能分析信息等監(jiān)控信息,支持數(shù)據(jù)安全保護,支持視頻數(shù)據(jù)加密、認證功能。
具體來說,SVAC 2.0的圖像空間分割不再支持多條帶,而支持編碼片(Tile)的劃分,如圖1(a)一幅圖像可以從水平和垂直方向上分割為若干個Tile區(qū)域,而這些Tile由一系列的CTU(Coding Tree Unit,樹形編碼單元)組成。據(jù)此,SVAC 2.0增加并行運算支持,多Tile同時編碼,加快了編碼速度。SVAC2.0的基本運算單元尺寸由之前的16X16提升為128X128,并可進一步劃分為預測單元(PU)和變換單元(TU),劃分方式由編碼樹決定。幀內(nèi)預測模式由SVAC 1.0的5種增加至37種,如圖1(b)細化預測方向,更好地適應視頻內(nèi)容不同方向的紋理,使預測更為準確。同時,提升了運動搜索插值精度為1/8像素精度,如圖1(c)采用8抽頭濾波器進行插值,優(yōu)化了插值結(jié)果。SVAC2.0加入4種尺寸的離散正弦變換(DST),并增大原有的離散余弦變換尺寸至zui大32X32,進一步提高了壓縮性能。
圖1 SVAC2.0 改進技術(shù)
2.SVAC2.0智能分析數(shù)據(jù)支持
時代與科技的發(fā)展使越來越多的新技術(shù)應用在攝像機中,隨著深度學習、人工智能以及高性能計算等技術(shù)的逐漸推廣,越來越多的智能算法應用于前端設備。為保證智能信息統(tǒng)一管理,SVAC2.0在保證實時視音頻編解碼的前提下,結(jié)合智能分析技術(shù),細化智能信息并整理分類,加入智能分析信息,提供了對智能視頻處理信息的結(jié)構(gòu)化支持。
在支持前端嵌入式智能分析數(shù)據(jù)應用方面,如圖2所示,SVAC2.0主要從圖像分析規(guī)則、目標檢測與特征分析、目標識別、行為分析、目標數(shù)量統(tǒng)計等方面對智能數(shù)據(jù)進行規(guī)范化格式定義,增加地理位置信息,規(guī)定了常用前端智能分析信息的數(shù)據(jù)格式和攜帶方式,zui終通過專門的語法將分析結(jié)果以及產(chǎn)生的相關(guān)報警信息等,隨視頻碼流同步傳輸和存儲,如此可以節(jié)省資源,規(guī)范管理,便于快速檢索、分類查詢、視音頻同步和監(jiān)控數(shù)據(jù)的綜合應用。
圖2 SVAC2.0智能分析數(shù)據(jù)描述
3. SVAC2.0邊緣計算智能數(shù)據(jù)的攜帶方式
SVAC2.0對邊緣計算智能信息和常用的智能分析結(jié)果規(guī)定了具體的攜帶方式。在監(jiān)控擴展數(shù)據(jù)單元中增加智能分析信息擴展語法,對監(jiān)控視頻進行智能分析算法得到的結(jié)果編碼進入視頻流中的方式做了定義。以此將中心與編碼端的數(shù)據(jù)智能分析過程相分離,視頻編碼端將智能分析得到的結(jié)果攜帶到碼流中并傳輸,中心只需要讀取邊緣計算后智能分析的結(jié)果,然后進行綜合比對、碰撞,大大地減輕中心分析數(shù)據(jù)的壓力,對監(jiān)控視頻大數(shù)據(jù)分析應用提供了。
在碼流結(jié)構(gòu)方面,如圖3所示,SVAC2.0采用了類似于SVAC1.0的分層結(jié)構(gòu),將屬于GOP層、Tile層中共用的大部分語法游離出來,組成序列參數(shù)集SPS(Sequence Parameter Set)、圖像參數(shù)集PPS(Picture Parameter Set)、安全參數(shù)集SePS(Security Parameter Set)和擴展參數(shù)集EPS(Extension Parameter Set)。其中,序列參數(shù)集的內(nèi)容大致包括解碼相關(guān)信息,如檔次級別、分辨率、某檔次中編碼工具開關(guān)標識和涉及的參數(shù)、時域可分級信息等。圖像參數(shù)集的內(nèi)容大致包括一幀圖像所用的公共參數(shù)集,如量化參數(shù)、Tile相關(guān)語法元素、去方塊濾波相關(guān)語法元素等。安全參數(shù)集包含了解碼所需的加密與認證的開關(guān)以及視頻密鑰加密密鑰版本號等安全參數(shù)信息,擴展參數(shù)集主要用來記錄監(jiān)控信息,如時間信息、OSD信息等。
圖3 SVAC2.0的碼流結(jié)構(gòu)
由圖3可知,經(jīng)過網(wǎng)絡傳輸后重新組合載荷包,經(jīng)過PS解封裝后可以得到ES視頻流,當解析至nal_unit_type=5的數(shù)據(jù)單元時,解碼器將其解析為監(jiān)控數(shù)據(jù)單元。SVAC2.0細化了此單元的內(nèi)容,根據(jù)Extension_id的不同可以分為時間擴展信息(0x04)、地理信息擴展(0x10)、智能分析信息擴展(0x11)和OSD信息擴展(0x12)四種監(jiān)控信息。
圖4 智能分析數(shù)據(jù)analysis_id[i]與智能特征的對應關(guān)系
SVAC2.0充分考慮了與公共安全息息相關(guān)的視頻特征,這些特征在公安辦案、監(jiān)控輿情、維護社會治安等方面起著非常重要的作用,支持對圖像分析規(guī)則、目標檢測與特征分析、目標識別、行為分析、目標數(shù)量統(tǒng)計的主要數(shù)據(jù)進行了規(guī)范性格式化定義。圖4中展示的是這些特征與語法元素analysis_id[i](第i項分析結(jié)果的分析功能標識)的映射關(guān)系,在一段視頻流中可以攜帶0個、1個或多個智能分析結(jié)果,結(jié)果的數(shù)量可以用語法元素analysis_num表示,每個分析結(jié)果的表示形式也定義了結(jié)構(gòu)化規(guī)范格式,通過值description_type[i]可知第i項分析結(jié)果的描述形式,當為0x02時廠家可自定義描述形式,當為0x03時則必須遵循國標中對結(jié)構(gòu)化描述的規(guī)定。同時,SVAC2.0還具有*的兼容性和可擴展性,在analysis_id的值中保留0x0E~0xFF的值為更加細化視頻特征做好鋪墊,保留description_type值為0x00和0x03的描述形式,兼容更多的描述結(jié)構(gòu)。在視頻流中可以清晰的知道當前視頻流所攜帶的智能分析結(jié)果的數(shù)量以及分別代表哪項識別功能。