音視頻信息技術能力主要指的就是通過音頻進行技術和視頻網絡技術,這兩者在直播軟件開發的處理工作過程是差不多的,一般都分為5大步:數據可以采集、編碼、傳輸、解碼和渲染。
數據采集
數據采集是視頻流過程中的第一步。 系統的基本設備獲取原始視頻數據并輸出到下一個環節。
1、數據采集分類
視頻采集分為音頻采集和圖像采集兩種不同的數據采集方法,并且相應的輸入源,與數據格式完全不同。
2、音頻采集
音頻數據是外部聲音收集裝置,即,能夠僅音頻模式下,它可以與圖像相組合。然后音頻獲取裝置主要是通過信號環境數據采集到原來的PCM編碼數據被編碼成壓縮格式,如MP3遞出。常見的音頻壓縮格式:MP3,AAC,OGG,WMA,作品,FLAC,APE,M4A等AMR。
3、圖像采集
圖像進行數據是將圖片可以組合成一個一組或更多組的連續通過播放的動畫,構成可肉眼直接觀看的視頻。圖像的采集工作過程主要由專業攝像頭等重要設備以及拍攝成YUV編碼的原始信息數據,然后我們經過系統編碼壓縮成H.264等格式的數據應用分發傳播出去。常見的視頻作為封裝技術格式有:MP3、AAC、OGG、WMA、Opus、FLAC、APE、m4a和AMR等。
音視頻編解碼技術
實際上,視頻編碼和解碼是根據一定的算法來實現,這是音頻和視頻信息,并引進編解碼算法的分析。但是,音頻算法的多樣性,復雜性,比視頻更高。而且不同的場景需要選擇不同的音頻解碼器。
音頻編解碼常用的實現中國方案有三種:第一種方式就是我們采用專用的音頻芯片對語音信號可以進行信息采集和處理,音頻編解碼算法通過集成在硬件系統內部。第二種方案設計就是企業利用A/D采集卡加上我國計算機重要組成部分硬件服務平臺,音頻編解碼算法由計算機應用軟件來實現;第三種方案是使用高精度、高速度的A/D采集芯片來完成語音信號的采集。
內容上的音視頻流內容分發和轉碼
1.前端設備、手機或攝像頭將實時音頻和視頻內容收集和處理,之后推送到平臺源站服務器(采用多機集群熱備份機制)。
2.源站服務器通常連接專業磁盤陣列存儲裝置中,當所述源站接收數據的服務器,下面將每個節點轉發到CDN,其中一個副本,然后發送到代碼轉換服務器的第一多個副本。碼服務器每人將獲得實時音頻和視頻流轉碼。實時轉碼服務器將在實況流記錄保存到磁盤陣列,方便用戶回放。
3.由于音視頻信息內容需要由高性能的服務器可以完成,在實時轉碼的過程中,常常會因為我們考慮使用不當,出現企業無法得到滿足市場需求的問題。畢竟我國目前的直播技術應用研究屬于高并發的大規模直播平臺運營,在每個直播間不同的時間段都會遇上百個甚至成千上萬個直播流,進行數據實時轉碼。這樣一來就需要通過配置更多高配置的服務器,成本管理相對簡單來說也會加大。
4.實時轉碼流必須是實時的,并且必須要求在1秒碼延遲,以前的延遲2-3S仍存在一定的差距。因此,為了確保廣播軟件開發完成后,轉碼的音頻和視頻都可以順利進行,不僅需要更加努力地工作在服務器的配置,還要注意是否具有高度的實時,無論是碼延遲可以在一定的時間內被控制。
以上這些研究內容還只是大體的流程概念,具體去實施會遇到更多的實際發展問題。畢竟做直播軟件企業需要我們全面的技術知識儲備和豐富的實戰經驗。