大數據技術有線電視節目研究

時間:2022-11-15 08:46:13

導語:大數據技術有線電視節目研究一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

大數據技術有線電視節目研究

摘要:在當前互聯網技術以及智能AI技術的發展背景下,合肥有線利用大數據技術對電視用戶群和節目資源進行細分,整合規范合肥有線的直播和點播節目資源元數據,利用基于內容的推薦算法和協同過濾算法對推薦模型的數據進行大數據分析,實現有線電視用戶的個性化推薦服務。

關鍵詞:推薦系統;大數據;互動電視;HFC

雙向網絡在當前互聯網技術以及智能AI技術的發展背景下,為了應對新媒體技術的挑戰,合肥有線對傳統機頂盒進行著技術升級,利用大數據技術對自己的用戶群進行細分,并以此信息對用戶進行合肥有線的直播和點播節目資源進行系統推薦,以期做到千人千面的個性服務,用以提高合肥有線的品牌競爭力。本系統從合肥有線雙向網絡中收集用戶終端的各類信息(用戶信息、用戶行為信息以及業務信息等),通過對各類數據信息的建模分析利用大數據平臺來實現有線用戶的個性化推薦服務。

1對有線節目資源進行大數據分析的意義

自全網雙向改造后,合肥有線不僅保證直播節目穩定無延時地傳輸也引進了海量視頻資源以供有線用戶點播收看。雖然節目資源的初步聚合歸類改變了用戶的被動接收的收視習慣,但與互聯網視頻網站對節目詳盡的分類相比,合肥有線的視頻資源入口相對簡單、點播路徑過長以及影片搜索不便捷等問題無不影響著用戶收視。因此,運用大數據分析系統,對節目資源進行深度分析,不僅可以提升有線優質資源的曝光率而且可以增加用戶的黏度;對用戶進行群體細分以及用戶喜好的分析,改變了有線電視節目的運營模式,從傳統的粗放式推送轉化為精細化的用戶運營,提升了用戶的品牌忠誠度。

2推薦系統介紹

推薦技術的發展是隨著信息技術和互聯網的發展而興起的,是信息過載時代信息消費者和信息生產者之間的紐帶,是一種幫助用戶快速發現有用信息的工具。推薦系統并不需要用戶提供明確的需求,是分析并挖掘用戶的歷史行為,利用特定算法找出用戶的個性化特點并主動給用戶推薦滿足他們需求的信息的系統。推薦系統面向的對象稱為用戶,推薦的產品稱為物品,推薦系統所關心的就是用戶與物品之間的關系,現有的一些基本類型的推薦系統包括:協同系統、基于內容的系統和基于知識的系統。[1]這些系統都具有一個重要的特點擁有強大的用于跟蹤和識別用戶長期興趣的用戶識別機制。

3有線節目資源推薦系統架構圖

有線節目資源推薦系統的用戶是收看有線電視節目的終端用戶,推薦系統的物品是有線節目資源,包括了直播電視節目、在線點播影片以及電視劇。有線節目資源推薦系統的架構如圖1所示。3.1數據信息。推薦系統能否提供用戶滿意的結果依賴于數據信息源。數據源需要具有大數據的特性:大量化、多樣化以及速度化等特點。涉及的數據信息可以分為以下幾類:(1)終端用戶自身數據信息:收看電視節目的終端設備以及智能卡號,用戶姓名、用戶地址;(2)終端用戶行為數據信息:用戶點播的數據信息(片名、開始點播時間、結束收看時間、暫停播放的時長以及對節目的評分)、用戶瀏覽的數據信息(片名、開始瀏覽時間、結束瀏覽時間)(3)節目資源的數據信息:節目資源的元信息(片名、類別、供應商、導演、主演、內容介紹、時長、集數)以及節目資源的綜合評分(網絡評分以及用戶評分)(4)其他數據:為了彌補節目資源元數據的不足,也需要利用網絡爬蟲技術,從互聯網上獲取節目資源相關的元數據作為數據信息的補充。3.2數據處理。跟一般的挖掘分析相同,推薦系統需要對已有的數據信息進行數據清洗以及整理,將重復的、不合理的以及錯誤的數據去除掉,并對符合要求的數據進行格式化處理。3.3數據分析。經過處理后的數據依然不能講用戶和物品關聯起來,要想給用戶推薦個性化的物品,就需要通過建模來對用戶和物品進行聚類分析,并依據特定算法用戶的個性化需求。推薦算法一般包括:協同過濾、基于內容的推薦、基于知識的推薦以及基于上下文的推薦系統等。本文中使用了基于內容的推薦和協同過濾兩種算法作為系統的推薦算法。3.4數據展示數據展示部分就是將推薦算法得出的接口通過特定的方式提供給用戶,比如:機頂盒首頁個性推薦、其他系統頁面以及各類數據接口等。

4系統實現

依據有線節目資源推薦系統的需求分析,我們結合爬蟲數據整理了有線節目資源的元數據,實時記錄了有線用戶的點播數據(瀏覽信息以及點播信息),并依據推薦模型采用基于內容的推薦算法和協同過濾算法的混合算法作為整個系統的推薦算法,對有線節目進行分類排行以及個性推薦。4.1分類排行。包含熱門節目排行、熱門影星參演排行、經典老片以及綜合評分排行等,為有線用戶提供最常用的節目資源推薦(如圖2所示)。4.2個性化推薦。個性推薦與單個用戶對節目的喜好有關,依據用戶的歷史行為通過推薦算法來推斷用戶的喜好,從而為用戶提供可能感興趣的節目資源,相對于分類排行而言,個性推薦更加地智能化(如圖3所示)。

5結語

本系統是針對合肥有線節目資源進行的數據分析,為有線互動點播業務提供長尾分析以及資源推薦,其實現主要包括兩部分,其一,合肥有線節目資源與爬蟲信息的基礎信息整合;其二,基于內容的推薦算法和協同過濾算法對推薦模型的數據進行大數據分析。實踐證明,該系統對有線節目資源進行的大數據分析為合肥有線互動點播業務提供了強有力的技術支持。

參考文獻:

[1][美]CharuC.,Aggarwal.推薦系統:原理與實踐[M].王宏志,譯.機械工業出版社,2018.

[2]美弗朗西斯科•里奇著推薦系統:技術、評估及高效算法[M].李艷民,譯.機械工業出版社,2018.

[3][美]BruceEckel.Java編程思想[M].陳昊鵬,譯.2007-06-01.

[4][美]CraigWalls.Spring實戰[M].張衛濱,譯.2016.

[5][美]湯姆,懷特.Hadoop權威指南:大數據的存儲與分析[M].王海,華東,劉喻,呂粵海,譯清華大學出版社,2017.

作者:張軍 單位:合肥有線電視寬帶網絡有限公司