當前位置: 首頁 > 專利查詢>浙江大學專利>正文

一種基于手機App安裝列表的用戶畫像方法技術

技術編號:23191072 閱讀:19 留言:0更新日期:2020-01-24 16:19
本發明專利技術公開了一種基于手機App安裝列表的用戶畫像方法,包括以下步驟:(1)獲取欲畫像用戶的手機App安裝列表并進行預處理;(2)對預處理后的所述手機用戶的App安裝列表提取關鍵特征,得到所述用戶的特征,建立特征空間;(3)基于所述的特征空間,對用戶進行表征;(4)針對所述的用戶表征向量,分別進行有監督和無監督的方法,完成所述的用戶畫像。由此可見,本發明專利技術方法利用布爾矩陣分解方法從手機App安裝列表中提取關鍵特征,有效地刻畫用戶的特性,從而完成對用戶的畫像。

A user portrait method based on mobile app installation list

【技術實現步驟摘要】
一種基于手機App安裝列表的用戶畫像方法
本專利技術屬于數據分析
,具體涉及一種基于手機App安裝列表的用戶畫像方法。
技術介紹
用戶畫像是指對用戶相關的真實數據進行統計分析,提煉代表性的信息,進而挖掘出該用戶的一系列屬性與特征信息(如興趣愛好、生活習慣、社會屬性、性格、價值觀等)。目前,用戶畫像在精準廣告投放、精準營銷、個性化推薦、產品優化、業務經營等方面有巨大的商業價值,是面向個人用戶市場的各大企業必爭的戰略核心技術,理解用戶的屬性與特征可大幅度提升廣告轉化率。國內外很多互聯網巨頭公司都是以廣告為主要盈利模式,例如Facebook、Google、百度等,據統計2017年Facebook全年收益98%來自于廣告。根據對用戶的理解,企業可分析潛在用戶,針對特定用戶進行營銷,服務提供商可根據用戶的需求與偏好,對用戶推薦和定制個性化產品與服務;企業還可根據對用戶個性化信息的理解,對產品進行針對性地優化,以提升用戶體驗;同時,還可以制定針對性的企業發展戰略,以擴大用戶數目,增加企業的競爭能力。隨著移動互聯網的發展和數據挖掘等技術的不斷進步,對用戶的理解會更加深入與全面,例如心理、人格層面等,深層次的個性化信息將會被越來越重視,用戶畫像在未來會進一步提升服務精準度,為企業帶來更多的利益。隨著智能手機的迅速普及,智能手機感知數據為用戶進行畫像開啟了一扇新的大門;作為移動互聯網的主要載體,智能手機逐漸成為人們日常生活中不可或缺的一部分?,F在全球約有20億的用戶使用智能手機,用戶在使用手機的過程中產生了大量的跟用戶相關的信息;由于智能手機通常被同一個用戶使用,這些數據往往隱含了豐富的一個用戶的個性化信息,智能手機為推測用戶屬性與特征進行用戶畫像提供了新的信息渠道。手機應用(App)在眾多的智能手機感知數據類型中,與用戶的個性化信息密切相關聯。隨著智能手機的迅猛發展,手機App市場爆炸式增長;其中,蘋果手機的AppStore大約有200萬個App,安卓手機的GooglePlay約有220萬個App;應用幾乎覆蓋了用戶日常生活中方方面面的需求,例如餐飲、外出旅游、辦公、天氣、日歷、生活助手等。用戶根據自己的需求、偏好、習慣等從應用市場上下載安裝和使用應用,手機App成為用戶使用手機各種服務的主要入口;手機上安裝了什么應用,即手機App安裝列表可在很大程度上反映用戶的個人信息,如各種基本屬性(例如,性別、年齡、職業等)、興趣偏好、性格、生活方式等。因此,手機App安裝列表給我們提供了一個對用戶畫像的便捷途徑。
技術實現思路
鑒于上述,本專利技術提供了一種基于手機App安裝列表的用戶畫像方法,能夠有效地刻畫用戶的特性,從而完成對用戶的畫像。一種基于手機App安裝列表的用戶畫像方法,包括如下步驟:(1)收集大量用戶的手機App安裝列表并進行預處理,以確定用戶數量m以及APP數量n;(2)構建用戶與APP的關聯矩陣U,并對其進行布爾矩陣分解U=CB,C為用戶系數矩陣且維度為m×k,B為特征矩陣且維度為k×n,k為自定義的特征數量;(3)對于待畫像的用戶,根據其手機App安裝列表確定這些用戶的App安裝向量;(4)使待畫像用戶的App安裝向量乘以B的偽逆矩陣,得到這些用戶的特征向量;(5)根據特征向量通過有監督和無監督的方式分別對待畫像用戶進行分類和聚類,同時根據所具備的特征為每一待畫像用戶打上標簽。進一步地,所述步驟(1)中對手機App安裝列表進行預處理的方法為:首先設定相關閾值,若某一App,其安裝人數小于一定閾值的話,則剔除該App及其相關信息;若某一用戶,其手機App安裝列表上的App數量小于一定閾值的話,則剔除該用戶及其相關信息。進一步地,所述關聯矩陣U的維度為m×n且每一元素值為0或1,若其中第i行第j列元素值uij=1,則表示第i個用戶的手機App安裝列表中存在有第j個APP,否則uij=0;i和j均為自然數且1≤i≤m,1≤j≤n。進一步地,所述步驟(2)中對關聯矩陣U進行布爾矩陣分解的具體過程為:首先計算關聯矩陣U中任意兩列之間的相關性,形成一個m×m大小的實數矩陣R,其中每一元素值代表兩個App的關聯性;然后將實數矩陣R轉換為布爾矩陣A,布爾矩陣A中每一個行向量作為形成特征矩陣B的候選向量;最后設計目標函數,以貪心的方式從布爾矩陣A中選擇行向量來補全特征矩陣B,同時生成用戶系數矩陣C的列向量,重復k次,最終得到兩個矩陣B和C。進一步地,所述特征矩陣B用于描述每個特征對應有哪些APP,矩陣B中每一元素值為0或1,若其中第p行第j列元素值bpj=1,則表示第j個APP具備第p個特征,否則bpj=0;p和j均為自然數且1≤p≤k,1≤j≤n。進一步地,所述用戶系數矩陣C用于描述每個用戶具備哪些特征,矩陣C中每一元素值為0或1,若其中第i行第p列元素值cip=1,則表示第i個用戶具備第p個特征,否則cip=0;i和p均為自然數且1≤i≤m,1≤p≤k。進一步地,所述步驟(3)中用戶App安裝向量的維度為1×n且每一元素值為0或1,若其中第j列元素值=1,則表示該用戶的手機App安裝列表中存在有第j個APP,否則第j列元素值=0,j為自然數且1≤j≤n。進一步地,所述步驟(5)中采用眾包的方式獲得每個特征的語義,所述特征向量的維度為k×1且每一元素值為0或1,若其中第p行元素值=1,則表示用戶具備第p個特征,否則第p行元素值=0;對于待畫像用戶,根據其特征向量中對應元素值為1的所有特征語義為用戶打上標簽。由此可見,本專利技術利用布爾矩陣分解等方法從用戶的手機App安裝列表中提取關鍵特征,并有效刻畫用戶的特性,從而完成對用戶的畫像。附圖說明圖1為本專利技術用戶畫像方法的整體流程示意圖。圖2為本專利技術用戶畫像方法中布爾矩陣分解的流程示意圖。圖3為本專利技術基于手機用戶畫像的結構示意圖。具體實施方式為了更為具體地描述本專利技術,下面結合附圖及具體實施方式對本專利技術的技術方案進行詳細說明。如圖1所示,本專利技術基于手機App安裝列表的用戶畫像方法,包括如下步驟:(1)收集大量用戶的手機App安裝列表并進行預處理,以確定用戶數量m以及APP數量n;(2)構建用戶與APP的關聯矩陣U,并對其進行布爾矩陣分解U=CB,C為用戶系數矩陣且維度為m×k,B為特征矩陣且維度為k×n,k為自定義的特征數量;(3)對于待畫像的用戶,根據其手機App安裝列表確定這些用戶的App安裝向量;(4)使待畫像用戶的App安裝向量乘以B的偽逆矩陣,得到這些用戶的特征向量;(5)根據特征向量通過有監督和無監督的方式分別對待畫像用戶進行分類和聚類,同時根據所具備的特征為每一待畫像用戶打上標簽。由此可見,本專利技術方法利用布爾矩陣分解方法從手機App安裝列表中提取關鍵特征,有效地刻畫用戶的特性,從而完成對用戶的畫像。在具體實施過程中,本實施例針對手機用戶的A本文檔來自技高網
...

【技術保護點】
1.一種基于手機App安裝列表的用戶畫像方法,包括如下步驟:/n(1)收集大量用戶的手機App安裝列表并進行預處理,以確定用戶數量m以及APP數量n;/n(2)構建用戶與APP的關聯矩陣U,并對其進行布爾矩陣分解U=CB,C為用戶系數矩陣且維度為m×k,B為特征矩陣且維度為k×n,k為自定義的特征數量;/n(3)對于待畫像的用戶,根據其手機App安裝列表確定這些用戶的App安裝向量;/n(4)使待畫像用戶的App安裝向量乘以B的偽逆矩陣,得到這些用戶的特征向量;/n(5)根據特征向量通過有監督和無監督的方式分別對待畫像用戶進行分類和聚類,同時根據所具備的特征為每一待畫像用戶打上標簽。/n

【技術特征摘要】
1.一種基于手機App安裝列表的用戶畫像方法,包括如下步驟:
(1)收集大量用戶的手機App安裝列表并進行預處理,以確定用戶數量m以及APP數量n;
(2)構建用戶與APP的關聯矩陣U,并對其進行布爾矩陣分解U=CB,C為用戶系數矩陣且維度為m×k,B為特征矩陣且維度為k×n,k為自定義的特征數量;
(3)對于待畫像的用戶,根據其手機App安裝列表確定這些用戶的App安裝向量;
(4)使待畫像用戶的App安裝向量乘以B的偽逆矩陣,得到這些用戶的特征向量;
(5)根據特征向量通過有監督和無監督的方式分別對待畫像用戶進行分類和聚類,同時根據所具備的特征為每一待畫像用戶打上標簽。


2.根據權利要求1所述的用戶畫像方法,其特征在于:所述步驟(1)中對手機App安裝列表進行預處理的方法為:首先設定相關閾值,若某一App,其安裝人數小于一定閾值的話,則剔除該App及其相關信息;若某一用戶,其手機App安裝列表上的App數量小于一定閾值的話,則剔除該用戶及其相關信息。


3.根據權利要求1所述的用戶畫像方法,其特征在于:所述關聯矩陣U的維度為m×n且每一元素值為0或1,若其中第i行第j列元素值uij=1,則表示第i個用戶的手機App安裝列表中存在有第j個APP,否則uij=0;i和j均為自然數且1≤i≤m,1≤j≤n。


4.根據權利要求1所述的用戶畫像方法,其特征在于:所述步驟(2)中對關聯矩陣U進行布爾矩陣分解的具體過程為:首先計算關聯矩陣U中任意兩列之間的相關性,形成一個m×m大小的實數矩陣R,其...

【專利技術屬性】
技術研發人員:潘綱,趙莎,陶建容,李石堅,
申請(專利權)人:浙江大學,
類型:發明
國別省市:浙江;33

網友詢問留言 已有0條評論
  • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

1
白小姐心水论坛