時間:2022-08-25 12:22:49
開篇:寫作不僅是一種記錄,更是一種創(chuàng)造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇個性化推薦系統(tǒng),希望這些內(nèi)容能成為您創(chuàng)作過程中的良師益友,陪伴您不斷探索和進步。
關(guān)鍵詞:云計算;技術(shù);個性化;系統(tǒng)
中圖分類號: TP3 文獻標識碼: A 文章編號: 1673-1069(2016)32-166-2
0 引言
如今,互聯(lián)網(wǎng)技術(shù)的深入發(fā)展,開始與各個領(lǐng)域?qū)崿F(xiàn)有機融合,更多的人開始參與到在線購物、社交網(wǎng)絡(luò)等網(wǎng)絡(luò)活動中,網(wǎng)絡(luò)給人們提供了一個無限的信息資源空間,這個資源庫中包含了各式各樣的信息,隨之發(fā)展起來的信息檢索技術(shù)便捷了人們對信息的搜索需求,搜索引擎成為用戶獲取信息的主要渠道,但該技術(shù)無法為用戶提供個性化的興趣服務(wù),這就需要建立基于云計算的個性化推薦系統(tǒng),這也是本文所要分析的主要內(nèi)容。
1 云計算技術(shù)與個性化推薦系統(tǒng)概述
1.1 云計算技術(shù)
云計算技術(shù)依托的是互聯(lián)網(wǎng),將互聯(lián)網(wǎng)的相關(guān)服務(wù)以動態(tài)化、易擴展、虛擬化的資源提供給用戶。云計算的定義有很多種,目前較為認可的是云計算技術(shù)是根據(jù)用戶使用量來進行相應(yīng)交易的計算模式,云計算能夠為用戶提供便捷、按需的網(wǎng)絡(luò)訪問,進入網(wǎng)絡(luò)、服務(wù)器、應(yīng)用軟件等可配置的計算資源共享區(qū)域,這些可以快速提供的資源,無須進行過多的管理,并與服務(wù)供應(yīng)商交互不多[1]。云計算平臺所擁有的超強計算能力,可以應(yīng)用在模擬核爆炸、預(yù)測市場發(fā)展趨勢及氣候變化等活動中。
1.2 個性化推薦系統(tǒng)
推薦系統(tǒng)就是結(jié)合用戶或顧客的購買行為規(guī)律以及興趣特點來推薦相應(yīng)的信息或商品,使用戶滿意。現(xiàn)如今,電子商務(wù)發(fā)展態(tài)勢迅猛,商品的種類和數(shù)量與日俱增,網(wǎng)絡(luò)信息是冗雜的,用戶或顧客需要花費大量的時間找尋目標信息與商品,信息過載問題直接影響了用戶或顧客的滿意度,導(dǎo)致用戶的流失。個性化推薦系統(tǒng)在此形勢下應(yīng)運而生,所謂個性化推薦系統(tǒng)是利用海量數(shù)據(jù)挖掘技術(shù),通過云計算平臺構(gòu)建的一種高級商務(wù)智能平臺,主要服務(wù)于網(wǎng)站,為用戶提供完全個性化的決策支持和信息服務(wù)[2]。
2 基于云計算技術(shù)的個性化推薦系統(tǒng)分析
2.1 推薦算法與推薦策略
2.1.1 推薦算法
推薦系統(tǒng)利用各個網(wǎng)頁間、網(wǎng)頁與關(guān)鍵詞之間的粗粒度關(guān)聯(lián)和排序,實現(xiàn)為用戶推薦相應(yīng)信息與商品的服務(wù)。隨著系統(tǒng)的不斷發(fā)展,其也開始利用網(wǎng)絡(luò)化計算能力,注重用戶興趣與模型的分析,而個性化推薦系統(tǒng)是在推薦系統(tǒng)的基礎(chǔ)上建立的更高級的信息導(dǎo)向系統(tǒng)。個性化推薦系統(tǒng)的構(gòu)建需要推薦算法的支持,常用的有協(xié)同過濾推薦算法、基于內(nèi)容的推薦算法、關(guān)聯(lián)規(guī)則推薦算法、混合推薦算法等。其中協(xié)同過濾推薦算法還可以細分,根據(jù)不同的算法特征分為基于用戶的推薦算法(也叫作基于存儲的算法、基于鄰居的算法)、基于項目的推薦算法、基于模型的推薦算法等。這些推薦算法都具有自身的優(yōu)缺點(詳見表1),為了彌補各類推薦算法的缺陷,可以將兩種互補的算法結(jié)合起來[3]。例如基于內(nèi)容的算法和協(xié)同過濾算法這兩種算法,我們可以為用戶直接展示用不同算法得出的推薦結(jié)果集,也可以先用第一種算法得出一種結(jié)果集,再用第二種算法計算第一種結(jié)果集,進而得到更加精確的結(jié)果,更好地滿足用戶的需求。
2.1.2 推薦策略
以往許多的推薦系統(tǒng)都是結(jié)合單一的推薦算法和推薦策略建立的,在使用的過程中逐步暴露除了系統(tǒng)個性化與適應(yīng)性方面的缺陷,無法結(jié)合實際的應(yīng)用優(yōu)化推薦策略。因此,在構(gòu)建個性化推薦系統(tǒng)時要充分結(jié)合當下推薦系統(tǒng)的優(yōu)勢以及瞬息萬變的市場需求,制定出綜合化、系統(tǒng)化、合理化、可行性較高的推薦策略。
前文分析了各類推薦算法的優(yōu)缺點及應(yīng)用場景,基于此,本文提出的個性化推薦系統(tǒng)中應(yīng)用的推薦策略是根據(jù)推薦系統(tǒng)數(shù)據(jù)量的大小制定的,當數(shù)據(jù)量偏小時系統(tǒng)會采用傳統(tǒng)的個性化推薦算法;當數(shù)據(jù)量偏大時系統(tǒng)會利用云計算平臺進行計算,具體就是將數(shù)據(jù)集發(fā)送到云平臺的各個節(jié)點來實現(xiàn)多節(jié)點分布式大規(guī)模數(shù)據(jù)計算。
2.2 系統(tǒng)架構(gòu)及流程設(shè)計
2.2.1 系統(tǒng)架構(gòu)
云計算技術(shù)集成了分布式計算、網(wǎng)格計算、并行計算和網(wǎng)絡(luò)存儲等先進的技術(shù),其有機整合了多個經(jīng)濟性較好的計算實體,逐步形成了具有超強計算能力的分布式系統(tǒng)。為了充分發(fā)揮出云計算技術(shù)的優(yōu)勢,本文設(shè)計的基于Google云計算平臺的個性化推薦系統(tǒng)架構(gòu)如圖1所示,該系統(tǒng)能夠?qū)Υ笠?guī)模數(shù)據(jù)進行快速、準確地處理,并且可以根據(jù)業(yè)務(wù)規(guī)模的不斷擴大進行相應(yīng)的拓展,充分展示了較高的通用性與擴展性[4]。
基于云計算技術(shù)的個性化推薦系統(tǒng)主要包括以下幾部分:①推薦計算子系統(tǒng),該子系統(tǒng)由數(shù)據(jù)預(yù)處理模塊、數(shù)據(jù)挖掘模塊、推薦模塊組成,其中數(shù)據(jù)預(yù)處理模塊的功能包括異構(gòu)數(shù)據(jù)的過濾、統(tǒng)計、轉(zhuǎn)換等;數(shù)據(jù)挖掘模塊主要是計算推薦結(jié)果的聚類,需要充分利用聚類、關(guān)聯(lián)規(guī)則算法進行分別計算;推薦模塊則是利用各類算法計算出精準的推薦結(jié)果,已達到用戶的需求。②業(yè)務(wù)應(yīng)用子系統(tǒng),該子系統(tǒng)主要是為后期的系統(tǒng)擴展服務(wù),根據(jù)業(yè)務(wù)需求的變化轉(zhuǎn)變系統(tǒng)的功能,并為系統(tǒng)需求制定合理的推薦規(guī)則。③基礎(chǔ)云計算平臺,其充分利用集群提供的大容量計算能力,在不同節(jié)點上進行大量的計算。
2.2.2 個性化推薦系統(tǒng)的操作流程
本系統(tǒng)的推薦流程是依據(jù)Map Reduce軟件架構(gòu),其是處理海量數(shù)據(jù)的并行編程模式,主要適合應(yīng)用于大規(guī)模數(shù)據(jù)集的并行運算,其封裝了并行處理、容錯處理、本地化計算、負載均衡等細節(jié),還提供可以把大容量的計算自動并發(fā)和分布執(zhí)行的簡單通用接口。具體如圖2所示[5]。
3 結(jié)束語
綜上所述,開發(fā)設(shè)計基于云計算技術(shù)的個性化推薦系統(tǒng)是適應(yīng)時展需求的,其能夠更好地滿足和引導(dǎo)用戶信息需求。本文設(shè)計的系統(tǒng)還不完善,還需在以后的運行實踐過程中不斷的改進。
參 考 文 獻
[1] 肖理釧.基于云計算模式的圖書文獻個性化推薦技術(shù)研究[J].科技廣場,2015(08):22-27.
[2] 毅,劉亞軍,陳誠.基于云計算技術(shù)的個性化推薦系統(tǒng)[J].計算機工程與應(yīng)用,2015(13):111-117.
[3] 谷瑞.基于云計算的個性化推薦系統(tǒng)的研究[J].蘇州市職業(yè)大學(xué)學(xué)報,2013(04):14-16+21.
關(guān)鍵詞:個性化;采集;推薦
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2013)36-8222-03
基于社會計算的個性化推薦系統(tǒng)的設(shè)計,主要以新浪博客網(wǎng)頁作為數(shù)據(jù)源來采集設(shè)計的,繼而為其網(wǎng)頁文檔信息創(chuàng)建索引。主要模塊包括網(wǎng)頁文本信息采集,lucene索引庫,搜索推薦主干,系統(tǒng)管理等。
為了實現(xiàn)網(wǎng)頁文檔信息的自動采集功能,本系統(tǒng)將采集模塊設(shè)置了后臺管理參數(shù),來實現(xiàn)信息的自動“爬蟲”功能,而為了使推薦模塊能夠基于用戶的信息關(guān)鍵詞來搜索并提高效率,就必須實現(xiàn)用戶信息的即時搜索和反饋推薦功能。其詳細設(shè)計如下:
1 系統(tǒng)流程分析
1)系統(tǒng)業(yè)務(wù)處理流程:首先,管理員利用爬蟲進行數(shù)據(jù)的采集,并將采集到的數(shù)據(jù)(博客網(wǎng)頁文檔)存儲進入本地數(shù)據(jù)庫。采集完成即可對數(shù)據(jù)庫中的文檔建立索引。用戶登錄系統(tǒng)前臺輸入關(guān)鍵詞進行搜索之后,服務(wù)器下達命令于搜索引擎,進行搜索并且對與關(guān)鍵字相關(guān)的數(shù)據(jù)進行協(xié)同過濾,最后推薦出用戶感興趣的信息,其處理流程如圖1示,系統(tǒng)業(yè)務(wù)流程分析圖。
2)系統(tǒng)數(shù)據(jù)處理流程:管理員登入系統(tǒng)后臺爬蟲參數(shù)設(shè)置界面,設(shè)置好采集數(shù)據(jù)參數(shù),進而在數(shù)據(jù)采集頁面進行抓取網(wǎng)頁文檔,在數(shù)據(jù)采集完成之對采集到的數(shù)據(jù)建立索引,其中包括博文的題目、作者、采集時間等。用戶登錄系統(tǒng)前臺主頁,輸入搜索的數(shù)據(jù),即關(guān)鍵詞進行搜索,程序服務(wù)器往后臺數(shù)據(jù)庫發(fā)送命令,數(shù)據(jù)庫返回協(xié)同過濾后的搜索結(jié)果給程序服務(wù)器,再完成所搜索到的博文以及其作者的反饋推薦。其處理流程如圖2示,系統(tǒng)數(shù)據(jù)流程分析圖。
2 系統(tǒng)概要設(shè)計
1)系統(tǒng)概念結(jié)構(gòu)設(shè)計:概念結(jié)構(gòu)設(shè)計就是根據(jù)需求分析的結(jié)果,以規(guī)定的方法將其轉(zhuǎn)化為一個概念數(shù)據(jù)模型。而概念數(shù)據(jù)模型,是根據(jù)系統(tǒng)的需求點來對數(shù)據(jù)和信息進行建模,采用E-R關(guān)系圖來描述。其系統(tǒng)總體E-R圖,如圖3示。
2)系統(tǒng)數(shù)據(jù)庫設(shè)計:本系統(tǒng)選用Mysql數(shù)據(jù)庫。從個性化推薦系統(tǒng)的功能需求點出發(fā),在系統(tǒng)中設(shè)計了采集信息配置表(如圖4示)、信息推薦表等數(shù)據(jù)庫表(如圖5示),可以準確有效地存儲采集到的數(shù)據(jù)。
3)安全性設(shè)計:為了系統(tǒng)安全,采用身份和密碼雙重登陸驗證機制,來確保系統(tǒng)后臺管理只有管理員能夠才能夠登陸,進行爬蟲參數(shù)設(shè)置、數(shù)據(jù)采集、索引建立以及采集信息查看等操作,保證了系統(tǒng)數(shù)據(jù)的安全性。
此外,還加設(shè)了數(shù)據(jù)庫的安全工具策略,如對數(shù)據(jù)庫中表字段或內(nèi)容的編輯功能等操作,需要特定的數(shù)據(jù)庫管理工具配合才能進行,從而進一步提高數(shù)據(jù)的安全性。
3 系統(tǒng)詳細設(shè)計
1)系統(tǒng)功能結(jié)構(gòu)設(shè)計:根據(jù)系統(tǒng)概要設(shè)計,將本系統(tǒng)分為前臺交互和后臺數(shù)據(jù)處理,由四個模塊共同組成:爬蟲采集網(wǎng)頁文檔和信息、lucene索引的創(chuàng)建,以及操控數(shù)據(jù)庫、搜索主干、前臺輸入輸出處理。各個模塊分工協(xié)作運行。其系統(tǒng)功能結(jié)構(gòu)如圖6示。
本系統(tǒng)管理和界面設(shè)計,包含了前臺和后臺相聯(lián)構(gòu)建的內(nèi)容,采用了Eclipse Tomcat服務(wù)器和JSP技術(shù)。以lucene創(chuàng)建索引,數(shù)據(jù)庫應(yīng)用了mysql,并使用JDBC來實現(xiàn)編程的友好交互,從而設(shè)計出友好的用戶界面。此外,在整個系統(tǒng)的設(shè)計上,采用了 B/S 三層體系結(jié)構(gòu)(如圖7示)。管理員使用網(wǎng)頁瀏覽工具向應(yīng)用服務(wù)器發(fā)送服務(wù)請求,應(yīng)用服務(wù)器接收請求,并且執(zhí)行業(yè)務(wù)邏輯,將操作人員想要的信息返回瀏覽工具顯示,確保整個系統(tǒng)使用過程的開放性與安全性。
本系統(tǒng)中抓取網(wǎng)頁文檔是系統(tǒng)的信息數(shù)據(jù)基礎(chǔ),也是數(shù)據(jù)的來源,只有有了豐富的數(shù)據(jù)源,才能夠提供有效的服務(wù)。因此,本系統(tǒng)測試過程,主要以新浪博客網(wǎng)頁作為數(shù)據(jù)源,來抓取其頁面的文本, heritrix爬蟲具有良好的擴充功能,可以通過編程進行過濾來抓取另外的文本。通過采集網(wǎng)頁的信息,來對網(wǎng)頁中有價值的數(shù)據(jù)實行提取,過濾掉那些無作用的數(shù)據(jù),只留下有效性的文本信息,來提高存儲的利用效率,其數(shù)據(jù)采集結(jié)果主要包括該博客網(wǎng)頁文檔以及該博客的地址,博客的題目、內(nèi)容、作者以及采集的時間等,如圖8數(shù)據(jù)采集過程圖和圖9數(shù)據(jù)采集查看圖所示。而搜索推薦主干同樣是利用lucene實現(xiàn),搜索的關(guān)鍵字在已經(jīng)創(chuàng)建的索引庫中搜查對應(yīng)的文本。
4 系統(tǒng)實現(xiàn)
基于社會計算的個性化推薦系統(tǒng)使用軟件MyEclipse 8.5集成開發(fā)實現(xiàn),采用JAVA語言來進行開發(fā),頁面采用jsp語言來設(shè)計實現(xiàn),而數(shù)據(jù)庫則是利用Mysql來實現(xiàn),從而實現(xiàn)了根據(jù)用戶的需求和興趣為用戶推薦出有價值的結(jié)果集,使用戶能夠在更短的時間獲取到自己想要的信息,其結(jié)果轉(zhuǎn)換如圖10 系統(tǒng)推薦實現(xiàn)圖所示。
參考文獻:
[1] 陳諾言.基于個性化推薦引擎組合的推薦系統(tǒng)的設(shè)計與實現(xiàn)[D].廣州:華南理工大學(xué),2012.
[2] 梁弼,王光瓊,鄧小青.基于 Lucene 的全文檢索系統(tǒng)模型的研究及應(yīng)用[J]. 微型機與應(yīng)用, 2011(3).
【關(guān)鍵詞】電子商務(wù) 專家系統(tǒng) 電子商務(wù)個性化推薦技術(shù)
電子商務(wù)個性化推薦技術(shù)是指在電子商務(wù)網(wǎng)站在客戶進行電子商務(wù)交易的過程中,根據(jù)用戶的個性化完成對用戶產(chǎn)品的推薦工作,通過對其網(wǎng)站系統(tǒng)內(nèi)部超多的數(shù)據(jù)挖掘來有效的匹配到客戶心目中的理想產(chǎn)品類型,為客戶提供符合其個性化要求的產(chǎn)品購買信息以及相關(guān)服務(wù)功能。事實上,隨著電子商務(wù)行業(yè)的不斷進步以及發(fā)展,電子商務(wù)個性化推薦技術(shù)已經(jīng)形成了專業(yè)成熟的電子商務(wù)個性化推薦系統(tǒng),在電子商務(wù)網(wǎng)站的運營過程為客戶的購買行為提供者非常重要和直觀的技術(shù)支撐,保證客戶個性化要求的滿足。而在電子商務(wù)個性化推薦技術(shù)的組成結(jié)構(gòu)中添加相應(yīng)的專家系統(tǒng)模式,能夠更加有效的分析出客戶在電子商務(wù)購買行為中的購買需求、購買期望、購買目的,更好的幫助電子商務(wù)個性化推薦系統(tǒng)完成對不同客戶的定位和識別,促進客戶完成交易過程。
1 專家系統(tǒng)的主要內(nèi)容
專家系統(tǒng)指的是一種專用的智能計算機程序系統(tǒng),其內(nèi)部含有大量的某一領(lǐng)域的專家水平的知識與經(jīng)驗,能夠通過對這種經(jīng)驗的分析和應(yīng)用有效的解決這一領(lǐng)域中出現(xiàn)的諸多問題。事實上,專家系統(tǒng)的組成結(jié)構(gòu)與電子商務(wù)個性化推薦系統(tǒng)的組成結(jié)構(gòu)是較為相似的,其二者都共同存在輸入模塊、數(shù)據(jù)收集以及分析處理模塊和最終的輸出模塊等等,在電子商務(wù)個性化推薦系統(tǒng)中添加關(guān)于專家系統(tǒng)的智能程序,能夠有效的提升電子商務(wù)個性化推薦系統(tǒng)中的智能型,使其能夠更加充分的面對客戶在電子商務(wù)交易行為中的種種決策并提供相應(yīng)的信息幫助。
2 基于專家系統(tǒng)的電子商務(wù)個性化推薦系統(tǒng)的主要組成
正如上文所述,專家系統(tǒng)的強大之處在于其可以利用某一領(lǐng)域的專家知識,模擬專家決策時候的決策方式以及相應(yīng)的推理和判斷方式來解決某一領(lǐng)域中出現(xiàn)的諸多問題。在電子商務(wù)個性化推薦系統(tǒng)中應(yīng)用專家系統(tǒng)這一程序,首先應(yīng)該確定專家系統(tǒng)的主要領(lǐng)域以及相關(guān)的信息知識內(nèi)容。具體來講,電子商務(wù)個性化推薦系統(tǒng)中專家系統(tǒng)應(yīng)該包含的領(lǐng)域和知識內(nèi)容應(yīng)該包括消費領(lǐng)域以及心理領(lǐng)域等等,其具體的知識內(nèi)容應(yīng)該包括電子商務(wù)客戶的行為需求特征分析、電子商務(wù)客戶的行為適宜行為需求特征分析、電子商務(wù)客戶的決策行為需求特征分析等等,而專家系統(tǒng)在電子商務(wù)個性化推薦系統(tǒng)中的主要應(yīng)用流程應(yīng)該包括消費者描述自身的需求、專家系統(tǒng)分析適合消費者的需求、專家系統(tǒng)提取相應(yīng)的產(chǎn)品信息滿足消費者的需求以及專家系統(tǒng)在最后的過程中對于產(chǎn)品的優(yōu)點介紹和競爭優(yōu)勢介紹等等,為消費者的最終決策提供信息幫助。
根據(jù)上述分析,基于專家系統(tǒng)的電子商務(wù)個性化推薦系統(tǒng)的主要結(jié)構(gòu)應(yīng)該包含專家系統(tǒng)的核心規(guī)則數(shù)據(jù)庫(靜態(tài)數(shù)據(jù)庫)和電子商務(wù)網(wǎng)站的商品數(shù)據(jù)庫以及客戶數(shù)據(jù)庫(動態(tài)數(shù)據(jù)庫),同時使用咨詢子系統(tǒng)、規(guī)則子系統(tǒng)以及結(jié)果子系統(tǒng)來實現(xiàn)專家系統(tǒng)核心規(guī)則數(shù)據(jù)庫以及電子商務(wù)網(wǎng)站動態(tài)數(shù)據(jù)庫之間的有效銜接和運用。
2.1 專家系統(tǒng)核心規(guī)則數(shù)據(jù)庫
邏輯上個性化推薦系統(tǒng)的靜態(tài)數(shù)據(jù)庫可以使用專家系統(tǒng)的核心規(guī)則數(shù)據(jù)庫作為程序建立的核心內(nèi)容,用來存放專家系統(tǒng)運行的領(lǐng)域知識結(jié)構(gòu)以及內(nèi)容,并設(shè)置相應(yīng)的輔助參數(shù)保證專家系統(tǒng)核心規(guī)則數(shù)據(jù)庫的良好運行。
2.1.1 規(guī)則特性
每一個規(guī)則包括四個特性,例如PREMISE規(guī)則的前提部分、ACTION規(guī)則的操作部分等等,同時注意CATEGORY規(guī)則按照上下文分類,每條規(guī)則只能用于某幾個上下文,以便調(diào)用;
2.1.2 設(shè)置參數(shù)
每個設(shè)置參數(shù)應(yīng)該各自存儲一組屬性,用來咨詢以及程序調(diào)用,同時規(guī)定好每一個參數(shù)的參數(shù)組名稱、參數(shù)取值范圍、參數(shù)的類型結(jié)構(gòu)。
2.2 動態(tài)數(shù)據(jù)庫
電子商務(wù)網(wǎng)站的用戶數(shù)據(jù)庫以及產(chǎn)品數(shù)據(jù)庫都隸屬于動態(tài)數(shù)據(jù)庫的存儲范圍,每一次客戶登錄或者登出的過程中,電子商務(wù)網(wǎng)站的動態(tài)數(shù)據(jù)庫都會隨之實時更新一次,添加相應(yīng)的動態(tài)數(shù)據(jù)內(nèi)容。動態(tài)數(shù)據(jù)庫對數(shù)據(jù)的主要存儲方式是根據(jù)相關(guān)對象、相關(guān)對象的具體屬性以及相關(guān)對象的具體參數(shù)數(shù)值(對象可信度、對象參數(shù)、對象跟蹤次數(shù))來確定對該對象的信息存儲、追蹤和使用過程。
2.2.1 電子商務(wù)用戶數(shù)據(jù)庫
電子商務(wù)用戶數(shù)據(jù)庫的存儲信息主要是商務(wù)網(wǎng)站瀏覽和登錄登出過程中各個用戶的主要信息,包括用戶的性別、年齡、職位、愛好、收藏、收入、購物經(jīng)歷以及其他相關(guān)信息等等。
2.2.2 電子商務(wù)商品數(shù)據(jù)庫
電子商務(wù)商品數(shù)據(jù)庫的存儲信息主要是諸多網(wǎng)站商戶的產(chǎn)品細細,包括產(chǎn)品的名稱、品牌、價格、尺寸、重量、功能、材料、生產(chǎn)日期、保質(zhì)期、售后服務(wù)以及其他相關(guān)的產(chǎn)品信息等等。
2.3 資訊子系統(tǒng)
資訊子系統(tǒng)的主要功能是根據(jù)客戶在電子商務(wù)網(wǎng)站上的登錄、訪問、收藏、購物等一系列信息對網(wǎng)站的客戶數(shù)據(jù)庫提供對客戶的定位信息,更好的做好客戶個性化產(chǎn)品的推薦工作,同時有效的滿足客戶產(chǎn)品咨詢的功能。
2.4 規(guī)則子系統(tǒng)
規(guī)則子系統(tǒng)的主要功能是專家系統(tǒng)的核心規(guī)則內(nèi)容,專家智能系統(tǒng)能夠憑借自身的核心規(guī)則以及規(guī)則子系統(tǒng)的有效連接來實現(xiàn)客戶的產(chǎn)品推薦工作。
2.5 結(jié)果子系統(tǒng)
結(jié)果子系統(tǒng)的主要功能是記錄客戶瀏覽、咨詢以及最終購買的過程,為客戶的可信度數(shù)值提供相應(yīng)的資訊信息,并記錄下客戶本次的操作內(nèi)容,為客戶的下次購買提供信息支持。
3 結(jié)語
綜上所述,本文對基于專家系統(tǒng)的電子商務(wù)個性化推薦系統(tǒng)的主要組成結(jié)構(gòu)以及相關(guān)功能進行了分析,電子商務(wù)網(wǎng)站在應(yīng)用專家系統(tǒng)的過程中仍然需要注意對專家系統(tǒng)智能模塊以及網(wǎng)站個性化推薦模塊兩者之間的有效連接和應(yīng)用,使專家系統(tǒng)能夠有效的融入在電子商務(wù)個性化推薦系統(tǒng)中并發(fā)揮功用。
參考文獻
[1]馬麗.電子商務(wù)個性化推薦技術(shù)分析及比較[J].計算機系統(tǒng)應(yīng)用.
關(guān)鍵詞:個性化服務(wù) Web使用挖掘 頻繁訪問模式 在線推薦
中圖分類號:TP311.52 文獻標識碼:A 文章編號:1007-9416(2012)07-0141-02
1、引言
互聯(lián)網(wǎng)已經(jīng)成為日常生活不可或缺的重要組成部分,然而隨著近年來爆炸式地增長,信息過載與信息迷失正逐漸制約著人們利用互聯(lián)網(wǎng)來高效地獲取有價值的信息。面對浩如煙海的網(wǎng)絡(luò)空間,如何快速定位到個人真正感興趣的資源是一個迫切需要解決的問題,個性化服務(wù)應(yīng)運而生。本文采用當前網(wǎng)絡(luò)開發(fā)的較為成熟的主流技術(shù),設(shè)計了一個基于Web使用數(shù)據(jù)挖掘的個性化推薦系統(tǒng)。
2、個性化服務(wù)的概述
2.1 個性化服務(wù)的主要方式
個性化服務(wù)是以用戶為中心的,解決和滿足用戶的信息服務(wù)的需要。目前,個性化服務(wù)方式主要有以下幾種:
(1)信息分類定制服務(wù):主要面對大眾提供可以定制的 web 頁面,具有為用戶創(chuàng)立和管理個人信息的功能,用戶可根據(jù)自己的需要定制個性化的界面設(shè)置、信息資源和服務(wù)形式,而系統(tǒng)會根據(jù)用戶的定制要求完成個性化的頁面設(shè)計,自動呈現(xiàn)用戶需要的信息類別。
(2)個性化信息檢索服務(wù):根據(jù)用戶的興趣和特點進行檢索,返回與用戶需求相關(guān)的檢索結(jié)果。這就要求個性化信息系統(tǒng)增加優(yōu)化查詢功能,通過內(nèi)容過濾等技術(shù),在檢索的同時考慮用戶的個性化差異,從而提高檢索質(zhì)量。
(3)個性化推薦服務(wù):主要是根據(jù)用戶的信息例如用戶的喜好,為滿足用戶的信息需求向用戶推送用戶喜好相關(guān)的信息,在這個過程中就是根據(jù)用戶的需求和目前的信息數(shù)據(jù)庫進行不斷的配對,將相關(guān)的信息推送給用戶。
2.2 個性化服務(wù)的相關(guān)技術(shù)
(1)數(shù)據(jù)挖掘是從大量的、不完整的、有噪聲的、模糊的和隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是可信的、潛在的和有價值的信息和知識的過程。
(2)信息推送技術(shù)是通過一定的標準和協(xié)議,在網(wǎng)絡(luò)上按照用戶的需求,定期主動傳送用戶需要的信息的一項計算機技術(shù)。推送技術(shù)的核心思想是建立一個信息機制,把由客戶端擔負的責任轉(zhuǎn)給服務(wù)器,由服務(wù)器將用戶定制好的感興趣的網(wǎng)上信息以推送或網(wǎng)播的方式直接傳送到用戶面前。
(3)信息過濾是指從動態(tài)的信息流中獲取符合用戶靜態(tài)需求的信息,或者根據(jù)需要禁止?jié)M足特定條件的信息流入。
(4)Web挖掘技術(shù)它可以從網(wǎng)絡(luò)瀏覽行為中抽取用戶感興趣的模式。通過對用戶瀏覽網(wǎng)站的日志數(shù)據(jù)進行收集、分析和處理,建立起用戶的行為和興趣模型,這些模型可以幫助理解用戶行為,改進站點結(jié)構(gòu)以及為用戶提供良好的個性化信息服務(wù)。
3、系統(tǒng)分析和設(shè)計
3.1 個性化服務(wù)的內(nèi)涵及特征
個性化信息服務(wù)是“信息爆炸”的背景下針對“信息過載”和“信息迷向”問題的重要解決方案之一。它基于用戶的學(xué)科、興趣和使用習(xí)慣等特征,利用網(wǎng)絡(luò)等信息技術(shù),通過用戶個人信息定制、系統(tǒng)推薦和信息推送等功能,針對不同的用戶需求,采用不同的服務(wù)方式,提供不同的信息內(nèi)容,實現(xiàn)多層面的個性化。從理論層面講,個性化信息服務(wù)是一種服務(wù)理念,從技術(shù)層面講,個性化信息服務(wù)是一個實現(xiàn)個性化服務(wù)的平臺。具休地說,個性化信息服務(wù)具有如下特征:
3.1.1 以用戶需求為中心
以用戶需求為中心包含兩層含義:一是以用戶的需求為導(dǎo)向設(shè)計與安排服務(wù)功能與設(shè)施;二是創(chuàng)建個性化的信息環(huán)境,按照用戶或用戶群的特點組織信息資源,提供多樣化的信息服務(wù)。
3.1.2 信息資源多元化
通過對各種館藏資源的有效組織、管理與配置,建立多元化的信息資源組織體系,為讀者利用館藏資源提供最大的便利。支持個性化服務(wù)系統(tǒng)的數(shù)據(jù)庫包含指向豐富信息內(nèi)容的鏈接,力爭達到讓用戶即需即得的效果。
3.1.3 具有智能化分析和挖掘用戶需求的功能
智能化分析是指主動采集并跟蹤用戶瀏覽的信息,一方面從用戶日常檢索瀏覽中主動學(xué)習(xí)用戶的興趣,推理并預(yù)測用戶需求,及時處理推薦信息;另一方面可根據(jù)不同用戶的相同點或相似性進行信息推薦,使需求相同的用戶之間共享查詢結(jié)果。
3.1.4 推薦信息的準確性、高效性
由個性化服務(wù)推薦給用戶的信息必須是準確的、高效的、適合用戶的。能通過使用信息過濾等技術(shù),屏蔽無關(guān)、無用的冗余信息,推薦精確、真實可用的信息;能自動地、智能地將大量的數(shù)據(jù)信息轉(zhuǎn)換為用戶所要求的或用戶可接受的系統(tǒng)知識形式,從而節(jié)約用戶時間,提高服務(wù)效率。
3.2 系統(tǒng)結(jié)構(gòu)設(shè)計
在Web使用挖掘的一般過程中,主要將其劃分為三個階段:數(shù)據(jù)預(yù)處理;模式發(fā)現(xiàn);模式分析與應(yīng)用,如圖1所示。
由于服務(wù)器日志并非專門用于數(shù)據(jù)挖掘,因此在進行Web使用挖掘之前必須對其進行處理過濾,解決數(shù)據(jù)的不一致性、不完整性等問題,使之符合Web挖掘的需要,這就是數(shù)據(jù)預(yù)處理階段,預(yù)處理的結(jié)果會直接影響到挖掘算法產(chǎn)生的規(guī)則和模式;模式發(fā)現(xiàn)階段即挖掘算法實施階段,是對預(yù)處理后的數(shù)據(jù)使用數(shù)據(jù)挖掘中的算法如關(guān)聯(lián)規(guī)則,聚類分析等來產(chǎn)生規(guī)則和模式;模式分析與應(yīng)用階段是整個Web使用挖掘過程的最后一步,此階段的主要目的是通過一定的技術(shù)和方法過濾掉模式發(fā)現(xiàn)階段產(chǎn)生的“不感興趣”的規(guī)則和模式。
3.3 系統(tǒng)功能模塊設(shè)計
整個系統(tǒng)框架包括離線和在線推薦引擎兩部分。離線部分又包括數(shù)據(jù)準備、用戶興趣建模等模塊;在線部分則由建立推薦池、產(chǎn)生初步推薦集、融合離線部分產(chǎn)生結(jié)果推薦集模塊組成。離線部分承擔數(shù)據(jù)準備和知識挖掘等功能,該部分面向的數(shù)據(jù)源通常為系統(tǒng)內(nèi)存儲的各種海量歷史數(shù)據(jù),挖掘處理需要較長時間,因此被設(shè)計為離線部分,以避免對實時性要求的影響;在線部分則承擔向當前用戶提供實時個性化服務(wù)推薦等功能,該部分是建立在離線部分的基礎(chǔ)上,直接參照其所生成的基于用戶興趣的頁面推薦集,針對不同用戶快速生成各種推薦服務(wù)。基于Web挖掘的個性化推薦系統(tǒng)的功能框架圖如圖2所示。
圖2 基于Web挖掘的個性化推薦系統(tǒng)框架圖
各子模塊功能如下:
(1)數(shù)據(jù)準備模塊。該模塊是對原始的用戶訪問日志進行數(shù)據(jù)采集、數(shù)據(jù)清洗和事務(wù)標識,生成對挖掘階段有用的用戶會話文件、事務(wù)數(shù)據(jù)庫及將站點的相關(guān)文件生成站點數(shù)據(jù)文件。
(2)建立用戶興趣模型庫模塊。該模塊使用Web挖掘技術(shù)對用戶訪問頁面內(nèi)容和用戶訪問行為進行分析,抽取用戶興趣,結(jié)合信息資源的相關(guān)性,形成用戶興趣的矢量描述,并能隨著用戶的訪問的推進和用戶興趣的改變,及時更新用戶模型。
(3)建立推薦池模塊。該模塊就是通過獲取用戶評價,得到帶有用戶訪問時長的用戶訪問頁面集合。
(4)產(chǎn)生初步推薦集模塊。該模塊通過對當前用戶訪問頁面的相似度計算,繼而進行用戶聚類分析,再對聚類用戶進行關(guān)聯(lián)規(guī)則發(fā)現(xiàn),產(chǎn)生初步推薦頁面集。
(5)融合離線部分產(chǎn)生個性化推薦集模塊。該模塊將產(chǎn)生的初步推薦頁面集與離線部分的用戶興趣模型相匹配。通過比較產(chǎn)生出最適合用戶的個性化推薦頁面集,并把這些頁面的地址附加到當前訪問頁面的底部,以進行推薦(圖3)。
4、結(jié)語
綜上所述,本文在對web服務(wù)技術(shù)及數(shù)據(jù)挖掘語言實施了分析和研究后,提出一個基于Web使用挖掘的個性化系統(tǒng)架構(gòu),該系統(tǒng)通過挖掘用戶Web訪問信息,生成了獨立的用戶興趣模型庫,可以更全面地反映用戶的興趣偏好,從而為用戶提供更詳細的信息推薦。
參考文獻
[1]韓家煒,孟小峰.Web挖掘研究.計算機研究與發(fā)展,38(4):405-414,2001.
[2]崔林,宋瀚濤,龔永罡,陸玉昌.基于Web使用挖掘的個性化服務(wù)技術(shù)研究.計算機系統(tǒng)應(yīng)用,第三期:23-26,2005.
[3]王彤,何丕謙.Web日志挖掘及AprioriAll算法的改進.天津理工大學(xué)學(xué)報,23(1):13-17,2007.
本文參考社會學(xué)和心理學(xué)將人們之間信任的產(chǎn)生來源分為三個方面:外部來源、交互來源和內(nèi)部信任,如圖 1.1所示。外部信任是由于當前用戶在公共環(huán)境中的聲譽而使得其他用戶對其產(chǎn)生的信任,它是一種全局信任,獨立于單個用戶。交互信任是系統(tǒng)中用戶之間的交互所產(chǎn)生的信任關(guān)系,這是一種本地信任度。內(nèi)部信任,是由于兩個人之間內(nèi)在的相似性(如愛好等)產(chǎn)生的信任關(guān)系。
圖 1.1 分層信任模型示意圖
1 基于層次的信任度計算模型
本文提出基于層次的信任度計算模型如(1.1)所,其中Reputation表示外部信任,InteractiveTrust表示交互信任,Similarity表示內(nèi)部信任。a,b,c是加權(quán)平均系數(shù),滿足a+b+c=1。這三個系數(shù)分別應(yīng)對不同類型的用戶:冷啟動用戶、常規(guī)用戶,爭議用戶。
(1.1)
在本文接下來的篇幅中將詳細介紹三種信任的計算方法以及a,b,c三個參數(shù)對于不同用戶的取值情況。
1.1 外部信任
本文使用的PageRank算法來計算外部信任。PageRank將指向一個網(wǎng)頁的鏈接看成是對于這個網(wǎng)頁的投票,本文將這種鏈接稱之為回指鏈接,而將一個網(wǎng)頁指向其他網(wǎng)頁的鏈接稱之為外向鏈接。例如在圖 2.1中,將用戶看作是網(wǎng)絡(luò)中的結(jié)點,將用戶之間的信任關(guān)系看做他們之間的信任,對于用戶A來說,從其他用戶到用戶A的鏈接如(B->A)等都是用戶A的回指鏈接;而從用戶A到其他用戶的鏈接如(A->B)等都是用戶A的外向鏈接。
圖 2.1 信任網(wǎng)絡(luò)初始狀態(tài)示意圖
PageRank在計算網(wǎng)頁排名的時候不單單考慮了網(wǎng)頁的回指鏈接的數(shù)量,更重要的是它還考慮了回指鏈接源網(wǎng)頁的價值。也就是說,一個高等級的頁面可以讓它所指向的低等級的頁面的等級提升。PageRank中,一個頁面的重要性是由鏈向它的所有頁面的重要性經(jīng)過遞歸算法得到的,如等式(2.2)所示是RageRank的數(shù)學(xué)表達式:
(2.2)
Reputation(u)表示用戶u的信譽度,Bu表示指向用戶u的所有用戶的集合,Nv表示以用戶v為源用戶的所有鏈接的數(shù)目,也就是用戶v的外向鏈接數(shù)。
1.2 交互信任
本文使用MoleTrust來作為度量交互信任值的算法,之所以選擇MoleTrust有兩個原因:1. 它具有省時高效的特點;2. 該算法對信任的計算是按照層次順序進行的,這與我們的社交習(xí)慣非常類似。接下來將詳細介紹MoleTrust的計算過程及其缺點以及對MoleTrust的改進措施。
1.2.1 MoleTrust
MoleTrust的整個計算過程可以分為兩步完成:1.從源節(jié)點出發(fā)遍歷整個信任網(wǎng)絡(luò),去除網(wǎng)絡(luò)中多余的信息和循環(huán)信任,構(gòu)造一個單向無循環(huán)的信任網(wǎng)絡(luò);2.在第一步的基礎(chǔ)上,從源節(jié)點出發(fā)開始傳播信任值,計算當前用戶對于網(wǎng)絡(luò)中其他用戶的信任。如Step 1和Step 2所示,是MoleTrust的具體運算過程:
MoleTrust的Step 1過程有一個非常重要的參數(shù):trust_propagation_distance,該參數(shù)用來控制信任傳播的距離。圖 2.1經(jīng)過MoleTrust的Step 1階段后得到圖 2.2所示信任網(wǎng)絡(luò)。將該信任網(wǎng)絡(luò)視為一個有向圖,在圖的第0層是當前用戶A,第1層,為用戶A的直接朋友,以此類推。
圖 2.2 經(jīng)MoleTrust的Step 1后的信任網(wǎng)絡(luò)
在MoleTrust的Step 2階段,同樣有一個非常重要的參數(shù):trust_threshold。只有信任值大于trust_threshod的用戶才會被加入到信任網(wǎng)絡(luò)中,該策略可以有效防止惡意用戶對于推薦系統(tǒng)的影響。
1.2.2 Modified MoleTrust
MoleTrust在計算信任值的過程中存在一個很大的漏洞,如Tr(A,G)=7,但這和我們的直覺是相悖的,因為G的上層用戶C的信任值只有3。為了彌補上述漏洞,本文提出一種修正的MoleTrust:Modified-MoleTrust。本文在在MoleTrust的Step 2階段引入一個遞減因子ω,其計算方式如等式(2.5)所示。
1.3 內(nèi)部信任
本文認為用戶對項目的評分是用戶內(nèi)部屬性的綜合體現(xiàn),所以本文選擇用戶對項目的評分矩陣來作為內(nèi)部信任的計算依據(jù)。有學(xué)者證明了在眾多衡量用戶相似性的指標中,Person相關(guān)系數(shù)的綜合表現(xiàn)最好,所以本文選擇Person相關(guān)系數(shù)作為內(nèi)部信任的衡量指標。
Person相關(guān)系數(shù)的取值范圍是[-1,1],若Person相關(guān)系數(shù)的取值為正,則說明兩個用戶之間存在著相似性,反之當其取為負時說明兩個人之間的興趣可能是相悖的。Person相關(guān)系數(shù)的計算公式如等式(2.6)所示。其中n表示用戶A和用戶W共同評分的項目數(shù),r(K,i)表示用戶K對項目i的評分。
2 實驗結(jié)果說明
本文利用Epinions網(wǎng)站的數(shù)據(jù)和Apache的Mahout平臺對所提出的模型進行了驗證。面對不同類型的用戶,對參數(shù)進行調(diào)整后,該模型總能得到較為理想的推薦準確度和覆蓋率,具體數(shù)3 結(jié)束語
摘要:隨著移動技術(shù)的發(fā)展,社交網(wǎng)絡(luò)已經(jīng)成為互聯(lián)網(wǎng)產(chǎn)品中的主體,而社交網(wǎng)絡(luò)產(chǎn)生的大量關(guān)系數(shù)據(jù)可以被用來進行個性化推薦的研
>> 基于網(wǎng)絡(luò)數(shù)據(jù)挖掘的個性化電子商務(wù)推薦系統(tǒng)研究 基于大數(shù)據(jù)的社團個性化推薦系統(tǒng) 基于swarm平臺和社交網(wǎng)絡(luò)的電子商務(wù)個性化推薦系統(tǒng)仿真模型的理論構(gòu)建 網(wǎng)絡(luò)數(shù)據(jù)挖掘在圖書館個性化推薦中的應(yīng)用研究 基于個性化推薦的網(wǎng)絡(luò)營銷 基于數(shù)據(jù)挖掘的電子政務(wù)個性化推薦服務(wù)框架研究 基于數(shù)據(jù)挖掘的個性化智能推薦系統(tǒng)應(yīng)用研究 基于社交網(wǎng)絡(luò)的個性化知識服務(wù)模型研究 基于免疫進化的網(wǎng)絡(luò)教學(xué)資源個性化推薦系統(tǒng)研究 移動社會網(wǎng)絡(luò)中基于位置的個性化餐館推薦建模研究 基于IPTV的個性化推薦技術(shù)的研究 個性化好友推薦系統(tǒng)在社交網(wǎng)站上的應(yīng)用研究 基于社交網(wǎng)絡(luò)的社會化推薦算法研究 基于個性化混合推薦算法的網(wǎng)絡(luò)推薦系統(tǒng) 基于數(shù)據(jù)挖掘的個性化推薦在SNS中的應(yīng)用 基于Web使用數(shù)據(jù)挖掘的個性化推薦系統(tǒng)設(shè)計 基于小數(shù)據(jù)的高校圖書館個性化推薦 基于個性化推薦學(xué)習(xí)的網(wǎng)絡(luò)培訓(xùn)教學(xué)課程平臺的設(shè)計與實現(xiàn) 基于網(wǎng)絡(luò)學(xué)習(xí)行為的個性化評價研究 社會化標簽系統(tǒng)中基于本體的個性化推薦方法研究 常見問題解答 當前所在位置:l
[2]張婷婷. 社會化網(wǎng)絡(luò)中人際關(guān)系與人際傳播研究[D].長沙:湖南大學(xué),碩士學(xué)位論文,2012
[3]王萍. 社會化網(wǎng)絡(luò)的信息擴散研究[J]. 情報雜志,2009,28(10):39-42
[4]《2013-2017年中國社交網(wǎng)絡(luò)行業(yè)發(fā)展前景預(yù)測與投資機會分析報告》:前瞻產(chǎn)業(yè)研究院,2013
[5]項亮. 推薦系統(tǒng)實踐[M].北京:人民郵電出版社,2012
[關(guān)鍵詞] 電子商務(wù)個性化信息服務(wù)個性化推薦系統(tǒng)
一、個性化信息服務(wù)
隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展和電子商務(wù)的盛行,個性化信息服務(wù)成為了各商家在激烈的競爭中立于不敗之地的重要法寶。DELL公司的成功,就證實了個性化信息服務(wù)的重要性。個性化信息服務(wù)是指互聯(lián)網(wǎng)絡(luò)使用者可以按照自己的目的和需求,在某種特定的網(wǎng)絡(luò)功能和服務(wù)方式中,自己設(shè)定網(wǎng)上信息的來源方式、表現(xiàn)形式、特定網(wǎng)上功能以及其他的網(wǎng)上服務(wù)方式等,以達到最為快捷地獲取自己所需的網(wǎng)上信息服務(wù)內(nèi)容的目的,強調(diào)“以用戶為中心”盡可能的滿足用戶的需求。個性化信息服務(wù)應(yīng)用于電子商務(wù)中,通過捕獲用戶的興趣來提高商品的銷售量。
二、個性化信息服務(wù)的主要特點
1.以用戶為中心,以滿足用戶個性化的價值追求為目標。個性化信息服務(wù)應(yīng)主動為用戶選擇最需要的資源與服務(wù),根據(jù)用戶需求的變化,動態(tài)的改變所提供的信息,讓用戶得到個性化的服務(wù)。它以滿足特定用戶的特定需求為主旨,以給用戶提供最快捷、最方便、最易用的服務(wù)為目標,它是“以用戶為中心”的服務(wù),可以是以用戶的信息需求為依據(jù),面向用戶開展的一切服務(wù)性活動,也可以是針對特定需求向用戶提供特定信息的有計劃、有目的的活動,服務(wù)的基礎(chǔ)就是用戶的信息需求。
2.具備智能化信息分析與處理功能。個性化信息服務(wù)中的智能化信息分析與處理功能一方面表現(xiàn)在系統(tǒng)的主動性推薦和協(xié)同推薦上,另一方面表現(xiàn)在對用戶綜合行為的挖掘中。主動推薦是指主動采集并跟蹤用戶瀏覽的信息,從用戶日常檢索瀏覽中主動學(xué)習(xí)用戶的興趣,推理并預(yù)測用戶需求,及時處理推薦信息;協(xié)同推薦是指根據(jù)不同用戶的相同點或相似性進行信息推薦,使需求相同的用戶之間共享查詢結(jié)果。用戶綜合行為的挖掘是針對用戶所有可能被記錄下來的行為進行數(shù)據(jù)挖掘,實現(xiàn)資源的深層挖掘并提供有效的服務(wù)。
3.推薦精確、系統(tǒng)的知識。個性化信息服務(wù)通過過濾、屏蔽無關(guān)無用的冗余信息,推薦精確、有效、真正具有針對性的信息,:能自動地、智能地將大量的數(shù)據(jù)轉(zhuǎn)換為具有規(guī)律性、系統(tǒng)性的知識,形成具有內(nèi)在關(guān)聯(lián)的信息鏈和知識鏈,并以易于理解的模式推薦給用戶。
4.主動性、高效性、靈活性。個性化信息服務(wù)采用“push”技術(shù),其主動性主要是指服務(wù)不需要用戶及時請求而主動地將數(shù)據(jù)傳給用戶,與傳統(tǒng)的瀏覽器的“pull”技術(shù)的被動服務(wù)形成鮮明的對比;高效性主要是指可在網(wǎng)絡(luò)空閑時啟動,能夠有效的利用網(wǎng)絡(luò)帶寬,比較適合傳送大量的多媒體信息;靈活性主要體現(xiàn)在用戶能夠完全根據(jù)自己的方便和需要,靈活地設(shè)置連接時間,通過E-mail、對話框、音頻、視頻等方式獲取網(wǎng)上特定信息資源。
5.允許用戶充分表達個性化需求。個性化信息服務(wù)系統(tǒng)不僅提供友好的界面,而且方便用戶交互、描述自己的需求、反饋對服務(wù)結(jié)果的評價等。
三、個性化信息服務(wù)研究的基本問題
個性化信息服務(wù)研究的基本問題包括個性化的具體應(yīng)用:個性化應(yīng)用分為資源的個性化入口和過濾/排序;用戶信息需求定義文件的表示與創(chuàng)建:用戶信息需求或興趣的描述和存儲;協(xié)同過濾與單獨過濾:針對一個或一組用戶對信息文檔根據(jù)文件進行的相關(guān)度排序;系統(tǒng)的體系結(jié)構(gòu):用戶信息需求定義文件放在服務(wù)器還是客戶計算機上,或者處于二者之間的服務(wù)器上;個性化系統(tǒng)的評估:包括信息需求定義文件的收斂分析和信息需求定義文件是否反映用戶的實際興趣分析。這些問題也是設(shè)計一個具體的應(yīng)用必須要明確的問題,而且它們之間是互相關(guān)聯(lián)、互相制約的。
四、個性化信息推薦系統(tǒng)
推薦系統(tǒng)是一種在特定類型數(shù)據(jù)庫中進行知識發(fā)現(xiàn)的應(yīng)用技術(shù),使用多種數(shù)據(jù)分析技術(shù)為用戶更好的服務(wù),向用戶主動、及時、準確地提供所需信息,并能根據(jù)用戶對推薦內(nèi)容的反饋進一步改進推薦結(jié)果。不僅要對用戶提出的要求提供最貼切的信息服務(wù),還要能依據(jù)個體個性特征,主動收集個體可能感興趣的信息,甚至預(yù)測個體可能的個性發(fā)展,提前收集相應(yīng)的信息,最后以個性化方式顯示給個體。是實現(xiàn)個性化信息服務(wù)的關(guān)鍵。
1.個性化信息推薦系統(tǒng)的關(guān)鍵技術(shù)。個性化信息服務(wù)推薦系統(tǒng)是實現(xiàn)個性化信息服務(wù)的主要途徑,主要是通過信息過濾和協(xié)同過濾等技術(shù)將用戶需要的信息推薦給用戶的。其關(guān)鍵技術(shù)有:
(1)內(nèi)容過濾技術(shù):試圖跟蹤和把握用戶的潛在信息需求,比較資源和用戶描述文件,對動態(tài)信息流進行過濾,盡量屏蔽無用信息,向用戶主動提供信息資源列表,從而提高用戶獲取信息的效率。
(2)協(xié)同過濾技術(shù):利用用戶的訪問信息,通過用戶群的相似性進行內(nèi)容推薦,不依賴于內(nèi)容僅依賴于用戶之間的相互推薦,避免了內(nèi)容過濾的不足,保證信息推薦的質(zhì)量。
(3)聚類分析技術(shù):對數(shù)據(jù)對象進行分類,把一組數(shù)據(jù)對象分到不同簇中,簇是一組數(shù)據(jù)對象的集合,使簇內(nèi)各對象間具有較高的相似度,而不同組的對象差別較大。
2.個性化信息推薦系統(tǒng)的基本要求。個性化信息服務(wù)是為用戶打造量身訂制的服務(wù),是為了更好的滿足用戶的需求。個性化信息服務(wù)推薦系統(tǒng)應(yīng)該滿足個性化、主動性、新穎性、準確性的基本要求。
(1)個性化:根據(jù)不同用戶的不同背景、不同需求,為不同用戶提供不同的信息,存在一定程度的個性差異。
(2)主動性:系統(tǒng)主動根據(jù)用戶的信息需求向用戶提供信息,實現(xiàn)“信息找人”的過程,而不是“人找信息”。
(3)新穎性:系統(tǒng)向用戶提供的信息是用戶以往所不具有的,未曾訪問的卻又是需要的。
(4)準確性:在相同或相近的信息資源中,對兩個不同用戶的相似要求返回不同的信息結(jié)果,以滿足不同用戶的不同需求。
3.個性化信息推薦系統(tǒng)體系結(jié)構(gòu)。目前,個性化信息推薦系統(tǒng)總的來說可以分為基于規(guī)則的和基于過濾的兩種推薦系統(tǒng)。基于關(guān)聯(lián)規(guī)則的個性化信息服務(wù),主要針對特定的站點組織結(jié)構(gòu),采用最大向前訪問路徑輔助內(nèi)容事務(wù)方法。制定一系列規(guī)則并利用這些規(guī)則為特定用戶提供服務(wù)。利用規(guī)則來推薦信息依賴于規(guī)則的質(zhì)量和數(shù)量,基于規(guī)則的技術(shù)缺點是隨著規(guī)則的數(shù)量增多,系統(tǒng)將變得越來難以管理。基于過濾的個性化推薦服務(wù)分為基于內(nèi)容過濾的推薦服務(wù)和基于協(xié)同過濾的推薦服務(wù)。基于內(nèi)容過濾是通過比較資源和用戶信息描述文件,推薦與用戶興趣相似的資源。基于協(xié)同過濾的推薦系統(tǒng)則是利用用戶群的訪問信息,通過用戶群之間的相似性進行內(nèi)容推薦。
結(jié)合以上兩類系統(tǒng),為了能夠為用戶主動提供所需信息,個性化信息服務(wù)推薦系統(tǒng)一般需要通過用戶接口模塊、需求信息模塊、信息檢索模塊、用戶分析模塊、信息過濾模塊、信息推送模塊6個功能模塊來實現(xiàn)。
(1)用戶接口模塊:是用戶與系統(tǒng)之間的接口。負責處理用戶初次輸入的用戶信息,并將它存儲在用戶信息庫中;接收用戶輸入的認證信息,與用戶信息庫中的個人認證信息比較,完成用戶身份認證;處理用戶的檢索需求;將用戶輸入的興趣、愛好信息及用戶對于推薦信息的評價提交給需求分析模塊,接收信息推送模塊送來的信息,最終將其提交給用戶。
(2)需求分析模塊:是對用戶接口模塊送來的用戶初始興趣信息進行分析,建立用戶模型,并根據(jù)用戶反饋修改用戶模型。
(3)信息檢索模塊:是接收用戶接口模塊處理過的用戶檢索需求,檢索本地數(shù)據(jù)庫和網(wǎng)絡(luò)數(shù)據(jù)庫,并將檢索結(jié)果送到信息過濾模塊,并將其存儲到本地信息庫中。
(4)用戶分析模塊:是負責比較該用戶模型與其它用戶模型之間的相似度,找出有相同或相似興趣的其他用戶,相互推薦信息,實現(xiàn)信息資源共享。
(5)信息過濾模塊:是根據(jù)用戶模型對信息檢索模塊返回的檢索結(jié)果進行過濾并將過濾的結(jié)果送到信息推薦模塊;此外,如果用戶分析模塊找到了具有相同或相似興趣的用戶,信息過濾模塊也將這些用戶的個性化信息傳送到信息推薦模塊。
(6)信息推薦模塊:是負責實現(xiàn)主動信息服務(wù),根據(jù)用戶信息庫中對于信息推送的時間、數(shù)量等設(shè)置,將經(jīng)過信息過濾模塊過濾的信息推送到用戶接口模塊。
五、結(jié)束語
傳統(tǒng)的定題服務(wù)所具有的主動性是有限的,從根本上講仍是“用戶找信息”,而個性化信息服務(wù)是依托網(wǎng)絡(luò)環(huán)境的,可以在較高程度上改變信息與用戶的關(guān)系,能夠滿足網(wǎng)絡(luò)環(huán)境下真正實現(xiàn)“信息找用戶”。個性化信息服務(wù)以其交互性好、不受時間地域的限制、針對性強、資源豐富等優(yōu)點,將成為電子商務(wù)發(fā)展的方向。
參考文獻:
[1]曾春:信息過濾的概念表示與算法研究[D].北京:清華大學(xué),2003
[2]劉偉成焦玉英:網(wǎng)絡(luò)信息過濾的方法與相關(guān)技術(shù)研究[J].現(xiàn)代圖書情報技術(shù),2002(4):48~50
電子商務(wù)推薦系統(tǒng)(RecommendationSystemsforE-Commerce)定義是:“它是利用電子商務(wù)網(wǎng)站向客戶提供商品信息和建議,幫助用戶決定應(yīng)該購買什么產(chǎn)品,模擬銷售人員幫助客戶完成購買過程”。
推薦系統(tǒng)面對的是用戶(user),任務(wù)是為用戶提供對項目(item)的推薦。用戶是指推薦系統(tǒng)的使用者,也就是電子商務(wù)活動中的客戶。項目是被推薦的對象,是指電子商務(wù)活動中提供給客戶選擇的產(chǎn)品和服務(wù),也就是最終推薦系統(tǒng)返回給用戶的推薦內(nèi)容。在一個電子商務(wù)活動中,用戶數(shù)和項目數(shù)是非常多的。推薦系統(tǒng)面對的當前用戶,稱為目標用戶或者活動用戶。推薦系統(tǒng)的當前工作,就是為根據(jù)一定的算法,給出對目標用戶的推薦項目。
電子商務(wù)推薦系統(tǒng)主要由三大部分構(gòu)成:輸入模塊、推薦方法模塊和輸出模塊。輸入模塊用來接受用戶的輸入信息,用戶的輸入信息中最重要的是用戶對項目的評價(rating)數(shù)據(jù);推薦方法模塊用來根據(jù)一定算法,根據(jù)用戶數(shù)據(jù),得出對目標用戶的推薦,該模塊是整個推薦系統(tǒng)的核心部分,個性化推薦方面的研究的很大一部分,都集中在找到好的推薦方法。輸出模塊主要是指得到的推薦以何種形式反饋給用戶。
根據(jù)項目的特點,目前主要有兩種類型的推薦系統(tǒng),一種是以網(wǎng)頁為對象的個性化推薦系統(tǒng),主要采用Web數(shù)據(jù)挖掘的方法與技術(shù),為用戶推薦符合其興趣愛好的網(wǎng)頁;另一種是網(wǎng)上購物環(huán)境下的、以商品為推薦對象的個性化推薦系統(tǒng),為用戶推薦符合其興趣愛好的各類產(chǎn)品,如各種書籍,音像等,這種推薦系統(tǒng)也稱電子商務(wù)個性化推薦系統(tǒng)。
二、電子商務(wù)個性化推薦系統(tǒng)的作用
電子商務(wù)推薦系統(tǒng)的最大的優(yōu)點在于它能收集用戶興趣資料并根據(jù)用戶興趣偏好為用戶主動作出個性化的推薦,也就是說,當用戶每次輸入用戶名和密碼登錄電子商務(wù)網(wǎng)站后,推薦系統(tǒng)就會按照目標用戶偏好程度的高低推薦用戶最喜愛的N個產(chǎn)品,而且系統(tǒng)給出的推薦是實時更新的,也就是說當系統(tǒng)中的產(chǎn)品庫和用戶興趣資料發(fā)生改變時,給出的推薦序列會自動改變,大大方便了用戶,也提高了企業(yè)的服務(wù)水平。
總體說來,電子商務(wù)推薦系統(tǒng)的作用主要表現(xiàn)在以下幾個方面:一方面,使用戶從無限的網(wǎng)絡(luò)資源和商品世界中解脫出來,大大節(jié)約了用戶采購商品的時間和成本;與此同時,推薦系統(tǒng)的個性化推薦服務(wù),提高了客戶對電子商務(wù)網(wǎng)站的忠誠度(BuildingLoyalty),將更多的電子商務(wù)網(wǎng)站瀏覽者轉(zhuǎn)變?yōu)樯唐返馁徺I者,從而提高電子商務(wù)網(wǎng)站的交叉銷售能力(Cross-Selling),為電子商務(wù)企業(yè)贏得了更多的發(fā)展機會。
研究表明,在基于電子商務(wù)的銷售行業(yè)使用個性化推薦系統(tǒng)后,能提高銷售額2%-8%,尤其在書籍、電影、CD音像、日用百貨等產(chǎn)品相對較為低廉且商品種類繁多的行業(yè),以及用戶使用個性化推薦系統(tǒng)的程度高的行業(yè),推薦系統(tǒng)能大大提高企業(yè)的銷售額。
電子商務(wù)推薦系統(tǒng)和銷售系統(tǒng)(MarketingSystems)、供應(yīng)鏈決策支持系統(tǒng)(Supply-ChainDecision-SupportSystems)既相似又有不同。銷售系統(tǒng)是幫助銷售人員如何把產(chǎn)品銷售出去;推薦系統(tǒng)最終目的幫助用戶,輔助用戶購買什么產(chǎn)品做出決策。供應(yīng)鏈決策支持系統(tǒng)是幫助生產(chǎn)者決定什么時候生產(chǎn)多少什么產(chǎn)品,以及倉庫應(yīng)該存貯多少各類產(chǎn)品,其最終目的是為企業(yè)生產(chǎn)者服務(wù)的,而同樣推薦系統(tǒng)是面向用戶的系統(tǒng)。
三、電子商務(wù)個性化推薦系統(tǒng)的研究內(nèi)容
電子商務(wù)個性化推薦的研究有四方面的問題:首先,要解決推薦系統(tǒng)的信息來源問題——推薦系統(tǒng)的基礎(chǔ)是用戶興趣資料信息,如何在電子商務(wù)環(huán)境下盡可能獲得更多用戶的相關(guān)信息,并以合適的形式表示是進行個性化推薦的前提;其次,要實現(xiàn)被顧客接受和認可的個性化推薦,設(shè)計準確、高效率的個性化推薦算法是核心;另外,要讓推薦系統(tǒng)為廣大用戶所接受,必須對推薦系統(tǒng)作出客觀、綜合的評價,尤其要注意從準確率、個性化、安全性、用戶滿意度等多方面進行評價;推薦系統(tǒng)的應(yīng)用是最終研究的落腳點,推薦系統(tǒng)不僅能為用戶提供完全個性化購物環(huán)境,更應(yīng)為企業(yè)的銷售決策和客戶關(guān)系管理提供支持。
在電子商務(wù)環(huán)境下,用戶信息收集表示是電子商務(wù)個性化推薦的基礎(chǔ)。根據(jù)當前對電子商務(wù)環(huán)境下用戶信息收集表示的研究來看,主要著眼于研究如何有效地收集能反映用戶興趣偏好的信息,以及如何通過網(wǎng)絡(luò)數(shù)據(jù)挖掘等的方法更自動化地收集用戶的隱式信息,解決用戶信息收集過多的依賴于顯式評價數(shù)據(jù)的問題。
個性化推薦技術(shù)是電子商務(wù)自動化推薦系統(tǒng)的核心問題。目前的推薦技術(shù)有協(xié)同過濾推薦(包括基于用戶的和基于項目的)、基于用戶人口統(tǒng)計信息的推薦、基于內(nèi)容的推薦、基于效用的推薦、基于知識的推薦、基于規(guī)則的推薦等等。協(xié)同過濾推薦是個性化推薦中研究和應(yīng)用最多的方法,廣泛應(yīng)用于電子商務(wù)網(wǎng)站、數(shù)字圖書館、網(wǎng)頁搜索、新聞過濾等,著名的推薦系統(tǒng)有Tapestry、GroupLens/NetPerceptions、Ringo/Firefly等,其前提假設(shè)是存在具有相似興趣愛好的用戶群,每個用戶都有與其興趣愛好相似的鄰居用戶。預(yù)測用戶對某一項目的偏好是根據(jù)鄰居用戶對該項目的偏好程度計算的,也就是說如果其鄰居用戶喜愛某項目,則該用戶也很可能會喜愛該項目。協(xié)同過濾最大優(yōu)點是不需要分析對象的特征屬性,所以對推薦對象沒有特殊的要求,能處理非結(jié)構(gòu)化的復(fù)雜對象,如音樂、電影等。
對推薦系統(tǒng)總體性能的評價是推薦系統(tǒng)研究的重要組成部分。目前大都只是采用準確率、召回率等評判尺度對推薦算法進行評價,并沒有真正意義上的、提升到對整個推薦系統(tǒng)進行的評價,尤其缺乏從個性化程度、持久性程度、系統(tǒng)的安全性以及用戶接受程度等多方面對推薦系統(tǒng)進行綜合的評價。
四、研究現(xiàn)狀
推薦行為產(chǎn)品或其它項目的軟件已經(jīng)在許多應(yīng)用中使用在電子商務(wù)領(lǐng)域,為了增加購買經(jīng)驗并滿足客戶需求,已經(jīng)推出了充分利用消費者的訪問和購買行為的推薦系統(tǒng)。推薦者通常通過給用戶展示他們可能感興趣的產(chǎn)品或服務(wù)來促進購買。例如,諸如就是通過利用偏好或其他用戶購買信息來介紹書籍或者其它產(chǎn)品給用戶的推薦系統(tǒng)。然而,使用的技術(shù)相當簡單,而且并非很精確和有效。基本上,程序?qū)斍翱蛻糍徺I的一系列產(chǎn)品與其他客戶購買的一系列產(chǎn)品作比較,選擇客戶購買較多的產(chǎn)品與當前客戶購買的產(chǎn)品集合的交集,最后從中選出一些尚未被客戶所購買而仍然在顧客購物籃中的產(chǎn)品,并將它們作為推薦列表呈現(xiàn)給客戶。該技術(shù)也用于類似于協(xié)作過濾的文本文檔的信息抽取。電影或音樂唱片的推薦,例如,通過預(yù)知一個人的偏好與其他人偏好的線性權(quán)重集合,并運用協(xié)作過濾技術(shù)來實現(xiàn)。
對于推薦系統(tǒng)的研究可分為三個種類:技術(shù)系統(tǒng)開發(fā)研究,用戶行為研究和隱私問題研究。其中技術(shù)系統(tǒng)開發(fā)是重點。目前各種推薦技術(shù),例如數(shù)據(jù)挖掘,和推理,都已經(jīng)應(yīng)用到了推薦系統(tǒng)中。現(xiàn)存的推薦系統(tǒng)從廣義上可以劃分為基于規(guī)則的系統(tǒng)和信息過濾系統(tǒng)。信息過濾系統(tǒng)又可分為基于內(nèi)容過濾的系統(tǒng)和協(xié)作過濾系統(tǒng)兩種。
基于規(guī)則的系統(tǒng),N1如:IBM的WebSphere,BroadVi-sion,ILOG等。他們允許系統(tǒng)管理員根據(jù)用戶的靜態(tài)特征和和動態(tài)屬性來制定規(guī)則,一個規(guī)則本質(zhì)上是一個if-then語句,規(guī)則決定了在不同的情況下提供不同的服務(wù)。基于規(guī)則的系統(tǒng),其優(yōu)點是簡單、直接,缺點是規(guī)則質(zhì)量很難保證,而且不能動態(tài)更新。此外,隨著規(guī)則的數(shù)量增多,系統(tǒng)將變得越來越難以管理。
基于內(nèi)容過濾的系統(tǒng),例如:PersonalWebWather,SysKill&Webert,Letizia,CiteSeer,ifWeb,SIFTER,PVA,WebMate,WebACE,ELFI和WebPersonalizer等。他們利用資源與用戶興趣的相似性來過濾信息。基于內(nèi)容的推薦系統(tǒng)通過將顧客的偏好與產(chǎn)品內(nèi)容自動匹配來給顧客提供建議,例如網(wǎng)頁和消息條目的推薦。在基于內(nèi)容的系統(tǒng)中,產(chǎn)品由其普通屬性描述。顧客偏好通過分析產(chǎn)品比率以及相應(yīng)的產(chǎn)品屬性來預(yù)測。基于內(nèi)容過濾的系統(tǒng),其優(yōu)點是簡單、有效。缺點是難以區(qū)分資源內(nèi)容的品質(zhì)和風(fēng)格,而且不能為用戶發(fā)現(xiàn)新的感興趣的資源,只能發(fā)現(xiàn)和用戶已有興趣相似的資源。在基于內(nèi)容的推薦系統(tǒng)中,一個核心問題是識別關(guān)鍵屬性集合。如果該集合太小,顯然,這對于識別用戶剖面是不充分的。因此,基于內(nèi)容的推薦系統(tǒng)不能用于僅僅實施一次購買行為新顧客,或者訪問了該網(wǎng)站,卻沒有實施任何購買行為的潛在顧客,以及購買他不是特別經(jīng)常購買的一種產(chǎn)品的顧客。
協(xié)作過濾系統(tǒng)如:WebWather,Let'sBrowse,Tapestry,GroupLens,F(xiàn)ab,Alexa,F(xiàn)irefly,SELECT,LikeMinds和Site-Seer等。他們利用用戶之間的相似性來過濾信息。協(xié)作性的推薦系統(tǒng)估計顧客對特定產(chǎn)品的偏好是根據(jù)顧客對該產(chǎn)品的偏好率以及其他顧客對同一產(chǎn)品的偏好率的比較來實現(xiàn)的。協(xié)作性的推薦系統(tǒng)與基于內(nèi)容的推薦系統(tǒng)之間的主要區(qū)別是協(xié)作性的推薦系統(tǒng)通過跟蹤一組顧客過去的行為來給該組中的個別顧客提供建議。使用該方法,顧客現(xiàn)在就可以接受建議,而在基于內(nèi)容的推薦系統(tǒng)中,只要具有相似意向的其他顧客的偏好,顧客就己經(jīng)具有先前預(yù)測了。基于協(xié)作過濾系統(tǒng)的優(yōu)點是能為用Web數(shù)據(jù)挖掘的研究及其在網(wǎng)絡(luò)學(xué)習(xí)個性化推薦中的應(yīng)用戶發(fā)現(xiàn)的新的感興趣的信息,缺點是存在兩個很難解決的問題,一個是稀疏性,亦即在系統(tǒng)使用初期,由于系統(tǒng)資源還未獲得足夠多的評價,系統(tǒng)很難利用這些評價來發(fā)現(xiàn)相似的用戶;另一個是可擴展性,亦即隨著系統(tǒng)用戶和資源的增多,系統(tǒng)的性能會越來越低。協(xié)作性的過濾方法用來識別與既定客戶具有相似興趣的顧客,所推薦的產(chǎn)品也是這些給定客戶喜歡的產(chǎn)品。該方法的一個主要局限是稀疏問題。在基于協(xié)作過濾的推薦系統(tǒng)中,很難精確確定下相似客戶和識別要推薦的產(chǎn)品。不僅如此,系數(shù)問題的極端形式是first-rater問題,當市場引入一種新產(chǎn)品時,不存在可用的先前估計信息。
還有一些個性化服務(wù)系統(tǒng)如:WebSIFT,F(xiàn)AB,Anatagon-omy和DynamicProfiler等,同時采用了基于內(nèi)容過濾和協(xié)作過濾這兩種技術(shù)。結(jié)合這兩種過濾技術(shù)可以克服各自的一些缺點,為了克服協(xié)作過濾的稀疏性問題,可以利用用戶瀏覽過的資源內(nèi)容預(yù)期用戶對其他資源的評價,這樣可以增加資源評價的密度,利用這些評價再進行協(xié)作過濾,從而提高協(xié)作過濾的性能。
近來,許多因特網(wǎng)公司還引進了有關(guān)信息產(chǎn)品的推薦系統(tǒng),它包括Web站點推薦,音樂推薦,視頻推薦,書籍推薦等等(例如,以及等等)。因特網(wǎng)行銷機構(gòu)運用推薦系統(tǒng)對某一廣告公司推薦用戶(例如Ac-tiveAgentWerbenetz。
通過將書籍推薦給已經(jīng)購買過特定書籍的顧客實現(xiàn)個性化推薦的。.所推薦書籍概括的分為有兩種:小說書籍和非小說書籍。小說書籍的推薦很簡單,就是將同一作者的其它小說書籍推薦給特定用戶,這樣最終就將由該作者撰寫的相似類別的小說書籍推薦給了有相似背景的用戶。而非小說書籍的推薦將是將每個作者的相似類別的小說書籍推薦給了有相似背景的用戶。
五、電子商務(wù)推薦技術(shù)存在的問題和發(fā)展方向
綜合目前電子商務(wù)中個性化推薦系統(tǒng)的現(xiàn)狀可以看出,現(xiàn)存的個性化推薦系統(tǒng)技術(shù)大都是基于規(guī)則的系統(tǒng),基于內(nèi)容過濾的系統(tǒng),以及協(xié)作過濾系統(tǒng)三種。而且,這些個性化推薦系統(tǒng)所運用的技術(shù)也僅僅限于基于內(nèi)容的過濾,KNN(L-NearestNeighboring)技術(shù),基于聚類的(Clustering-based)協(xié)作過濾,基于項目的(Item-based)協(xié)作過濾,序列模式,規(guī)則分析等等。由于這些推薦系統(tǒng)各自應(yīng)用范圍的局限,而且都不同程度的需要人工參與,因而導(dǎo)致目前推薦系統(tǒng)的推薦精確度較低。不僅如此,大多數(shù)個性化推薦系統(tǒng)只是給用戶推薦一些不同類別的資源,這與普通的搜索引擎比較相似,而且對用戶正確行為的推薦卻比較少。
未來電子商務(wù)推薦技術(shù)研究的發(fā)展主要體現(xiàn)在以下幾個方面:
1.組合推薦技術(shù)的研究
眾所周知,現(xiàn)存的推薦技術(shù)已經(jīng)得到推廣和應(yīng)用,但各種技術(shù)都存在一些缺陷,能否將各種推薦技術(shù)融合起來作到取長補短是未來電子商務(wù)推薦技術(shù)研究的重要課題。
2.推薦技術(shù)準確度的研究
目前的推薦技術(shù)推薦的準確性還得不到保證,準確度的研究還局限在手工實驗階段,因此,研究出自動的準確性驗證理論模型就顯得非常重要。
3.數(shù)據(jù)獲取方面,主要還是依賴用戶的顯式評價,在自動獲得用戶的隱式信息方面做得不夠。
4.研究過于集中解決推薦算法性能的提高,對推薦系統(tǒng)的開發(fā)與應(yīng)用,尤其是與企業(yè)其它系統(tǒng)的集成應(yīng)用,在輔助企業(yè)的市場銷售,客戶管理和企業(yè)商務(wù)智能方面缺乏研究。
參考文獻:
[1]CooleyR,MobasherB,SrivastavaJ.Dataprepara2tionforminingworldwideWebbrowsingpatterns.JournalofKnowledgeandInformationSystems,1999(1):230~241
[2]GoldbergD,NicholsD,OkiBM,TerryD.Usingcol-muni-cationsoftheACM,1992,35(12):61~70.
[3]ResnickandVarian.RecommendationsystemsCommu-nicationsoftheACM,40(3):56C58,1997.98-122
[4]R.D.Lawrence,G.S.Almasi,V.Kotlyar,M.S.Viveros,S.S.Duri,Personalizationofsupermarketproductrecommenda-tions,IBMResearchRport,2000.43-75.
[5]鄧愛林,朱揚勇,施伯樂.基于項目評分預(yù)測的協(xié)同過濾推薦算法[J].軟件學(xué)報,2003,(9).
[6]曾春,邢春曉,周立柱.個性化服務(wù)技術(shù)綜述[J].軟件學(xué)報,2002,(10).
[7]趙亮,胡乃靜,張守志.個性化推薦算法設(shè)計[J].計算機研究與發(fā)展,2002,(8).
關(guān)鍵詞:感知價值;采納意愿;VAM模型;移動個性化推薦
一、 引言
學(xué)者們關(guān)于用戶互聯(lián)網(wǎng)產(chǎn)品或服務(wù)接受意愿和使用行為的研究經(jīng)常采用Davis等提出的TAM模型(Technology Adoption Model),或者在TAM模型的基礎(chǔ)上增加一些影響用戶態(tài)度和行為的因素形成擴展的TAM模型。但是,有研究表明TAM模型在研究用戶自愿購物方面的解釋力度不高(朱閣等,2010)。移動互聯(lián)網(wǎng)的使用者扮演著用戶和消費者的雙重角色,對移動互聯(lián)網(wǎng)的使用費用由自己承擔,是否接受具有自愿性。移動個性化推薦作為移動商務(wù)發(fā)展的重要產(chǎn)物,是電子商務(wù)網(wǎng)站向移動用戶推薦商品或服務(wù)信息的主要手段,這些信息能否引起用戶態(tài)度和行為主要取決于用戶對推薦信息的價值感知(Sabiote et al.,2012)。本文從感知價值相關(guān)理論出發(fā),基于Kim等提出的VAM模型(Value-based Adoption Model),將用戶對移動個性化推薦的價值感知分為功能價值、體驗價值和安全價值三個維度,試圖從收益和損失兩個方面來分析影響用戶移動個性化推薦感知價值的因素,并測量后者對其采納意愿的作用路徑。
二、 相關(guān)理論綜述
1. VAM模型。VAM模型是Kim等(2007)基于價值最大化視角,針對用戶關(guān)于移動互聯(lián)網(wǎng)(M-Internet)的接受態(tài)度而構(gòu)建的模型。該模型認為用戶對移動互聯(lián)網(wǎng)的感知價值是影響其接受意愿的主要因素,其它因素通過感知價值的中介作用影響接受意愿。在該模型中,Kim等將影響用戶移動互聯(lián)網(wǎng)感知價值的因素分為收益和損失兩個維度,并進一步將感知有用性和感知娛樂納入收益維度,將技術(shù)特性和感知費用納入損失維度;同時研究了感知價值對用戶移動互聯(lián)網(wǎng)接受意愿的影響。
2. 感知價值。Zeithaml(1988)認為感知價值是消費者基于感知利得和感知損失兩個角度,對產(chǎn)品效用做出的總體評價。根據(jù)研究情境的不同,學(xué)者們認為感知價值應(yīng)該是一個多維度的概念。如,Sheth等(1991)提出了Sheth-Newman-Gross消費價值模型,該模型將影響用戶行為的感知價值分為社會價值、條件價值、情感價值、功能價值和認知價值五個維度。在Sheth-Newman-Gross消費價值模型的基礎(chǔ)上,Sweeney和Soutar(2001)將價格從功能價值中剝離出來,同時去掉了條件價值和認知價值,進而形成了包括質(zhì)量/表現(xiàn)、社會價值、情感價值和價格/金錢價值四個維度的消費者感知價值模型。陳潔等(2012)把感知價值劃分為功利主義價值和享樂主義價值,并進一步將前者劃分為價格和品質(zhì)兩個子維度,后者劃分為自我延伸、自我享樂和社交價值三個子維度。基于前人的研究成果,考慮到用戶移動個性化推薦使用的實際情況,筆者主要從功能價值、安全價值和體驗價值三個維度對用戶移動個性化推薦感知價值進行測量。功能價值類似于TAM理論中的感知有用性,是用戶對移動個性化推薦功能性、實用性、自然屬性等方面的感知;安全價值是用戶對移動個性化推薦的內(nèi)容和系統(tǒng)基于正直、友善、可靠等方面的感知;體驗價值是用戶感知移動個性化推薦帶來的愉悅感、滿足感等。
三、 研究假設(shè)和模型
1. 感知價值與移動個性化推薦采納意愿。移動個性化推薦是商家根據(jù)目標消費者自身或者相似消費者的消費行為和偏好,為其推薦符合當前興趣和偏好的商品或服務(wù)信息。戴德寶等(2015)基于Sheth-Newman-Gross消費價值模型的研究表明,感知r值各個維度對用戶網(wǎng)絡(luò)個性化推薦的采納意愿都影響顯著,且VAM理論也證明了用戶對移動互聯(lián)網(wǎng)的感知價值影響其采納意向。基于此,本文認為用戶對移動個性化推薦感知價值的三個維度均正向影響其采納意愿。考慮到用戶使用移動個性化推薦主要是為了解決信息超載問題,享受移動個性化推薦帶來的愉悅體驗,提出假設(shè):
H1:用戶移動個性化推薦感知價值的三個維度均正向影響采納意愿,且功能價值和體驗價值對采納意愿的影響更為顯著。
2. 收益與感知價值。TAM理論中的“感知有用性”和“感知易用性”分別是指用戶主觀上感知信息系統(tǒng)提高其工作績效的程度和使用信息系統(tǒng)所需付出的努力程度。移動個性化推薦的感知有用性和感知易用性主要涉及用戶對產(chǎn)品或服務(wù)功能屬性和享樂屬性的感知。基于此,提出以下假設(shè):
H2:感知有用性正向影響用戶移動個性化推薦感知價值的三個維度,且對功能價值的影響最大;
H3:感知易用性正向影響用戶移動個性化推薦感知價值的三個維度,且對體驗價值的影響最大。
網(wǎng)絡(luò)個性化推薦系統(tǒng)是商家為了解決種類繁多的商品選擇同顧客相對單一的需求之間的矛盾而采用的信息工具和技術(shù)(Ricci et al.,2011)。受到移動設(shè)備屏幕小、資源有限、鏈接不穩(wěn)定等因素的制約,移動個性化推薦系統(tǒng)如果不能在正確的時間、合適的地點為目標用戶推薦符合其興趣和偏好的信息,就會引起用戶的心理抗拒(萬君等,2015)。因此移動個性化推薦的界面設(shè)計、推薦信息數(shù)量、推薦時間和地點等情境特性都會影響用戶對其的價值認知。基于此,提出假設(shè):
H4:情境特性正向影響用戶移動個性化推薦感知價值的三個維度,且對功能價值和體驗價值的影響均比較大。
3. 損失與感知價值。移動個性化推薦系統(tǒng)在一定程度上降低了用戶搜索商品或服務(wù)的時間和精力成本,但是,瀏覽移動個性化推薦過程中會產(chǎn)生流量費用、交易費用等費用,且移動個性化推涉及到了用戶的隱私信息泄露問題(Bandyopadhyay,2012)。已有研究表明,移動商務(wù)環(huán)境下感知費用和安全風(fēng)險顯著影響用戶的感知價值(周濤等,2009)。基于此,提出以下假設(shè):
H5:感知M用負向影響用戶移動個性化推薦感知價值的三個維度,且對體驗價值的影響最大;
H6:感知風(fēng)險負向影響用戶移動個性化推薦感知價值的三個維度,且對安全價值的影響最大。
四、 實證研究
1. 問卷設(shè)計與發(fā)放。本文采用問卷調(diào)研的方式對提出的假設(shè)和模型進行檢驗,為保證問卷的信度和效度,問卷的測試題項均來自已有文獻,通過深度訪談和預(yù)調(diào)研對問卷進行修正,最終形成本研究的正式測量量表。正式調(diào)研于2016年6月底開始,7月中旬結(jié)束。正式調(diào)研均采用李克特5級量表,從“1”到“5”分別代表“非常不同意”到“非常同意”。共收回問卷221份,剔除無效問卷17份,共得到有效問卷204份,有效回收率為92.3%。有效問卷中,男女比例接近1∶1;20歲~30歲的人群占比90.2%;擁有大學(xué)學(xué)歷的人群占比67.2%,碩士及以上人群占比28.9%;手機上網(wǎng)年限大部分在2年以上占比超過90.0%;每天都上網(wǎng)的人群占比96.1%;有76%的人瀏覽移動個性化推薦。
2. 信度和效度分析。本文采用探索性因子分析(EFA)和驗證性因子分析(CFA)對測量量表進行信度和效度檢驗。結(jié)果顯示,整個量表的KMO值為0.877,巴特利特球形檢驗的結(jié)果為Sig=0.000。如表1所示,9個因子的Cronbanch's 值和組合信度(CR)值均大于0.7,說明量表的信度良好;各個測量題項的因子載荷均大于0.5,平均方差提取量(AVE)大于0.5,說明測量量表的效度良好。
3. 假設(shè)檢驗。本文采用AMOS21.0對研究模型進行了結(jié)構(gòu)方程檢驗。各擬合指標值如表2所示,所有的擬合指標均在可接受范圍內(nèi),可以對概念模型進行假設(shè)檢驗。
檢驗結(jié)果顯示,研究模型對功能價值、體驗價值、安全價值和用戶移動個性化推薦采納意愿的解釋率分別為73.3%(R2=0.733)、57.3%(R2=0.573)、36.6%(R2=0.366)和89.5%(R2=0.895)。在收益對用戶移動個性化推薦感知價值的影響方面:感知有用性對功能價值(0.244)、體驗價值(0.205)、安全價值(0.235)均有顯著正向影響,對功能價值的影響最大(P<0.001),假設(shè)H2得到完全支持;感知易用性對體驗價值和安全價值的影響不明顯,在0.05的顯著性水平上影響功能價值(0.160),假設(shè)H3未得到實證支持;情境特性對功能價值(0.424)和體驗價值(0.247)均有產(chǎn)生正向影響,且對功能價值的影響最大(P<0.001),對安全價值的影響不顯著,假設(shè)H4得到部分支持。在損失對用戶移動個性化推薦感知價值影響方面,感知費用對功能價值(-0.260)、體驗價值(-0.490)和安全價值(-0.307)均產(chǎn)生負向影響,且對體驗價值的影響最大(P<0.001),假設(shè)H5得到完全支持;感知風(fēng)險對用戶感知移動個性化推薦的功能價值影響不明顯,對體驗價值(-0.162)和安全價值(-0.311)均產(chǎn)生負向影響,其中對安全價值的影響最大(P<0.001),假設(shè)H6得到部分支持。在用戶移動個性化推薦感知價值對采納意愿的影響中,功能價值和體驗價值對接受意愿影響顯著,路徑系數(shù)分別為0.426和0.578,安全價值在0.1的顯著性水平上影響接受意愿,即相較于安全價值,功能價值和體驗價值對接受意愿的影響更大,假設(shè)H1得到完全支持。
五、 結(jié)論與啟示
1. 提升用戶體驗,形成用戶習(xí)慣。在自愿采納的環(huán)境中,用戶對信息技術(shù)的采納除了受到功能價值的影響外,還受到其它類型感知價值的影響。在需要付出時間和精力的移動個性化推薦情境中,用戶十分在意移動個性化推薦帶來的體驗價值。即企業(yè)在推送商品或服務(wù)信息時,不僅要根據(jù)用戶的興趣愛好為其推薦適宜的產(chǎn)品或服務(wù)信息,還要注重推送信息能給用戶帶來的愉悅感,通過優(yōu)質(zhì)的推薦信息喚醒用戶對移動個性化推薦積極的情感反應(yīng),進而提升用戶使用移動個性化推薦的頻率并最終形成用戶使用習(xí)慣。
2. 關(guān)注用戶收益感知。本研究發(fā)現(xiàn)用戶對移動個性化推薦的感知易用性對體驗價值和安全價值的影響不顯著,這可能是由于在移動個性化推薦較為普遍的移動商務(wù)環(huán)境中,用戶使用個性化推薦的難度小,更多的從其它方面來考慮移動個性化推薦帶來的價值。此外,研究發(fā)現(xiàn)用戶對移動個性化推薦的感知有用性對感知價值的三個維度均有顯著影響,情境特性對功能價值和體驗價值影響顯著,且兩者對功能價值的影響都最大;感知易用性對功能價值也有顯著影響。這進一步表明:一方面功能價值對用戶移動個性化推薦接受意愿起到了決定性作用;另一方面在功能滿足需求的情況下,用戶會追求個性化推薦帶來的情感體驗。分析認為:首先,企業(yè)必須切實保障移動個性化推薦的功能屬性,通過優(yōu)化個性化推薦的技術(shù)特性,推送準確、適時的信息為用戶解決信息過載問題;其次,設(shè)計方便快捷的操作界面,用戶在瀏覽現(xiàn)有信息的同時可以隨時了解已有資源;最后,在關(guān)注推送信息質(zhì)量和數(shù)量的同時,還要注重推送信息的界面設(shè)計、新穎性和個性化等,提升移動個性化推薦的享樂屬性。
3. 降低用戶損失感知。研究發(fā)現(xiàn)用戶使用移動個性化推薦的感知費用對感知價值三個維度均產(chǎn)生顯著影響,感知風(fēng)險對安全價值和體驗價值影響顯著。相較于傳統(tǒng)互聯(lián)網(wǎng)推薦,受到移動設(shè)備屏幕顯示以及移動設(shè)備個人信息存儲的影響,用戶瀏覽和使用移動個性化推薦的過程中,除了需要付出大量時間、精力和金錢以外,還可能遭受隱私、財產(chǎn)信息泄露的風(fēng)險。分析認為:首先,企業(yè)要同移動數(shù)據(jù)服務(wù)商合作,降低用戶接入互聯(lián)網(wǎng)的成本;其次,信息推薦商家、應(yīng)用提供商家、支付機構(gòu)等要注重對用戶信息的保護,不能隨意泄露和使用用戶信息;最后,構(gòu)建用戶對移動個性化推薦基于正直和友善的信任,降低隱私風(fēng)險感知。
參考文獻:
[1] 朱閣,馬龍,Sangwan Sunanda,等.基于社會認知理論的消費者采用模型與實證研究[J].南開管理評論,2010,13(3):12-21.
[2] 周濤,魯耀斌,張金隆.基于感知價值與信任的移動商務(wù)用戶接受行為研究[J].管理學(xué)報,2009,6(10):1407-1412.
[3] 陳潔,王方華.感知價值對不同商品類別消費者購買意愿影響的差異[J].系統(tǒng)管理學(xué)報,2012,21(6): 802-810.
[4] 戴德寶,劉西洋,范體軍.“互聯(lián)網(wǎng)+”時代網(wǎng)絡(luò)個性化推薦采納意愿影響因素研究[J].中國軟科學(xué), 2015,(8):163-172.
[5] 萬君,郭婷婷,吳正祥,等.用戶對移動互聯(lián)網(wǎng)主動式推薦信息的心理抗拒與接受意愿研究[J].北京郵電大學(xué)學(xué)報:社會科學(xué)版,2015,17(5):47-53.
基金項目:國家自然科學(xué)基金項目(項目號:71172218);高等學(xué)校博士學(xué)科點專項科研基金項目(項目號:20122121110005)。
[關(guān)鍵詞]Web挖掘;物流信息平臺;個性化推薦
[DOI]10.13939/ki.zgsc.2015.20.019
1 引 言
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,網(wǎng)絡(luò)已經(jīng)成為人們獲取信息的一個重要途徑。為了提高物流服務(wù)的運作效率,各種類型的物流信息平臺紛紛建立。一般認為,凡是能夠支持或者進行物流服務(wù)供需信息的交互或交換的網(wǎng)站,均可視為物流信息平臺。物流信息平臺匯集了物流行業(yè)各方面的信息,通過Web頁面大量的物流資訊、物流人才、貨運信息、物流服務(wù)等內(nèi)容,給用戶提供了獲取更快捷、更便宜的物流服務(wù)的手段。然而,隨著物流信息平臺整合信息資源種類和數(shù)量的增多,如何讓用戶在訪問網(wǎng)站時更準確、更快捷地獲得自己需要的信息,是物流信息平臺發(fā)展面臨的一個問題。而目前來說,物流信息平臺通常是以系統(tǒng)內(nèi)搜索引擎或檢索工具幫助用戶檢索網(wǎng)站信息,但是大多數(shù)檢索功能缺少主動性,沒有考慮用戶的興趣偏好和用戶間的差異,所以無法滿足用戶對信息的個性化需求,物流信息平臺亟待改進其服務(wù)質(zhì)量。
借鑒電子商務(wù)網(wǎng)站個性化服務(wù)的應(yīng)用,個性化推薦服務(wù)可以作為物流信息平臺提高服務(wù)質(zhì)量的一個有效途徑。個性化推薦服務(wù)是根據(jù)用戶的信息需求、興趣或行為模式,將用戶感興趣的信息、產(chǎn)品和服務(wù)推薦給用戶,這樣就可以避免用戶花費較多的時間進行信息篩選,使用戶在更短的時間內(nèi)更準確地獲得自己真正感興趣的信息。
實現(xiàn)個性化推薦,關(guān)鍵是獲知和描述用戶的個性特征以及興趣偏好。考慮到物流信息平臺是通過Web頁面大量的信息和服務(wù)資訊,用戶的訪問情況可以很容易地反映出其個性特征和興趣偏好,因此對于物流信息平臺的個性化推薦服務(wù)可以通過Web挖掘技術(shù)來實現(xiàn)。
2 基于Web挖掘的物流信息平臺個性化推薦系統(tǒng)
2.1 系統(tǒng)基本功能
個性化推薦系統(tǒng)的基本功能是:通過分析用戶對Web訪問的規(guī)律,尋找行為模式相似的用戶,形成虛擬用戶社區(qū),并建立用戶興趣庫,在對Web內(nèi)容挖掘的基礎(chǔ)上,將符合用戶興趣的信息資源(包括新聞、供求信息、物流服務(wù)等)推薦給當前用戶。同時,利用系統(tǒng)建立的用戶興趣庫,當用戶輸入關(guān)鍵詞進行檢索時,將用戶檢索的結(jié)果按用戶的興趣程度排序,將用戶最有可能關(guān)注的信息或服務(wù)提供給用戶。
2.2 系統(tǒng)體系結(jié)構(gòu)
該系統(tǒng)的體系結(jié)構(gòu)主要由三個部分組成:數(shù)據(jù)采集及預(yù)處理、生成推薦模型與在線推薦部分。如圖1所示。
圖1 基于Web挖掘的物流信息平臺個性化推薦系統(tǒng)體系結(jié)構(gòu)
數(shù)據(jù)預(yù)處理模塊負責從Web服務(wù)器日志、Web使用記錄等中提取、分解、合并、轉(zhuǎn)換相關(guān)的數(shù)據(jù),供數(shù)據(jù)挖掘、偏好分析及推薦引擎使用,為實現(xiàn)個性化推薦任務(wù)提供必要的數(shù)據(jù)。為保證提供數(shù)據(jù)的準確性,因此該模塊一般要經(jīng)過數(shù)據(jù)清洗(數(shù)據(jù)凈化)、用戶識別、會話識別、路徑補充、事務(wù)識別等過程。
模式生成是指用于個性化推薦的推薦模型的生成,該階段是推薦系統(tǒng)的主要部分,主要負責建立用戶興趣庫和虛擬用戶社區(qū)。該工作框架基于聚類算法。挖掘、創(chuàng)建模式數(shù)據(jù)庫是一個循環(huán)往復(fù)的過程。該階段也是離線進行,為在線實時推薦提供支撐。
在線推薦是根據(jù)用戶的訪問情況,將其與系統(tǒng)挖掘生成的模型進行匹配,找到與當前用戶行為相似的虛擬社區(qū),按照該虛擬社區(qū)用戶的興趣庫實時地為用戶進行在線推薦。通常采用的推薦方法為用戶登錄時以頁面的形式給出推薦頁面,也可將推薦內(nèi)容發(fā)送到用戶郵箱中。針對用戶群建立的虛擬用戶社區(qū),可將相同的信息推薦給同一社區(qū)中的所有用戶。
2.3 系統(tǒng)的技術(shù)實現(xiàn)思路
個性化推薦服務(wù)以Web內(nèi)容挖掘為支撐,首先對物流信息平臺上出現(xiàn)的物流信息進行分析,提取出關(guān)鍵詞;根據(jù)關(guān)鍵詞確定該資源所屬的類別,對用戶興趣中對應(yīng)類別的權(quán)重達到設(shè)定閾值的用戶進行推薦。
個性化檢索服務(wù)的工作主要是對檢索結(jié)果進行2次處理。將頁面內(nèi)容按標題提取關(guān)鍵詞后,根據(jù)關(guān)鍵詞將內(nèi)容歸為某一類,然后根據(jù)用戶的興趣,將檢索結(jié)果按與用戶興趣匹配程度從大到小排序后,再提供給用戶。
3 系統(tǒng)關(guān)鍵技術(shù)
3.1 Web使用記錄數(shù)據(jù)的處理
Web使用記錄是用戶興趣及虛擬社區(qū)建立的關(guān)鍵。它所包含的內(nèi)容主要來源于兩個方面:一方面是Web服務(wù)器日志記錄,另一方面是用戶在客戶端操作的記錄。前者可直接從服務(wù)器日志文件中獲得,但數(shù)據(jù)量龐大,需要經(jīng)過數(shù)據(jù)清洗(數(shù)據(jù)凈化)、用戶識別、會話識別、路徑補充、事務(wù)識別等一系列預(yù)處理過程;后者則必須通過對用戶的瀏覽操作進行跟蹤記錄,可在網(wǎng)頁上增加對用戶下載、保存等與興趣程度相關(guān)操作的記錄,用小型的形式實現(xiàn)。
3.2 Web內(nèi)容挖掘中頁面內(nèi)容的表達與分類
在個性化推薦及個性化檢索服務(wù)中,首先要對待處理的資源進行分類。若考慮整個頁面的內(nèi)容,則雖然能得到精確的內(nèi)容表達,但對正文進行處理費時太多,所以采用對標題進行關(guān)鍵詞提取,再根據(jù)關(guān)鍵詞進行分類的方法。分詞采用分詞軟件完成。頁面分類工作流程如圖2所示。
圖2 Web頁面分類工作流程
分類算法有決策樹分類、貝葉斯分類、基于遺傳算法的分類等。該系統(tǒng)采用KNN分類算法。分類過程中,將訓(xùn)練頁面及測試頁面經(jīng)過標題提取及分詞后,形成相應(yīng)的矢量。
3.3 用戶興趣的表示
用戶興趣根據(jù)用戶對Web進行訪問的各種瀏覽行為進行挖掘而得。一些典型的操作,如用戶下載、較長時間的瀏覽、添加至收藏夾等行為,反映出用戶對相關(guān)內(nèi)容感興趣。用戶興趣采用向量空間描述,形如{(A1,W1),(A2,W2),…,(An,Wn)}。Wi取值范圍為[0,1],Wi值越大,說明相應(yīng)的興趣度越高。如,某用戶的興趣向量空間為{(貨源,0.8),(車源,0.2)},說明該用戶在貨源關(guān)鍵詞上的興趣值為0.8,而在車源關(guān)鍵詞上興趣值為0.2,興趣度較低。用戶興趣的向量空間中,每個關(guān)鍵詞對應(yīng)的權(quán)重是動態(tài)變化的。當用戶進行相關(guān)內(nèi)容的下載、長時間瀏覽等操作時,權(quán)重增加(增加至1時不再遞增);若長時間未進行相關(guān)內(nèi)容的瀏覽操作,則權(quán)重值減少。設(shè)定一個閾值,當某一關(guān)鍵詞對應(yīng)的權(quán)重低于該閾值時,將相應(yīng)分項從向量空間中去除,同樣,當某一新增關(guān)鍵詞的權(quán)重高于該閾值時,要在向量空間中增加對應(yīng)分項,使向量空間反映出用戶興趣的實際變化情況。
3.4 虛擬用戶社區(qū)的建立與維護
虛擬用戶社區(qū)的建立采用聚類的方法,將用戶聚合在不同社區(qū)中。常用的聚類算法有基于劃分方法、基于層次方法、基于密度方法、基于網(wǎng)格方法等。該系統(tǒng)采用較為簡單的K平均劃分方法進行聚類處理,設(shè)聚類后簇的數(shù)目為K,具體操作步驟是:①隨機選取K個對象作為初始的K個簇的質(zhì)心;②將其余對象根據(jù)其與各個簇質(zhì)心的距離分配到最近的簇,再求新形成的簇的質(zhì)心;③上述迭代過程不斷重復(fù),直至目標函數(shù)最小化。
為簡化算法,選擇最能體現(xiàn)用戶興趣的網(wǎng)絡(luò)訪問活動進行分析。主要考慮以下用戶行為:下載資源、瀏覽資源。分別構(gòu)建下載和瀏覽行為的相異度矩陣,再通過聚類算法生成虛擬用戶社區(qū)。
首先構(gòu)建下載行為的相異度矩陣。將下載活動表示為(userid,KJ),其中userid為用戶標識,KJ為下載的資源號以及下載時間。以在一段時間內(nèi)用戶下載相同資源的相同程度為基礎(chǔ),構(gòu)建相異度矩陣。如,有10個物流信息資源,編號分別為1~10,在同一段時間內(nèi)用戶A、B下載資源的情況為:A下載的資源集合為(1,2,5,7),B下載的資源集合為(1,2,4),A下載資源中與B相同的比例為50%,B與A相同的比例為66%,綜合考慮,得A、B兩個用戶下載資源活動的相近程度為58%,則相異度為42%。經(jīng)過處理后,得到用戶下載情況的相異度矩陣。
然后構(gòu)建瀏覽行為的相異度矩陣。用戶的瀏覽行為與其興趣的相關(guān)程度在很大程度上取決于瀏覽時間,即用戶對某個頁面瀏覽時間越長,說明該用戶對頁面的興趣度越大。在以瀏覽行為為評價對象進行用戶相似性聚類時,除了考慮用戶瀏覽頁面的相同程度之外,還應(yīng)考慮瀏覽時間。為方便處理,將瀏覽時間按長短分為若干個等級,如瀏覽時間在1min之內(nèi),1~5min,5~10min,10min以上等。以用戶在一段時間內(nèi)訪問相同頁面時間長度等級的差異情況為主,構(gòu)建相異度矩陣。
分別對上述2個相異度矩陣采用K平均劃分方法進行聚類,也可以將2個相異度矩陣合并,然后進行聚類處理。合并時可以加上一定的權(quán)重,如側(cè)重瀏覽行為,則對瀏覽情況的相異值乘上一個較大的系數(shù)B(0
用戶的興趣是動態(tài)變化的。相應(yīng)的虛擬社區(qū)應(yīng)根據(jù)用戶的興趣變化而變動。若某個用戶的興趣發(fā)生變化,某類興趣值下降至設(shè)定的閾值,則將該用戶從相應(yīng)的社區(qū)中刪除;若用戶某類興趣值增加至設(shè)定的閾值,則將該用戶加入到對應(yīng)的社區(qū)中。對新用戶經(jīng)過一段時間的瀏覽行為跟蹤后,分配至合適的社區(qū)中。
4 結(jié) 論
隨著物流信息平臺整合資源和信息的增多,用戶訪問網(wǎng)站及時獲取所需信息的難度越來越大,而大多數(shù)物流信息平臺所具備的搜索功能又缺乏主動性。本文主要針對網(wǎng)站的普通用戶獲取信息的問題,將電子商務(wù)的個性化推薦技術(shù)應(yīng)用其中。主要以Web挖掘技術(shù)從用戶的瀏覽行為間接地獲取用戶興趣進而完成個性化推薦。系統(tǒng)中所用的算法只是選用了相關(guān)挖掘算法中比較典型的,具體選用算法還可以進一步研究。
參考文獻:
[1]趙影.基于Web使用挖掘的個性化推薦服務(wù)研究[D].大連:東北財經(jīng)大學(xué),2009.
[2]張紅霞.基于Web挖掘的電子商務(wù)個性化推薦系統(tǒng)[J].遼寧工程技術(shù)大學(xué)學(xué)報(社會科學(xué)版),2009,11(6).
[3]陳基漓,牛秦洲.Web挖掘在農(nóng)業(yè)信息網(wǎng)站個性化服務(wù)中的應(yīng)用[J].安徽農(nóng)業(yè)科學(xué),2008,36(35).
關(guān)鍵詞:智慧旅游;數(shù)字旅游;旅游智能推薦
1 引言
隨著城市智慧旅游的建設(shè),旅游系統(tǒng)的旅游資源庫也逐漸龐大。如何整合這些旅游資源為游客提供一個智能化、個性化的服務(wù),讓游客在短時間內(nèi)找到自己想要的旅游信息,這就需要利用數(shù)據(jù)挖掘技術(shù)開發(fā)一個數(shù)字旅游服務(wù)智能推薦系統(tǒng)。該系統(tǒng)能夠根據(jù)游客的喜好、歷史訪問記錄或其他相似客戶信息為游客提供個性化的旅游服務(wù)。
2 系統(tǒng)設(shè)計
構(gòu)建一個能充分利用秦皇島旅游資源,為游客推薦具有秦皇島特色旅游服務(wù)的系統(tǒng)是秦皇島旅游資訊服務(wù)實現(xiàn)個性信息化服務(wù)的有效手段。該系統(tǒng)運用數(shù)據(jù)挖掘技術(shù)根據(jù)需求信息結(jié)合歷史訪問記錄向游客推薦更符合用戶需求的旅游資源。通過該系統(tǒng)游客可以在世界的任何地方根據(jù)自己的喜好得到實時、動態(tài)和準確的旅游資源。
2.1 系統(tǒng)結(jié)構(gòu)
該系統(tǒng)是基于java、Servlet、jsp、JDBC、數(shù)據(jù)庫等技術(shù)實現(xiàn)的以 Web 技術(shù)為核心的瀏覽器/服務(wù)器(B/S)模式的與平臺無關(guān)的大型旅游推薦系統(tǒng)。系統(tǒng)基于J2EE三層結(jié)構(gòu)設(shè)計的,分為邏輯層、表達層和數(shù)據(jù)層。系統(tǒng)分為GUI(圖形用戶接口)、智能分析、推薦引擎、旅游資源庫、數(shù)據(jù)挖掘處理等幾個模塊。游客登錄網(wǎng)站后,系統(tǒng)智能分析模塊調(diào)用嵌入的Web挖掘算法根據(jù)游客以往的瀏覽記錄為用戶提供貼合用戶喜好的個性化頁面。而當用戶通過頁面輸入自己要查詢的信息關(guān)鍵詞提交后,智能分析模塊對用戶輸入的關(guān)鍵字進行分析,分析結(jié)果交給推薦引擎,經(jīng)過數(shù)據(jù)挖掘處理模塊對系統(tǒng)用戶信息庫和旅游資源庫進行挖掘,得出推薦頁面集,最后將推薦內(nèi)容返回給用戶。系統(tǒng)各個模塊之間相互依賴,互相交互得到個性化的推薦結(jié)果集。系統(tǒng)結(jié)構(gòu)圖如圖1所示:
圖1 系統(tǒng)結(jié)構(gòu)圖
2.2 系統(tǒng)功能
旅游智能推薦系統(tǒng)是秦皇島旅數(shù)字旅游系統(tǒng)的一個子系統(tǒng),系統(tǒng)中嵌入了數(shù)據(jù)挖掘等技術(shù)實現(xiàn)了智能推薦功能,使系統(tǒng)可以根據(jù)用戶輸入需要的關(guān)鍵詞及用戶的訪問記錄為用戶感興趣的個性化推薦頁面集。具有以下方面的功能:
a.旅游詳細信息瀏覽。b.旅游資源庫更新。c.用戶查詢功能。
此功能包括兩個子功能:
a.分析輸入的檢索詞及用戶以往瀏覽記錄 b.通過嵌入的數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)進行分攤返回給用戶端感興趣的個性化頁面。
2.3 智能分析模塊設(shè)計
(1)獲取用戶需求,分析用戶訪問記錄;(2)響應(yīng)用戶提交的搜索請求,通過關(guān)聯(lián)規(guī)則挖掘分析將列出對應(yīng)的搜索結(jié)果以及相關(guān)鏈接返回給用戶。
2.4 推薦引擎設(shè)計
用戶與數(shù)據(jù)庫之間是通過推薦引擎模塊連接的,推薦引擎作為系統(tǒng)的一部分實施簡單運行在服務(wù)器端,推薦引擎模塊應(yīng)用系統(tǒng)協(xié)同過濾推薦法來實現(xiàn)初始推薦功能。推薦引擎通過GUI模塊接受用戶需求,經(jīng)過處理得到的數(shù)據(jù)立方體,在數(shù)據(jù)立方體上進行聯(lián)機分析。
2.5 數(shù)據(jù)挖掘處理模塊設(shè)計
系統(tǒng)實現(xiàn)智能推薦功能的主要模塊為數(shù)據(jù)挖掘處理模塊,此模塊繼承了多種成熟的數(shù)據(jù)挖掘算法。該模塊應(yīng)用合理的數(shù)據(jù)挖掘算法通過對已有數(shù)據(jù)及資源庫進行數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析給用戶提供個性化的旅游服務(wù)。
2.5.1 數(shù)據(jù)收集
數(shù)據(jù)預(yù)處理的前提就是做好數(shù)據(jù)收集,收集的數(shù)據(jù)源包括頁面、日志以及用戶的訪問記錄和旅游資源庫的數(shù)據(jù),分析這些數(shù)據(jù),為數(shù)據(jù)挖掘做好充分準備。
2.5.2 數(shù)據(jù)預(yù)處理
數(shù)據(jù)分析之前需要對收集到的數(shù)據(jù)做預(yù)處理,處理成符合算法的數(shù)據(jù)集。數(shù)據(jù)預(yù)處理包括數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)選擇和數(shù)據(jù)變換四部分。數(shù)據(jù)清洗是對收集的數(shù)據(jù)進行預(yù)處理、抽取、過濾和組織重構(gòu)等操作,通過數(shù)據(jù)清洗將數(shù)據(jù)整理成具有一定主題的主題數(shù)據(jù)庫,如中原山水、紅色之旅等,為進一步數(shù)據(jù)挖掘提供數(shù)據(jù)基礎(chǔ)。數(shù)據(jù)集成將不同的數(shù)據(jù)源合并成一致的數(shù)據(jù)存儲,對不同城市的旅游資源包括旅游路線、就去景點、酒店預(yù)訂、車票預(yù)訂等進行數(shù)據(jù)分析,按照數(shù)據(jù)的相似性進行集成。數(shù)據(jù)選擇通過一定的算法刪除數(shù)據(jù)集中的冗余數(shù)據(jù),達到壓縮數(shù)據(jù)的目的。數(shù)據(jù)轉(zhuǎn)換將數(shù)據(jù)經(jīng)過合適的規(guī)范化算法整理成適合不同數(shù)據(jù)挖掘算法合適的數(shù)據(jù)形式。通過對數(shù)據(jù)進行預(yù)處理可以降低數(shù)據(jù)挖掘處理的時間,提高數(shù)據(jù)挖掘的質(zhì)量,進而提高系統(tǒng)的效率。數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘模塊必不可少的階段,預(yù)處理的結(jié)果直接影響著系統(tǒng)推薦的質(zhì)量。
2.5.3 數(shù)據(jù)分析
數(shù)據(jù)分析主要由成熟數(shù)據(jù)挖掘算法組成。通過數(shù)據(jù)挖掘算法對處理好的數(shù)據(jù)進行挖掘,挖掘出符合用戶需求的規(guī)則,并通過推薦引擎將分析的結(jié)果處理成個性化的推薦頁面返回給瀏覽器端。我們的系統(tǒng)暫時集成了聚類和關(guān)聯(lián)規(guī)則挖掘算法。
2.6 開放性智能推薦系統(tǒng)接口設(shè)計
為了提高系統(tǒng)的可擴展性,使系統(tǒng)可以不斷的集成先進的數(shù)據(jù)挖掘算法,我們定義一組標準的接口供各類人員繼承和調(diào)用。接口依據(jù)Java 語言中的 interface 類型來進行定義了,所有實現(xiàn)此接口的算法實例都必須實現(xiàn)相應(yīng)的方法,從而為各種算法的實現(xiàn)提供了統(tǒng)一的規(guī)范,使得不同數(shù)據(jù)算法可以方便快速的集成。系統(tǒng)中的接口定義如下:
public interface IRSystem {
public String getAlgorithmName();// 數(shù)據(jù)挖掘算法名稱
public String getCName();//獲取所屬公司名稱
public String getAlgorithmDescription();// 獲取算法詳細描述
public String[] getRecoSets ();//獲取推薦結(jié)果
public String[] getRecoSets(String[]Keys); // 根據(jù)輸入的關(guān)鍵詞獲取推薦結(jié)果
public void init(String configFile); // 根據(jù)配置文件對當前推薦方法進行初始化
}
3 結(jié)束語
基于數(shù)據(jù)挖掘技術(shù)的旅游智能推薦系統(tǒng),能夠滿足用戶的個性化需求,可以智能化的向用戶推薦感興趣的旅游服務(wù),對建設(shè)智慧旅游有著重要的意義。現(xiàn)有系統(tǒng)僅僅集成了K-聚類、貝葉斯、關(guān)聯(lián)規(guī)則等幾種成熟的推薦算法,隨著數(shù)據(jù)挖掘算法人員的研究會有更好更有效率的挖掘算法出現(xiàn),為了使系統(tǒng)能夠很好的擴展這些算法,我們提供了標準的接口來實現(xiàn)這一功能,提高了系統(tǒng)的可擴展性。
參考文獻
[1]張晗,潘正運,張燕玲.智能“旅游電子超市”的研究與設(shè)計[J].微計算機信息.2005.12,3.
[2]黃解軍,潘和平,萬幼川.數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究[J].計算機工程與應(yīng)用,2003.2,45-48.
[3]錢衛(wèi)寧,魏藜,王焱,錢海蕾,周傲英.一個面向大規(guī)模數(shù)據(jù)庫的數(shù)據(jù)挖掘系統(tǒng)[J].軟件學(xué)報,2002.8,1540-1545頁.
[4]姚罡,麥永浩,黨選舉,數(shù)據(jù)挖掘在電子商務(wù)推薦系統(tǒng)中的應(yīng)用設(shè)計[J].計算機與自動化,2002.12,39-41頁.
【關(guān)鍵詞】 個性化推薦 移動學(xué)習(xí) 混合式推薦
近年來,我國英語教學(xué)經(jīng)歷了一系列的改革,教學(xué)理念和教學(xué)方法都發(fā)生了巨大的變化,然而,大班教學(xué)的現(xiàn)狀卻始終未能改變。在大班條件下,有限的課堂時間使教師只能講授語言知識,而不能為學(xué)生提供充足的語料和運用英語的機會,學(xué)生的學(xué)習(xí)需求無法得到滿足。移動技術(shù)的發(fā)展為解決這一問題提供了一個契機。利用移動設(shè)備,學(xué)生可以隨時隨地從網(wǎng)上獲取大量的學(xué)習(xí)資源。然而,網(wǎng)上海量的資源卻容易造成“網(wǎng)絡(luò)迷航”和注意力分散現(xiàn)象。在這種情勢下,個性化推薦技術(shù)應(yīng)運而生。
一、個性化學(xué)習(xí)理論
個性化學(xué)習(xí)是指學(xué)習(xí)者可以自主制定學(xué)習(xí)計劃、選擇學(xué)習(xí)內(nèi)容,確定學(xué)習(xí)時間和學(xué)習(xí)地點的學(xué)習(xí)方式。個性化學(xué)習(xí)是在多元智能理論和元認知理論的基礎(chǔ)上提出的。多元認知理論認為人的智力是多元的,學(xué)習(xí)者之間個體差異巨大,因此,教師應(yīng)了解并尊重個體間的差異。元認知理論認為每個學(xué)習(xí)者都有獨特的認知風(fēng)格和認知方式,因此,教師應(yīng)提供多樣化的學(xué)習(xí)資源,以滿足不同的認知需求。個性化學(xué)習(xí)具有學(xué)習(xí)資源的多維性、學(xué)習(xí)價值追求的多重性、學(xué)習(xí)風(fēng)格的獨特性、學(xué)習(xí)過程的終身性和學(xué)習(xí)方式的自主性、合作性與探究性特征[1]。
二、個性化推薦
個性化推薦是指利用用戶以往的選擇或相似性關(guān)系發(fā)掘用戶潛在的興趣對象,通過過濾信息為用戶提供滿足個性化需求的產(chǎn)品。個性化推薦系統(tǒng)通常由3部分組成:用戶行為記錄模塊、用戶偏好模塊和推薦算法模塊。推薦算法主要包括基于內(nèi)容的推薦、協(xié)同過濾推薦、基于網(wǎng)絡(luò)結(jié)構(gòu)的推薦、基于知識的推薦、混合推薦等。
三、移動英語學(xué)習(xí)平臺設(shè)計
設(shè)計移動英語學(xué)習(xí)平臺是為了滿足學(xué)習(xí)者個性化的學(xué)習(xí)需求,因此首先要分析用戶的特點和用戶的偏好以及用戶間的相似關(guān)系。其次要對學(xué)習(xí)資源進行分析,包括資源的類型、特征、屬性等。在此基礎(chǔ)上利用混合式推薦,為學(xué)習(xí)者提供需要的學(xué)習(xí)材料。
3.1 平臺總體結(jié)構(gòu)
個性化移動英語學(xué)習(xí)平臺主要由服務(wù)器和移動終端兩部分組成。服務(wù)器端包括web服務(wù)器和數(shù)據(jù)庫服務(wù)器。數(shù)據(jù)庫服務(wù)器用于存儲用戶信息和學(xué)習(xí)資源,Web服務(wù)器用于上傳資源和修改數(shù)據(jù)庫。移動終端是指接入互聯(lián)網(wǎng),可以向Web服務(wù)器提出學(xué)習(xí)請求或接收資源的智能手機、平板電腦等設(shè)備。個性化移動英語學(xué)習(xí)平臺架構(gòu)分為三層:數(shù)據(jù)層、業(yè)務(wù)層和表現(xiàn)層。具體如下圖所示:
數(shù)據(jù)層采集、存儲學(xué)習(xí)者的基本信息和學(xué)習(xí)行為信息以及學(xué)習(xí)資源信息,并通過預(yù)加工為業(yè)務(wù)層提供信息。業(yè)務(wù)層是整個平臺最核心的一層,通過數(shù)據(jù)挖掘和數(shù)據(jù)分析,對數(shù)據(jù)層傳遞來的信息進行過濾、分析、加工、建模以建立用戶偏好模型。應(yīng)用層接受用戶偏好模型,并為學(xué)習(xí)者推薦個性化的學(xué)習(xí)內(nèi)容。
3.2用戶偏好模塊
要建立用戶偏好模型首先要采集和整理用戶信息。用戶信息包括基本信息和學(xué)習(xí)行為信息。基本信息是指用戶在注冊時填寫的個人信息,學(xué)習(xí)行為信息是通過用戶的各種學(xué)習(xí)行為采集的信息,如點擊、瀏覽、搜索、下載、收藏、分享、評價等行為數(shù)據(jù)。服務(wù)器端對用戶信息進行數(shù)據(jù)分析和建模。對于新用戶基本信息的簡單處理可采用決策樹算法。該算法不需要了解用戶背景知識,只需要對用戶進行分類就可以初步預(yù)測用戶對學(xué)習(xí)材料的態(tài)度。例如,兒童可能對英語兒歌感興趣,高中生可能對語法知識感興趣。利用決策樹進行數(shù)據(jù)分類首先需用一組訓(xùn)練數(shù)據(jù)集來訓(xùn)練分類器,然后用已建好的分類器對真實用戶數(shù)據(jù)進行分類。在對用戶基本信息簡單處理后,通過對用戶的學(xué)習(xí)行為數(shù)據(jù)的分析,來建立用戶偏好模型。具體方法是用關(guān)鍵詞和相應(yīng)的權(quán)值來表示偏好,對關(guān)鍵詞權(quán)值的計算有多種方法,其中TF-IDF(詞頻-逆文檔頻率)算法簡單且容易實現(xiàn)。
3. 3學(xué)習(xí)資源分析模塊
聽、說、讀、寫、譯是英語基本技能,其中說、寫屬于輸出性技能,聽、讀屬于輸入性技能,譯則是各種技能實現(xiàn)的基礎(chǔ)。為學(xué)生提供個性化推薦,主要是推薦輸入性的語言材料,即聽力材料和閱讀材料,同時為了提高寫作能力,教師也可為學(xué)生提供作文的范文。在為學(xué)生提供閱讀材料和作文范文前,教師首先要了解材料中詞匯的難度。詞匯的難度取決于詞匯的長度、音節(jié)數(shù)和使用頻率。Chin-Ming Chen總結(jié)了詞匯難度公式[2]:
bj =( Lj×0.7+Pj×0.3) ×Gj
其中, bj表示第j個詞匯的難度, Lj表示第j個詞匯的長度系數(shù), Pj表示第j個詞匯的音節(jié)長度系數(shù), Gj表示根據(jù)詞頻確定的第j個詞匯的難度系數(shù)。
詞匯的難度對文章難度有影響,文章的類別、主題對文章的難度也有影響。最常用的文本表示方法是向量空間模型。在向量空間模型中,每個特征項對分類有不同的貢獻,因此需要進行權(quán)重計算。為了使用戶描述文件和學(xué)習(xí)資源描述文件的表達方式一致,對學(xué)習(xí)資源文件也采用TF-IDF算法來計算。
同樣,在向?qū)W生推薦寫作范文時,也需要了解文檔的相似度,也可采用TF-IDF算法來進行相似度判斷[3]。為學(xué)習(xí)者提供聽力材料的過程較為復(fù)雜,由于計算機不具備人腦的智能,因此難以分析音、視頻材料的難度和主題。因此需要教師為聽力材料標注難度、主題、類型等,系統(tǒng)在結(jié)合用戶學(xué)習(xí)需求的基礎(chǔ)上為用戶提供個性化的聽力材料。
3.4個性化推薦模塊
由于移動終端數(shù)據(jù)存儲、處理能力有限,因此本平臺的個性化推薦模塊在服務(wù)器端實現(xiàn)。推薦算法選擇基于內(nèi)容的推薦算法。該算法對用戶和學(xué)習(xí)資料分別建立配置文件,通過分析用戶瀏覽的內(nèi)容,建立用戶的配置文件,通過比較用戶與學(xué)習(xí)資料的相似度,向用戶推薦與其最匹配的學(xué)習(xí)資料。基于內(nèi)容的推薦可以處理冷啟動問題,而且本平臺的學(xué)習(xí)資料多為文本資料,多媒體資料經(jīng)過標識,已便于計算機識別和處理,因此基于內(nèi)容的推薦算法更為適用。
本文將個性化推薦技術(shù)應(yīng)用于移動英語學(xué)習(xí)中。通過對學(xué)習(xí)者基本信息和學(xué)習(xí)行為信息的采集和處理,建立用戶偏好模型,通過對學(xué)習(xí)資料的分析建立學(xué)習(xí)資料模型,運用基于內(nèi)容的推薦算法將用戶信息與學(xué)習(xí)資料信息相匹配,并將最匹配的材料發(fā)送至用戶的移動設(shè)備上。本平臺節(jié)約了學(xué)習(xí)者大量的資料搜索和選擇時間,緩解了“網(wǎng)絡(luò)迷航”狀況,提高了英語學(xué)習(xí)效率。
參 考 文 獻
[1]李廣,姜英杰.個性化學(xué)習(xí)的理論建構(gòu)與特征分析[J].東北師大學(xué)報(哲學(xué)社會科學(xué)2005,(3):152