合肥非度信息技術有限公司
參考價: | 面議 |
- 產品型號
- 品牌
- 其他 廠商性質
- 所在地
訪問次數(shù):96更新時間:2021-07-02 15:49:12
個性化推薦解決方案 | |
非度個性化推薦解決方案包括: 1) 從個性化推薦角度,實現(xiàn)個性化推薦算法:建設適合通信行業(yè)的產品個性化推薦研究方法。包括,常用推薦算法、產品推薦算法改進與優(yōu)化。 2) 從行業(yè)現(xiàn)實應用的角度,分析算法的*性:解決運營商實際業(yè)務管理中的問題,在評價算法的*性時除了通過常規(guī)算法評價指標外,系統(tǒng)還將從實際推薦效果的角度評價算法的*性。 一、 功能架構
二、數(shù)據(jù)挖掘任務管理 數(shù)據(jù)挖掘任務是指一個完整的數(shù)據(jù)采集、數(shù)據(jù)預處理、算法選擇、數(shù)據(jù)挖掘計算、結果輸出的過程,任務管理提供定制任務的界面和后臺的任務調度執(zhí)行。 任務是數(shù)據(jù)挖掘管理的起點,任何數(shù)據(jù)挖掘必須從定制一個任務開始,一個任務可以是周期性執(zhí)行的,如每天定時執(zhí)行;也可以只一次性執(zhí)行的,任務只執(zhí)行一次,執(zhí)行完畢后即結束。一個任務包含執(zhí)行時間間隔(周期性任務)、數(shù)據(jù)采集對象及采集方式、數(shù)據(jù)采集時間、算法選擇與計算等要素。 三、數(shù)據(jù)采集管理 數(shù)據(jù)采集是從各數(shù)據(jù)源獲取用于數(shù)據(jù)挖掘的原始數(shù)據(jù)的過程。 支持從關系型數(shù)據(jù)庫(Oracle、Mysql)采集數(shù)據(jù); 支持導入格式的數(shù)據(jù)文件(excel、CSV);支持分批次多次導入?yún)R總。 支持數(shù)據(jù)源管理,定義與各種關系型數(shù)據(jù)庫連接。 四、數(shù)據(jù)預處理 數(shù)據(jù)預處理是對采集到的原始數(shù)據(jù)集進行解析、過濾、校驗的過程,處理后的數(shù)據(jù)按業(yè)務實體存儲。 支持在線實時采集的數(shù)據(jù)預處理、離線采集的數(shù)據(jù)預處理。 支持數(shù)據(jù)過濾與數(shù)據(jù)校驗功能,對數(shù)據(jù)的有效性進行判斷,對于異常數(shù)據(jù)進行記錄。 支持數(shù)據(jù)修復功能,對異常數(shù)據(jù)進行更正,如去掉前綴(86)。 五、數(shù)據(jù)挖掘算法 1)關聯(lián)分析 關聯(lián)分析(Association Analysis)是指從大量的數(shù)據(jù)集中,搜索出有強關聯(lián)的規(guī)則(Rule)。建立關聯(lián)規(guī)則的兩個重要判據(jù)是:Support以及Confidence。Support是指在數(shù)據(jù)集中,包含規(guī)則中所有Item的條目越多,Support越大,就越能夠排除偶然因素的影響。 而Confidence則是,當規(guī)則前件出現(xiàn)時,規(guī)則后件出現(xiàn)地越多,Confidence越大。我們在關聯(lián)分析算法中所要做的工作,就是找出所有超過特定閾值的關聯(lián)規(guī)則。 2)數(shù)據(jù)挖掘計算 根據(jù)提交的數(shù)據(jù)挖掘任務,執(zhí)行分析計算工作。 支持計算過程日志監(jiān)控和保存 支持多任務并行計算。 3)數(shù)據(jù)挖掘結果查詢與導出 實現(xiàn)數(shù)據(jù)挖掘結果TOP N列表提取和Excel導出功能 實現(xiàn)在線查詢數(shù)據(jù)挖掘結果 4)數(shù)據(jù)挖掘模型管理 對于數(shù)據(jù)挖掘任務執(zhí)行結果較滿足實際需求情況下,系統(tǒng)支持將這些挖掘任務轉換成模型,以便沉淀下來作為以后數(shù)據(jù)挖掘分析使用。也可以作為后續(xù)數(shù)據(jù)訓練使用。 | |