培訓安排:2020年10月24-25日上海 2020年12月26-27日上海
培訓費用:4200元/人(含培訓費、資料費、午餐、稅費等)
課程背景:
數據和算法在支持企業精細化運營、生產制造、營銷、用戶體驗、供應鏈、物流等場景得到廣泛的應用。
本課程將為學員梳理數據算法在不同領域的實際案例,幫助學員掌握常用的數據模型原理和應用方法。
對高價值用戶篩選、反作弊、供需預估和物流配送、成本優化等方向的案例進行現場解析。
對于計劃轉行數據算法方向的學員,提供理論和實踐的綜合課程。
培訓收益:
·幫助非數據算法專業的團隊leader快速理解數據算法的應用場景與脈絡。
·為計劃轉行數據算法的同學提供實際項目建模經驗和解析。
·了解常用的數據分析模型和經典算法原理與應用落地的流程。
·學習如何構造營銷用戶、流失用戶、高價值用戶的篩選模型。
·學習如何利用規則和模型構建 反作弊、異常值監控系統。
·了解如何構建需求預估模型。針對周、天、小時等粒度的未來需求進行預測。
·了解如何利用運籌優化算法支持相關項目落地。優化項目的建模思想與實際案例。
課程大綱:
第一部分、數據分析探索與應用流程
·商業數據分析
數據挖掘Road Maps
Rpython簡單介紹
·數據探索
數據預處理
構建新的變量
異常值處理
數據可視化
·數據分析應用流程
第二部分、經典預測和分類方法
·回歸分析
相關性
線性回歸與擬合
最小二乘法的幾何解釋
線性回歸中的變量選擇
回歸算法的評估與選擇
·KNN 分類器
確定相鄰的樣本數據
分類規則
參數K的選擇
算法優缺點
案例分析:如何選擇相似用戶?
·邏輯回歸
邏輯回歸模型
分類算法的評估
案例分析:用戶借貸能力判定
·決策樹
迭代分割
純度的計算
決策樹的使用效果
如何避免過擬合
剪枝與終止條件
案例分析:如何利用決策樹的提取出業務規則?
·(補充)樹模型應用——隨機森林
案例分析:如何幫助業務方篩選出重要的業務變量?
第三部分、經典聚類算法
·聚類問題介紹
·兩條數據之間的距離
歐式距離
數值型數據處理與距離函數
類別型數據的距離計算
混合類型數據的距離計算
兩個類別之間的距離
最大距離、最小聚類、中心距離
·K-means
如何選擇參數K
·層次聚類
案例分析:如何選擇相似用戶?
第四部分、異常檢測與反欺詐
·異常值檢測
異常團體識別
案例分析:無監督反欺詐方案應用
業務思考:如何構建一個反欺詐系統?
第五部分、時間序列預測
·時間序列回歸模型
預測變量篩選
回歸預測
非線性回歸
相關、因果和預測
·時間序列分解
時間序列成分
移動平均
經典時間序列分解
STL分解法
趨勢性、季節性判定
業務思考:如何對時間序列進行聚類?
分解法預測
時間序列類異常值檢測
業務思考:如何評估促銷活動效果?
·ARIMA模型
平穩性和差分
延遲算子
自回歸與移動平均
非季節性arima
參數估計與選擇
季節性arima
·高級預測方法
復雜的季節性
向量自回歸
神經網絡
·實際預測問題
周數據、天粒度數據以及小時數據預測
預測組合
長序列與短序列預測
訓練集與測試集
缺失值與異常值
案例分享:共享單車Daily天粒度需求預測
第六部分、決策優化
·開源決策優化工具介紹 google or-tools
運籌優化方法介紹
優化算法應用流程
·案例分享(可選)
電商促銷優惠券發放優化:給定用戶補貼的預算,如何選擇合適的補貼用戶。
工廠布局優化:考慮如何減少物料搬運成本(運量和距離)。
倉庫選址問題:如何選擇服務點,滿足服務能力和降低運輸成本。
物流配送、車輛路徑調度:配送問題綜合建模與分析。
講師介紹:侯老師
同濟工業工程背景,數據算法專家。
具有需求預測、收益管理、反作弊、物流配送路徑優化系統等豐富的數據算法實戰經驗。
在外資企業中享有很高的知名度。 接受咨詢或培訓的單位包括上海大眾汽車、長春西門子汽車電子、聯合汽車電子、三維制藥等等有限公司以及其他來自全國各地的合資企業。
【報名咨詢】
聯系電話:010-62258232 62278113 13718601312 18610339408
聯 系 人:李先生 陳小姐