培訓(xùn)安排:2023年03月20日-03月22日(19日報到) 北京
培訓(xùn)對象:
1.系統(tǒng)架構(gòu)師、系統(tǒng)分析師、高級程序員、資深開發(fā)人員。
2.牽涉到網(wǎng)絡(luò)采集、處理和規(guī)劃的負(fù)責(zé)人、設(shè)計人員。
3.政府機(jī)關(guān),金融保險、移動等以互聯(lián)網(wǎng)信息為數(shù)據(jù)來源單位的負(fù)責(zé)人。
4.高校、科研院所牽涉到人工智能與機(jī)器學(xué)習(xí)的項目負(fù)責(zé)人。
培訓(xùn)費用:7800元/人(含教材、培訓(xùn)費、考證費以及學(xué)習(xí)用具等費用),食宿統(tǒng)一安排,費用自理。
課程介紹:
Python是數(shù)據(jù)分析最常用的語言之一,中文自然語言處理(簡稱NLP)是計算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個重要方向。它研究能實現(xiàn)人與計算機(jī)之間用自然語言進(jìn)行有效通信的各種理論和方法。NLP是一門融語言學(xué)、機(jī)器學(xué)習(xí)、統(tǒng)計學(xué)、大數(shù)據(jù)以及人工智能等于一體的科學(xué)。本課程偏重實戰(zhàn),不僅系統(tǒng)介紹了NLP涉及的知識點,同時也教會大家如何實際應(yīng)用與開發(fā)。
本次培訓(xùn)主要介紹NLP所需要了解的Python科學(xué)包、正則表達(dá)式以及檢索技術(shù)的知識。包括NLP相關(guān)的各個知識點:詞法分析技術(shù)、句法分析技術(shù)、常用的向量化方法,介紹機(jī)器學(xué)習(xí)的一些基本概念,重點突出NLP常用的分類算法、聚類算法,同時還分享了幾個案例。每個部分都有對應(yīng)源數(shù)據(jù)和完整代碼,供實戰(zhàn)使用。
自然語言處理(NLP)屬于人工智能與計算機(jī)語言學(xué)的交叉領(lǐng)域,處理的是計算機(jī)與人類語言之間的交互問題。隨著人機(jī)交互需求的日益增長,計算機(jī)具備處理當(dāng)前主要自然語言的能力已經(jīng)成為了一個必然趨勢。
本培訓(xùn)適合通信、金融、保險、制造、醫(yī)藥、教育科研、市場調(diào)研、連鎖零售和電子商務(wù)等行業(yè)的數(shù)據(jù)分析人員,通過本課程的學(xué)習(xí),將對NLP與數(shù)據(jù)科學(xué)領(lǐng)域中的概念有一個充分的了解,并能將這些知識應(yīng)用到日常工作中。
頒發(fā)證書:
參加相關(guān)培訓(xùn)并通過考試的學(xué)員,可以獲得:
工業(yè)和信息化部頒發(fā)的-《NLP自然語言處理證書》。該證書可作為專業(yè)技術(shù)人員職業(yè)能力考核的證明,以及專業(yè)技術(shù)人員崗位聘用、任職、定級和晉升職務(wù)的重要依據(jù)。注:請學(xué)員帶一寸彩照2張(背面注明姓名)、身份證復(fù)印件一張。
詳細(xì)培訓(xùn)內(nèi)容介紹:
模塊一 NLP和深度學(xué)習(xí)發(fā)展概況和最新動態(tài)
1. NLP歷史現(xiàn)在及為什么需要學(xué)習(xí)NLP技術(shù)
2. NLP實現(xiàn)機(jī)器學(xué)習(xí),聊天機(jī)器人,情感分析和語義搜索
模塊二 NLP與PYTHON編程
3. Python環(huán)境搭建及開發(fā)工具安裝
4. NLP常用PYTHON開發(fā)包的介紹
5. Jieba安裝、介紹及使用
6. Stanford NLP 在Python環(huán)境中安裝、介紹及使用
7. Hanlp 在Python環(huán)境中安裝、介紹及使用
模塊三 快速掌握NLP技術(shù)之分詞、詞性標(biāo)注和關(guān)鍵字提取
08. 分詞、詞性標(biāo)注及命名實體識別介紹及應(yīng)用
09. 準(zhǔn)確分詞之加載自定義字典分詞
10. 準(zhǔn)確分詞之動態(tài)調(diào)整詞頻和字典
11. 詞性標(biāo)注代碼實現(xiàn)及信息提取
12. 人名、地名、機(jī)構(gòu)名等關(guān)鍵命名實體識別
13. TextRank算法原理介紹
14. 基于TextRank關(guān)鍵詞提取
模塊四 句法與文法
16. 依存句法與語義依存分析
17. 依存句法樹解析(子樹遍歷,遞歸搜索,葉子節(jié)點提取等)
18. 名詞短語塊挖掘
19. 自定義語法與CFG
模塊五 N-GRAM文本挖掘
20. N-GRAM算法介紹
21. N-GRAM生成詞語對
22. TF-IDF算法介紹應(yīng)用
23. 基于TF-IDF挖掘符合語言規(guī)范的N-GRAM
模塊六 表示學(xué)習(xí)與關(guān)系嵌入
24. 語言模型
25. 詞向量
26. 深入理解Word2vec算法層次sofmax
27. 深入理解Word2vec算法負(fù)采樣
28. 6.4 基于Word2vec技術(shù)的詞向量、字向量訓(xùn)練
模塊七 深度學(xué)習(xí)之卷積神經(jīng)網(wǎng)絡(luò)
29. BP神經(jīng)網(wǎng)絡(luò)
30. 徹底理解深度學(xué)習(xí)指卷積神經(jīng)網(wǎng)絡(luò)
31. CNN文本分類
32. CNN文本分類算法模塊
33. CNN文本分類模型詳解數(shù)據(jù)預(yù)處理
34. CNN文本分類模型測試與部署
模塊八 深度學(xué)習(xí)之遞歸神經(jīng)網(wǎng)絡(luò)
35. 遞歸網(wǎng)絡(luò)
36. LSTM
37. LSTM文本分類原理
38. LSTM文本分類代碼架構(gòu)
39. LSTM文本分類代碼詳解
40. LSTM文本分類模型預(yù)測與部署
模塊九 特定領(lǐng)域命名實體識別NER技術(shù)
41. 基于深度學(xué)習(xí)醫(yī)藥保險命名實體識別課題背景介紹
42. 醫(yī)藥保險命名實體和實體關(guān)系體系建立和命名實體分類規(guī)范
43. 醫(yī)藥保險命名實體識別相關(guān)前沿技術(shù)和難點
44. 基于深度學(xué)習(xí)醫(yī)藥保險命名實體識別的算法模塊設(shè)計
45. 數(shù)據(jù)的采集,清洗,數(shù)據(jù)機(jī)器自動標(biāo)注及轉(zhuǎn)化為深度學(xué)習(xí)格式
46. 模型本地Lib庫封裝
47. 部署tensorflow訓(xùn)練好的模型為云服務(wù)
48. 算法設(shè)計及代碼實現(xiàn)
49. 代碼調(diào)試,參數(shù)優(yōu)化及深度剖析(深入理解)
培訓(xùn)講師:
張老師:阿里大數(shù)據(jù)高級專家,國內(nèi)資深的大數(shù)據(jù)、Python技術(shù)專家,在Python技術(shù)編程、NLP自然語言處理、CV領(lǐng)域有很深造詣技術(shù)進(jìn)行了多年的深入的研究,更主要的是這些技術(shù)在大量的實際項目中得到廣泛的應(yīng)用,曾使用Tensorflow,Caffe,Keras等深度學(xué)習(xí)框架完成過多項圖像,語音,nlp,搜索相關(guān)的人工智能實際項目,研發(fā)經(jīng)驗豐富。同時具有多年授課培訓(xùn)經(jīng)驗,講課通熟易懂,代碼風(fēng)格簡潔清晰。
【相關(guān)課程】自然語言處理(NLP)培訓(xùn)班
【報名咨詢】
聯(lián)系電話:010-62258232 62278113 13718601312 13120125786
聯(lián) 系 人:李先生 陳小姐