【最新】2021年自然语言处理(NLP)算法学习路线!

NLP近几年非常火,且发展特别快。像BERT、GPT-3、图神经网络、知识图谱等技术应运而生。我们正处在信息爆炸的时代、面对每天铺天盖地的网络资源和论文、很多时候我们面临的问题并不是缺资源,而是找准资源并高效学习。但很多时候你会发现,花费大量的时间在零零散散的内容上,但最后发现效率极低,浪费了很多宝贵的时间。为了迎合大家学习的需求,我们这次重磅推出了《自然语言处理终身升级版》。课程覆盖了从经典的机器学习、文本处理技术、序列模型、深度学习、预训练模型、知识图谱、图神经网络所有必要的技术。重点:课程会不断更新,比如一篇新的有趣的论文出现在arxiv,我们会在1个月之内提供技术的讲解和实战。我相信这个课程将是你在NLP领域中的终身伴侣。01 课程大纲第一部分:机器学习基础篇第一章:自然语言处理概述自然语言处理的现状与前景自然语言处理应用自然语言处理经典任务第二章:数据结构与算法基础时间复杂度、空间复杂度动态规划贪心算法各种排序算法第三章:分类与逻辑回归逻辑回归最大似然估计优化与梯度下降法随机梯度下降法第四章:模型泛化与调参理解过拟合、防止过拟合L1与L2正则交叉验证正则与MAP估计第二部分:文本处理篇第五章:文本预处理与表示各类分词算法词的标准化拼写纠错、停用词独热编码表示tf-idf与相似度分布式表示与词向量词向量可视化与评估第六章:词向量技术独热编码的优缺点分布式表示的优点静态词向量与动态词向量SkipGram与CBOWSkipGram详解Negative  Sampling第七章:语言模型语言模型的作用马尔科夫假设UniGram, BiGram, NGram模型语言模型的评估语言模型的平滑技术第三部分:序列模型篇第八章:隐马尔科夫模型HMM的应用HMM的Inference维特比算法前向、后向算法HMM的参数估计详解第九章:线性条件随机场有向图与无向图生成模型与判别模型从HMM与MEMMMEMM中的标签偏置Log-Linear模型介绍从Log-Linear到LinearCRFLinearCRF的参数估计第四部分:深度学习与预训练篇第十章:深度学习基础理解神经网络各种常见的激活函数反向传播算法浅层模型与深度模型对比深度学习中的层次表示深度学习中的过拟合第十一章:RNN与LSTM从HMM到RNN模型RNN中的梯度问题梯度消失与LSTMLSTM到GRU双向LSTM双向深度LSTM第十二章:Seq2Seq模型与注意力机制Seq2Seq模型Greedy DecodingBeam Search长依赖所存在的问题注意力机制的实现第十三章:动态词向量与ELMo技术基于上下文的词向量技术图像识别中的层次表示文本领域中的层次表示ELMo模型ELMo的预训练与测试ELMo的优缺点第十四章:自注意力机制与TransformerLSTM模型的缺点Transformer概述理解自注意力机制位置信息的编码理解Encoder和Decoder区别理解Transformer的训练与预测Transformer的缺点第十五章:BERT与ALBERT自编码介绍Transformer EncoderMasked语言模型BERT模型BERT的不同训练方式ALBERT第十六章:BERT的其他变种RoBERTa模型SpanBERT模型FinBERT模型引入先验知识K-BERTKG-BERT第十七章:GPT与XLNetTransformer Encoder回顾GPT-1, GPT-2,  GPT-3ELMo的缺点语言模型下同时考虑上下文Permutation LM双流自注意力机制第五部分:信息抽取与知识图谱篇 第十八章:命名识别与实体消歧信息抽取的应用和关键技术命名实体识别NER识别常用技术实体统一技术实体消歧技术指代消解第十九章:关系抽取关系抽取的应用基于规则的方法基于监督学习的方法Bootstrap方法Distant Supervision方法第二十章:句法分析句法分析的应用CFG介绍从CFG到PCFG评估语法树寻找最好的语法树CKY算法第二十一章:依存文法分析从语法分析到依存文法分析依存文法分析的应用基于图算法的依存文法分析基于Transition-based的依存文法分析依存文法的应用案例第二十二章:知识图谱知识图谱的重要性知识图谱中的实体与关系非结构化数据与构造知识图谱知识图谱设计图算法的应用第六部分:模型压缩与图神经网络篇第二十三章:模型的压缩模型压缩重要性常见的模型压缩总览基于矩阵分解的压缩技术基于蒸馏的压缩技术基于贝叶斯模型的压缩技术模型的量化第二十四章:基于图的学习图的表示图与知识图谱关于图的常见算法Deepwalk和Node2vecTransE图嵌入算法DSNE图嵌入算法第二十五章:图神经网络卷积神经网络回顾在图中设计卷积操作图中的信息传递图卷积神经网络图卷积神经网络的经典应用第二十六章:GraphSage与GAT从GCN到GraphSAge注意力机制回归GAT模型详解GAT与GCN比较对于异构数据的处理第二十七章:图神经网络的其他应用Node ClassificationGraph ClassificationLink Prediction社区挖掘推荐系统图神经网络的未来发展课程其他的细节可以联系课程顾问来获取添加课程顾问微信报名、课程咨询👇👇👇02 课程中的部分案例1. 实现一个拼写纠错器2. 从零实现Word2Vec词向量3. 利用SkipGram做推荐4. 从零实现HMM模型5. 基于Linear-CRF的词性分类器实现6. 从零实现深度学习反向传播算法7. 实现AI程序帮助写程序8. 实现AI程序帮助写文章9. 基于Transformer的机器翻译10. 基于KG-BERT的知识图谱学习11. 基于知识图谱的风控系统12. 基于知识图谱的个性化教学13. 利用蒸馏算法压缩Transformer14. 利用GCN实现社交推荐15. 基于GAT的虚假新闻检测(剩下20+个案例被折叠,完整请咨询...)03 课程中的部分项目作业        1. 豆瓣电影评分预测    涉及到的知识点:中文分词技术独热编码、tf-idf分布式表示与Word2VecBERT向量、句子向量2. 智能客服问答系统    涉及到的知识点:问答系统搭建流程文本的向量化表示FastText倒排表问答系统中的召回、排序3. 基于Linear-CRF的医疗实体识别    涉及到的知识点:命名实体识别特征工程评估标准过拟合4. 基于闲聊的对话系统搭建    涉及到的知识点:常见的对话系统技术闲聊型对话系统框架数据的处理技术BERT的使用Transformer的使用5. 搭建基于医疗知识图谱的问答系统    涉及到的知识点:医疗专业词汇的使用获取问句的意图问句的解释、提取关键实体转化为查询语句6. 搭建基于医疗知识图谱的问答系统    涉及到的知识点:文本摘要生成介绍关键词提取技术图神经网络的摘要生成基于生成式的摘要提取技术文本摘要质量的评估04 课程中带读的部分论文主题论文名称机器学习XGBoost: A Scalable Tree Boosting System机器学习Regularization and Variable Selection via the Elastic Net词向量Evaluation methods for unsupervised word embeddings词向量Evaluation methods for unsupervised word embeddings词向量GloVe: Global Vectors for Word Representation词向量Deep Contexualized Word Representations词向量Attention is All You Need词向量BERT: Pretraining of Deep Bidirectional Transformers for Language Understanding词向量XLNet: Generalized Autoregressive Pretraining for Language Understanding词向量KG-BERT: BERT for Knowledge Graph Completion词向量Language Models are Few-shot Learners图学习Semi-supervised Classification with Graph Convolutional Networks图学习Graph Attention Networks图学习GraphSAGE: Inductive Representation Learning on Large Graphs图学习Node2Vec: Scalable Feature Learning for Networks被折叠其他数十篇文章......05 课程适合谁?大学生理工科相关专业的本科/硕士/博士生,毕业后想从事NLP工作的人希望能够深入AI领域,为科研或者出国做准备希望系统性学习NLP领域的知识在职人士目前从事IT相关的工作,今后想做跟NLP相关的项目目前从事AI相关的工作,希望与时俱进,加深对技术的理解希望能够及时掌握前沿技术

06 报名须知1、本课程为收费教学。2、本期仅招收剩余名额有限。3、品质保障!正式开课后7天内,无条件全额退款。4、学习本课程需要具备一定的机器学习基础。●●●课程其他的细节可以联系课程顾问来获取

(0)

相关推荐