社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

面向深度学习研究人员的自然语言处理实例教程

机器学习AI算法工程 • 4 年前 • 623 次点击  




向AI转型的程序员都关注了这个号👇👇👇

人工智能大数据与深度学习  公众号:datayx


nlp-tutorial

nlp-tutorial是一个使用Pytorch/TensorFlow,学习自然语言处理的教程。大多数模型的代码行数少于100行。

旧的TensorFlow v1代码存档在存档文件夹中,适合初学者。


环境依赖:

  • Python 3.5+

  • Pytorch 1.0.0+


代码和数据集 获取方式

关注微信公众号 datayx  然后回复 NLP  即可获取。

AI项目体验地址 https://loveai.tech


1. Basic Embedding Model

  • 1-1. NNLM(Neural Network Language Model) - Predict Next Word

    • Paper - A Neural Probabilistic Language Model(2003)

    • Colab - NNLM.ipynb

  • 1-2. Word2Vec(Skip-gram) - Embedding Words and Show Graph

    • Paper - Distributed Representations of Words and Phrases and their Compositionality(2013)

    • Colab - Word2Vec.ipynb

  • 1-3. FastText(Application Level) - Sentence Classification

    • Paper - Bag of Tricks for Efficient Text Classification(2016)

    • Colab - FastText.ipynb

2. CNN(Convolutional Neural Network)

  • 2-1. TextCNN - Binary Sentiment Classification

    • Paper - Convolutional Neural Networks for Sentence Classification(2014)

    • TextCNN.ipynb

3. RNN(Recurrent Neural Network)

  • 3-1. TextRNN - Predict Next Step

    • Paper - Finding Structure in Time(1990)

    • Colab - TextRNN.ipynb

  • 3-2. TextLSTM - Autocomplete

    • Paper - LONG SHORT-TERM MEMORY(1997)

    • Colab - TextLSTM.ipynb

  • 3-3. Bi-LSTM - Predict Next Word in Long Sentence

    • Colab - Bi_LSTM.ipynb

4. Attention Mechanism

  • 4-1. Seq2Seq - Change Word

    • Paper - Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation(2014)

    • Colab - Seq2Seq.ipynb

  • 4-2. Seq2Seq with Attention - Translate

    • Paper - Neural Machine Translation by Jointly Learning to Align and Translate(2014)

    • Colab - Seq2Seq(Attention).ipynb

  • 4-3. Bi-LSTM with Attention - Binary Sentiment Classification

    • Colab - Bi_LSTM(Attention).ipynb

5. Model based on Transformer

  • 5-1. The Transformer - Translate

    • Paper - Attention Is All You Need(2017)

    • Colab - Transformer.ipynb, Transformer(Greedy_decoder).ipynb

  • 5-2. BERT - Classification Next Sentence & Predict Masked Tokens

    • Paper - BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding(2018)

    • Colab - BERT.ipynb




阅读过本文的人还看了以下文章:


TensorFlow 2.0深度学习案例实战


基于40万表格数据集TableBank,用MaskRCNN做表格检测


《基于深度学习的自然语言处理》中/英PDF


Deep Learning 中文版初版-周志华团队


【全套视频课】最全的目标检测算法系列讲解,通俗易懂!


《美团机器学习实践》_美团算法团队.pdf


《深度学习入门:基于Python的理论与实现》高清中文PDF+源码


特征提取与图像处理(第二版).pdf


python就业班学习视频,从入门到实战项目


2019最新《PyTorch自然语言处理》英、中文版PDF+源码


《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码


《深度学习之pytorch》pdf+附书源码


PyTorch深度学习快速实战入门《pytorch-handbook》


【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》


《Python数据分析与挖掘实战》PDF+完整源码


汽车行业完整知识图谱项目实战视频(全23课)


李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材


笔记、代码清晰易懂!李航《统计学习方法》最新资源全套!


《神经网络与深度学习》最新2018版中英PDF+源码


将机器学习模型部署为REST API


FashionAI服装属性标签图像识别Top1-5方案分享


重要开源!CNN-RNN-CTC 实现手写汉字识别


yolo3 检测出图像中的不规则汉字


同样是机器学习算法工程师,你的面试为什么过不了?


前海征信大数据算法:风险概率预测


【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类


VGG16迁移学习,实现医学图像识别分类工程项目


特征工程(一)


特征工程(二) :文本数据的展开、过滤和分块


特征工程(三):特征缩放,从词袋到 TF-IDF


特征工程(四): 类别特征


特征工程(五): PCA 降维


特征工程(六): 非线性特征提取和模型堆叠


特征工程(七):图像特征提取和深度学习


如何利用全新的决策树集成级联结构gcForest做特征工程并打分?


Machine Learning Yearning 中文翻译稿


蚂蚁金服2018秋招-算法工程师(共四面)通过


全球AI挑战-场景分类的比赛源码(多模型融合)


斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)


python+flask搭建CNN在线识别手写中文网站


中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程



不断更新资源

深度学习、机器学习、数据分析、python

 搜索公众号添加: datayx  



机大数据技术与机器学习工程

 搜索公众号添加: datanlp

长按图片,识别二维码


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/105623
 
623 次点击