整理一些NLP学习资源(不止NLP,本人主要关注NLP),如果有更好的,欢迎分享^_^
1. NLP 中文自然语言处理相关资料
https://github.com/crownpku/Awesome-Chinese-NLP
Contents 列表
1. Chinese NLP Toolkits 中文NLP工具
2. Corpus 中文语料
2. 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎
https://github.com/GeneralZh/Chinese_Corpus
3. pytorch学习
https://github.com/chenyuntc/pytorch-book
Deep Learning with PyTorch: A 60 Minute Blitz — PyTorch Tutorials 1.9.1+cu102 documentation
4. AI最新paper阅读 Browse state-of-the-art
Browse the State-of-the-Art in Machine Learning | Papers With Code
收藏|最优论文+代码查找神器,覆盖AI全领域(966个ML任务、8500+论文)
数据下载
论文摘要:
https://paperswithcode.com/media/about/papers-with-abstracts.json.gz
论文与代码之间的链接:
https://paperswithcode.com/media/about/links-between-papers-and-code.json.gz
评估排行榜:
https://paperswithcode.com/media/about/evaluation-tables.json.gz
参考:
NLP 进展:
https://github.com/sebastianruder/NLP-progress
斯坦福问答数据集(Stanford Question answer Dataset, SQuAD)
The Stanford Question Answering Dataset
State-of-the-art result for all Machine Learning Problems
https://github.com/RedditSota/state-of-the-art-result-for-machine-learning-problems
5. 自己动手做聊天机器人教程
https://github.com/lc222/ChatBotCourse
6.Kaggle 项目实战(教程) = 文档 + 代码 + 视频(欢迎参与)
https://github.com/apachecn/kaggle
7. 100+ Chinese Word Vectors 上百种预训练中文词向量
https://github.com/Embedding/Chinese-Word-Vectors
8. 吴恩达老师的机器学习&深度学习课程个人笔记
https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes
https://github.com/fengdu78/deeplearning_ai_books
9. 斯坦福 nlp课程 CS224n: Natural Language Processing with Deep Learning
Stanford CS 224N | Natural Language Processing with Deep Learning
10. ACL
https://aclanthology.info/events/acl-2018
https://aclanthology.info/events/acl-2017
11.机器学习数据集
UCI Machine Learning Repository
作为机器学习社区的一项服务,我们目前维护着468个数据集。
13.《COMS W4995 Applied Machine Learning》由哥伦比亚大学开设
COMS W4995 Applied Machine Learning Spring 2019 - Andreas C. Müller - Associate Research Scientist
https://github.com/amueller/COMS4995-s19
【哥伦比亚大学机器学习公开课】COMS W4995 Applied Machine Learning Spring 2018_哔哩哔哩_bilibili
14. 大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP
https://github.com/brightmart/nlp_chinese_corpus
40个中文NLP词库
https://github.com/fighting41love/funNLP
资源警告!有人收罗了40个中文NLP词库,放到了GitHub上
非正式汉语数据集资源 内容来源分别“豆瓣读书”和Chiphell论坛
你说“神马”?非正式汉语数据集资源上线,帮你训练网络语言处理
15. 深度学习资源列表 All You Need to Know About Deep Learning
https://github.com/osforscience/deep-learning-ocean
Table of Contents
- Introduction
- Papers
- Datasets
- Courses
- Books
- Blogs
- Tutorials
- Frameworks
- Contributing
16. 医疗深度学习技术指南
斯坦福&谷歌Jeff Dean最新Nature论文:医疗深度学习技术指南(29页综述)
17. 200多个最好的机器学习、NLP和Python相关教程
速码!200多个最好的机器学习、NLP和Python相关教程
18. PyTorch资源
关于github的pytorch相关内容的完整列表,如不同的模型、实现、帮助库、教程等
干货 | 476个PyTorch资源大合集推荐,GitHub超过3600星
https://github.com/bharathgs/Awesome-pytorch-list
Contents
20. 最新知识图谱论文清单
19年:知识图谱最新论文清单(附论文解读)_weixin_30865427的博客-优快云博客
21. 自然语言处理481个公开数据集和基准任务
自然语言处理( Natural Language Processing, NLP)以语言为对象,利用计算机技术来分析、理解和处理自然语言的一门学科,即把计算机作为语言研究的强大工具,在计算机的支持下对语言信息进行定量化的研究,并提供可供人与计算机之间能共同使用的语言描写。包括自然语言理解( NaturalLanguage Understanding, NLU)和自然语言生成( Natural LanguageGeneration, NLG)两部分。
自然语言处理包含很多子任务,比如中文自动分词(Chinese word segmentation),词性标注(Part-of-speech tagging),句法分析(Parsing),自然语言生成(Natural language generation),文本分类(Text categorization),信息检索(Information retrieval),信息抽取(Information extraction),文字校对(Text-proofing),问答系统(Question answering),机器翻译(Machine translation),自动摘要(Automatic summarization),文字蕴涵(Textual entailment)等等。
NLP领域非常多,同时又非常多公开数据集和基准任务。本资源整理了大概481个最新的自然语言处理公开数据集和基准任务。
全部数据获取地址:The NLP Index