自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 问答 (4)
  • 收藏
  • 关注

转载 gensim在NLP中的一些简单运用

文章目录前言一、gensim是什么?二、使用步骤1. 安装2.引入库3. 运用3.1 基本概念3.2 应用语料的预处理3.2 主题向量的变换3.3 文档相似度的计算总结前言本文为记录学习gensim过程中自己的一些浅显的理解。gensim作为NLP领域的具备多种功能的神器,以下对其进行应用进行简单介绍及示例。学习参考了以下博客:https://www.jianshu.com/p/9ac0075cc4c0一、gensim是什么?Gensim是一款开源的第三方Python工具包,它支持包括TF-I

2021-05-28 16:22:05 333

原创 sklearn学习总结

文章目录前言一、SKlearn是什么?二、使用步骤1. 安装sklearn库2. 引入库3. API使用测试3.1 datasets模块3.2 sklearn监督、非监督学习模块总结前言本专题主要是记录作者在学习使用sklearn工具箱时的一些案例经验及心得体会。一、SKlearn是什么?scikit-learn (sklearn) 是一个Python第三方提供的非常强力的机器学习库,它包含了从数据预处理到训练模型的各个方面。在实战使用scikit-learn中可以极大的节省我们编写代码的时间以及

2021-05-18 11:31:40 1435

转载 NLP常用工具

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考一、pandas是什么?示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代码

2021-05-17 17:58:13 1337

转载 NLP学习过程中常用数据

NLP项目常用数据概述数据集来源1. 搜狗实验室数据1.1 互联网语料库(SogouT)1.2 全网新闻数据(SogouCA)1.3 搜狐新闻数据(SogouCS)1.4 文本分类评价(SogouTCE)1.5 互联网词库(SogouW)2. 阿里云天池3. 百度大脑|AI开放平台4. IMDB Reviews5. Sentiment1406. 今日头条新闻文本分类数据集写在最后概述在NLP项目中,主要的项目包含:文本分类、舆情分析、摘要抽取、文本纠错、情感分析以及智能分词等。而在学习这类项目的过程中,

2021-05-17 16:28:05 1025 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除