自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(315)
  • 收藏
  • 关注

原创 nlp实现文本摘要提取

nlp实现文本摘要提取

2024-10-23 22:15:25 294

原创 java集合 -- 面试

​int n, i;//判断数组是否未初始化//如果未初始化,调用resize方法 进行初始化//通过 & 运算求出该数据(key)的数组下标并判断该下标位置是否有数据//如果没有,直接将数据放在该下标位置//该数组下标有数据的情况else {K k;//判断该位置数据的key和新来的数据是否一样//如果一样,证明为修改操作,该节点的数据赋值给e,后边会用到e = p;//判断是不是红黑树//如果是红黑树的话,进行红黑树的操作。

2024-10-03 17:14:01 1356

原创 关于HashMap中的二次Hash

在学习HashMap的底层源码的时候 ,发现 :在putVal的时候会调用一个hash()对key进行hash操作 :先通过key.hashCode()获得了哈希值h ,这是第一次hash操作;再进行 :h^h>>>16也就是二次Hash操作;那么为什么要进行二次hash操作呢?

2024-10-01 23:14:11 604

原创 project modules模块消失,只显示module,不显示project

1. 找到Project下的.idea文件删除。

2024-09-25 17:20:38 526

原创 Codeforces Round 974 (Div. 3)

也是模拟,找到最小不满足哪一个,求出应满足的最小值+1减去原来的sum即可;只用分情况(奇偶)讨论即可;

2024-09-22 19:01:00 791

原创 牛客小白月赛101 (A-E)C++ 题解

牛客小白月赛101 (A-E)C++ 题解

2024-09-21 10:59:26 597

原创 为什么全双工不需要冲突检测

为什么全双工不需要冲突检测

2024-09-16 17:32:14 1161

原创 Redis -- 全记录(面试)

redis

2024-09-12 20:43:13 1614

原创 MySql全记录(面试)

mysql

2024-09-12 20:25:17 1134

原创 关于Vscode的vscode-cpptools中的icph占用c盘内存过大问题

关于Vscode的vscode-cpptools中的icph占用c盘内存过大问题

2024-09-06 11:23:23 804

原创 关于java中map先获取value,再对value修改 ,会不会对原map中数据修改的问题;

关于java中map先获取value,再对value修改 ,会不会对原map中数据修改的问题;

2024-08-27 15:17:44 1056

原创 sql报错之 : The user specified as a definer (‘xxx‘@‘%‘) does not exiet

sql报错之 : The user specified as a definer ('xxx'@'%') does not exiet

2024-08-27 11:42:58 456

原创 zipkin启动发生报错 : Failed to start bean ‘armeriaServerGracefulShutdownLifecycle‘;

zipkin启动发生报错 : Failed to start bean ‘armeriaServerGracefulShutdownLifecycle‘;

2024-08-27 11:24:10 347

原创 (图文详解)同步、异步、阻塞和非阻塞的概念

(图文详解)同步、异步、阻塞和非阻塞的概念

2024-08-27 10:47:35 695

原创 Codeforces Round 968 (Div. 2) C++ (A-D1)

Codeforces Round 968 (Div. 2) C++ (A-D1)

2024-08-26 14:49:13 606 2

原创 AtCoder Beginner Contest 367 (A-D)

AtCoder Beginner Contest 367 (A-D)

2024-08-17 23:13:56 210

原创 Codeforces Round 966 (Div. 3) 题解(C++)A-F

Codeforces Round 966 (Div. 3) 题解(C++)A-F

2024-08-14 09:13:34 1009

原创 D - Index Trio -- 灵茶 2024-08-05

D - Index Trio -- 灵茶 2024-08-05

2024-08-13 17:17:33 288

原创 VsCode配置Cph实现高效刷题教程

VsCode配置Cph实现高效刷题教程

2024-08-12 21:34:54 4423 7

原创 事务的四大特征

事务的四大特征

2024-08-07 01:22:14 314 1

原创 Codeforces Round 964 (Div. 4) C++题解(A-F)

Codeforces Round 964 (Div. 4) C++题解(A-F)

2024-08-07 01:17:45 992

原创 字节测开一面面经

字节测开一面面经

2024-08-04 22:21:28 226

原创 牛客周赛 Round 54 (c++题解)

c++牛客题解

2024-08-04 22:19:30 648

原创 Java反射详细学习笔记

特点 : 无侵入式的给代码增加额外的功能 ;代理里面就是对象要被代理的方法 ;通过接口保证,后面的对象和代理需要实现同一个接口 , 接口中就是被代理的所有方法 ;如何为java对象创建一个代理 :java.lang.reflect.Proxy类 : 提供了为对象产生代理对象的方法 : 实例代码 :首先是一个需要代理的对象 : BigStar :定义接口Star,指定需要被代理的方法 :​创建代理ProxyUtil :测试 :​调用步骤 :反射 :反射允许对封装类

2024-07-25 17:40:50 557

原创 2024睿抗机器人开发者大赛CAIP编程赛题解(c++)

2024睿抗机器人开发者大赛CAIP编程赛题解(c++)

2024-07-16 22:09:07 1083 2

原创 快速排序c++&&java代码实现

快速排序的思想 (基于分治法):每次选一个基准元素x,通过一次遍历将排序表划分为独立的两部分a[l,k-1],a[k+1,r];其中左边的元素x,然后递归下去,直到每个块的大小为1;

2024-07-05 09:43:22 315

原创 Python实现将txt文件转换为csv文件

【代码】Python实现将txt文件转换为csv文件。

2024-07-03 11:33:55 891

原创 C. Theofanis‘ Nightmare

创建一个后缀和数组 , 然后把所有后缀和>0的加入到答案中,注意,整个数组的和一定要加入答案中;

2024-07-02 09:24:14 263

原创 WARNING: Hive-on-MR is deprecated in Hive 2 and may not be available in the future versions.

修改配置后需要重启Hive;

2024-07-01 21:31:18 493

原创 chunkers/maxent_ne_chunker/english_ace_multiclass.pickle 找不到

官方下的数据集,找不到english_ace_multiclass.pic。

2024-06-30 16:49:37 291

原创 nlp--最大匹配分词(计算召回率)

最大匹配算法是一种常见的中文分词算法,其核心思想是从左向右取词,以词典中最长的词为优先匹配。这里我将为你展示一个简单的最大匹配分词算法的实现,并结合输入任意句子、显示分词结果以及计算分词召回率。

2024-06-30 16:43:19 334

原创 走进机器学习

机器学习近年来被大规模应用在各种领域,特别是 NLP 领域。虽然机器学习是门建立在统计和优化上的新兴学科,但是在自然语言处理、数据科学等领域,它却占据着核心的地位。图 1机器学习最初的研究动机是让计算机系统具有人的学习能力以便实现人工智能。因为没有学习能力的系统很难被认为是具有智能的。目前被广泛采用的机器学习的定义是“利用经验来改善计算机系统自身的性能”。

2024-06-27 18:45:36 1132

原创 情感分析方法与实践

情感极性分析是对带有感情色彩的主观性文本进行分析、处理、归纳和推理的过程。按照处理文本的类别不同,可分为基于新闻评论的情感分析和基于产品评论的情感分析。其中,前者多用于舆情监控和信息预测,后者可帮助用户了解某一产品在大众心目中的口碑,目前常见的情感极性分析方法主要是两种:基于情感词典的方法和基于机器学习的方法。本实训主要接下来将主要介绍基于情感词典的情感分析,关于基于机器学习的情感分析,将在后续实训中介绍。图 1。

2024-06-27 18:38:53 1386

原创 向量化算法 doc2vec

Doc2Vec 的目的是获得文档的一个固定长度的向量表达。在我们获得 Doc2Vec 模型之前,我们首先需要准备好数据,即多个文档,以及它们的标签(可以用标题作为标签)。Doc2vec 算法的过程,主要有两步:训练模型:在已知的训练数据中得到词向量 W ,softmax,以及段落向量/句向量;推断过程:对于新的段落,得到其向量表达。在这个阶段中,可以呈现新文档,并且固定所有权重以计算文档向量。其中,影响模型准确率的因素主要有:语料的大小,文档的数量,越多越高;文档的相似性,越相似越好。

2024-06-27 18:32:37 1141

原创 向量化算法 word2vec

文本表示是自然语言处理中的基础工作,文本表示的好坏直接影响到整个自然语言处理系统的性能。文本向量化就是将文本表示成一系列能够表达文本语义的向量,是文本表示的一种重要方式。目前对文本向量化大部分的研究都是通过词向量化实现的,也有一部分研究者将句子作为文本处理的基本单元,于是产生了 doc2vec 和 str2vec 技术。

2024-06-27 18:24:57 1156

原创 句法分析的常用方法与实战

HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。不同于一些简陋的分词类库,HanLP 精心优化了内部数据结构和 IO 接口,做到了毫秒级的冷启动、千万字符每秒的处理速度,而内存最低仅需120MB。无论是移动设备还是大型集群,都能获得良好的体验。不同于市面上的商业工具, HanLP 提供训练模块,可以在用户的语料上训练模型并替换默认模型,以适应不同的领域。

2024-06-27 18:20:05 853

原创 句法分析概述

句法分析( syntactic parsing )是自然语言处理中的关键技术之一,它是对输入的文本句子进行分析以得到句子的句法结构的处理过程。对句法结构进行分析,一方面是语言理解的自身需求,句法分析是语言理解的重要一环,另一方面也为其它自然语言处理任务提供支持。例如句法驱动的统计机器翻译需要对源语言或目标语言(或者同时两种语言)进行句法分析。从20世纪50年代初机器翻译课题被提出时算起,自然语言处理研究已经有60余年的历史,句法分析一直是自然语言处理前进的巨大障碍。歧义。

2024-06-27 18:15:35 1117

原创 TextRank 算法

nlp,TextRank算法

2024-06-27 18:13:09 1052 1

原创 TF/IDF算法

停用词是指在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为 Stop Words(停用词)。这些停用词都是人工输入、非自动化生成的,生成后的停用词会形成一个停用词表。但是,并没有一个明确的停用词表能够适用于所有的工具。甚至有一些工具是明确地避免使用停用词来支持短语搜索的。在信息爆炸的时代,很多信息我们无法全面接收,我们需要从中筛选出一些我们感兴趣的或者说对我们有用的信息进行接收。怎么选择呢,关键词提取就是其中一个很好的方法。

2024-06-27 17:42:25 1733

原创 词性标注--头歌

NLP词性标注

2024-06-27 17:28:09 677

一个关于jdbc操作mysql和java基础练手的通讯录管理系统小项目

一个关于jdbc操作mysql和java基础练手的通讯录管理系统小项目

2023-11-13

基于jsp和mysql实现的学生选课管理系统

用java实现学生选课信息管理系统

2023-08-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除