- 博客(315)
- 收藏
- 关注
原创 java集合 -- 面试
int n, i;//判断数组是否未初始化//如果未初始化,调用resize方法 进行初始化//通过 & 运算求出该数据(key)的数组下标并判断该下标位置是否有数据//如果没有,直接将数据放在该下标位置//该数组下标有数据的情况else {K k;//判断该位置数据的key和新来的数据是否一样//如果一样,证明为修改操作,该节点的数据赋值给e,后边会用到e = p;//判断是不是红黑树//如果是红黑树的话,进行红黑树的操作。
2024-10-03 17:14:01
1356
原创 关于HashMap中的二次Hash
在学习HashMap的底层源码的时候 ,发现 :在putVal的时候会调用一个hash()对key进行hash操作 :先通过key.hashCode()获得了哈希值h ,这是第一次hash操作;再进行 :h^h>>>16也就是二次Hash操作;那么为什么要进行二次hash操作呢?
2024-10-01 23:14:11
604
原创 Codeforces Round 974 (Div. 3)
也是模拟,找到最小不满足哪一个,求出应满足的最小值+1减去原来的sum即可;只用分情况(奇偶)讨论即可;
2024-09-22 19:01:00
791
原创 关于Vscode的vscode-cpptools中的icph占用c盘内存过大问题
关于Vscode的vscode-cpptools中的icph占用c盘内存过大问题
2024-09-06 11:23:23
804
原创 关于java中map先获取value,再对value修改 ,会不会对原map中数据修改的问题;
关于java中map先获取value,再对value修改 ,会不会对原map中数据修改的问题;
2024-08-27 15:17:44
1056
原创 sql报错之 : The user specified as a definer (‘xxx‘@‘%‘) does not exiet
sql报错之 : The user specified as a definer ('xxx'@'%') does not exiet
2024-08-27 11:42:58
456
原创 zipkin启动发生报错 : Failed to start bean ‘armeriaServerGracefulShutdownLifecycle‘;
zipkin启动发生报错 : Failed to start bean ‘armeriaServerGracefulShutdownLifecycle‘;
2024-08-27 11:24:10
347
原创 Codeforces Round 968 (Div. 2) C++ (A-D1)
Codeforces Round 968 (Div. 2) C++ (A-D1)
2024-08-26 14:49:13
606
2
原创 Codeforces Round 966 (Div. 3) 题解(C++)A-F
Codeforces Round 966 (Div. 3) 题解(C++)A-F
2024-08-14 09:13:34
1009
原创 Codeforces Round 964 (Div. 4) C++题解(A-F)
Codeforces Round 964 (Div. 4) C++题解(A-F)
2024-08-07 01:17:45
992
原创 Java反射详细学习笔记
特点 : 无侵入式的给代码增加额外的功能 ;代理里面就是对象要被代理的方法 ;通过接口保证,后面的对象和代理需要实现同一个接口 , 接口中就是被代理的所有方法 ;如何为java对象创建一个代理 :java.lang.reflect.Proxy类 : 提供了为对象产生代理对象的方法 : 实例代码 :首先是一个需要代理的对象 : BigStar :定义接口Star,指定需要被代理的方法 :创建代理ProxyUtil :测试 :调用步骤 :反射 :反射允许对封装类
2024-07-25 17:40:50
557
原创 快速排序c++&&java代码实现
快速排序的思想 (基于分治法):每次选一个基准元素x,通过一次遍历将排序表划分为独立的两部分a[l,k-1],a[k+1,r];其中左边的元素x,然后递归下去,直到每个块的大小为1;
2024-07-05 09:43:22
315
原创 WARNING: Hive-on-MR is deprecated in Hive 2 and may not be available in the future versions.
修改配置后需要重启Hive;
2024-07-01 21:31:18
493
原创 chunkers/maxent_ne_chunker/english_ace_multiclass.pickle 找不到
官方下的数据集,找不到english_ace_multiclass.pic。
2024-06-30 16:49:37
291
原创 nlp--最大匹配分词(计算召回率)
最大匹配算法是一种常见的中文分词算法,其核心思想是从左向右取词,以词典中最长的词为优先匹配。这里我将为你展示一个简单的最大匹配分词算法的实现,并结合输入任意句子、显示分词结果以及计算分词召回率。
2024-06-30 16:43:19
334
原创 走进机器学习
机器学习近年来被大规模应用在各种领域,特别是 NLP 领域。虽然机器学习是门建立在统计和优化上的新兴学科,但是在自然语言处理、数据科学等领域,它却占据着核心的地位。图 1机器学习最初的研究动机是让计算机系统具有人的学习能力以便实现人工智能。因为没有学习能力的系统很难被认为是具有智能的。目前被广泛采用的机器学习的定义是“利用经验来改善计算机系统自身的性能”。
2024-06-27 18:45:36
1132
原创 情感分析方法与实践
情感极性分析是对带有感情色彩的主观性文本进行分析、处理、归纳和推理的过程。按照处理文本的类别不同,可分为基于新闻评论的情感分析和基于产品评论的情感分析。其中,前者多用于舆情监控和信息预测,后者可帮助用户了解某一产品在大众心目中的口碑,目前常见的情感极性分析方法主要是两种:基于情感词典的方法和基于机器学习的方法。本实训主要接下来将主要介绍基于情感词典的情感分析,关于基于机器学习的情感分析,将在后续实训中介绍。图 1。
2024-06-27 18:38:53
1386
原创 向量化算法 doc2vec
Doc2Vec 的目的是获得文档的一个固定长度的向量表达。在我们获得 Doc2Vec 模型之前,我们首先需要准备好数据,即多个文档,以及它们的标签(可以用标题作为标签)。Doc2vec 算法的过程,主要有两步:训练模型:在已知的训练数据中得到词向量 W ,softmax,以及段落向量/句向量;推断过程:对于新的段落,得到其向量表达。在这个阶段中,可以呈现新文档,并且固定所有权重以计算文档向量。其中,影响模型准确率的因素主要有:语料的大小,文档的数量,越多越高;文档的相似性,越相似越好。
2024-06-27 18:32:37
1141
原创 向量化算法 word2vec
文本表示是自然语言处理中的基础工作,文本表示的好坏直接影响到整个自然语言处理系统的性能。文本向量化就是将文本表示成一系列能够表达文本语义的向量,是文本表示的一种重要方式。目前对文本向量化大部分的研究都是通过词向量化实现的,也有一部分研究者将句子作为文本处理的基本单元,于是产生了 doc2vec 和 str2vec 技术。
2024-06-27 18:24:57
1156
原创 句法分析的常用方法与实战
HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。不同于一些简陋的分词类库,HanLP 精心优化了内部数据结构和 IO 接口,做到了毫秒级的冷启动、千万字符每秒的处理速度,而内存最低仅需120MB。无论是移动设备还是大型集群,都能获得良好的体验。不同于市面上的商业工具, HanLP 提供训练模块,可以在用户的语料上训练模型并替换默认模型,以适应不同的领域。
2024-06-27 18:20:05
853
原创 句法分析概述
句法分析( syntactic parsing )是自然语言处理中的关键技术之一,它是对输入的文本句子进行分析以得到句子的句法结构的处理过程。对句法结构进行分析,一方面是语言理解的自身需求,句法分析是语言理解的重要一环,另一方面也为其它自然语言处理任务提供支持。例如句法驱动的统计机器翻译需要对源语言或目标语言(或者同时两种语言)进行句法分析。从20世纪50年代初机器翻译课题被提出时算起,自然语言处理研究已经有60余年的历史,句法分析一直是自然语言处理前进的巨大障碍。歧义。
2024-06-27 18:15:35
1117
原创 TF/IDF算法
停用词是指在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为 Stop Words(停用词)。这些停用词都是人工输入、非自动化生成的,生成后的停用词会形成一个停用词表。但是,并没有一个明确的停用词表能够适用于所有的工具。甚至有一些工具是明确地避免使用停用词来支持短语搜索的。在信息爆炸的时代,很多信息我们无法全面接收,我们需要从中筛选出一些我们感兴趣的或者说对我们有用的信息进行接收。怎么选择呢,关键词提取就是其中一个很好的方法。
2024-06-27 17:42:25
1733
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人