- 博客(33)
- 收藏
- 关注
原创 NLP - 依存句法分析、句子歧义
在自然语言中,将句子处理为,constituency grammar的标准形式是。还有其他的方法,比如说等。但是在计算机语言中,另一种看待方式最常见。
2024-03-04 19:39:49
2340
原创 NLP - 神经网络与反向传播
求导,使用链式法则反向传播:下游梯度 = 上游梯度 * 局部梯度前向传播计算出当前参数的值,然后进行反向传播以计算出损失的梯度(当前参数的损失)。现在的深度学习神经网络框架(Tensorflow, PyTorch, etc…)可以自动做反向传播,我们不用知道具体是怎么操作的,就像我们使用gcc来编译c代码,但是我们不需要具体知道gcc是怎么操作的。
2024-03-01 22:08:02
1155
1
原创 NLP - 共现矩阵、Glove、评估词向量、词义
两种词向量表示方法:共现矩阵,然后使用线性代数方法(SVD)(问题:词之间没有意思层面的联系,只是相似性;过分重视大计数)随机初始,然后使用迭代神经网络更新算法(梯度下降法 负采样)(问题:语料库很大,分母太难计算;没有有效利用数据)Glove:将两种表示方法结合起来 => 在神经网络中使用计数矩阵|||V。
2024-02-28 13:39:41
1626
原创 NLP-词向量、Word2vec
分母 用于归一化,最终得到概率分布 => 所有词跟中心词的相似程度所构成的概率#目的:找到与中心词向量 点乘最大的词向量,得到最相似的向量。点乘 用于计算向量相似程度。向量之间越相似,点乘结果越大。我们做什么来计算一个词在中心词的上下文中出现的概率?然后所有中心词的这个相乘数 再全部相乘,希望得到。:具有相似上下文的单词,具有相似的向量。调整θ来最大化上下文词的预测!词已知,它的上下文单词的概率。表示模型所有的参数,向量长度为。所有上下文之间的向量最相似,取幂 用于使得所有数都为正。个词,每个词向量都是。
2024-02-27 00:12:52
649
原创 学习NER-day02
昨天讨论了使用神经网络的方法来得到词向量语言模型的原理和一些问题,word2vec也使用了CBOW与Skip-Gram来训练模型与得到词向量,但是并没有使用传统的DNN模型。现在我们开始关注word2vec的语言模型如何改进传统的神经网络的方法。word2vec有两种改进方法,一种是基于的,另一种是基于的。Word2vec主要思想是包含两个算法:•(SG): 预测上下文。): 预测目标单词。以及两种训练方法:•: 通过树结构来定义目标函数,来计算所有词汇的概率。•。
2024-02-24 23:49:08
833
原创 文本分析流程
在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。
2024-02-22 16:37:29
561
原创 解决E盘分空间给C盘
右键点击【未分配空间】,点击【新建简单卷】5. 右键点击【E盘】,选择【删除卷】,将E盘删除后,看到C盘紧靠未分配的空间。6. 右键点击【C盘】,选择【扩展卷】,将E盘删除后,看到C盘紧靠未分配的空间。因为我们压缩出来的空间,紧靠的不是C盘,而是E盘,所以只有E盘可以”扩展卷“。右键【E盘】选择【扩展卷】。在”扩展卷“窗口,我们将之前压缩出来的再换给E盘。2. 点击 【磁盘管理】 -> 【新加卷(E:)】 -> 【压缩卷】1. 桌面点击 【此电脑】 -> 【管理】一直默认选项点击【下一步】就行。
2024-01-06 13:38:36
10629
2
原创 DataScience_笔记_7
用KNN算法处理 MNIST 数据集中的手写数字图像:MINIST.pyKNN_MINIST.py2. Classifier: Decision Tree优点:直观且易于解释: 与其他机器学习算法相比,决策树的结果是可视化的,并且直观容易理解,这使得它非常适合在需要解释模型决策过程的场景中使用。不需要数据预处理: 决策树不需要特征标准化或规范化,而且它们可以处理数值型和分类数据。特征选择: 决策树可以进行自动的特征选择,并且可以显示每个特征的相对重要性。可以处理非线性关系: 决策树能够捕获
2023-11-09 16:05:02
105
原创 DataScience_笔记_5
确定目标函数:明确要优化的目标函数。这可以是一个损失函数,需要最小化初始化参数:为优化过程初始化参数的初始值。这些参数将被逐步更新以接近最优解。判断函数凸性:判断目标函数是否是凸函数。如果是凸函数,则梯度下降算法有望找到全局最优解。(二阶导大于0)( 凸函数的和还是凸函数 )得出结论后,不需要在代码实现中去验证。设置学习率:选择一个合适的学习率(步长),控制每次参数更新的幅度。学习率过大可能导致震荡或发散,学习率过小可能导致收敛缓慢。迭代更新参数:使用梯度下降算法迭代地更新参数值,直到满足终止条件。
2023-10-13 09:48:18
164
原创 解决Error querying database. Cause: com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: Communica
因为教程老师不同,所以在用Spring整合MyBatis时,运行一直出现连接Mysql错误。
2023-10-12 08:21:30
1801
原创 DataScience_笔记_4
计算机现在就像早期的英语专业,所以要发散性思维。研究生申请可以考虑一些其他的专业,比如说金融,机械…申请工作可以考虑格力、小米、灯泡等偏制造业的公司…老师最差的师妹去了很好的公司,师妹去了蓝月亮。
2023-10-05 16:07:43
45
原创 解决JupyterNotebook启动时的警告:has moved from NotebookApp to ServerApp
打开jupyter_notebook_config.json,加入。
2023-10-05 12:49:35
7080
4
原创 解决IDEA导入maven项目只有pom.xml
按照网上主流的方法解决:成功之后 Module 还是一片空白,依旧只有一个pom.xml。
2023-10-02 13:01:48
1420
3
原创 记录一下ElementUI的使用
通过引入 Element UI 组件库,可以快速使用预定义的 UI 组件来构建你的应用程序界面,无需从头开始编写复杂的样式和交互逻辑。Element UI 提供了丰富的组件,包括按钮、表格、表单、弹窗、导航栏等,可以大大加快开发效率,并提供一致和美观的用户界面。
2023-09-30 19:21:56
172
原创 解决IDEAjava文件图标为咖啡;Maven构建成功,但是没有启动Tomcat服务器
大概率是因为系统找不到根目录,我们手动将src设置为根目录。
2023-09-30 14:50:19
7680
原创 解决IDEA 2023.2.1右键不能新建Servlet文件
IntelliJ IDEA 2023.2.1 右键新建文件找不到Servlet,尝试过设置src文件为sources然后打勾等等方法后依旧行不通。原文链接:https://blog.youkuaiyun.com/weixin_73609038/article/details/132347125。版权声明:本文为优快云博主「圆头源脑」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。打开Settings下的File and Code Templates,加入新建模板Servlet,
2023-09-23 19:01:29
586
2
原创 NetworkProgramming_笔记_3
To setup an application, two models:Client/server modelClientBefore communication, client requires:Client’s function:考试会考,不同角度回答都行,下面也是正确的答案两种类型的serversServer’s function:一个典型的client/server交互:(考试稍微漏两条没答-没事)比喻成打电话的过程sockaddr 和 sockaddr_in 结构体
2023-09-23 16:22:51
87
1
原创 解决 A child container failed during start
然后进行了各种查看文件,最后才从之前创建的java文件中找到了问题。WebServlet导入的路径冲突....改正后程序成功运行。
2023-09-21 19:52:32
118
原创 DataScience_笔记_3
loss function 求导 = 0 (555555 拉上黑板被羞辱了微积分)要尽可能得到凸函数,因为有唯一的极小值。
2023-09-21 18:20:29
63
原创 解决maven报错:COMPILATION ERROR 不再支持源选项5...不再支持目标选项 1.5...
运行某个maven项目,在IDEA和管理员命令行执行都出现如下错误。我的Java版本是11,在 配置文件pom.xml中加入如下代码。BTW. 第一次运行需要下载很多管理文件。
2023-09-21 09:56:22
477
原创 解决端口被占用问题
在命令行中查看相应端口的情况 netstat -ano|findstr XXXX。在命令行中关闭被占用的端口 taskkill /t /f /im XXXXX。端口8080正在被占用,该端口对应的TCP号为19024。启动项目时出现端口被占用,启动失败的情况。
2023-09-20 20:00:52
58
1
原创 解决maven配置pom.xml时找不到依赖项
按照mybatis官方入门配置pom.xml的mybatis依赖时,会出现错误❌。这时,我们需要修改maven的home path,指向自己下载的maven路径。修改成功后记得点右上角的刷新,不然依旧挂红。
2023-09-18 13:22:45
1916
原创 解决IDEA中Alt+Insert不能使用
Alt + Insert快捷键在java开发中使用频率非常高,但是自己的电脑貌似对这个快捷键不太感兴趣。按快捷键Alt + Insert时,其实IDEA中响应的是Alt + Delete。因此改变Generate的快捷键,改为Alt + =
2023-09-18 12:22:28
1430
原创 解决mysql服务无法启动
第一次碰到不能开启mysql服务的问题,打开计算机管理服务开启mysql也失败。最后是修改my.ini文件内容(如下),然后成功启动了mysql服务。
2023-09-17 14:31:39
81
1
原创 机器学习1
在说服别人的时候最有效的方法是跟ta说一个故事/事实而不是大道理,因为每个人都有自己一套固定的思考模式和方法,当出现价值观点相悖时,人们倾向于放弃这个观点表示不认同。这就有点像机器学习的过程,当已经有一套模型后,我们会对新的数据进行处理并且得到结果。人倾向于自信,不愿意听大道理,但是当数据来临,我们不得不思考并且得出预期的结论。机器学习一个主要目的是把人类思考归纳经验的过程转化为计算机通过对数据的处理计算得出模型的过程。机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。
2023-05-16 23:21:16
48
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人