qq_45702616-优快云博客

原创本科毕业设计

实体识别，基于大模型的RAG，agent系统，以及xxx系统的开发。

2025-03-10 17:04:28 364

原创 overleaf写论文时遇到引用是？的问题

最近在写论文，遇到我们引用参考文献时是？的情况，看了好多方法没有解决，发现，需要bst包里面的sn-mathphys-num.bst方法包外面这个时候就可以编译通过了。

2024-11-02 16:56:41 313

原创 Centos7安装docker报错

1，Centos7使用yum命令失效，报错：Could not retrieve mirrorlist http://mirrorlist.centos.org/?在执行上诉命令时需要漫长的等待，例如下面的例子，依次执行完就行。b）将文件中的内容替换为下面的内容。

2024-10-24 11:12:45 530

由于刚开始训练时,模型的权重(weights)是随机初始化的，此时若选择一个较大的学习率,可能会造成模型的不确定性，选择Warmup预热学习率的方式，可以使得开始训练的几个epoch或者一些step内学习率较小,在预热阶段的小学习率下，模型在训练的过程中慢慢趋于稳定,等模型相对稳定后再选择预先设置的学习率进行训练,使得模型收敛速度变得更快，模型效果更佳。下面是学习率预热的代码实现，为部分代码。在进行深度学习时，学习率的调整策略是我们躲不开的问题，那么咋样才能设计才能找到比较适合的学习率呢？

2024-09-22 16:31:25 673

原创中文糖尿病科研文献实体关系数据集DiaKG抽取出实体识别数据集，并随机分割成训练集测试集和验证集

好多的数据集比如ccks2017，ccks2018等数据集只给出了整个的数据集并没有进行分割。而对于DiaKG数据官方给出的既包含实体信息也包含了关系抽取的信息，显得比较冗余，并且分割成立几十个json文件导致我们在使用的时候比较麻烦。这几天刚好想用这个数据集做一下医学实体识别的实验，就对该数据集进行了分割。有什么不足之处，或者实现错误的地方，还请多多指教！上面的代码时进行数据的整理，从原始的数据集中抽取做实体识别的数据集并进行保存。上面的代码时使用sklearn库将数据集分成了训练集，测试集和验证集。

2024-09-21 15:06:46 448

原创 CCKS2020数据集处理

这几天再看关于医学命名实体识别的论文，想着自己尝试去运行一下论文中的代码。但是第一步就是我们对数据记得处理。结合csdn中的一些博主的代码命名实体识别ccks2020数据集的数据预处理之上进行了修改，因为我需要的格式需要对数据集中的每一个句子进行编码。为了方便得到每一个句子的编码表示。我们在预处理时为每一个句字中间都加了一个\n\n用来区分不同的句子。

2024-04-22 12:58:57 528

qq_45702616的博客