七月花nancy-优快云博客

原创 COZE插件开发-读取图像

由于需要推理图像小模型，然后返回相关参数，目前商店中没有满足需要的插件，所以开发了一个。1. coze发送的图片不是二进制流，而是url链接。

2024-09-23 14:26:05 2702 5

原创调用kimi-api进行多轮对话

今天练习了调用kimi-api进行多轮对话，测试一下他的文本生成能力。运行后，流式输出答案~

2024-09-03 16:34:22 937

之前在华为昇腾服务器上推理了Qwen1.5-14b-chat模型，但是用Mindie RC1.0版本无法兼容openai接口，传递的文本字符数有限，不能超过16000.因此，选用了最新版本的Mindie RC2.0版本，成功推理。步骤和上述链接一致，但是下载镜像的时候用MindieRC2.0.目前利用Mindie启动了大模型服务，fastchat启动了embedding服务，然后再启动langchain-chatchat就成功运行，且推理速度和V100卡差不多。如果大家有部署问题，可以后台私信我~

2024-08-05 20:24:08 2110 14

原创 python爬虫-事件触发机制

点击标头可以看到请求后端服务器的api地址，通过拿到这个地址，编写python脚本，不会的可以让gpt帮你写，很好用。然后运行后，就等到爬取完成了，后面也可以多线程爬，还没试，不知道是否有防爬机制。这个网址爬取，html源码找不到链接地址，通过浏览器的开发者工具，点击以下红框。分析预览可知想要的链接地址的id有了，进行地址拼接就行。今天想爬取一些政策，从。

2024-07-27 23:08:21 558

原创华为910b推理Qwen1.5-72b

910b部署推理大模型

2024-07-12 09:16:36 4664 6

原创本科毕设《文本查重系统2.0》

本科时期做的文本查重系统没想到很多同学感兴趣，后台下载记录超过20次，也有同学问我查重算法相关的，也有同学问能不能对算法进行改进。为此，我整理了一个需求：文本查重原型系统，查上传文章与库中其他文章的相似度，查重算法包括：（1）深度学习进行embedding（2）传统simhash，（3）对文章进行分句计算.

2024-05-12 18:35:19 325

原创实习遇到的问题

然而公司并没有提前做埋点，交互数据基本没有，只有我的相关属性信息。没有数据炒饭都没有原材料，服了。公司需要我做一个智能化推荐算法。

2024-04-07 09:59:28 646 1

原创面试经验秋招最后一个

技术问题：1.信息定义 2.信息是谁提出来的 3.系统的定义，谁提出来的 4.二进制和三进制 5.计算机系统结构 6.数据中心你知道吗 7.大数据和AI的区别 8.给你一个服务器，你怎么运维。.....还有一些给忘了，看来还是要从基础打起！

2023-12-01 16:03:43 519 3

原创秋招+今日学习思考

最近在看图神经网路，我第二篇想对graphsage进行改进，但是我看别人改的最多的是采样部分，加排序后采样的，加强化学习采样的，对于聚合部分改进很少，头疼。从暑假开始投简历，一直到现在，基本只有笔试，面试最远走到了二面，基础还是不扎实，很多东西都忘了。上个月是各种考试：银行，证券，国企等，还有我的实习一起，真个人都累的不行。比如，奇安信二面问到的三次握手，很多详细我不记得了，只能说大概。这个月把实习辞了，好好休息一下，写好我的大论文。银行面试都是去当柜员，很离谱。

2023-11-06 22:14:17 140

原创 lingyue南京面试

7.核对信息能不能线下面试，期望薪资是多少（我不知道这个啥意思，随便说了一个12k，结果人家说15.5薪，我还是说的12k。总结：要会java，JavaScript，数据库，总的来说，学校里面做的用不到。今天下午三点面试，远程面试，四个面试官，工具：teams 吐槽一下，这个软件真难用。结束了，面试官说后面会有hr联系你，我估计凉了。中途还掉线了，离谱。问题：看你的简历我主要写了python项目，就问了一些python相关的。5.你会前端吗，你会JavaScript吗我：不会。

2023-10-23 15:48:43 128

原创面试-交通银行江苏省分行暑期实习生

你常用的编程语言是什么？最后是开放性问题：如果有一个时间紧，任务重的项目，你该怎么做？（有专业性问题，也有半结构化面试）一共四个人，总共花了20分钟，面试官会根据你的回答给你打分，我们在回答的时候，他们在观察我们。另外，这种银行的竞争特别激烈，很多都是复旦，东南的/(ㄒoㄒ)/~~，调整心态就好。一定要提前准备一下，我第一个线下面试就没准备，回答的非常磕磕绊绊，自信很重要。昨天去面试了职能部门实习生，场合非常正式，三个面试官，每个人都很严肃。先自我介绍，然后对你的简历提问，我们那组就我一个计算机专业。

2023-07-05 13:20:40 273

原创兴业银行笔试

ps：昨天收到的暑期实习笔试通知，双机位，第一次收到银行的考试，hhhh以为很简单，没想到还挺多题目的。这个部分可能要靠刷题来了，不然根本做不完。就是四六级的英语阅读--这个做的还行。1.EPI考试--公务员行测内容。

2023-06-10 17:04:11 458

原创面试经验(1)

下午四点面试了毕马威KDI 自然语言处理的实习，发现面试官真的很温柔hhhh，问的东西主要是你的简历上的，你的研究方向的东西，但是我都忘了，最基础的都忘了，太离谱了。后面问到了自然语言处理的部分，还是回答上了，主要包括：怎么处理文本的，你用过大语言模型吗，了解chatgpt吗，...我感觉要招聘一个会直接撸代码的人/(ㄒoㄒ)/~~，可是我不太行......自己的研究方向的东西一定要很熟悉！还问了你的pytorch怎么样，用过hugging库吗。

2023-05-30 16:59:52 371

原创剑指offer11：旋转数组的最小数字

【代码】剑指offer11：旋转数组的最小数字。

2023-05-20 22:02:16 128

原创剑指offer06：从尾到头打印链表

【代码】剑指offer06：从尾到头打印链表。

2023-05-18 13:26:52 103

原创剑指offer 04：二维数组中的查找

思路很简单，就是输入可能不是很会，参考了网上的代码，尽量记住。

2023-05-17 13:18:13 89

原创剑指offer03：数组中重复的元素

这个题目我之前的想法是用暴力，判断是否两个元素相同，很麻烦，python中的集合很好的解决了时间复杂度高的问题。

2023-05-16 09:43:33 137 1

原创 LC:找出其中不含有重复字符的最长子串的长度

滑动窗口 set(),目前窗口大小，左指针；自己写代码时，“while s[i] in cwd:”写成了if，有问题，得想一下为什么？

2023-05-15 18:13:16 155 2

原创 LC:两数相加

其实这道题目思路不难，但是不知道python怎么处理的链表，lc中没有输入输出，但是笔试的时候是有的，所以得写全面。

2023-05-12 19:56:06 182 1

原创 LC:子串能表示从 1 到 N 数字的二进制串

【代码】LC:子串能表示从 1 到 N 数字的二进制串。

2023-05-11 15:24:07 129

原创 LC:可被 K 整除的最小整数

问题：考虑到了偶数不能被全是1的数字整除，但是没有考虑5的情况；另外，在循环体里面，如果k不能被整除，就会一直循环下去，没有结束条件。给定正整数 k ，你需要找出可以被 k 整除的、仅包含数字 1 的最小正整数 n 的长度。带模运算的原理可能要推一下了，忘了。优化：增加判断语句；

2023-05-10 18:49:32 91

原创笔试在线编程题

平时不怎么刷LC，笔试的时候在规定时间内不能想出来，为此，记录一下这次的面试题目。(告诫一下自己，多刷LC)

2023-05-09 15:18:23 128

原创 bilstm代码问题（未解决）

# Defined in Section 4.6.7#encoding:utf-8import torchfrom torch import nn, optimfrom torch.nn import functional as Ffrom torch.utils.data import Dataset, DataLoaderfrom torch.nn.utils.rnn import pad_sequence, pack_padded_sequencefrom collections i.

2022-05-06 16:36:14 930 1

原创静态词向量预训练模型与动态词向量预训练模型

提示：最近在做文本情感分析，实现Electra预训练模型+BiLstm+attention。在github上找了一些代码，很多都是只有一部分，而且Electra预训练模型没有什么可以参考的代码。所以，记录一下学习过程，有错误的点，大家可以指出来，共同学习。一、静态词向量预训练模型将一个词在整个语料库中的共现上下文信息聚合至该词的向量表示中，也就是说，对于任意一个词，其向量表示是恒定的，不随其上下文的变化而变化。但是，在自然语言中，同一个词语在不同上下文或者语境中可能呈现出多种不同的词义、.

2022-04-08 14:10:10 4027 1

原创 pip加速安装

pip install ...... -i https://pypi.tuna.tsinghua.edu.cn/simple

2022-01-11 22:35:21 757

原创字符串列表中含有‘nan’

在对句子进行处理时，一直报错：float object has no attribute 'lower'后来每个句子进行输出排查，发现可能读取csv文件时有错，空字符串读取成了nan。用博客记录此次bug，花了两个小时才解决！！！！！！！...

2022-01-07 23:01:15 508

原创 pip国内安装源

pip install -i https://pypi.mirrors.ustc.edu.cn/simple/ pkgname

2021-10-24 22:02:32 190

原创图解算法数据结构--剑指 Offer 05. 替换空格

题目要求：请实现一个函数，把字符串s中的每个空格替换成"%20"。示例：限制：0 <= s 的长度 <= 10000输入：s = "We are happy."输出："We%20are%20happy."python代码：根据题目要求，利用for循环实现，如果是空格就替换，得到的最新结果用列表存储。class Solution(object): def replaceSpace(self, s): """ :typ..

2021-10-19 23:05:58 145

原创根据年份提取dblp内容

文章目录前言一、pandas是什么？二、使用步骤 1.引入库 2.读入数据总结前言最近在做dblp数据集相关预处理工作，根据老师给定的论文，需要按照年份划分提取信息，年份是从1970--2008年。一、分析dblp数据结构从官网上下载dblp最早版本的数据集（不是最新的，最新的有2.1G），大约是1.12GB，XML格式，刚开始老师和我准备手工清洗，只清洗了一年的就好困难，果断放弃，让我想办法编程试一下。查看各种博客后，发现可以用sax进行解析，十分方便

2021-10-18 19:22:58 1407

原创大话数据结构之线性表的顺序存储

operation： InitList(*L):初始化操作，建立一个空的线性表L ListEmpty(L):若线性表为空，返回true，否则返回false ClearList(*L):将线性表清空 GetElem（L,i，*e）：将线性表L中的第i个位置元素值返回给e LocateElem(L,e):在线性表L中查找与给定值e相等的元素，如果查找成功，返回该元素在表中序号表示成功；否则，返回0表示失败 ...

2021-07-25 23:10:08 183 2

原创大话数据结构第一章读书笔记

数据是描述客观事物的符号，是计算机中可以操作的对象数据元素是组成数据的、有一定意义的基本单位，在计算机中通常作为整体处理数据项一个数据元素可以由若干个数据项组成，数据项是数据不可分割的最小单位数据对象是性质相同的数据元素的集合，是数据的子集数据结构是相互之间存在一种或多种特定关系的数据元素的集合逻辑结构集合结构；线性结构；树形结构；图形结构物理结构顺序存储结构；链式存储结构...

2021-07-19 21:42:38 249 1

原创大学四年的课程设计及实验

面向对象课程设计--学生成绩管理系统操作系统课程设计数据结构课程设计计算机硬件课程设计信息论与编码课程设计数据库课程设计--教室管理系统计算机网络课程设计密码学课程设计--轻量级盲签名算法网络安全课程设计入侵防御技术课程设计信息内容安全课程设计渗透测试课程设计信息安全综合实践工控安全及系统安全实验...

2021-07-19 12:13:50 172 1

原创从社交关系挖掘引申的两个题目

1.基于机器学习的用户账号异常检测系统的设计与实现本系统旨在利用用户的行为特征来区分正常帐号和异常帐号。具体的思路为，首先抽取用户行为特征以及帐号状态标记（正常或异常）形成训练集，然后基于训练集使用机器学习中有监督学习算法训练分类器，最后对于待测用户样本数据，直接使用该分类器判断是否异常。本系统主要有以下功能模块：用户数据获取模块，异常用户检测模块，统计展示模块。用户数据获取可设计网络爬虫爬取或者自己构造数据集来进行，建议爬取微博用户。异常用户检测是对数据进行预处理，然后特征提取，最后对结果进行存储。统

2021-07-18 19:57:00 237 1

文本在线查重系统手稿讲解.pdf

01_文本在线查重系统.rar

空空如也