自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(90)
  • 收藏
  • 关注

原创 当日金价格实时显示小插件

widget = RealTimeDataWidget(root, title="当日金价", update_interval=1000, get_data_func=get_custom_data)self.after(self.update_interval, self.update_data) # 定时回调。self.time_var.set(f"更新时间: {time.strftime('%H:%M:%S')}")"""默认获取数据函数""""""刷新显示"""# 模拟自定义数据函数。

2025-10-15 12:01:04 458

原创 redis哨兵集群

格式:sentinel monitor <master-name> <ip> <redis-port> <quorum>拷贝基础配置文件到/project/bushu/cloud/redis_master/conf目录。拷贝基础配置文件到/project/bushu/cloud/redis_slave/conf目录。# master在连续多长时间无法响应PING指令后,就会主观判定节点下线,默认是30秒,这个可以不配置。=============redis哨兵部署--完毕===============

2025-09-26 14:55:05 612

原创 solr cloud集群搭建 solr5+zookeeper

zkcli.bat -zkhost 192.168.1.38:2181,192.168.1.38:2182,192.168.1.38:2183 -cmd upconfig -confdir C:\Users\cdg19\Desktop\solr_cloud说明\bag\solr-8.11.2\server\solr\kapt\conf -confname kapt。修改以下文件第一行数据(第二台就是echo2):echo '2'>/zookeeper/data/myid。docker 启动命令。

2025-09-26 14:52:02 585

原创 发文量统计,echarts展示

bar.set_global_opts(title_opts=opts.TitleOpts(title='2024年发文量'),datazoom_opts=[opts.DataZoomOpts()])#xaxis_opts=opts.AxisOpts(type_="time")bar.add_yaxis('发文量',monthly_count['count'].tolist())

2025-09-05 13:54:37 681

原创 获取小红书某个用户列表

api_response_data.append(response.json()) # 将 JSON 数据添加到列表中。page.locator('//div[text()=" 用户"]').click()# 检查是否是 JSON 格式。cookie=[] #用自己的cookie。print("下拉结束")print("继续下拉")# 检查响应的 URL 是否匹配。

2025-08-28 23:39:05 337

原创 windows端口映射

映射删除映射。

2025-08-28 16:04:01 256

原创 简单的词语数组取描述词

如果使用本地模型文件,请指定路径,如 model = KeyedVectors.load_word2vec_format("path/to/model", binary=True)#核心取中心向量,中心向量最近的两个词来描述此数组;# 你可以使用预训练的Google新闻Word2Vec模型,或自己训练一个模型。words = ['房车', '旅行', '草原', '露营']# 根据索引返回最能代表整个词组的两个词。# 筛选出模型中存在的词,并生成词向量。# 获取最相似的两个词的索引。

2025-08-26 13:37:58 176

原创 pdf文件流或者本地文件读取

获取当前页面的全部文本信息,包括表格中的文字,没有内容则打印None。print(e,"打开本地文件失败")print(e,"打开链接失败")print("路径为空或格式不对!

2025-08-14 10:45:50 413

原创 xpath2.0

result=ep.select(html,'if (/html/head/meta[11]/@content>100) then "大于100" else "小于100"')

2025-08-14 10:42:25 305

原创 curl_cffi 用于动态完善浏览器指纹信息,支持http2.0以上,模拟TSL信息,防止被认为爬虫

from curl_cffi import requestsurl='https://www.globalsecurity.org/military/world//philippines/paf-modernization.htm'proxies={'http':'192.168.1.122:1080','https':'192.168.1.122:1080'}response = requests.get(url,impersonate="chrome110",proxies=proxies)pr

2025-08-14 10:41:44 248

原创 linux 扩展未分配的磁盘空间到home下

lvextend -L +10G /dev/centos/home 或者 sudo lvextend -l +50%FREE /dev/centos/home。lvextend -L +10G /dev/centos/root 或者 sudo lvextend -l +50%FREE /dev/centos/home。sudo xfs_growfs /home (ext4系统使用 resize2fs /dev/centos/home) ##最后一步执行扩展文件系统。下面把这50G分配给home。

2025-08-03 23:09:51 368

原创 python udp视频服务端客户端

if cv2.waitKey(1) & 0xFF == 27: # ESC键退出。font_path = "simhei.ttf" # 你可以换成系统其他中文字体。text=input("请输入想发送的内容:")color = (0, 255, 0) # 绿色。# 转换为 PIL 图像对象。ip=input("输入对方ip地址:")# 加载中文字体(Windows 示例)print("视频服务端已准备好!# 转回 OpenCV 格式。print("准备发送")

2025-07-23 15:12:20 580

原创 使用kkfileview在线预览

###必须使用网络地址,把文件放到nginx服务器或者放到tomcat底下。如果没有nginx可以自己写个http服务器下面是个非常简单的示例。print(f"服务器启动,监听端口 {PORT}")######编码url地址为base64。###调用webdriver启动浏览器。######预览文件。

2025-07-18 09:31:07 384

原创 python 日期转换函数使用

print(recognize_and_convert_date(date_str1)) # 输出:2023-03-15。print(recognize_and_convert_date(date_str2)) # 输出:2023-03-15。print(recognize_and_convert_date(date_str3)) # 输出:2023-03-15。print(recognize_and_convert_date(date_str4)) # 输出:2023-03-15。

2025-07-18 09:24:46 328

原创 minio服务器图片数据写入到excel并且下载到本地

endpoint = '192.168.1.148:9000' # MinIO服务器地址。secure = False # 若为HTTPS则设置为True,否则设置为False。# 初始化MinIO客户端。# 列出存储桶中的所有文件。

2025-07-18 09:21:23 494

原创 python solr数据导出脚本

print(s.add(tmp_doc),"剩余数量",s_num,":::::使用时间::::")#更改url需要修改的地方,查看文章id,修改search_sql,修改要更改的modify_url。print("剩余数量",s_num,":::::使用时间::::")#solr地址,如果实时提交always_commit=True。print('数据总量:',data_num_count)#需要过滤的字段,例如COPY字段,需要跳过。

2025-07-11 16:32:58 305

原创 汽车零部件元件专业词汇

【代码】汽车零部件元件专业词汇。

2025-07-11 16:26:38 1523

原创 python 操作arangodb 图数据库

'tonodetype': '类型1','tonodetext': '透水事故''relation': '事故类型',# 使用AQL查询文档。

2025-07-11 16:20:23 436

原创 arangodb集群docker搭建方法

docker run -itd -e ARANGO_ROOT_PASSWORD=123456 --name my1 -p 18528-18538:8528-8538 --network host arangodb:cdg arangodb --starter.data-dir=/root/arangodb/db1 --server.storage-engine=rocksdb --auth.jwt-secret=/etc/arangodb.secret --starter.join 192.168.1.25

2025-07-11 16:15:48 503

原创 dockerfile 笔记

指定存储卷, 任何向/tmp写入的信息都不会记录到容器存储层。# 设置JVM运行参数, 这里限定下内存大小,减少开销。# 入口点, 执行JAVA运行命令。#空参数,方便创建容器时传参。# 设置JAVA版本。# 拷贝运行JAR包。

2025-07-11 16:11:31 480

原创 mysql数据库导入导出命令

在D:\mysql\bin下面执行。在D:\mysql\bin下面执行。注意下面ip密码以及端口号。#######导入数据库。######导出数据库。

2025-07-11 15:36:56 335

原创 selenium 使用方法

d.get(url)

2025-07-11 11:35:25 583

原创 python 修改nacos配置文件

if(input("节点值是否输入完毕?tmp=input("请输入节点:")zhi=input("请输入此节点值:")# 分组名称,默认为:DEFAULT_GROUP。# 将修改后的配置转换回字符串。# 配置数据解析(YAML)# 通过键路径,解析出数据。# 创建一个连接对象。# 发布修改后的配置。

2025-07-01 10:59:49 340

原创 python pandas模块读取excel插入数据库笔记

conn=pymysql.Connection(user='root',password='123456',host='127.0.0.1',port=3309,database='每日科学')

2025-07-01 10:39:01 222

原创 使用nssm工具创建windows服务和删除服务

echo offpause删除服务。

2025-07-01 10:04:44 479

原创 Milvus报错,reson=timestamp lag too large

清空配置文件会解决第一张图片问题。

2025-06-27 23:34:19 378

原创 关于根据词库分词的算法逻辑实现(最长词汇匹配原则)

for size in range(block, 1, -1): # 从最长的块开始,直到长度为2。ss = set(['我爱北京天安门','北京','天安','爱北','张三'])# 替换掉双括号中的额外括号,只保留一个括号,最长词汇匹配原则。####根据最长词汇block窗口大小移动套取词汇。######过滤多括号嵌套,因为是最长匹配原则。#####根据用户词典列表把词汇用括号括起来。a = '我爱北京天安门,天安门上太阳升'#####得到句子中包含的词汇列表。####查找最长词汇。

2025-06-05 15:44:17 199

原创 文章相似度对比

text_a = "中国是一个拥有悠久历史和灿烂文化的国家。text_b = "中国是一个拥有悠久历史的国家。print(f"相似度:{sim:.4f}")print("判定为重复文章")print("可能是相似文章")print("非重复文章")# 加载中文句向量模型(BGE)

2025-05-21 16:06:56 358

原创 selenium webdriver使用

####多选框城市和。

2025-05-20 17:38:17 1179

原创 对于语义向量化测试,BAAI/bge-large-zh-v1.5大模型的效果还是不错的

f=open('飞机设计手册 第22册 技术经济设计.docx.txt','r',encoding="utf-8")print(f"{i+1}. {corpus[idx]} (相似度: {D[0][i]:.4f})")return ' '.join(jieba.lcut(text)) # 加分隔符提升效果。# Step 3: 准备你的语料库(可以替换为你的问答、百科等)query = "确 定 VE 对象的改进范围"# Step 1: 添加自定义词(比如人名)#jieba.add_word("张洋洋")

2025-05-14 16:36:07 563

原创 rag简单demo

【代码】rag简单demo。

2025-05-12 13:58:17 140

原创 关于solr删除某些数据的方法

标红的部分分别是条件和地址。

2025-04-29 17:38:26 232

原创 python 取出字串中的所有词

for size in range(block, 1, -1): # 从最长的块开始,直到长度为2。ss = set(['天安门','我爱','天安'])a = '我爱北京天安门,天安门上太阳升'

2025-04-27 11:49:53 165

原创 词语关系图谱模型

hs=0, # 是否使用层次Softmax(和 negative 二选一)sg=0, # 训练算法:0 = CBOW;window=5, # 词与上下文之间的最大距离(滑动窗口大小)sample=1e-3, # 高频词下采样的阈值(越小,越容易下采样)negative=5, # 负采样的数量(常用5~20之间)workers=4, # 用于训练的线程数(多线程加速)

2025-04-22 19:39:27 181

原创 solr自动建议接口简单使用

def api():def cdg():try:!!!"+userelif user!=NoneType:!

2025-04-22 16:02:45 318

原创 修改docker utc时区方法

如下以只读方式挂在linux主机时间和时区文件。

2025-04-19 21:49:28 270

原创 关于solr请求参数过长解决办法

找到jetty.xml 修改 <Set name="requestHeaderSize">65536</Set> 默认是8k的。###tomcat版本的。找到server.xml。

2025-04-11 16:46:58 136

原创 windows sc 创建删除服务

另外一种方式是nssm软件直接加入路径和参数,更方便。#删除 sc delete MyJavaApp。

2025-04-11 13:49:49 477

原创 调用ollama deepseek-r1:1.5b向量化句子

text='我爱北京天安门,天安门上太阳升'

2025-03-25 15:23:50 156

原创 redis查询数据方法,命令行

get name 查询键值。select 0 选库。dbsize 查询数量。keys * 查询所有键。

2025-03-25 14:59:48 185

ocr 免费使用,ocr 免费使用

ocr 免费使用,自己做的小程序,可以调整ipx,ipx越高识别度越高,识别速度,一张9秒左右,把文件放到配置文件路径,如果没有自己新建

2025-07-11

ocr工具,脱机版,支持中英文,调整ipx,ipx越高效果越好,但是速度慢

ocr工具,脱机版,支持中英文,调整ipx,ipx越高效果越好,但是速度慢

2025-04-29

词语关系图谱模型,大数据计算

词语关系图谱模型,大数据计算

2025-04-22

kkfileview linux版依赖java

kkfileview linux版依赖java

2025-03-18

ntfs-3g,linux文件挂载程序

linux文件挂载程序 rpm -ivh *.rpm --force --nodeps 挂载 fdisk -l 查看识别的硬盘是sdc多少 例如识别的sdc4 那么挂载命令如下/mnt是挂载到的目录 mount -t ntfs-3g /dev/sdc4 /mnt/ 解除挂载 umount -l /dev/sdc4

2024-03-25

dbeaver连接国产达梦数据库工具

dbeaver连接国产达梦数据库工具

2024-12-09

kkfileview 用于展示多种格式的java程序

kkfileview 用于展示多种格式,访问地址 http://localhost:8012/ 支持 doc, docx, xls, xlsx, xlsm, ppt, pptx, csv, tsv, dotm, xlt, xltm, dot, dotx, xlam, xla, pages 等 Office 办公文档 支持 wps, dps, et, ett, wpt 等国产 WPS Office 办公文档 支持 odt, ods, ots, odp, otp, six, ott, fodt, fods 等OpenOffice、LibreOffice 办公文档 支持 vsd, vsdx 等 Visio 流程图文件 支持 wmf, emf 等 Windows 系统图像文件 支持 psd, eps 等 Photoshop 软件模型文件 支持 pdf ,ofd, rtf 等文档 支持 xmind 软件模型文件 支持 bpmn 工作流文件 支持 eml 邮件文件 支持 epub 图书文档 支持 obj, 3ds, stl, ply, gltf, glb, off, 3dm, fbx, dae

2024-03-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除