- 博客(90)
- 收藏
- 关注
原创 当日金价格实时显示小插件
widget = RealTimeDataWidget(root, title="当日金价", update_interval=1000, get_data_func=get_custom_data)self.after(self.update_interval, self.update_data) # 定时回调。self.time_var.set(f"更新时间: {time.strftime('%H:%M:%S')}")"""默认获取数据函数""""""刷新显示"""# 模拟自定义数据函数。
2025-10-15 12:01:04
458
原创 redis哨兵集群
格式:sentinel monitor <master-name> <ip> <redis-port> <quorum>拷贝基础配置文件到/project/bushu/cloud/redis_master/conf目录。拷贝基础配置文件到/project/bushu/cloud/redis_slave/conf目录。# master在连续多长时间无法响应PING指令后,就会主观判定节点下线,默认是30秒,这个可以不配置。=============redis哨兵部署--完毕===============
2025-09-26 14:55:05
612
原创 solr cloud集群搭建 solr5+zookeeper
zkcli.bat -zkhost 192.168.1.38:2181,192.168.1.38:2182,192.168.1.38:2183 -cmd upconfig -confdir C:\Users\cdg19\Desktop\solr_cloud说明\bag\solr-8.11.2\server\solr\kapt\conf -confname kapt。修改以下文件第一行数据(第二台就是echo2):echo '2'>/zookeeper/data/myid。docker 启动命令。
2025-09-26 14:52:02
585
原创 发文量统计,echarts展示
bar.set_global_opts(title_opts=opts.TitleOpts(title='2024年发文量'),datazoom_opts=[opts.DataZoomOpts()])#xaxis_opts=opts.AxisOpts(type_="time")bar.add_yaxis('发文量',monthly_count['count'].tolist())
2025-09-05 13:54:37
681
原创 获取小红书某个用户列表
api_response_data.append(response.json()) # 将 JSON 数据添加到列表中。page.locator('//div[text()=" 用户"]').click()# 检查是否是 JSON 格式。cookie=[] #用自己的cookie。print("下拉结束")print("继续下拉")# 检查响应的 URL 是否匹配。
2025-08-28 23:39:05
337
原创 简单的词语数组取描述词
如果使用本地模型文件,请指定路径,如 model = KeyedVectors.load_word2vec_format("path/to/model", binary=True)#核心取中心向量,中心向量最近的两个词来描述此数组;# 你可以使用预训练的Google新闻Word2Vec模型,或自己训练一个模型。words = ['房车', '旅行', '草原', '露营']# 根据索引返回最能代表整个词组的两个词。# 筛选出模型中存在的词,并生成词向量。# 获取最相似的两个词的索引。
2025-08-26 13:37:58
176
原创 pdf文件流或者本地文件读取
获取当前页面的全部文本信息,包括表格中的文字,没有内容则打印None。print(e,"打开本地文件失败")print(e,"打开链接失败")print("路径为空或格式不对!
2025-08-14 10:45:50
413
原创 xpath2.0
result=ep.select(html,'if (/html/head/meta[11]/@content>100) then "大于100" else "小于100"')
2025-08-14 10:42:25
305
原创 curl_cffi 用于动态完善浏览器指纹信息,支持http2.0以上,模拟TSL信息,防止被认为爬虫
from curl_cffi import requestsurl='https://www.globalsecurity.org/military/world//philippines/paf-modernization.htm'proxies={'http':'192.168.1.122:1080','https':'192.168.1.122:1080'}response = requests.get(url,impersonate="chrome110",proxies=proxies)pr
2025-08-14 10:41:44
248
原创 linux 扩展未分配的磁盘空间到home下
lvextend -L +10G /dev/centos/home 或者 sudo lvextend -l +50%FREE /dev/centos/home。lvextend -L +10G /dev/centos/root 或者 sudo lvextend -l +50%FREE /dev/centos/home。sudo xfs_growfs /home (ext4系统使用 resize2fs /dev/centos/home) ##最后一步执行扩展文件系统。下面把这50G分配给home。
2025-08-03 23:09:51
368
原创 python udp视频服务端客户端
if cv2.waitKey(1) & 0xFF == 27: # ESC键退出。font_path = "simhei.ttf" # 你可以换成系统其他中文字体。text=input("请输入想发送的内容:")color = (0, 255, 0) # 绿色。# 转换为 PIL 图像对象。ip=input("输入对方ip地址:")# 加载中文字体(Windows 示例)print("视频服务端已准备好!# 转回 OpenCV 格式。print("准备发送")
2025-07-23 15:12:20
580
原创 使用kkfileview在线预览
###必须使用网络地址,把文件放到nginx服务器或者放到tomcat底下。如果没有nginx可以自己写个http服务器下面是个非常简单的示例。print(f"服务器启动,监听端口 {PORT}")######编码url地址为base64。###调用webdriver启动浏览器。######预览文件。
2025-07-18 09:31:07
384
原创 python 日期转换函数使用
print(recognize_and_convert_date(date_str1)) # 输出:2023-03-15。print(recognize_and_convert_date(date_str2)) # 输出:2023-03-15。print(recognize_and_convert_date(date_str3)) # 输出:2023-03-15。print(recognize_and_convert_date(date_str4)) # 输出:2023-03-15。
2025-07-18 09:24:46
328
原创 minio服务器图片数据写入到excel并且下载到本地
endpoint = '192.168.1.148:9000' # MinIO服务器地址。secure = False # 若为HTTPS则设置为True,否则设置为False。# 初始化MinIO客户端。# 列出存储桶中的所有文件。
2025-07-18 09:21:23
494
原创 python solr数据导出脚本
print(s.add(tmp_doc),"剩余数量",s_num,":::::使用时间::::")#更改url需要修改的地方,查看文章id,修改search_sql,修改要更改的modify_url。print("剩余数量",s_num,":::::使用时间::::")#solr地址,如果实时提交always_commit=True。print('数据总量:',data_num_count)#需要过滤的字段,例如COPY字段,需要跳过。
2025-07-11 16:32:58
305
原创 python 操作arangodb 图数据库
'tonodetype': '类型1','tonodetext': '透水事故''relation': '事故类型',# 使用AQL查询文档。
2025-07-11 16:20:23
436
原创 arangodb集群docker搭建方法
docker run -itd -e ARANGO_ROOT_PASSWORD=123456 --name my1 -p 18528-18538:8528-8538 --network host arangodb:cdg arangodb --starter.data-dir=/root/arangodb/db1 --server.storage-engine=rocksdb --auth.jwt-secret=/etc/arangodb.secret --starter.join 192.168.1.25
2025-07-11 16:15:48
503
原创 dockerfile 笔记
指定存储卷, 任何向/tmp写入的信息都不会记录到容器存储层。# 设置JVM运行参数, 这里限定下内存大小,减少开销。# 入口点, 执行JAVA运行命令。#空参数,方便创建容器时传参。# 设置JAVA版本。# 拷贝运行JAR包。
2025-07-11 16:11:31
480
原创 mysql数据库导入导出命令
在D:\mysql\bin下面执行。在D:\mysql\bin下面执行。注意下面ip密码以及端口号。#######导入数据库。######导出数据库。
2025-07-11 15:36:56
335
原创 python 修改nacos配置文件
if(input("节点值是否输入完毕?tmp=input("请输入节点:")zhi=input("请输入此节点值:")# 分组名称,默认为:DEFAULT_GROUP。# 将修改后的配置转换回字符串。# 配置数据解析(YAML)# 通过键路径,解析出数据。# 创建一个连接对象。# 发布修改后的配置。
2025-07-01 10:59:49
340
原创 python pandas模块读取excel插入数据库笔记
conn=pymysql.Connection(user='root',password='123456',host='127.0.0.1',port=3309,database='每日科学')
2025-07-01 10:39:01
222
原创 关于根据词库分词的算法逻辑实现(最长词汇匹配原则)
for size in range(block, 1, -1): # 从最长的块开始,直到长度为2。ss = set(['我爱北京天安门','北京','天安','爱北','张三'])# 替换掉双括号中的额外括号,只保留一个括号,最长词汇匹配原则。####根据最长词汇block窗口大小移动套取词汇。######过滤多括号嵌套,因为是最长匹配原则。#####根据用户词典列表把词汇用括号括起来。a = '我爱北京天安门,天安门上太阳升'#####得到句子中包含的词汇列表。####查找最长词汇。
2025-06-05 15:44:17
199
原创 文章相似度对比
text_a = "中国是一个拥有悠久历史和灿烂文化的国家。text_b = "中国是一个拥有悠久历史的国家。print(f"相似度:{sim:.4f}")print("判定为重复文章")print("可能是相似文章")print("非重复文章")# 加载中文句向量模型(BGE)
2025-05-21 16:06:56
358
原创 对于语义向量化测试,BAAI/bge-large-zh-v1.5大模型的效果还是不错的
f=open('飞机设计手册 第22册 技术经济设计.docx.txt','r',encoding="utf-8")print(f"{i+1}. {corpus[idx]} (相似度: {D[0][i]:.4f})")return ' '.join(jieba.lcut(text)) # 加分隔符提升效果。# Step 3: 准备你的语料库(可以替换为你的问答、百科等)query = "确 定 VE 对象的改进范围"# Step 1: 添加自定义词(比如人名)#jieba.add_word("张洋洋")
2025-05-14 16:36:07
563
原创 python 取出字串中的所有词
for size in range(block, 1, -1): # 从最长的块开始,直到长度为2。ss = set(['天安门','我爱','天安'])a = '我爱北京天安门,天安门上太阳升'
2025-04-27 11:49:53
165
原创 词语关系图谱模型
hs=0, # 是否使用层次Softmax(和 negative 二选一)sg=0, # 训练算法:0 = CBOW;window=5, # 词与上下文之间的最大距离(滑动窗口大小)sample=1e-3, # 高频词下采样的阈值(越小,越容易下采样)negative=5, # 负采样的数量(常用5~20之间)workers=4, # 用于训练的线程数(多线程加速)
2025-04-22 19:39:27
181
原创 关于solr请求参数过长解决办法
找到jetty.xml 修改 <Set name="requestHeaderSize">65536</Set> 默认是8k的。###tomcat版本的。找到server.xml。
2025-04-11 16:46:58
136
ntfs-3g,linux文件挂载程序
2024-03-25
kkfileview 用于展示多种格式的java程序
2024-03-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅