奔向理想的星辰大海
这个作者很懒,什么都没留下…
展开
-
Python中调用ffmpeg命令处理视频
'-vf', 'scale=1280:720', # 输出1280x720。'-c:v', 'libx264', # 视频编码器。'-c:a', 'aac', # 音频编码器。'-b:a', '192k', # 音频比特率。'-crf', '23', # 质量参数。'-ss', '00:01:23', # 定位时间点。'-vframes', '1', # 截取1帧。'-y', # 覆盖已存在文件。(可能引发命令注入漏洞)对用户输入进行严格过滤。原创 2025-04-03 11:16:41 · 8 阅读 · 0 评论 -
Spring Boot 实战搞定电子签名与合同系统集成!
在本篇文章中,我们深入探讨了基于 Spring Boot 3.4 实现 电子签名与合同系统集成 的完整解决方案。通过结合 Spring Boot、MyBatis-Plus、Vue & Element,我们成功构建了一个支持 在线文档签署、合同审批、电子印章管理 的系统。这一系统的引入,不仅简化了企业合同签署流程,还极大提升了数据安全性和防篡改能力。业务层(Service)原创 2025-04-03 09:55:55 · 34 阅读 · 0 评论 -
AI赋能网页爬虫的利器AIGC+Python
这是一段电影列表html,请获取电影名(name),封面链接(picture),简介(info),评分(score),评论人数(conmmentsNumber)最终,通过以上步骤,我们可以快速实现一个网页爬虫,从网页中提取我们需要的信息。现在,我们可以调用AIGC的API,并传入HTML内容和设置好的Prompt,让AIGC帮助我们生成网页爬虫所需的代码。在使用AIGC之前,我们需要设置Prompt,以便AIGC可以生成我们需要的内容。接下来,我们可以通过发送HTTP请求来获取网页的HTML内容。原创 2025-04-03 09:53:11 · 111 阅读 · 0 评论 -
Python 彻底掌握 SQLAlchemy数据库操作神器
SQLAlchemy 是 Python 的 ORM(对象关系映射)框架,可以用 Python 代码 直接操作数据库,而 不需要写 SQL。为什么要用 ORM?数据库操作更 Pythonic(面向对象)兼容多种数据库(MySQL、PostgreSQL、SQLite 等)自动生成 SQL,避免 SQL 注入风险更易维护,代码比 SQL 语句更清晰SQLAlchemy 让数据库操作更清晰、更 Pythonic!# 创建表ORM 方式定义表结构,避免手写 SQL!原创 2025-04-03 09:50:03 · 7 阅读 · 0 评论 -
精炼高可用架构设计要点
容量规划阶段更多是要依靠自身和团队的经验,比如要了解系统的 log 的性能、redis 的性能、rpc 接口的性能、服务化框架的性能等等,然后根据各种组件的性能来综合评估已经设计的系统的整体性能情况。在高可用服务设计章节提到,核心服务可以监控:服务流量预警、端口存活、进程占用的资源、服务接口功能逻辑是否正常,应用 FGC 等情况,需要一个完善监控告警机制,并在告警后,通过一定的策略进行处理,以致服务可以快速恢复。评估的时候,要从一个整体角度来看全局的量级,然后再细化到每个子业务模块要承载的量级。原创 2025-04-03 09:46:10 · 121 阅读 · 0 评论 -
Python的金融领域AI训练数据抓取实战
成本项自建方案(月)API方案(月)基础设施$3200$0代理费用$4500$2800开发维护$8000$500合规风险成本$2000$200总计$17700$3500。| (Scrapy集群) | | (Kafka/RabbitMQ)| | (Spark) || 爬虫集群 | --> | 消息队列 | --> | 数据清洗服务 || 客户端请求 +------>| 反向代理服务器 +------>| 应用服务器 |原创 2025-03-27 14:18:10 · 295 阅读 · 0 评论 -
Deepseek RAG维保案例,如何实现“文+图“的答案呈现
修改嵌入模型可以使用本地嵌入模型替代云端 API。在create_kb.py和chat.py中取消相关注释并安装额外依赖。优化提示词模板修改chat.py中的prompt_template变量以定制提示词模板。添加新的文档类型支持扩展upload_file.py中的处理逻辑以支持更多文件类型。原创 2025-03-27 10:46:58 · 24 阅读 · 0 评论 -
OpenCV 实现图像识别的十个基础算法
OpenCV 是一个强大的计算机视觉库,广泛用于图像和视频处理。它支持多种编程语言,Python 版本尤其受欢迎!通过 OpenCV,你可以轻松实现图像识别、处理等任务。Canny算法是图像处理中经典的边缘检测方法,它能帮助我们从图片中提取清晰的边界信息。简单来说,Canny算法通过高斯模糊、梯度计算和非极大值抑制等步骤,最终生成精准的边缘图。比如,你想从一张照片中找到物体的轮廓,Canny算法就是个好帮手!import cv2# 读取图像并转换为灰度图# 使用Canny算法检测边缘# 显示结果。原创 2025-03-27 09:39:53 · 116 阅读 · 0 评论 -
剖析 Redisson 分布式锁原理、实现与应用实践
在此之后,其他线程就可以抢锁,由此避免了死锁问题。(1) 分布式集合的支持:Redisson按照Java的语义和规范实现了各种java集合对象的实现,包括multimap、priorityQueue、DelayQueue等设置是原子类,而Jedis仅仅支持一些比较常见的java集合类,例如Map、Set、List等。若没有则看看等待队列中最后一个元素的超时时间,并基于这个超时时间获取自己的等待时长,如果超时清单中没有元素,则直接基于分布式锁lock中持有锁线程的到期时间获取自己的等待时长。原创 2025-03-26 10:29:02 · 32 阅读 · 0 评论 -
DeepSeek+HTML制作数据看板
DeepSeek以极强的推理能力,支持生成各种代码,比如Python、SQL、Matlab、JS、HTML等,你可以拿这些代码放到编译器里,就能直接跑出结果,比如机器学习算法、exe应用、可视化图表、web应用。最近发现了一个好玩的场景,使用DeepSeek生成HTML来制作可视化数据看板。数据看板是职场中常见的数据展现形式,一般用Excel、Tableau、PowerBI来做,但现在DeepSeek也能帮你完成简单的看板搭建工作。原创 2025-03-26 10:14:29 · 108 阅读 · 0 评论 -
广告点击事件处理方案——策略模式驱动的Java企业级实现
platformType=tencent&adSourceType=tencent_app ,依据这些参数来调用对应的策略)2publishEvent()参数标准化处理,生成统一AdEvent对象3handlerAdEvent()Spring事件监听器,触发异步处理4handleAdEventMq()策略路由核心逻辑:1. 解析platform_type+event_type2. 查询策略注册表5handleEvent()具体策略执行:- 参数解密- 数据校验- 业务处理- 结果持久化。原创 2025-03-25 12:59:51 · 21 阅读 · 0 评论 -
某金融银行内部基础业务引入DeepSeek大模型
随着金融科技的高速发展,人工智能技术在金融银行业的应用逐渐深入,成为提升业务效率、优化客户体验和降低运营成本的重要手段。近年来,大模型技术的成熟为金融银行业带来了新的机遇,特别是以DeepSeek为代表的大模型,凭借其强大的自然语言处理能力、知识整合能力和智能化决策能力,为金融业务场景提供了创新的解决方案。金融银行业的基础业务,如客户服务、风险管理、合规管理、产品推荐等,面临着日益复杂的市场环境和客户需求,传统的技术手段已难以满足高效、精准和个性化的服务要求。原创 2025-03-25 09:16:05 · 37 阅读 · 0 评论 -
巧用DeepSeek设计交互式演示动画,让你的课件生动有趣
复制代码,新建一个文本文档,粘贴代码,保存并重命名为xxx.html,用Chrome、Edge、Safari等现代浏览器打开,便可以查看演示动画效果。这篇文章就给大家举几个例子,展示如何使用DeepSeek快速制作演示动画(包括3D动画)以及动画效果,主要包括中学物理中的单摆运动、自由落体、气体分子运动、光的折射和原子模型等演示动画。只需要几十秒,DeepSeek便能给我们输出一大段完整的包含原生js或者引入在线js库的html代码,以及代码的主要功能与特点。S 全屏播放 full_screen_mv。原创 2025-03-25 09:13:36 · 46 阅读 · 0 评论 -
DeepSeek 助力电子病历智能质控系统落地方案
通过非结构化文本解析、诊疗逻辑验证、规则执行和多中心模型优化,不仅提升了数据处理效率,还能根据医院间数据的差异不断优化模型的泛化能力。建议医院优先实施基础规则质控(完整性/规范性),6个月后再拓展复杂逻辑校验,最终构建覆盖"书写-归档-应用"全流程的智能质控体系。:使用DeepSeek完成BERT+CRF模型训练。:建立标准化病历数据字典(覆盖300+字段):建立包含疾病-症状-药品关系的医学知识库。:建立AI质控-医生修正-闭环管理机制。:整理医院现有质控规则3000+条。:抽取3年历史病历建立训练集。原创 2025-03-25 09:05:47 · 438 阅读 · 0 评论 -
Python 中使用 `json` 模块
在Python中,json 模块提供了一个非常方便的方法来处理JSON数据。无论是将Python对象转换为JSON格式(序列化),还是将JSON格式的数据解析为Python对象(反序列化),json 模块都能满足你的需求。原创 2025-03-24 09:40:48 · 24 阅读 · 0 评论 -
Python NumPy 从入门到精通详解
这20个案例涵盖了 NumPy 最常用的功能,包括数组创建、基本操作、索引切片、形状变换、聚合函数、合并分割、广播、线性代数运算以及性能优势。通过学习和实践这些案例,你应该能够基本掌握 NumPy 的核心用法,并为后续深入学习数据分析、机器学习等领域打下坚实的基础。原创 2025-03-24 09:28:13 · 275 阅读 · 0 评论 -
Python 数据清洗的必备技巧
假如你现在负责一家电商平台的数据分析工作,需要处理用户购买行为记录的数据集。你需要先清理数据,包括去重、处理丢失值,接着分析用户最常购买的类别等。首先,我们先从简单的一环开始——去除重复值。想象一下,你的数据中有些行可能是完全一样的,这在分析时会影响准确性。当我们的数据涉及大量文本时,需要进行清理以便更好地分析,比如转换大小写、移除空格等。数据中的空值是非常常见的问题,我们可以选择删除或填充这些缺失值。有时候,异常高或低的数值也被称为离群值。确保每一列的数据都是正确的类型对于后续操作是重要的。原创 2025-03-21 10:01:08 · 35 阅读 · 0 评论 -
推荐 12 个提升程序员软技能与效率的必备工具
整个过程非常的简单傻瓜,你完完全全不需要花费任何精力去自己抠图。不同于 Fiddler 通过断点修改请求响应的方式,whistle 采用的是类似配置系统 hosts 的方式,一切操作都可以通过配置实现,支持域名、路径、正则表达式、通配符、通配路径等多种匹配方式,且可以通过 Node 模块扩展功能。ProcessOn 是一个在线作图工具的聚合平台,它可以在线画流程图、思维导图、UI原型图、UML、网络拓扑图、组织结构图等等, 不管 Mac 还是 Windows,一个浏览器就可以随时随地的发挥创意,规划工作。原创 2025-03-20 09:43:08 · 23 阅读 · 0 评论 -
推荐这16 个极具现代化风格的 UI 网站
一个很棒的网站,可以找到按屏幕、产品类别和元素分类的应用程序设计灵感。原创 2025-03-20 09:40:28 · 30 阅读 · 0 评论 -
15个很有趣的开源项目推荐
dooringx-lib 在运行时维护一套数据流,主要分为json数据部分,左侧组件部分,右侧配置项部分,快捷键部分,弹窗部分,事件与函数部分,数据源部分。提供状态管理服务的框架,提炼现有各大框架的精华,以及社区公认的最佳实践,通过良好的模块设计,既保证react的最佳性能又允许用户非常灵活的解耦UI逻辑与业务逻辑的关系,从整体上提高代码的。Fair是为Flutter设计的动态化框架,通过Fair Compiler工具对原生Dart源文件的自动转化,使项目获得动态更新Widget的能力。原创 2025-03-20 09:38:12 · 35 阅读 · 0 评论 -
使用Python提取快递信息
在上面的代码中,我们定义了一个query_express函数,用于查询快递信息。接着,函数解析返回的JSON数据,并提取出我们需要的快递信息,最后返回一个包含快递信息的字典。大部分快递公司都提供了快递查询API接口,通过调用这些接口,我们可以获取到快递的实时信息。除了打印快递信息到控制台外,你还可以将快递信息发送到你的手机或电子邮箱,以便随时了解快递的最新状态。此外,你还需要找到一个可靠的快递查询API接口,并获取到相应的API密钥。遵守使用协议:在使用快递查询API接口时,要遵守提供方的使用协议和限制。原创 2025-03-20 09:35:10 · 285 阅读 · 0 评论 -
python实现两个Excel表格数据对比、补充、交叉验证
python可以实现表格的合并及数据处理,完成表格的合并及数据对比、数据补充、数据交叉验证。首先将表格A数据和表格B数据交叉排列,奇数位为表格A的数据,偶数位为表格B数据,每两行为同一公司主体,进行上下数据对比,上一行数据没有的下一行补充,上下两行都有数据就进行对比,相同的不做处理,不同的标注颜色,并把表格B的数据放到大括号中拼接到表格A数据之后,最后删除偶数行的所有数据。原创 2025-03-19 09:53:49 · 22 阅读 · 0 评论 -
Python Generator:一个被低估的性能利器
每次 send 调用,生成器都会在 value = yield average 这行代码处经历一个完整的"接收-计算-返回"周期。print(f"最终结果:{e.value}") # 打印 11.0 (len("hello") + len("world") + len("!T_co = TypeVar('T_co', covariant=True) # 生成器产出的类型。print(next(c)) # 打印 "Starting" 和 "Generating 0",返回 0。原创 2025-03-18 10:24:30 · 118 阅读 · 0 评论 -
业务幂等性设计的六种方案
很多系统都会基于分布式或微服务思想完成对系统的架构设计。那么在这一个系统中,就会存在若干个微服务,而且服务间也会产生相互通信调用。那么既然产生了服务调用,就必然会存在服务调用延迟或失败的问题。当出现这种问题,服务端会进行重试等操作或客户端有可能会进行多次点击提交。在存在重复请求的场景中(如支付交易),为确保系统最终处理结果的一致性并避免资损风险,必须通过业务幂等性设计保障数据操作的唯一性。原创 2025-03-18 08:50:12 · 121 阅读 · 0 评论 -
打工人必备的十个Python自动化脚本
如何解决这些问题,就是本节内容的核心,本节使用Python盘点十个在办公场景中使用最多的脚本,帮你提高工作效率。首先使用Python中的Faker库生成一个包含员工信息的模拟数据集,字段为中文字段,包括员工编号、姓名、部门、工资、入职日期、邮箱等,这个案例数据集用于本节的代码演示。原创 2025-03-17 13:13:42 · 167 阅读 · 0 评论 -
Python retrying库提供便捷的装饰器和函数
在Python生态中,retrying库提供了非常便捷的装饰器和函数来帮助我们轻松添加失败重试机制。它可以自定义重试策略、停止条件、等待间隔等,对各种异常进行捕捉处理。使用retrying可以大大减少我们重复编写失败重试轮询的代码量。原创 2025-03-12 09:41:17 · 30 阅读 · 0 评论 -
DeepSeek与AI可解释性预防银行欺诈
随着数字银行与在线交易的兴起,欺诈检测必须不断发展才能始终领先于欺诈者。传统基于规则的系统已不再可靠,AI驱动的欺诈检测讲成为新的、最强大的解决方案。银行机构可集成DeepSeek AI、可解释AI(XAI)与实时仪表板,建立起更透明、更准确且更具动态性的欺诈检测系统。为了解决这些问题,DeepSeek AI将深度学习模型与可解释性技术相结合,以更好地检测欺诈。在选择可视化交易属性(如金额、频率、位置)时,选择对欺诈检测结果影响最大的条目。欺诈检测的一大挑战,在于确切把握交易被标记为欺诈的原因。原创 2025-03-11 13:40:41 · 142 阅读 · 0 评论 -
手搓RAG新增功能:递归检索与迭代查询+重回成熟框架API
使用向量检索获取语义相关结果# 使用关键词检索获取精确匹配# 自定义融合策略(比如考虑文档及时性等)5.3高级处理流程自动化。原创 2025-03-10 23:11:58 · 112 阅读 · 0 评论 -
Python JSON 字符串转换成 SQL 脚本
使用脚本(如Python)动态推断数据类型并生成SQL。遍历JSON数组,将每行数据转换为SQL插入语句。:根据复杂度选择平铺为JSON字段或拆分为关联表。字符串值需用单引号包裹,并转义内部单引号(如。# 生成CREATE TABLE语句。布尔值转换为数据库支持的格式(如。:转义单引号,处理空值和布尔类型。# 生成INSERT语句。: 布尔值(或TINYINT): 字符串(VARCHAR): 字符串(VARCHAR)根据JSON键和值类型生成。原创 2025-03-10 16:09:15 · 62 阅读 · 0 评论 -
Deepseek+Xmind快速生成竖版思维导图
在小红书上,大家应该都刷到过思维导图笔记,其中有一些博主把思维导图做成竖屏的,不仅内容逻辑更清晰,排版也非常的简洁好看,非常适合手机竖屏查看,并且也很适合做成知识卡片和读书笔记,在小红书上流量很可观。我是一位读书博主,我想做《非暴力沟通》这本书的思维导图笔记,请帮我提炼这本书的核心内容,要求同一级别的标题在字数上保持一致,每个二级标题下需要有具体的三级内容,确保内容准确且易于制作成思维导图。指令示例:我是一位读书博主,请提炼文件中内容要点,以Markdown格式输出,层级清晰,确保内容易于制作思维导图。原创 2025-03-10 12:21:49 · 153 阅读 · 0 评论 -
Python 实现金融风控建模全流程
在模型中,多重共线性可能会导致一些问题。破产负债、民事判决、行政处罚、法院强制执行、涉赌涉诈黑名单、公安不良等(这类特征不一定能拿得到数据,且通常缺失度比较高,对模型贡献一般,更多的是从还款意愿/欺诈维度的考虑)3.查看数据信息格式:数据是由int64,category,object类型的数据组成,category类型的数据具有局限性,此处转化为object。-风控信用评分模型的目标,是解决对好人坏人区分的二分类问题,且对解释性、计算速度与可追溯性上要求较高,所以业界普遍选用逻辑回归模型建立风控评分卡。原创 2025-03-10 09:34:38 · 49 阅读 · 0 评论 -
玩 转DeepSeek必备的100个实⽤提⽰词
举个例⼦,⽐如你想要学习量⼦⼒学,但是让DeepSeek直接解释,肯定是看不懂的,会⼀头雾⽔, 这个时间,你就可以这样⼦对DeepSeek说:把我当成⼩孩⼦,模仿费曼的教学⻛格,使⽤卡夫卡 的⽐喻⽅式,解释量⼦⼒学基础理论。DeepSeek很擅⻓模仿某个知名作者(特别是经典作家,最好是古代的,因为训练数据充⾜,⻛格 特征明显)的说话⻛格,当你学习知识很枯燥时,可以绕过他模仿你的偶像,⽐如李⽩、鲁迅,给 你来上⼀段别开⽣⾯的课程,哈哈哈~原创 2025-03-09 20:04:41 · 61 阅读 · 0 评论 -
DeepSeek 生成开发流程图CICD部署图
CI/CD 流程图可以帮助团队理解自动化部署的流程。使用 Mermaid 或 Draw.io 可以快速生成流程图。常见的 CI/CD 工具包括 Jenkins、GitLab CI 和 GitHub Actions。原创 2025-03-07 17:39:52 · 172 阅读 · 0 评论 -
详解SQL数据库类型及选型技巧
选择SQL数据库对数据平台的成功意义深重。通过考虑数据模型和模式、可扩展性和性能需求等因素,组织可以选择符合其项目需求和业务目标的数据库。这种深思熟虑的数据库选择方法为有效的数据管理和分析奠定了基础,使企业能够有效地利用其数据。原创 2025-03-06 09:20:59 · 68 阅读 · 0 评论 -
Java利用 Function 接口告别冗余代码,打造高效断言神器
传统的做法可能充斥着大量相似的查询逻辑,每次都需要手动构建查询条件、执行查询并处理结果,这样的代码既冗长又难以维护。通过这两个扩展方法,我们不仅巩固了函数式编程在减少代码重复、提升代码灵活性方面的优势,还进一步证明了通过抽象和泛型设计,可以轻松应对各种复杂的业务校验需求,使代码更加贴近业务逻辑,易于理解和维护。例如以下两个验证用户 ID 和部门 ID 是否有效的方法,虽然简单,但每次需要校验不同实体或不同条件时,就需要复制粘贴并做相应修改,导致代码库中充满了大量雷同的校验逻辑,给维护带来了困扰。原创 2025-03-05 09:23:37 · 319 阅读 · 0 评论 -
PyTorch内存优化:在有限资源环境下高效训练模型
混合精度训练的核心思想是在大部分计算中使用较低精度执行数学运算,从而减少内存带宽和存储需求,同时在计算的关键环节保持必要的精度。它允许在训练过程中虚拟增加批量大小,其核心原理是为较小的批量计算梯度,并在多次迭代中累积这些梯度(通常通过求和或平均),而不是在每个批次后立即更新模型权重。这种方式减少了临时内存分配,在迭代训练循环中尤为重要。如上图所示,该过程首先将权重转换为低精度(FP16)以加速计算,然后计算梯度,接着将梯度转回高精度(FP32)以确保数值稳定性,最后使用这些适当缩放的梯度更新原始权重。原创 2025-03-04 08:52:00 · 135 阅读 · 0 评论 -
MySQL 两千万订单数据 6 种深度分页优化全解析
当数据量突破千万级时,这种暴力扫描不仅造成 I/O 资源的巨大浪费,更会导致关键业务查询的链式阻塞。本文将深入拆解深度分页的技术黑箱,通过电商订单表等真实场景,揭示 B+树索引与分页机制的碰撞奥秘,并给出 6 种经过实战检验的优化方案。原创 2025-03-03 11:08:15 · 303 阅读 · 0 评论 -
MySQL 中区分聚簇索引和非聚簇索引
本文,我们详细地分析了 MySQL InnoDB 表中的聚簇索引和非聚簇索引,了解了它们的特点和适用场景。聚簇索引在 InnoDB 中是数据的物理存储顺序,默认情况下表的主键就是聚簇索引。它适合于需要按主键或范围查询的高效访问,但只能有一个,且维护成本较高。非聚簇索引是辅助索引,存储索引字段和主键值,可以有多个,适合多样化的查询需求,但查询时需要额外的查找步骤,访问效率相对较低。原创 2025-03-02 14:49:25 · 33 阅读 · 0 评论 -
Python实现语音识别
支持二十+种语言 - 中文,英语,印度英语,德语,法语,西班牙语,葡萄牙语,俄语,土耳其语,越南语,意大利语,荷兰人,加泰罗尼亚语,阿拉伯, 希腊语, 波斯语, 菲律宾语,乌克兰语, 哈萨克语, 瑞典语, 日语, 世界语, 印地语, 捷克语, 波兰语, 乌兹别克语, 韩国语。使用docker方式启动服务,比较简单,但下载docker包比较耗时,如果已经下载好vosk-server代码及对应的模型文件,可以直接通过python代码启动vosk-server提供asr服务。Vosk 是一个语音识别工具包。原创 2025-02-28 14:37:12 · 106 阅读 · 0 评论 -
Python 构建网络扫描工具,快速识别网络中的设备
通过本项目,我们成功地创建了一个基于Python的网络扫描器,具备扫描单个IP、IP网段、获取MAC地址、操作系统信息等功能。利用Tkinter打造了简洁的GUI界面,借助多线程技术提高了扫描效率,进度条的加入则大大改善了用户体验。原创 2025-02-28 11:43:57 · 162 阅读 · 0 评论