自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(395)
  • 资源 (10)
  • 收藏
  • 关注

原创 【博客之星2024】跨越代码与算法的24年:一名AI工程师的成长与突破回顾

24年的技术旅程是一段从探索到深耕、从追随到引领的历程,也是人工智能与个人成长交织的精彩篇章。从最初对代码的热爱,到如今深耕人工智能全栈技术,我见证了AI从概念到广泛应用的飞跃,也感受到技术改变行业、推动社会进步的强大力量。在这条路上,每一次的突破都源于对技术的坚持,每一篇文章都是对经验的凝练。

2025-01-22 11:29:14 2680 12

原创 深入解析 PyPTO Operator:以 DeepSeek‑V3.2‑Exp 模型为例的实战指南

本文深入探讨了PyPTO算子在大模型推理中的关键作用。作为DeepSeek-V3.2-Exp等大型模型的核心组件,PyPTO并非简单的算子实现,而是一个介于框架与硬件之间的"软垫层",通过可编程的算子DSL将复杂计算步骤高效映射到目标设备。文章详细解析了PyPTO如何将模型中的关键结构(如SparseAttention、MoE路由等)拆解为可控算子,并针对NPU等硬件进行深度优化。重点分析了PyPTO在量化路径、RoPE编码和动态Tile处理等方面的创新设计,展示了其如何通过Tile-L

2025-11-24 19:06:31 469

原创 Doubao-Seed-Code 深度体验测评:国内首个支持视觉理解的编程模型,能替代 Claude Code 吗?

国产编程模型Doubao-Seed-Code实现了突破性进展,能够直接根据UI设计稿生成代码,大幅提升开发效率。该模型支持256K长上下文和视觉理解能力,可处理复杂编程场景,并已在多项权威评测中表现优异。实际测试显示,它能准确还原设计稿细节,合理规划项目结构,并具备安全意识和工程思维,生成可直接运行的代码。相比Claude等国外模型,Doubao-Seed-Code成本更低,在前端开发等场景中展现出显著优势,为国产编程模型树立了新标杆。

2025-11-24 16:08:25 481

原创 仓颉三方库开发实战教程(以 gcoord4cj 为例)

本文基于开源项目 gcoord4cj,总结一套从 0 到 1 的仓颉(Cangjie)三方库开发流程:工程化、API 设计、实现细节、单元测试、文档规范与发布建议。读者可直接参考本文在自己项目中落地实践。

2025-11-12 16:35:01 6079

原创 仓颉正则入门指南

正则表达式是处理字符串的强大工具,在给类编程语言中有着广泛的应用,本文将全面介绍正则表达式在仓颉中的使用方法。

2025-11-03 17:58:40 847

原创 仓颉三方库开发模版使用指南

package]name = "my-awesome-lib" # 修改为你的库名version = "0.1.0" # 设置初始版本description = "一个很棒的仓颉库" # 描述你的库cjc-version = "1.0.3" # 根据需要调整编译器版本output-type = "static_library" # 通常三方库设置为 static_library 或 dynamic_library仓颉三方库开发模版为开发者提供了一个坚实的起点,让你可以快速启动标准化的库项目。

2025-11-03 09:42:38 6017

原创 AI辅助数学建模有哪些优势?

本篇文章会带你走一遍完整的实战流程,从赛题理解、模型构建、数据处理到论文成稿,每一步告诉你如何更好使用AI,如何配合它、质疑它,最终用它来构建一个值得评委信服的解决方案。因此,AI 的价值,不在于替人做决定,而在于让学生有更多时间去考虑“为什么这样建模”、 “结果说明了什么”、 “是否符合实际问题的数学结构”。如果你参加过建模比赛,你就一定懂那个时刻:拿到题的第一天,大家兴致勃勃,“一小时搞清模型”,可现实往往变成:讨论思路越聊越散,每个人都是“我觉得…——这里有最新的探索,有深入的思考,也有未来的方向。

2025-10-29 12:00:18 838 1

原创 开源项目重构我们应该怎么做-以 SQL 血缘系统开源项目为例

当我完成整个 SQL 血缘系统的重构,再次打开那张干净、层次分明、能交互的可视化图时,我其实有点感慨。 这不仅仅是一次“代码重写”,更像是一次从“工具意识”到“系统意识”的跃迁。过去我追求的是功能能实现, 现在我追求的是系统能成长。这次重构让我对“开源项目该如何进化”有了更深的理解——不仅仅是技术的事情,更是一种思维方式的转变。很多人不敢重构的第一个原因,是害怕承认问题。

2025-10-13 10:39:40 847

原创 CrewAI + Bright Data MCP 打造“点评情报智能体”:从抓取到洞察

CrewAI 是一个用于构建协作式 AI 智能体团队的开源框架。你可以定义智能体的角色、目标和工具来执行复杂工作流。每个智能体处理特定任务,并协同朝共同目标推进。CrewAI 包括:Agent(智能体):具有明确职责与工具的 LLM 驱动“工作者”Task(任务):具备清晰输出要求的具体工作Tool(工具):智能体用于专业化工作的函数,如数据提取Crew(团队):共同协作的一组智能体。

2025-10-03 17:14:36 2301 10

原创 图像创作模型模型在工程领域上的探索与应用:从概念到落地

如果说 CAD 曾经是工程制图的革命,那么文生图很可能就是下一次革命的起点。未来,工程不只是冷冰冰的图纸和文字,更是直观、生动、可交互的智能表达。

2025-09-22 16:27:57 1045

原创 2025 年高教社杯全国大学生数学建模竞赛C 题问题三详解+Python可运行代码

在问题一中,我们以孕周与 BMI 建立了二次回归并观察到异方差;问题二在该模型基础上,经 BMI 分组给出 4% 阈值的最早达标孕周。问题三进一步综合**身高、体重、年龄**及**测序质控**等因素,采用**两层分布回归**(均值 μ 与方差 σ²)与**直接 Logistic** 两条路线,构造**达标概率**与**失败概率**,并引入**时间成本**、**返工成本**形成期望风险函数。最终在 BMI 维度上自动寻优**分组阈值**,为每组给出**最佳 NIPT 时点** $t^\*$ 并开展**敏感性分

2025-09-16 14:14:58 835

原创 最全面详解文档生成提示词优化:让AI写得更好

在人工智能文档生成中,**提示词(Prompt)就像一把钥匙**,决定了模型会开启怎样的大门。它既是用户需求的载体,也是模型输出的起点。一个好的提示词能让模型写出条理清晰、逻辑严谨又符合语境的内容;而一个模糊的提示词,可能只会得到空泛甚至偏题的回答。本文的目标,就是带大家理解提示词设计的基本原则,学会优化提示词的技巧,并能在实际应用中灵活运用不同的设计方案。

2025-09-15 17:43:26 846

原创 Prompt提示工程上手指南(六):AI避免“幻觉”(Hallucination)策略下的Prompt

摘要:本文探讨了大型语言模型(LLM)中普遍存在的"幻觉"问题,即AI产生不准确或虚构信息的情况。研究表明,幻觉是LLM的内在局限,无法完全消除。文章分析了AI幻觉的成因,包括训练数据偏差、泛化能力有限等问题。虽然定制化微调可以缓解幻觉,但会损害模型的泛化能力。作者建议通过Prompt工程来遏制幻觉,提出了四种策略:1)提供明确具体的指令;2)包含充分上下文信息;3)设计引导性问题;4)采用主流LLM框架(如CoT、ToT、RAG)。这些Prompt技巧能有效提高回答的准确性和相关性。

2025-09-12 10:31:06 1205 2

原创 基于大模型的个性化推荐系统实现探索与应用

需要强调的是,在这一整条链路中,推荐算法虽然只是其中的一个环节,但却是最核心的“心脏”。没有好的算法,视频无法精准匹配用户;但如果缺少审核、冷启动、合规、反馈闭环的支持,再好的算法也难以真正落地。

2025-09-11 16:16:03 1147 14

原创 2025 年高教社杯全国大学生数学建模竞赛C 题问题二详解

2025 年高教社杯全国大学生数学建模竞赛C 题问题二详解

2025-09-08 16:03:27 927

原创 一文速通最全ChatGPT模型架构与简介

GPT,全称为 “Generative Pre-trained Transformer”(生成式预训练 Transformer),是由人工智能研究机构 OpenAI 提出的**基于 Transformer 架构的预训练生成模型**,也是当前自然语言处理(NLP)领域极具影响力的基础模型之一。其核心定位是 “通用语言模型”—— 区别于传统针对单一任务(如仅做翻译或仅做摘要)设计的专用模型,GPT 具备跨场景的语言理解与生成能力,可灵活适配多种自然语言处理任务,无需为每个任务单独进行大规模重构。​

2025-09-08 15:40:20 1396

原创 2025 年高教社杯全国大学生数学建模竞赛C 题 NIPT 的时点选择与胎儿的异常判定详解(一)

本文利用某竞赛提供的胎儿Y染色体浓度数据,建立了以孕周和孕妇BMI为自变量的多项式回归模型,探讨了其对Y染色体浓度的影响。通过数据清洗与筛选,共获得1082条有效男胎样本。结果显示:Y染色体浓度随孕周显著上升,BMI对浓度也存在非线性效应。嵌套F检验表明引入BMI及其二次项显著提升模型拟合效果(p < 0.001)。该研究为无创产前检测(NIPT)中合理确定检测时机与人群分层提供了方法学依据。

2025-09-05 17:53:00 2075 2

原创 亚马逊云科技免费套餐新政解析与实战:数据分析与可视化平台

以前我们用 Excel,但随着业务扩展,销售数据从几千行变成几十万行,Excel 已经明显吃不消,打开都卡。公司没有预算去买很贵的 BI 工具,于是我开始尝试看看能不能用 AWS 免费套餐搭一个简易的数据分析平台。刚好 AWS 在 2025 年 7 月调整了免费套餐政策(6 个月 + $200 Credit),对我们这种想快速验证方案的团队来说再合适不过。在实际业务运营中,很多中小企业都面临一个相似的问题:- 数据量日益增加(销售数据、客户日志、财务流水);- 团队缺乏专业的 BI 工具和运维人员

2025-08-26 15:33:46 1414 6

原创 2014-2024高教社杯全国大学生数学建模竞赛赛题汇总预览分析

收集近 11 年的赛题并非简单的 “题目存档”,而是为了从**历史规律、能力匹配、实战准备**三个维度为参赛者或研究者提供价值。赛题命题往往紧扣当年社会热点、科技前沿与行业痛点(如 2024 年 E 题 “交通流量管控” 对应城市旅游拥堵治理,2021 年 A 题 “FAST 主动反射面调节” 关联国家重大科技工程)。通过纵向梳理,可清晰发现命题从 “纯理论建模” 向 “实际问题解决” 倾斜(如近年赛题普遍增加 “数据预处理”“多约束优化” 要求),也能总结高频命题领域(如交通优化、生产决策、环境分析、科技

2025-08-26 15:03:33 1412 14

原创 智能客服系统云端部署实战:基于云端免费资源的工程实现

亚马逊云科技免费套餐2025年7月迎来重大调整,从12个月免费改为6个月+最高$200抵扣金的新模式。本文以智能客服问答系统为例,展示如何在新套餐周期内完成部署:采用RAG架构,整合EC2、RDS、S3、Bedrock等服务,提供RESTAPI接口,实现FAQ检索与大模型语义回答。新套餐通过任务奖励机制引导用户熟悉核心服务,更适合短期PoC项目验证,$200额度可覆盖基础云资源成本。系统部署后需关注成本优化与安全合规,为后续扩展奠定基础。

2025-08-25 09:44:19 582

原创 AI 推荐系统云端部署实战:基于亚马逊云科技免费资源的工程实现

本文通过AI电商推荐系统案例,详解如何利用该套餐完成云端部署,包括EC2实例搭建、RDS数据库配置、Bedrock AI服务调用等关键步骤,并强调成本控制与安全设置。新政策虽缩短免费周期,但通过合理规划仍可完成项目验证,为后续扩展奠定基础。

2025-08-18 10:58:48 1395 5

原创 看不见的伪造痕迹:AI时代的鉴伪攻防战

摘要:随着生成式AI的快速发展,深度伪造技术正带来严重安全威胁。2025年上半年全球深度伪造相关诈骗损失已达9亿美元。为应对挑战,TextIn开发了多维度鉴伪技术:1)人脸视频检测通过分析像素级噪声和时序异常实现毫秒级识别;2)AIGC图像鉴别融合语义分析和频域特征,准确率超90%;3)通用文档检测平台采用模块化架构,误检率低至0.1%。这些技术已在金融等领域落地应用,团队还参与制定了行业标准,推动AI安全生态建设。尽管面临伪造技术持续升级的挑战,多模态融合检测仍是未来发展方向。

2025-08-06 16:05:02 2016 24

原创 一文速览:大模型语料构建与基础训练全流程实战指南

因为模型只有看到足够丰富、高质量的数据,才能真正学到“真本事”,展现出更强大的泛化能力,也就是能够在全新的场景和任务下,做出准确的推理和判断。我们日常做饭的时候,通常会先把买回来的菜仔细清洗干净,把坏掉的叶子、泥土、杂质等去除掉。同理,训练大模型的数据就像我们的食材,如果不干净,就会影响模型的学习效果,甚至训练出逻辑紊乱的模型。在大模型的世界里,有一句名言:“Garbage in, Garbage out”,翻译过来就是“垃圾输入,垃圾输出”,说白了,就是给模型喂的是什么数据,它学到的就是什么知识。

2025-07-17 09:39:29 1277 8

原创 MySQL5.7版本出现同步或插入中文出现乱码或???显示问题处理

摘要:针对阿里云MaxComputer同步数据到MySQL5.7时出现的中文乱码问题,分析指出根本原因是MySQL默认latin1编码不支持中文。建议统一采用utf8mb4编码(支持4字节Unicode字符),并对比了utf8、gbk等编码方案的优劣。提供了完整的MySQL编码配置方案,包括修改配置文件、建表语句和会话设置,同时给出emoji存储失败、排序异常等常见问题的解决方法。强调最佳实践应全局统一使用utf8mb4,确保从服务器配置到表结构再到连接参数的编码一致性,以完美支持中文等多语言数据处理。

2025-07-11 17:26:52 1111

原创 一文看懂文心一言4.5开源模型!全方位全应用场景技术评测

百度文心大模型4.5开源评测摘要 百度于2025年6月30日开源文心大模型4.5系列,包含MoE混合专家架构的47B/3B参数模型和0.3B稠密模型,采用跨模态异构MoE技术实现高效多模态处理,支持128K超长上下文。评测显示该模型在中文任务上表现优异,HumanEval编程测试达68.2%,综合能力与主流模型相当。开源举措显著降低AI应用门槛,使开发者可直接基于预训练模型进行定制开发,推动产业智能化转型。模型在智能办公、客服等场景展现出快速落地潜力,但其实际影响力仍需更多应用验证。

2025-07-06 03:06:15 1997 1

原创 数学建模软件必备大全

本文系统介绍了数学建模竞赛中常用的核心软件工具链,涵盖数据处理、数学计算、可视化和论文排版四大类工具。重点推荐Anaconda(含Pandas等库)、MATLAB、SPSS等专业数据处理工具;LINGO优化求解器;Matplotlib可视化工具;以及CTeX、TeXLive等学术排版系统。作者结合五年建模经验,详细阐述各工具的功能特点、适用场景及优势,帮助初学者快速搭建高效的建模环境。文中所有推荐软件均可通过指定公众号免费获取。通过合理配置这些工具,能显著提升数学建模的效率和质量。

2025-06-27 10:33:38 1770

原创 LaTeX下载与实践入门指南

LaTeX专业排版系统安装使用指南 本文详细介绍了LaTeX排版系统的安装与使用步骤。首先解释了LaTeX作为代码驱动排版系统的特点,对比了与传统Word编辑方式的区别。然后提供了Texlive编译环境和TeXstudio编辑器的具体下载安装方法,包括注意事项和验证方式。最后通过一个包含中文、数学公式和图片的示例文档,展示了LaTeX的基本使用方法。文章还介绍了作者Fanstuck的技术分享平台,涵盖从人工智能基础到前沿研究的各种内容。所有相关软件均可通过"数学建模岛"公众号免费获取。

2025-06-27 09:00:14 543

原创 AI驱动的DevOps运维与云服务部署自动化

《AI赋能运维:智能终端Chaterm的创新实践》 文章探讨了AI技术在DevOps运维中的应用前景,重点介绍开源智能终端工具Chaterm如何通过自然语言处理和大模型能力解决传统运维痛点。Chaterm将AI助手直接嵌入命令行,支持SSH远程管理,能理解自然语言指令并转化为具体命令执行,显著提升了批量操作、配置生成、故障排查等场景的效率。通过对比传统运维方式与AI辅助模式的差异,文章展示了Chaterm在清理日志、部署应用、分析错误等方面的优势,同时强调其内置的安全机制对企业级应用的支持。该工具代表了AI

2025-06-24 11:04:59 1300 10

原创 大模型是自我能力延展,还是认知主权的让渡?

或许未来的理想图景并非人机对立,而是你中有我、我中有你的协同进化。人类保持对价值目标和终极关怀的掌舵,AI则提供前所未有的计算智慧和创造力,两者融合,去完成单独任一方都无法完成的宏图。这条路充满挑战也充满希望。

2025-06-17 08:44:40 853

原创 技术反思:LLM时代,MCP是必需品还是过渡方案?

我们建议开发者从实际需求出发,结合场景特点合理选择MCP的适用与否,以确保技术选型的精准性和落地的有效性,从而推动人工智能应用更高效、更务实地走向成功。

2025-06-10 08:56:58 889 1

原创 2025年五一数学建模竞赛A题-支路车流量推测问题详细建模与源代码编写(二)

本文摘要:针对多支路汇入主路的车流量推断问题,建立了基于流量守恒和时序特征的数学模型。通过分析主路监测数据,构建了四条支路的流量函数表达式:支路1采用恒定流量模型,支路2为分段线性函数,支路3为线性增长后稳定,支路4采用正弦周期函数。利用最小二乘法拟合参数,考虑2分钟延迟效应,实现了主路流量的高精度拟合(MSE=3.2,MAE=1.4)。模型可准确输出7:30和8:30时刻各支路流量数值,为交通流量分析和预测提供了有效工具。

2025-06-05 11:36:31 1046

原创 2025年五一数学建模竞赛A题-支路车流量推测问题详细建模与源代码编写(一)

摘要:本文针对Y型道路车流量预测问题,建立数学模型通过主路监测数据反推支路流量。基于支路1线性增长、支路2先增后减的假设,采用最小二乘法拟合分段函数参数,得到支路1表达式为Q1(t)=28.49t+9.03,支路2为分段线性函数(t≤31时为-27.03t-1.54,t>31时为-29.04t+60.56)。模型验证表明拟合曲线与主路观测数据吻合良好,为交通流量分析提供了有效方法。(149字)

2025-06-04 18:03:49 1161

原创 高效速搭基于DeepSeek的招标文书智能写作Agent

总的来说,智能写作Agent正在推动招标文书写作从传统人工操作向智能化、自动化的方向发展。随着AI技术的不断进步,未来智能写作Agent将变得更加智能、高效和定制化,进一步解放人力资源,提升招标文书写作的质量和效率。

2025-06-04 15:13:13 1209

原创 Deepseek与manus是何区别?深入解析AI Agent和智能体编排

《AIAgent技术演进与应用落地解析》摘要:本文探讨了DeepSeek与Manus两大AI平台的核心差异与发展路径。DeepSeek侧重深度语义理解与推理,而Manus专注于任务自动化执行,二者分别代表AIAgent发展的认知与执行方向。文章系统梳理了AIAgent从机械执行(2010-2016)、认知增强(2017-2022)到具身智能(2023-)的技术演进历程,重点分析了智能体编排系统的三大突破:动态工作流引擎、认知资源调度和元认知控制层。通过药企研发案例展示了智能体编排的商业价值,并给出了工程落地

2025-06-04 14:56:59 1079

原创 如何高效提升大模型的RAG效果?多种实用策略一次掌握

摘要: RAG(检索增强生成)技术通过结合外部知识库提升大模型回答准确性,但实际落地需多维度优化。本文剖析四大关键因素:数据质量(合理文档拆分与更新)、检索算法(ANN加速搜索)、Embedding模型(按场景选择)及结果排序(Cross-Encoder重排)。提供实操方案如分层文档分割、多语言模型适配、开源向量库(FAISS/Milvus)搭建等,并强调从小规模试点开始,持续评估指标(Recall/F1)。未来RAG将更智能高效,助力企业降低幻觉风险,实现精准知识问答。关注@Fanstuck,获取AI落地

2025-05-27 16:43:17 894

原创 大模型推理性能差?你必须知道的优化技巧全汇总

有更多感悟以及有关大模型的相关想法可随时联系博主深层讨论,我是Fanstuck,致力于将复杂的技术知识以易懂的方式传递给读者,热衷于分享最新的行业动向和技术趋势。如果你对大模型的创新应用、AI技术发展以及实际落地实践感兴趣,那么请关注Fanstuck,下期内容我们再见!

2025-05-27 16:33:12 1076

原创 一文详解模型上下文协议(MCP):打通大模型与业务场景的关键

摘要: MCP(Model Context Protocol)是Anthropic于2024年提出的标准化协议,旨在解决AI模型与外部数据/工具交互的"信息孤岛"问题。它通过客户端-服务器架构实现统一接口,支持AI安全访问本地/远程资源(如文件系统、API),并具备动态发现、双向通信等优势。与Function Calling相比,MCP更通用、复用性更高。文章以开发"arXiv论文检索工具"为例,演示了MCP服务器的搭建流程,包括工具接口定义、API调用及结构化返回。

2025-05-26 09:21:09 1135

原创 一文看懂大模型核心参数调优用法与实战

本文深入探讨了OpenAI Python SDK在大模型开发中的核心参数调优方法。首先介绍了参数调优的重要性,通过实际案例展示了不同场景下的参数配置策略。详细解析了ChatCompletion和Completion两大核心接口,包括接口用途、主要参数及其影响,并提供了调用示例。文章强调参数调优如同"对话艺术",合理配置temperature、max_tokens等参数能显著提升模型输出质量,满足不同业务需求。最后指出,掌握参数调优技巧是将大模型从"能用"到"好用"的关键一步。

2025-05-26 09:09:15 1066

原创 AI 数据采集实战指南:基于 Bright Data 快速获取招标讯息

综上所述,亮数据的网页抓取工具凭借全面的特性和高可用性,为开发者提供了一站式的爬虫解决方案。**实际使用中,我们体验到开发效率显著提升,很多繁琐的反爬对策都由平台自动完成**。它解决了传统爬虫中常见的 **IP 封锁、反爬墙、复杂结构解析** 等难题,同时保持高度的扩展性和合规性。对于需要快速构建训练数据管道和开展数据驱动业务的团队来说,Bright Data Web Scraper 是一个值得尝试的利器。

2025-05-23 11:16:46 2386

原创 从零构建智能公考岗位推荐系统:腾讯云CodeBuddy带你轻松玩转AI开发

通过本章的实战开发,我们借助腾讯云 CodeBuddy 高效构建了一个智能岗位推荐系统的核心模块。从项目初始化、岗位数据处理、用户画像建模,到岗位推荐算法和 API 接口搭建,每一个步骤都体现了智能代码助手在降低开发门槛、加快开发节奏、提升代码质量方面的巨大优势。

2025-05-13 23:45:30 1471

chromedriver-linux64.zip 最新122.70

我们之所能操作浏览器,是因为我们有该浏览器对应的驱动。若是缺少驱动我们并不能对浏览器进行操作: 首先我们需要知道浏览器的版本,输入: chrome://version/ Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),火狐, 谷歌浏览器,360浏览器等。这个工具的主要功能包括:测试与浏览器的兼容性——测试应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试系统功能——创建回归测试检验软件功能和用户需求。支持自动录制动作和自动生成.Net、JAVA,PHP等不同语言的测试脚本。 2.功能 框架底层使用JavaScript模拟真实用户对浏览器进行操作。测试脚本执行时,浏览器自动按照脚本代码做出点击,输入,打开,验证等操作,就像真实用户所做的一样,从终端用户的角度测试应用程序。 使浏览器兼容性测试自动化成为可能,尽管在不同的浏览器上依然有细微的差别。 使用简单,可使用Java,Python等多种语言编写用例脚本。 ——

2024-02-29

chromedriver-122.0.6261.70-64

谷歌浏览器最新122.0.6261.70-32位驱动器selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题selenium本质是通过驱动浏览器,完全模拟浏览器的操作,比如跳转、输入、点击、下拉等,来拿到网页渲染之后的结果,可支持多种浏览器,如 Chrome、Firefox、Edge 等,还有 Android、BlackBerry 等手机端的浏览器。可以看到从122 Stable 稳定版本以及更高版本的测试版

2024-02-29

chromedriver-122.0.6261.70-32

谷歌浏览器最新122.0.6261.70-32位驱动器selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题selenium本质是通过驱动浏览器,完全模拟浏览器的操作,比如跳转、输入、点击、下拉等,来拿到网页渲染之后的结果,可支持多种浏览器,如 Chrome、Firefox、Edge 等,还有 Android、BlackBerry 等手机端的浏览器。可以看到从122 Stable 稳定版本以及更高版本的测试版,我们选择对应的版本复制链接到浏览器或者下载器里面就可以下载最新版本驱动了

2024-02-29

金融风控-贷款违约预测数据

赛题以预测用户贷款是否违约为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、purpose、postCode和title等信息进行脱敏。df2文件已经进行数据处理,具体可看博客:https://blog.youkuaiyun.com/master_hunter/article/details/129423185 Field Description id 为贷款清单分配的唯一信用证标识 loanAmnt 贷款金额 term 贷款期限(year) interestRate 贷款利率 installment 分期付款金额 grade 贷款等级 subGrade 贷款等级之子级 verificationStatus 验证状态 issueDate 贷款发放的月份 purpose 借款人在贷款申请时的贷款用途类别 postCode 借款人

2023-10-16

cchardet-2.7.1-cpy310

在https://www.lfd.uci.edu/~gohlke/pythonlibs/#cchardet上面没有看到支持python3.10版本的,但是在github上面人家发版了,先传自用,有需要可以下载。cchardet是chardet的升级版,功能和chardet完全一样(requests依赖包采用的就是chardet),用来检测一个字节数组的编码。由于是用C和C++实现的,所以它的速度非常快,非常适合在爬虫中用来判断网页的编码。

2023-04-13

jython-installer-2.7.3.jar

交互式实验-Jython提供了一个交互式解释器,可用于与Java包或运行的Java应用程序交互。这允许程序员使用Jython来实验和调试任何Java系统。 快速应用程序开发——Python程序通常比等效Java程序短2-10倍。这直接转化为程序员生产力的提高。Python和Java之间的无缝交互允许开发人员在开发过程中和产品交付过程中自由地混合这两种语言。

2022-10-26

已编译版本solr-8.11.2.tgz

Solr 8.11.2是8.x系列的最后一个版本,新版本已经是9.0版本了。 1,什么是solr? Solr是一个独立的企业级搜索应用服务器,他对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务提供一定格式的xml文件,生成索引;也可以通过http get 操作提供查找请求,并得到xml格式的返回结果 2.,solr特点 Solr是一个高性能,采用java语言,基于Lucene开发的全文搜索服务器。并对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置,可扩展并对查询性能进行了优化,提供了一个完善的功能管理页面,是一款非常优秀的全文搜索引擎。 3,solr工作方式 文档通过http利用xml加到一个搜索集合中。solr查询该集合也是通过http收到一个xml/json响应来实现。他的主要特性包括:高效,灵活的缓存功能,垂直搜索功能,高亮下试搜索结果,通过索引复制来提高可用性,提供一套强大的data schema 来定义字段,类型和设置文本分析,提供基于web的管理界面等。

2022-08-26

apache-maven-3.8.6-bin+安装教程

远程仓库分类 分类 本地仓库 maven本地仓库的默认位置:无论是Windows还是Linux,在用户的目录下都有一个.m2/repository/的仓库目录,这就是Maven仓库的默认位置,变更maven默认的本地仓库的位置可更改存在于maven的settings.xml文件中localRepository的标签中的地址 远程仓库 中央仓库 maven官方的远程库,中央仓库包含了绝大多数流行的开源Java构件,以及源码、作者信息、SCM、信息、许可证信息等。一般来说,简单的Java项目依赖的构件都可以在这里下载得到 私服 私服是一种特殊的远程仓库,它是架设在局域网内的仓库服务,私服代理广域网上的远程仓库,供局域网内的Maven用户使用。当Maven需要下载构件的时候,它从私服请求,如果私服上不存在该构件,则从外部的远程仓库下载,缓存在私服上之后,再为Maven的下载请求提供服务。我们还可以把一些无法从外部仓库下载到的构件上传到私服上 其他公共库 mirror元素和rep

2022-08-24

Dependency Walker2.2

Dependency Walker 之前一直用Dependency Walker看DLL导出接口,今天总结一下 Dependency Walker 使用说明。如果你想学习如何使用Dependency Walker, 可以仔细阅读这篇文章,了解一下Dependency Walker对你以后调试DLL有所帮助。 1.什么是DLL? 在Windows世界中,有无数块活动的大陆,它们都有一个共同的名字——动态链接库。现在就让我们走进这些神奇的活动大陆,找出它们隐藏已久的秘密吧! 初窥门径:Windows的基石 随便打开一个系统目录,一眼望去就能看到很多扩展名DLL的文件,这些就是经常说的“动态链接库”,DLL是Dynamic Link Library(即“动态链接库”)的缩写。从Microsoft公司推出首个版本的Windows以来,动态链接库就一直是这个操作系统的基础。 2.DLL有什么? 与其用晦涩的专业术语来解决DLL是什么,不如先来看看DLL里有什么。DLL和EXE文件一样,其中包含的也是程序的二进制执行代码和程序所需的资源(比如图标、对话框、字符串等),可是为什么要把代码放在D

2022-08-23

hive3.1.0-antrl3.5.2-Hivegrammar源码.zip

Antlr是一种语言识别的工具,可以用来构造领域语言。 使用antlr需要我们提前定义好识别字符流的词法规则和用于解释Token流的语法分析规则。然后,antlr会根据我们提供的语法文件自动生成相应的词法/语法分析器。hive借助Antlr定义SQL的词法规则和语法规则,完成SQL词法,语法解析,将SQL转化为抽象语法树AST Tree。HiveSql后续的编译过程全都基于AST Tree,所以我们想要完整理解hive sql的编译过程,需要前置了解一下antlr是怎么工作的。 HiveLexer.g:词法解析文件,定义了所有用到的token。 HiveParser.g:语法解析文件,实现了所有的Hive语法解析。 FromClauseParser.g:FROM语句解析。 IdentifiersParser.g:自定义函数解析,标识符定义 函数名称、系统函数、关键字等。 nonReserved,非保留的关键字可以作为标识符的。比如 select a as date from mytable 这个date不添加转义会报错的,但是该处如果添加 “ | KW_DATE ” dat

2022-08-23

pyjnius-1.4.2-cp37-cp37m-win32.whl

PyJNIus 是一个神奇的 Python 第三方模块。它能使用Java本地接口将Java类作为Python类访问的Python模块。 如果你需要在Python中使用Java 类,这个第三方模块是你最好的选择。 1.准备 开始之前,你要确保Python和pip已经成功安装在电脑上 请选择以下任一种方式输入命令安装依赖: 1. Windows 环境 打开 Cmd (开始-运行-CMD)。 2. MacOS 环境 打开 Terminal (command+空格输入Terminal)。 3. 如果你用的是 VSCode编辑器 或 Pycharm,可以直接使用界面下方的Terminal. pip install pyjnius 2.快速开始 使用Jnius导入Java类特别简单,你只需要引入 autoclass 并引用你所需要的类即可: >>> from jnius import autoclass >>> autoclass('java.lang.System').out.println('Hello world') Hello world

2022-08-23

pyjnius-1.4.2-pp37-pypy37_pp73-win_amd64.whl

PyJNIus 是一个神奇的 Python 第三方模块。它能使用Java本地接口将Java类作为Python类访问的Python模块。 如果你需要在Python中使用Java 类,这个第三方模块是你最好的选择。适用场景:极个别的加密算法等内容,用python不方便实现或者实现较耗时,可基于Pyjnius把java类当做python库使用。如果出现ImportError,一般是java环境变量或者path没有配置好。先安装Java JDK 和JRE、Cython注意:jnius安装的坑比较多,请参考http://stackoverflow.com/search?q=jnius 如果出现ImportError,一般是java环境变量或者path没有配置好。 jnius/jnius.c:4:20: fatal error: Python.h 一般为缺python-dev, yum -y install python-devel pip 安装不成功可以尝试 setup.py方式。

2022-08-23

antlr-repackaged-4.0.jar

antlr是指可以根据输入自动生成语法树并可视化的显示出来的开源语法分析器。ANTLR—Another Tool for Language Recognition,其前身是PCCTS,它为包括Java,C++,C#在内的语言提供了一个通过语法描述来自动构造自定义语言的识别器(recognizer),编译器(parser)和解释器(translator)的框架。 antlr有 v2 v3 v4多个版本并存,中文文档多数是v2的, hive 1.1.0版本在注释中提到了antlr 3.4。ANTLR将上述结合起来,它允许我们定义识别字符流的词法规则和用于解释Token流的语法分析规则。然后,ANTLR将根据用户提供的语法文件自动生成相应的词法/语法分析器。用户可以利用他们将输入的文本进行编译,并转换成其他形式(如AST—Abstract Syntax Tree,抽象的语法树)。

2022-08-23

antlrworks-1.5.1.jar

Antlr是一种语言识别的工具,可以用来构造领域语言。 使用antlr需要我们提前定义好识别字符流的词法规则和用于解释Token流的语法分析规则。然后,antlr会根据我们提供的语法文件自动生成相应的词法/语法分析器。hive借助Antlr定义SQL的词法规则和语法规则,完成SQL词法,语法解析,将SQL转化为抽象语法树AST Tree。HiveSql后续的编译过程全都基于AST Tree,所以我们想要完整理解hive sql的编译过程,需要前置了解一下antlr是怎么工作的。通过ANTLRWorks可以更加直观的理解解析过程。 对ANTLR的支持——源代码图。编辑ANTLR语法文件时,“语法图”窗口显示当前规则的直观表示。此功能提供语法元素的自然表示,并且是提供自定义功能以增强特定语言的特征的示例。另外,双击源代码图中的元素将立即跳转到相关的源代码。antlrworks:专门用于开发antlr的ide,(不同版本的antlrworks)其内部集成了某个版本的antlr。 换句话说,你即使下载了antlr-x.x-complete.jar,将其添加到了CLASSPATH中,其也和an

2022-08-22

antlr-3.4.jar

antlr是指可以根据输入自动生成语法树并可视化的显示出来的开源语法分析器。ANTLR—Another Tool for Language Recognition,其前身是PCCTS,它为包括Java,C++,C#在内的语言提供了一个通过语法描述来自动构造自定义语言的识别器(recognizer),编译器(parser)和解释器(translator)的框架。 antlr有 v2 v3 v4多个版本并存,中文文档多数是v2的, hive 1.1.0版本在注释中提到了antlr 3.4。ANTLR将上述结合起来,它允许我们定义识别字符流的词法规则和用于解释Token流的语法分析规则。然后,ANTLR将根据用户提供的语法文件自动生成相应的词法/语法分析器。用户可以利用他们将输入的文本进行编译,并转换成其他形式(如AST—Abstract Syntax Tree,抽象的语法树)。

2022-08-22

hadoop3.3.3-winutils

Scala项目中的winutils.exe详解 作用: 模拟linux环境 意义: hadoop基于linux开发和布署运行,故不能将hadoop环境原始运行在windows上。 操作系统环境差异说明 因为模拟linux环境,所以在linux原生环境中就不需要他了 在windows环境中需要配置 如何配置: 配置到运行环境当前目录下的/bin目录下 如果是eclipse开发,就配置到项目根目录下/bin/下即可 在Hadoop1.x 时代,Hadoop中的MapReduce同时处理业务逻辑运算和资源的调度,耦合性较大。 在Hadoop2.x时代,增加了Yarn。Yarn只负责资源的调度,MapReduce 只负责运算。 Hadoop3.x在组成上没有变化Hadoop Distributed File System,简称HDFS,是一个分布式文件系统。 (1)NameNode(nn):存储文件的元数据,如文件名,文件目录结构,文件属性(生成时间、副本数、文件权限),以及每个文件的块列表和块所在的DataNode等。 (2)DataNode(dn):在本地文件系统存储文件块数据,以及块

2022-07-19

scrt-sfx-9.0.0.2430+使用教程

内带使用教程你懂得! SecureCRT 9.1是一款专业强大的SSH远程终端服务软件,该软件在所以平台上都支持SSH2,SSH1,Telnet,串行和Raw。从多种仿真中选择大多数采用ANSI颜色。具有多会话选项样式或者平铺式界面,具有大范围的会话管理以及自定义功能。使用时用户可以创建在指定会话的基础上使用各个配置。并且这款软件整体界面简洁,操作方便易用,支持可视化界面,将本地主机和远程主机的目录结构以树形结构的方式显示出来,文件的传输可以直接手动拖动而无需使用命令。 同时,SecureCRT 9.1版本进行了全方面的新增和优化,支持在会话管理器过滤器框中使用通配符,优化搜索以显示您感兴趣的确切会话,最大程度地减少错误,还提供了新的自定义选项,新增了对Python 3的支持,对选定文本进行Google搜索的功能以及对多行粘贴确认的增强等等,致力于为组织中的每个人提供安全的远程访问、文件传输和数据隧道。添加了Windows、macOS和Linux支持本地Shell;新增书签管理器,使您可以更轻松地添加,删除书签,以及从其他会话中复制书签,提高用户工作效率。

2022-06-13

机器学习之数据均衡算法种类大全+Python代码一文详解

以Imbalancd sklearn库收录的算法来看,过采样共有11种方法,欠采样共有8种方法,组合采样有2种方法。 1.欠采样算法: ClusterCentroids CondensedNearestNeighbour EditedNearestNeighbours RepeatedEditedNearestNeighbours AlIKNN InstanceHardnessThreshold NearMiss NeighbourhoodCleaningRule OneSidedSelection RandomUnderSampler TomekLinks 2.过采样方法 RandomOverSampler SMOTE SMOTENC SMOTEN ADASYN BorderlineSMOTE KMeansSMOTE SVMSMOTE 3.组合采样 SMOTEENN SMOTETomek

2022-06-05

dbeaver+navicat

DBeaver 是一个基于 Java 开发,免费开源的通用数据库管理和开发工具,使用非常友好的 ASL 协议。可以通过官方网站或者 Github 进行下载。 由于 DBeaver 基于 Java 开发,可以运行在各种操作系统上,包括:Windows、Linux、macOS 等。DBeaver 采用 Eclipse 框架开发,支持插件扩展,并且提供了许多数据库管理工具:ER 图、数据导入/导出、数据库比较、模拟数据生成等。 DBeaver 通过 JDBC 连接到数据库,可以支持几乎所有的数据库产品,包括:MySQL、PostgreSQL、MariaDB、SQLite、Oracle、Db2、SQL Server、Sybase、MS Access、Teradata、Firebird、Derby 等等。商业版本更是可以支持各种 NoSQL 和大数据平台:MongoDB、InfluxDB、Apache Cassandra、Redis、Apache Hive 等。“Navicat”是一套可创建多个连接的数据库管理工具,用以方便管理 MySQL、Oracle、PostgreSQL、SQLite、

2022-05-30

sqldeveloper-21.4.3.x64+jdk1.8

Oracle SQL Developer是Oracle公司出品的一个免费的集成开发环境。是一个免费非开源的用以开发数据库应用程序的图形化工具,使用 SQL Developer 可以浏览数据库对象、运行 SQL 语句和脚本、编辑和调试 PL/SQL 语句。另外还可以创建执行和保存报表。该工具可以连接任何 Oracle 9.2.0.1 或者以上版本的 Oracle 数据库,支持 Windows、Linux 和 Mac OS X 系统。 Oracle SQL Developer是针对Oracle数据库的交互式开发环境(IDE)。 Oracle SQL Developer简化了Oracle数据库的开发和管理。 SQL Developer提供了PL/SQL程序的端到端开发,运行查询工作表的脚本,管理数据库的DBA控制台,报表接口,完整的数据建模的解决方案,并且能够支持将你的第三方数据库迁移至Oracle。 SQL Developer可以连接到任何Oracle 10g及其后续版本的数据库,并且能在 是连接Hive以及mysql常用的图形化工具之一,此安装包还自带jdk1.8.可以直接部署进行开发。

2022-05-26

熵权法实战代码,根据港口研发投入数据进行熵值法确定权重。

熵权法实战代码,根据港口研发投入数据进行熵值法确定权重。

2022-02-28

机器学习实战Logistic回归举例数据

本资源是机器学习实战Logistic回归举例中的数据

2020-12-20

hadoop-common-2.6.0-bin-master.zip

设置本地为master而进行hadoop编程所必须文件

2021-04-07

使用朴素贝叶斯过滤垃圾邮件数据集

数据集说明: 数据集下包含两个文件夹,其中spam文件夹下为垃圾邮件,ham文件夹下为非垃圾邮件。  数据集格式: txt文件

2020-12-02

操作系统调度算法.zip

操作系统作业调度算法C代码实现,进程入队与出队模拟,FCFS调度算法,时间片轮转调度算法

2021-03-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除