自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

机器学习菜鸟

机器学习、数据挖掘、数据分析

  • 博客(221)
  • 资源 (27)
  • 问答 (2)
  • 收藏
  • 关注

原创 GraphHopper调研笔记

graphhopper有以下几种常见的地图应用:(1) 把一个GPS点垂直投影到最近的道路上(2)根据输入的两个GPS点进行路径规划,支持设置起点的离开方向和终点的到达方向(3)根据一个GPS点和给定的时间范围给出等时圈的点ghLoc是OSM格式的地图路径cachePath是读取OSM地图之后的地图缓存,下次可以直接使用缓存中的地图// OSM 文件路径 hopper . setOSMFile(ghLoc);

2023-05-10 14:33:42 4213 5

原创 [笔记] MCPO搭建教程

适用场景:快速将本地 MCP 工具转换为 Web API,供 LLM Agent 或其他系统调用。优势:零配置、自动文档、多工具支持、跨平台(Docker/Python)。扩展性:支持通过配置文件扩展多个工具,适合复杂工作流。

2025-04-26 14:20:40 458

原创 【dify】 dify环境变量配置说明

这是一份Dify平台的环境变量配置文件,对平台的各项功能、服务和组件进行参数设置。

2025-03-21 16:03:49 2186

原创 [Jsprit]Jsprit学习笔记-vrp问题新解的接收策略

在第一次迭代或游走中,算法生成一个解,这个解是下一次游走的基础,以此类推。每个解的值都被记忆,因为初始阈值本质上是这些解值的标准差的函数。为了避免在搜索开始时就陷入局部最小值,这种阈值接受函数在开始时也接受较差的解(与只接受更好解的贪婪方法相反),并随着时间的推移逐渐转变为贪婪方法。这个方法的目的是维护一个解决方案集合,只保留成本较低的解决方案,并在新解决方案的成本低于当前最差解决方案的成本加上一个阈值时更新集合。定义(i)一个合适的初始阈值和(ii)一个描述阈值如何收敛到零的相应函数,即贪婪阈值。

2025-03-01 16:36:55 346 1

原创 【大模型学习笔记】0基础本地部署dify教程

在docker 安装包路径下cmd命令窗口下执行下面的命令。

2025-03-01 12:38:00 2365

原创 [大模型笔记]扣子-知识库搭建,并用Java-SDK调用的笔记

在扣子平台创建知识库、智能体,并用sdk调用

2025-02-20 17:20:45 971 1

原创 Python笔记

1.如何在windows同时存在两个版本的Python2,Python3将Python2,Python3的路径添加到path中2.如何使用指定的Python版本 pippython3 -m pip install jupyter

2025-02-16 10:36:40 783 2

原创 [Jsprit]Jsprit学习笔记-vrp问题的求解

的公共方法,它是一个算法的核心部分,用于搜索车辆路径问题(Vehicle Routing Problem, VRP)的解决方案。通过这种方式,算法可以系统地探索解空间,逐步改进解决方案。这个方法体现了一个典型的优化算法结构,包括。

2024-08-27 18:51:28 825 2

原创 [Jsprit]Jsprit笔记-最大迭代次数的设置

【代码】[Jsprit]Jsprit笔记-最大迭代次数的设置。

2024-08-27 18:28:31 198

原创 [Jsprit]Jsprit学习笔记-一个简单的示例

这段代码是一个 Java 程序,它演示了如何使用 Jsprit 库来解决一个简单的车辆路径问题(VRP)。这个示例程序提供了一个基本的框架,展示了如何使用 Jsprit 解决 VRP 问题,并提供了一些基本的可视化和输出选项。:创建一个位于坐标 (10,10) 的车辆,使用上面定义的车辆类型。:创建四个服务(客户地点),每个服务都有一个容量需求为 1。:从搜索到的解决方案中选择最佳(成本最低)的解决方案。:使用 Jsprit 提供的默认算法来搜索解决方案。和一个容量维度(重量)为 2 的车辆类型。

2024-08-27 15:53:59 674

原创 [Jsprit] Jsprit学习笔记-核心算法VehicleRoutingAlgorithm

整体来看,这个类是 Jsprit 算法的框架,提供了算法执行的主体逻辑,包括迭代、解的改进、终止条件的检查以及解决方案的记录。通过这个框架,用户可以定制和扩展算法以适应不同的车辆路径问题场景。包,并导入了其他必要的 Jsprit 类和 Java 基础类。方法启动算法,执行指定次数的迭代或直到满足提前终止条件。方法添加算法监听器,以观察和监听算法的不同阶段。方法用于设置和获取算法的最大迭代次数。方法用于设置算法提前终止的条件。方法管理每个迭代的开始和结束。:管理算法提前终止的条件。来记录算法的执行过程。

2024-08-27 15:40:17 334

原创 [Jsprit]Jsprit学习笔记-初见Jsprit-doc

创建服务对象,代表客户的位置和需求。

2024-08-27 15:29:41 988

原创 [Matsim]Matsim学习笔记-车辆和订单匹配的逻辑

这个方法体现了在DRT系统中对未计划请求进行调度的逻辑,包括对旧请求的重试和新请求的调度。通过并行处理车辆入口信息的创建,提高了调度过程的效率。matsim扩展包中DRT动态线路的场景是,给定一些车辆、一些订单,进行车辆和订单的匹配,类似滴滴的拼车功能。的方法,它用于调度未计划的DRT(需求响应交通)请求。操作,确保了在调度过程中对已处理的请求进行清理,避免重复调度。

2024-08-23 10:40:59 646

原创 [Matsim]Matsim学习笔记-动态线路接乘客上车的逻辑

这段代码展示了在DRT系统中如何根据当前车辆状态和请求要求,安排新的上客任务,并相应地更新车辆的行程。:计算从上客点到下一个目的地的路径,并创建一个新的行驶任务。insertion:当前应答成功的订单的插入对象。:将新创建的上客任务和行驶任务添加到行程中。接乘客上车在matsim中的代码是在扩展包。:将接受的DRT请求添加到相应的上客任务。本次学习第2个功能:接乘客上车的任务。,确定是否需要创建新的上客任务。:从插入数据中获取上客的索引。2、生成接乘客上车的任务。更新行程中的任务时间。

2024-08-23 10:14:57 681

原创 [Matsim]Matsim学习笔记-drt场景中车辆调度的学习

在用matsim实现交通流模拟drt场景时,遇到这样一个问题:车辆接送完乘客后,在没有新的订单之前,车辆一直停在最后一个停靠点上,这样车辆的利用率会较低,想实现一个送完最后一个乘客后,车辆能回到某个点上,在回到某个点的过程中响应新的订单?学习matsim在drt场景中是如何实现车辆的调度、任务的添加、更新以及调度状态的更新的?可以发现车辆初始化时是创建了一个StayTask任务,添加到车辆调度任务列表中。有三种任务:Stay、Drive、Stop。3、matsim中的任务类型。

2024-08-20 17:24:46 342

原创 [Matsim]Matsim学习笔记-population.xml的创建

示例代码中创建person对象需要的标签id、起点坐标、终点坐标、activity结束的时间、leg的模式,生成的person对象要包含这些值。幸运的发现matsim中实现了很多的writer工具类,population的生成就需要用到PopulationWriter这个工具类。在利用matsim实现交通模拟时,需要把模拟的乘客出行数据替换成自己的,如何进行替换呢?带着这个问题,调研学习matsim,实现population.xml的生成。

2024-08-20 15:27:22 360

原创 [Matsim]Matsim学习笔记-时变路段的创建

在交通模拟中,默认的路网中link的速度是不随时间发生变化,在实际的交通流中,高峰期和平峰期的link的速度是不同的,甚至,在不同的时间段,速度也不相同,因此需要实现link的速度随时间段进行更新,带着这个需求,开始继续学习matsim…调研matsim幸运的发现,matsim的已经实现了这个需求,在matsim中支持三种模式的时变路网更新,时变路网支持三种变化模式:在指定的时间段内以指定的速度替换、以设置的速度乘以系数、以设置速度加减数据偏移量三种方式。在代码中是如何实现了时变路网的加载和属性的更新呢?

2024-08-20 10:25:55 436

原创 [Matsim]Matsim学习笔记-扩展包contribs的说明

MATSim是一个开源的交通模拟软件,它提供了一系列的扩展(contribs),这些扩展由社区成员维护,并且可以增强MATSim的功能。DVRP (Dynamic Vehicle Routing Problem): 解决动态车辆路径问题的辅助工具。Shared Mobility: 模拟人类驱动的共享移动性(例如,微移动性)。

2024-08-20 09:53:43 932

原创 [笔记]利用python中的re模块正则匹配

代码中的test.txt 是利用requests请求得到的html文本。

2023-06-14 16:29:29 198

原创 ArcMap打开shp文件笔记

点击连接到文件夹,在本地找到shp文件所在的目录。1、点击文件菜单-添加数据-添加数据。我用的是ArcMap 10.8.1。鼠标右键图层,点击打开属性表。2、选择shp文件所在目录。修改标注要素的大小和颜色。把属性表的值标注在图中。修改标注的颜色、大小。

2023-06-14 16:23:18 9718

原创 python对象转geojson,geojson转shp文件

工作中遇到需要把经纬度坐标在地图上进行可视化,需要写成geojson格式的文件。笔记记录一下学习过程。生成的geojosn文件可以在中地图展示。

2023-06-14 16:16:24 1521

原创 写PPT的步骤

编写幻灯片内容:根据主题和目标受众,编写幻灯片的内容。调整字体和颜色:选择易读的字体和配色方案,确保幻灯片的整体风格一致。设计幻灯片布局:选择一个适合主题的幻灯片布局,包括标题页、正文页和结论页等。确定主题和目标受众:首先需要明确你要展示的主题是什么,以及你的目标受众是谁。练习演讲:在制作好幻灯片后,要多次练习演讲,熟悉内容和流程。收集素材:根据主题和目标受众,收集相关的图片、文字、数据等素材。确保素材的质量和准确性。总之,写PPT需要注意内容的准确性、逻辑性和连贯性,同时也要注重展示效果和视觉效果。

2023-05-10 18:04:06 715

原创 [笔记]信息化、数字化、智能化三者的区别

信息化是指企业基于电脑和网络技术,广泛应用以ERP为核心的信息系统,实现经营活动的电子流,改进和再造流程,并对流程进行有效控制和管理,降本增效并提升可靠性。数字化是利用数字技术来改变商业模式并提供新的收入和价值创造机会;是转向数字业务的过程。数字化的三个关键点:改变商业模式、实现价值创造、转向数字业务。智能化有两方面的含义:一是采用“人工智能”的理论、方法和技术处理信息与解决问题。二是具有类人智能的特性和功能,自适应、自校正、自协调等。是企业信息化发展的不同阶段。

2023-05-09 16:53:59 437

原创 形象说明数据仓库与数据中台的区别

数据仓库系统的作用能实现跨业务条线、跨系统的数据整合,为管理分析和业务决策提供统一的数据支持。数据仓库能够从根本上帮助你把公式的运营数据转化为高价值的可以获取的信息或者知识,并且在恰当的时候通过恰当的方式把恰当的信息传递给恰当的人。,根据不同客户提供不同的户型、不同的装修。数据中台不是一套软件,也不是一个信息系统,而是一系列数据组件的集合,企业基于自身的信息化建设基础、数据基础以及业务特点对数据中台的能力进行定义,基于能力定义利用数据组件搭建自己的数据中台。数据仓库:就好比给我们。

2023-05-09 16:49:04 146

原创 高德POI数据采集笔记

高德POI数据采集

2023-04-20 17:17:43 3305

原创 百度墨卡托坐标转化笔记

墨卡托坐标转换

2023-04-10 10:07:18 1597

原创 Nginx搭建Netty负载均衡

Nginx搭建Netty负载均衡笔记记录一下用Nginx实现netty的负载均衡学习过程。

2022-12-20 16:15:37 3582 1

原创 Nginx部署SpringBoot项目

nginx 部署springboot项目

2022-12-15 15:16:38 4765

原创 nohup提交jar包脚本

【代码】linux提交任务脚本。

2022-12-15 13:00:37 200

原创 问题 java.net.SocketException Too many open files

解决too many files

2022-11-25 12:00:17 3246

原创 MATSim笔记01-controler结构梳理

MATSim笔记01-controler结构梳理。

2022-09-27 12:18:25 266

原创 UTM坐标系与GPS坐标系转换笔记

UTM与GPS坐标系转换

2022-08-11 10:34:01 2150 3

原创 Flink State示例

Flink State示例// 流1 要先按照id分组,再设置水印和事件时间,因为后面注册的定时器是基于事件时间的DataStreamSource<Order> sourceStream1 = env.addSource(consumer);KeyedStream<Order, String> stream1 = sourceStream1.assignTimestampsAndWatermarks(new BoundedOutOfOrdernessTimestampExtra

2022-04-22 07:45:22 360

原创 Flink State的初始化总结

ValueState示例ValueState<T> lastDataState ;this.lastDataState = getRuntimeContext().getState(new ValueStateDescriptor<>("lastDataState ", T.class));ValueState<Tuple2<Long, Long>> lastSimIdDataTimeState;this.lastSimIdDataTimeState

2022-04-20 13:22:58 2864 2

原创 根据输入地铁站获取所有出口坐标

百度拾取坐标系统

2022-03-11 11:16:27 524

原创 window环境下玩flink(一)

一、安装flink1、下载https://archive.apache.org/dist/flink/flink-1.8.1/flink-1.8.1-bin-scala_2.11.tgz2、解压到目录D:\bigdata\flink-1.8.1-bin-scala_2.113、启动start-cluster.bat4、在浏览器中输入http://localhost:8081/二、测试执行测试程序flink.bat run ../examples/batch/WordCount.jar

2022-03-01 14:49:11 1925

原创 window环境下玩kafaka

参考链接一、安装zookeeper1、https://zookeeper.apache.org/releases.html下载后解压到目录,我这里是D:\bigdata\apache-zookeeper-3.7.0目录结构:2、 解压并进入ZooKeeper目录,笔者:D:/bigdata/apache-zookeeper-3.7.0/conf3、 将“zoo_sample.cfg”重命名为“zoo.cfg”4、 打开“zoo.cfg”找到并编辑dataDir=D:/bigdata/apa

2022-03-01 14:14:20 271

原创 成功利用arthas解决一个cpu占用100%的问题

最近在项目中,发现一个程序的cpu瞬间会占用100%,经验来说应该是某个方法死循环了或者迭代次数过多。利用arthas可以查看问题的症结所在。arthas用户手册1、首先启动arthasjava -jar arthas-boot.jar2、找到对应的程序序号3、输出最繁忙的前3个线程thread -n 3例如输出如下格式可以看出可能有问题的方法是 at com.tsingvast.intelligent.smartbus.service.match.BusShiftMatch

2022-03-01 11:43:12 1311

原创 impala 实现滑动累计求和

最近在工作中遇到这样一个需求:从一天24小时中找出客流量最大的90分钟。基础数据格式如下:一个字段是时段,一个字段是客流如果通过python或者java循环遍历,非常easy,这里主要是通过sql实现。用到了窗口函数ROWS BETWEEN [ { m | UNBOUNDED } PRECEDING | CURRENT ROW] [ AND [CURRENT ROW | { UNBOUNDED | n } FOLLOWING] ]RANGE BETWEEN [ {m | UNBOUNDED

2022-02-28 14:15:50 1784

原创 SpringBoot项目问题总结

SpringBoot项目启动问题整理1、启动SpringBoot报错,报错信息:错误1:SLF4J: Actual binding is of type [org.apache.logging.slf4j.Log4jLoggerFactory]Exception in thread "main" java.lang.ExceptionInInitializerError at com.tsingvast.SpringBootTest.main(SpringBootTest.java:27)Cau

2021-08-11 13:15:12 430

Docker+dify+ollma+deepseek组合方案的Windows本地化部署教程

内容概要:本文档详细介绍了基于 Windows 操作系统的 docker+dify+ollma+deepseek 组合方案的本地化部署流程。首先明确最低硬件要求为CPU>=2 Core、RAM>=4GiB、磁盘空间至少20G。随后阐述了必要的前期准备,如安装 Git、TortoiseGit 和 Docker,同时推荐切换至国内 Docker 镜像源以提高效率。接下来依次讲解 dify 部署的具体步骤,包括从 GitHub 上克隆代码、启动 Docker、验证和访问 dify 应用程序。针对 ollma,提供从官网获取、配置非C盘存储路径及模型下载直至成功检验部署的完整过程,并指出集成 Ollama 部署涉及到选择或安装特定文本嵌入模型。最后,还列举了一些常见的 Docker 操作命令作为辅助参考资料。 适用人群:拥有基础的 IT 素养并且正在寻找关于构建人工智能开发环境方法的学习者或是专业人士,特别是那些专注于自然语言处理或深度学习领域的工作者。 使用场景及目标:为用户提供一套完整的指导方案来帮助他们快速地搭建起基于以上技术栈的工作环境,以便更好地探索机器学习、深度学习相关的前沿话题和技术应用,比如大型语言模型训练。

2025-03-01

Heart Attack Analysis & Prediction Dataset

Heart Attack Analysis & Prediction Dataset

2024-05-14

利用python中的re模块正则匹配

利用python中的re模块正则匹配

2023-06-14

高德城市编码表excel格式

高德城市编码表

2023-04-20

坐标系转换库proj源码

坐标系转换proj库源码

2022-08-11

坐标系转换库 proj 教程

PDF Manual proj.pdf https://proj.org/download.html 手册文档

2022-08-11

国内常用EPSG坐标系

坐标系转换需要的资源

2022-08-11

关闭HttpClient日志的logback文件

关闭HttpClient日志的logback文件

2020-11-21

手写识别数据集MNIST

MNIST 数据分为两个部分。第⼀部分包含 60,000 幅⽤于训练数据的图像。这些图像扫描 ⾃ 250 ⼈的⼿写样本,他们中⼀半⼈是美国⼈口普查局的员⼯,⼀半⼈是⾼校学⽣。这些图像 是 28 × 28 ⼤小的灰度图像。第⼆部分是 10,000 幅⽤于测试数据的图像,同样是 28 × 28 的灰 度图像。

2018-06-21

通过jdbc链接hive所需要的jar包

通过jdbc链接hive时所需要的jar包,把需要的jar都下载下来汇总到一起,供有需要的人使用

2018-05-08

hive jar包

hive metastore jar包,可以直接下载使用,hadoop,hive

2018-05-07

win7下注释掉checkReturnValue方法体后的jar文件

Exception in thread "main" java.io.IOException: Failed to set permissions of path: \tmp\hadoop-ywf\mapred\staging\ywf1760469788\.staging to 0700 win7下报错,需要注释掉checkReturnValue的方法体

2018-05-07

UCI分类数据集

UCI数据集

2017-08-17

Weka 3.4 教程

Weka3.4教程

2017-08-17

selenium源码

selenium源代码

2016-09-27

WeatherCrawl

提供了解析天气网址信息的程序

2016-07-15

CrawlerDemo

利用url,httpurlconnection,socket爬取任意网页demo

2015-04-17

利用TikaAPI解析各种文档

利用开源工具Tika解析PDF文档,HTML文档,微软形式的文档

2015-01-23

复旦自然语言处理技术NLP

复旦NLP,自然语言处理技术,很棒的奥,包括了分词,词性标注,命名体识别

2015-01-08

最大连续子串问题

求一个数组的最大连续子串,和最大的串即为最大连续子串,其中还包括了最大连续子矩阵

2015-01-08

K均值聚类算法

利用k均值聚类算法对词进行聚类,输入是词之间的相似度矩阵

2015-01-08

建立二叉树,前后中序遍历二叉树,求二叉树的深度

建立二叉树,前后中序遍历二叉树,求二叉树的深度

2015-01-08

通过JAVA执行命令行程序

文件中包含两个方法,一个是读取文件路径下的文件列表,另一个是通过JAVA调用命令行程序,涉及到线程阻塞问题

2013-08-17

Dijkstra算法JAVA代码

Dijkstra 求任意两个点的最短路径算法

2013-08-01

传播图谱、意见领袖、社区分析笔记

在做文本挖掘应用时的调研笔记,包括传播图谱、意见领袖、社区分析三部分的笔记

2013-07-29

JAVA 常见的小程序

这是我在自学JAVA时练习写的小程序,包括 递归,继承,排序,打印星型,随机数等,适合初学JAVA的练习

2013-04-07

21天学通JAVA

21天学通JAVA,快速学会JAVA,比较适合的电子版教程,适合初学者

2013-04-07

JAVA基础教程

JAVA基础教程,写的很详细,非常适合初学者学习。

2013-04-07

JAVA程序员必读-基础篇

JAVA程序员的基础知识,适合初学者学习

2013-04-07

数据结构、算法及应用代码

数据结构算法及应用 源代码 书籍作者是 Sartaj Sahni著 孔芳 高伟译

2012-12-06

JAVA笔记总结

自己学习JAVA,总结的笔记,适合初学JAVA学习

2012-11-15

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除