代码片段
文章平均质量分 66
这里私人代码记录的地方
节选程序算法中的经典部分,加以记录
春种千粒粟
学习Python,深度学习,强化学习的知识
有时间看私聊和回答问题
私聊我问题请写好题目
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【上海(2)】自行车数据协同路网、天气、区级数据解决问题--新手小白保姆级
文章摘要 本文介绍共享单车数据分析的两个关键部分:站点流量统计和社区检测。首先通过3D柱状图可视化站点借还车频次,筛选特定区域数据展示地理分布。其次应用Louvain算法进行社区检测,包括数据预处理、图构建、社区分析和优化过程,最终识别出具有高内聚性的地理区域。文章详细展示了数据处理流程,包括孤立节点移除、异常数据处理,以及各阶段图结构的对比分析。完整代码见配套文件,实现了从原始数据到社区聚类可视化的完整分析链条。原创 2025-12-25 19:36:29 · 572 阅读 · 0 评论 -
【上海(1)】自行车数据协同路网、天气、区级数据解决问题--新手小白保姆级
SHP格式是GIS中最常用的矢量数据交换格式,包含.shp(几何信息)、.shx(索引)和.dbf(属性)三个必需文件。Python可通过geopandas库读取SHP文件,并支持基于属性和空间关系的筛选操作(如within、intersects等)。以上海路网数据为例,演示了数据筛选、空间查询、可视化(含轨迹叠加)及保存为GeoJSON等操作流程。还展示了摩拜单车轨迹数据的解析方法,包括坐标点提取、LineString转换和静态/交互式可视化技巧,为地理空间数据分析提供了完整的技术路线。原创 2025-12-19 12:09:18 · 870 阅读 · 0 评论 -
DQN和DDQN(进阶版)
Q表格、Q网络与策略函数Q表格是有限的离散的,而神经网络可以是无限的。对于动作有限的智能体来说,使用Q网络获得当下状态的对于每个动作的状态-动作值。那么arg maxQas;θabest,那么我们对当前的状态s,会有一个最佳的选择abesta_{best}abest,选择的依据是策略θ\thetaθ. 我们的目标是获得最优的策略θ∗\theta^*θ∗.即优化θ\thetaθ。原创 2025-06-01 22:00:09 · 1356 阅读 · 0 评论 -
【 ai-safety-gridworlds】介绍和使用(未完)
我们实现了一种自动策略来解决这些问题,比如当两个智能体同时试图移动到同一个位置时候,或者多个智能体同时争夺有限的资源的时候,系统会自动介入处理,而不是需要你在每个具体的环境代码里都去写冲突解决逻辑。我们可以选择将某些智能体的内部指标,比如健康度、满意度等,设置为公开状态,让其他智能体能够观察到这些信息,这有助于建立更复杂的社交关系和协作策略。比如,对于一个既要生存又要积累财富的智能体,它的奖励向量可能有两个维度:一个是生存值,另一个是财富值。优点是直观,缺点是基于梯度的算法,可能不太方便处理向量奖励。原创 2025-05-28 10:03:01 · 1078 阅读 · 0 评论 -
【代码】自制网格世界
本文介绍了一个网格环境类MapEnv的设计与实现,主要包括地图初始化和执行动作两大核心功能模块。在地图初始化部分,通过构造器init和__init__map方法控制地图生成流程,提供随机生成(随机墙、起点、奖励点)和固定配置两种模式,并包含路径连通性验证(BFS算法)和障碍物检测等关键功能。执行动作部分实现智能体的移动、拾取等交互逻辑,支持局部视野观测。该环境采用双矩阵结构表示水平和垂直墙,支持三种地图生成模式:完全固定、部分随机和完全随机,为智能体训练提供灵活的测试场景。原创 2025-05-28 09:44:13 · 473 阅读 · 0 评论 -
gurobipy代码
【代码】gurobipy代码。原创 2024-04-15 23:47:41 · 435 阅读 · 0 评论 -
【2016bike】构造图矩阵的代码记录
[bike]邻接矩阵中邻居和时间模式矩阵的获取原创 2022-04-04 13:13:04 · 680 阅读 · 0 评论 -
[loss画图记录]
一、导入库import numpy as npimport pandas as pd #import networkx as nximport matplotlib.pyplot as pltimport randomfrom collections import *import csv import pickle import os二、修改当前文件工作路径os.getcwd() # 获得当前工作路径cd "C:\\Users\\Administrator\\Desktop原创 2022-02-13 11:16:35 · 1649 阅读 · 0 评论 -
[数据处理记录]little_data_process2016
一、小数据点数据一:[13098, 11129, 11105, 11157, 11021, 11018, 11028, 11157]网状数据二:[11194, 15090, 11018, 11028, 11009, 15076, 11147, 11105]星状数据三:[11106, 15018, 11020, 11012, 11018, 11212, 11016, 11014]网状数据四:[11131, 11194, 11106, 11012, 15018, 11228, 11013, 11014原创 2022-01-23 16:59:30 · 1364 阅读 · 0 评论 -
【2019bike】数据处理记录
数据记录原创 2021-11-29 22:48:11 · 330 阅读 · 0 评论 -
[MDP]的案例gridworld
MDP的案例一、Grid world参考连接:https://www.jianshu.com/p/b392405115bb网格世界(Grid World)规则:网格中的每一个小格都对应于环境中的状态. 在一个小格上, 有 4 种可能的动作: 北移, 南移,东移, 西移, 其中各个动作都确定性地使智能体在网格上沿对应的方向移动一格. 如果所采取的动作将令智能体脱离网格, 那么该动作的结果为智能体的位置保持不变, 且造成 −1 的奖赏. 除了上述动作与将智能体移出特殊状态 A 与 B 的动作外, 其他的原创 2021-11-28 16:13:38 · 1427 阅读 · 1 评论 -
[MRP]代码纪录
MRP"""这是MRP迭代过程(Markov Reward Process马尔可夫报酬过程)""" # 迭代def next_v(_lambda, r_list, old_v_list, weight_list): # _lambda是折扣因子,表示未来报酬的当前价值 new_v_list = [] for j in range(len(old_v_list)): if j != len(old_v_list) - 1: j_sum原创 2021-11-28 16:06:35 · 570 阅读 · 0 评论
分享