- 博客(19)
- 收藏
- 关注
原创 Bismark与BSMAP(笔记)
BSMAP将每个甲基化位点的甲基化状态用一个二进制位表示,1表示甲基化,0表示未甲基化,从而将甲基化信息压缩到BAM文件中。总之,BAM格式文件是甲基化测序数据比对和甲基化位点鉴定的重要输出结果,它们可以被用于后续的甲基化位点分析和差异分析等研究。比对结果:每个序列与参考基因组的比对结果,包括比对上的参考序列名称、起始位置、终止位置、比对方向、比对质量等信息。甲基化信息:每个Cytosine位点的甲基化信息,包括其在参考基因组上的位置、甲基化状态、甲基化水平等信息。
2023-04-19 17:29:06
1468
原创 R语言绘制累计积分密度图(笔记)
axis.text=element_text(colour="#36648B"),axis.ticks.length=unit(.4,"lines"),axis.ticks=element_line(#坐标轴刻度线的设置。values = c("red", "green"), #manual: 直接指定分组使用的颜色。sum_excel_data<-read_excel("路径.xls",col_names=TRUE)#x、y轴标题颜色、大小、字体、位置。#x、y轴标题颜色、大小、字体、位置。
2023-03-30 21:22:11
345
原创 putty基础知识【screen】(笔记)
此时会退出并挂起虚拟终端(保存会话,后台运行该虚拟终端),此时会话状态变成Detacted。最简单的对比理解就是:attached模式在前台运行,detached模式在后台运行。Linux下批量修改文件及文件夹所有者及权限chmod 770 路径。给screen命名 screen -S name。强制关闭一个screen窗口+screen命名。在Attached状态下,按。
2023-03-30 21:12:35
312
原创 putty修改普通用户密码(笔记)
1、普通用户自己修改密码(前提知道自己旧密码,可以登陆上putty)sudo passwd 用户名。2、管理员修改普通用户密码。
2023-03-30 20:32:19
909
原创 类别不平衡问题1——1(笔记)
偏差指模型的预测结果和实际结果之间的平均差距,可以理解为模型本身的你和能力,如果模型拟合不足,无法捕捉到数据的实际特征,导致预测结果与实际结果的偏差较大,我们称之为偏差较高的欠拟合模型。方差是指模型在不同数据集上预测结果的差异,可以理解为模型的泛化能力。如果模型过拟合,会对训练集过于敏感,对未知数据的预测能力较差,我们称之为方差较高的过拟合模型。一组数据的变异程度。在统计学中,方差是衡量一组数据离散程度的指标,它衡量的是每个数据值与数据集平均值的距离的平方的平均值。模型在新的、未知的数据上预测能力。
2023-03-30 10:46:24
159
原创 特征选择(笔记)
温度控制决定了算法在搜索过程中接受劣解的概率,随着搜索的进行,温度逐渐降低,接受劣解的概率也逐渐降低。接受概率的计算是根据当前温度和系统的能量差来计算的,能量差越大,接受概率越高。原理:比较两个变量的联合分布和各自分布之间的差异,如果差异显著,则认为它们之间存在非线性关系。包裹式特征选择是在模型训练过程中进行的,它将特征选择看作是一个搜索问题,通过不断的选择和排除特征来优化模型的性能。:将问题的解表示为染色体的形式,通过模拟自然选择、交叉和变异等过程,不断优化染色体的适应度,最终得到最优解。
2023-03-30 10:15:57
339
原创 K折交叉验证和留一交叉验证(笔记)
剩余的k-1个子集作为训练集,重复k次取平均值。k折交叉验证能够使用更多的数据进行训练,但是时间是留一交叉验证的k倍。,其余作为训练,重复n次取平均值。留一交叉验证能够使用最多的数据进行训练,但是计算时间是k折交叉验证的n倍。K折交叉验证和留一交叉验证都是常用的交叉验证方法,用于评估和选择一个机器学习模型的性能。K折交叉验证:将训练集分成k个子集,每次使用一个。每个样本都作为测试集一次。通常,k折交叉验证适用于。
2023-03-30 09:34:44
1134
1
原创 Arcmap软件中将地图上的省/市/区/县的名称显示出来
首先打开Arcmap软件,最上方的菜单栏找到customize——Toolbars——Draw,调出Draw面板点击 A 右方的下三角,选择“Label”,鼠标悬浮在地图上将会出现该地区的名称,然后当你鼠标落地它出现的是中文名称。首先双击打开提前导进去.shp格式的邯郸市地图图层属性面板,选择Symbology——左侧Shwo——Categories——Unique values,左侧值字段选择“名字”,然后点击Add all values点击确定。下图展示的就是最终效果。
2023-03-29 20:16:24
17568
原创 机器学习、深度学习、强化学习、规则学习(笔记)
智能体可以使用不同的算法和技术来实现不同的任务。反向传播算法的优点是可以训练具有多个层次的神经网络,并且可以处理大量的非结构化数据,例如图像、语音和文本。它可以表示为从当前状态开始,智能体采取某个动作后,在未来的所有时间步中所能获得的期望奖励的总和。价值函数可以帮助智能体评估当前状态和动作的好坏,策略函数可以指导智能体选择最佳的动作。智能体可以使用不同的算法和技术来学习最优价值函数和策略函数,以实现最优决策。强化学习的主要思想:通过与环境的交互来学习最优策略,通过奖励和惩罚来调整策略,从而实现最优决策。
2023-03-29 19:35:54
1220
原创 地理分布分析图+Arcmap(学习链接)
http://datav.aliyun.com/portal/school/atlas/area_selector 获取地理信息,如邯郸.json文件 https://jingyan.baidu.com/article/f79b7cb3af2476d044023ede.html某个字段符号化(将邯郸市各个区县显示出来Arcmap软件)https://lbs.amap.com/demo/javascript-api/example/3d/map3d 高德地图热力图。
2023-03-29 18:01:25
70
原创 如何使用arcmap绘制核密度图(笔记)
选择Geoprocessing——ArcToolbox(进行双击),接下来找到Spatial Analyst——Density——Kernel Density(双击),第一行Input Point or polyline features选择你导入的带有经纬度数据(.shp格式),选择下方的Environments(双击),找到processing Extent(选择你所选区域地图),再找到Raster Analysis——Mask(选择你所选区域地图),点击OK。导进去就出现你所需的地图形状。
2023-03-29 17:49:28
3096
原创 使用Python绘制邯郸地区散点图
from pyecharts.charts import Geofrom pyecharts import optionsfrom pyecharts.globals import GeoTypefrom pyecharts.globals import CurrentConfig, NotebookTypefrom pyecharts import options as optsfrom pyecharts.globals import GeoTypeimport pandas as p
2023-03-29 16:50:53
244
原创 使用Python编程实现将.json格式转成.shp格式(笔记)
plt.rcParams['font.sans-serif'] = 'Microsoft YaHei' # 设置字体为微软雅黑。plt.rcParams['font.sans-serif'] = 'Microsoft YaHei' # 设置字体为微软雅黑。data = gpd.read_file(r'路径\文件名.json')prd_city = ['邯山区','丛台区','复兴区']data.to_file('SHP/文件名.shp',prd.to_file('SHP/文件名.shp',
2023-03-29 14:13:06
1580
原创 使用Python编程根据地址输出地址+经纬度(笔记)
##############读入地址 ------转成数组格式-------------根据高德API接口输出经纬度。jsonData=json_data['geocodes'][0]['location']#获取经纬度。df = pd.read_excel(r'路径\文件名.xlsx', usecols=[0],# 也可以直接写成 address = ['地点1','地点2','地点3'] 的形式。# 也可以直接写成 address = ['地点1','地点2','地点3'] 的形式。
2023-03-29 14:01:52
2546
原创 使用Python编写代码,实现经纬度转成详细地址
jingdu = str(114.523376)#(data['经纬度'][1400].split(",")[0])# weidu = str(36.585729)#(data['经纬度'][1400].split(",")[1])data = pd.read_excel(r'文件路径/文件名.xlsx', usecols=[0],jingdu = (data['经纬度'][i].split(",")[0])weidu = (data['经纬度'][i].split(",")[1])
2023-03-29 11:18:38
1438
原创 统计学常用图形以及直方图和条形图的区别(笔记)
直方图的横轴表示数据的取值范围,纵轴表示数据的频率或者频数。条形图适用于比较不同类别或者组的数据,横轴表示数据值,纵轴表示类别或者组/条形图的条形宽和间距通常是相等的,条形的高度表示数据的大小或者比例,例如:不同产品的销售额、不同地区的人口数量等。2、箱线图:用于表示数据的分布情况和异常值,将数据分成四分位数,箱体表示数据的中间50%范围,上下须表示数据的最大值和最小值,异常值用点表示。8、等高线图:用于表示数据在三维空间中的分布情况,将数据在三维空间中用等高线表示,等高线的高度表示数据的大小或者密度。
2023-03-29 10:45:45
5557
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人