- 博客(10)
- 收藏
- 关注

原创 用RMD导出PDF的方法
今天遇到一个客户需要用RMD导出PDF文件,折腾半天终于帮他搞定了,经验总结如下:#1.安装最新版本的R网址如下:https://cran.r-project.org/#2.安装Rstudio网址如下:https://www.rstudio.com/products/rstudio/download/#3.安装tinytex在R中输入以下语句:devtools::install_...
2019-11-26 16:05:21
18085
4

原创 R语言爬虫之二手房房价XML和rvest包
R语言爬取北京二手房房价众所周知北京的房价一直居高不下,2019年房价到底在北京各个区呈现怎样的分布趋势呢?今天我们用爬虫方法在某知名房产交易网站上获取房价有关数据,从而进行数据清洗及数据可视化展示。数据爬取####################沟通交流Q 63531202###################pacman::p_load(XML,rvest,jiebaR,dpl...
2019-07-29 15:42:33
2260
1

原创 R语言可视化(一)GGally包
R package "GGally"GGallyTalk is cheap, let's coding!GGallyGGally包作为ggplot2扩展包之一,可以方便的显示配对图矩阵,散点图矩阵,平行坐标图,生存图,以及绘制网络。下面对其功能做代码展示:Talk is cheap, let’s coding!首先在R中安装GGally包,显示线性回归各系数显著性。以iris鸢尾花数据集...
2019-07-22 22:23:24
9761
1

原创 机器学习分类模型:R语言实现支持向量机
运用支持向量机实现多分类预测任务,并采用重采样的方法确保模型稳定性。 #1. find the parameters fit.svm <- train(trainset[,-1], trainset$y, "svmRadialWeights", trControl = trainControl(method = "cv",number = 10)) fit.svm#查看预测...
2018-10-16 19:33:33
3417
2
原创 PYTORCH分类损失函数运行记录
尝试了以下3种损失函数,记录下报错情况二分类损失函数binary_cross_entrophy_losstorch.nn.functional.binary_cross_entropy(input, target, weight=None, reduction=‘mean’)运行代码时报错:Expected object of scalar type Float but got scalar type Long for argument #2 ‘target’解决:将target类型转换为fl
2021-01-14 17:13:39
354
1
转载 常用特征选取算法(转载)
今天正好进行特征选择相关的工作,看到一篇总结详细的攻略,与各位分享~原文链接:https://www.cnblogs.com/wymlnn/p/4569437.html特征选取的功能特征选取是机器学习建模前的常见步骤,主要有两个功能:(1)减少特征数量、降维,使模型泛化能力更强,减少过拟合(2)增强度特征和特征值之间的理解常用的特征选取方法一、去掉取值变化小的特征考察某个特征下,样...
2019-08-01 17:21:00
947
原创 R语言机器学习分类模型之逻辑回归
本篇详细介绍了用R语言构建逻辑回归的全过程。有需求的话 Q 63531202 随时交流讨论#1.在训练集上构建逻辑回归模型,family选择binomial,因变量为0,1 set.seed(111) #glm.train <- glm(as.factor(trainset$class) ~ ., data = trainset,family = binomial) ...
2019-07-15 22:36:22
697
原创 R语言机器学习之聚类算法t-SNE
t-SNE是常见的一种聚类方法,用于数值型变量的降维与聚类可视化。在生物信息、医疗等领域得到广泛应用。其主要思想是将高维分布点的距离,用条件概率来表示相似性。下面直接上t-SNE聚类的R代码。#首先安装RtsneR包install.packages(“Rtsne”)library(“Rtsne”)#导入数据集data <- read.csv("data",head...
2019-04-07 11:51:52
6474
1
原创 应对不均衡样本——R语言实现下采样
###=====dataset ======#读取csv文件dataset <- read.csv(".csv",header = T,row.names = 1)#将因变量变为因子型,以便于分类dataset$y<-as.factor(dataset$y)summary(dataset$y)#=== down-sampling ====#提取y=1的样本sub...
2018-10-16 19:30:20
2838
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人