R语言中将字符向量或者字符列表按字符串长度排序的方法

最新推荐文章于 2023-07-19 09:07:59 发布

原创最新推荐文章于 2023-07-19 09:07:59 发布 · 1.7k 阅读

1 ·

CC 4.0 BY-SA版权

R语言专栏收录该内容

5 篇文章

订阅专栏

本文介绍如何使用R语言将字符向量或字符列表转化为数据帧，并利用dplyr包的arrange函数进行排序。通过示例步骤展示从初始化测试数据到最终结果转换为字符向量的全过程。

部署运行你感兴趣的模型镜像

核心思路：将字符向量或者字符列表转化为数据帧，利用dplyr包的arrange函数排序。示例如下：

#1.初始化测试数据
attr<-"This procedure read the BallMapper object from file. The parameter of the file is filename. We assume that files: filename_vertices filename_edges filename_edges_strength filename_points_covered_by_landmarks filename_landmarks filename_coloring"

#2.字符串转换为字符列表
a<-strsplit(attr,"[ .,;:{}()*]") #将英文句子拆分成单词,多个分隔符的时候需要用中括号括起来

#3.得到字符向量
b1<-unlist(a)

#4.字符向量转化为数据帧
b2<-data.frame(x=b1) #先将上述得到的列表转成数据帧，列名设置为x

#5.排序
b3<-arrange(b2,-nchar(b2$x)) #利用dplyr包的arrange函数排序，-nchar(b1$x)即按字符串长度排倒序

#6.结果转换为字符向量
b<-b2[,1] #从排序后的数据帧中取出想要的内容，转换为字符向量

更多R语言实战经验，见R语言论坛：http://idata8.com/forum.php?mod=forumdisplay&fid=38

您可能感兴趣的与本文相关的镜像

Llama Factory

模型微调

LLama-Factory

LLaMA Factory 是一个简单易用且高效的大型语言模型（Large Language Model）训练与微调平台。通过 LLaMA Factory，可以在无需编写任何代码的前提下，在本地完成上百种预训练模型的微调