计算字符列中的唯一字符串

问题描述:

我有一列有字符串观察值,我需要计算该列中的唯一字。对于例如计算字符列中的唯一字符串

enter image description here

我想我的最终输出看起来像这个 -

enter image description here

列的文字是单独使用空格所以这是在我的情况的另一项挑战。

谢谢

+0

你应该看看'strsplit'和'table' – cdeterman

这是一个解决方案。

# the data 
dat <- data.frame(X = c("Program Manager", "Program Coordinator", 
         "Senior Manager", "Senior Associate", 
         "Senior Researcher"), 
        stringsAsFactors = FALSE) 

# count words 
table(unlist(strsplit(dat$X, " +"))) 

其结果是:

Associate Coordinator  Manager  Program Researcher  Senior 
      1   1   2   2   1   3 

随着as.data.frame结果可以被转换成一个数据帧。

tab <- table(unlist(strsplit(dat$X, " +"))) 
as.data.frame(tab) 

结果:

  Var1 Freq 
1 Associate 1 
2 Coordinator 1 
3  Manager 2 
4  Program 2 
5 Researcher 1 
6  Senior 3 
+0

非常感谢。这对我有效。 –