如何从一个数据框创建一个新列,但在现有列的一段数据上使用
问题描述:
基本上,我有一个名为top100_retailers
的数据框。它有一个名为Headquarter
的列,其中包含城市,州(例如:Bentonville, Ark.
)。我想创建2个新列,分别为City
和State
。我如何才能取得城市信息并将其分配到新的City
列,并只取得状态信息并将其分配给新的“州”列?如何从一个数据框创建一个新列,但在现有列的一段数据上使用
答
我们可以从separate
tidyr
library(tidyr)
top100_retailers <- separate(top100_retailers, Headquarter, into = c("City", "State"))
如果我们想要保持“总部”列好,使用remove = FALSE
参数,因为它是默认TRUE
做到这一点。
这是否应该自动为数据框创建新列“城市”和“状态”? – user6794408
@ user6794408'separate'会自动找到分隔符,在本例中为''',并创建两列。我们必须提供新列的名称,即“城市”和“州” – akrun