斯卡拉通用“串分”的方法
问题描述:
如果我是分割字符串,我能做到斯卡拉通用“串分”的方法
"123,456,789".split(",")
得到一个字符串的 Seq("123","456","789")
思考作为一个字符序列,怎么可能这是推广到其他序列的对象?
val x = Seq(One(),Two(),Three(),Comma(),Five(),Six(),Comma(),Seven(),Eight(),Nine())
x.split(
number=>{
case _:Comma => true
case _ => false
}
)
分裂在这种情况下不存在,但它让我想起了跨度,分区,GROUPBY,但只有跨度似乎接近,但它不处理的领先/结束逗号优雅。
答
implicit class SplitSeq[T](seq: Seq[T]){
import scala.collection.mutable.ListBuffer
def split(sep: T): Seq[Seq[T]] = {
val buffer = ListBuffer(ListBuffer.empty[T])
seq.foreach {
case `sep` => buffer += ListBuffer.empty
case elem => buffer.last += elem
}; buffer.filter(_.nonEmpty)
}
}
它可以然后使用像x.split(Comma())
。
答
这就是我过去解决这个问题的方法,但我怀疑有更好/更优雅的方法。
def break[A](xs:Seq[A], p:A => Boolean): (Seq[A], Seq[A]) = {
if (p(xs.head)) {
xs.span(p)
}
else {
xs.span(a => !p(a))
}
}
答
以下为 'a' 的解决方案,不是最优雅 -
def split[A](x: Seq[A], edge: A => Boolean): Seq[Seq[A]] = {
val init = (Seq[Seq[A]](), Seq[A]())
val (result, last) = x.foldLeft(init) { (cum, n) =>
val (total, prev) = cum
if (edge(n)) {
(total :+ prev, Seq.empty)
} else {
(total, prev :+ n)
}
}
result :+ last
}
实施例结果 -
scala> split(Seq(1,2,3,0,4,5,0,6,7), (_:Int) == 0)
res53: Seq[Seq[Int]] = List(List(1, 2, 3), List(4, 5), List(6, 7))
对Meghana的接受,因为它对我来说似乎更易读+它不需要创建多个tuple2。 –