如何获取按字母顺序排列的unicode字符?

问题描述:

如何获得Ruby 1.8.7 unicode字符在给定字符后面的字母顺序?如何获取按字母顺序排列的unicode字符?

如果你的意思是“在代码页中的下一个”,那么你总是可以查看字节并找出答案。如果您按顺序浏览代码页,您最终可能会陷入没有分配字符的孔中。如果你能想象这样一个术语,这将意味着“Unicode-abetically”。

如果你的意思是“按字母顺序排列”,那么你的运气不好,因为这并不意味着什么。字母顺序的概念从一种语言到另一种语言差别很大,有时甚至是特定于语境的。有些语言甚至没有设置他们的字符的顺序。这就是为什么除了编码之外,某些系统还有排序规则。排序规则定义了顺序,但为了排序的目的,通常很多字母被认为是等价的,从而使事情更加复杂化。

Ruby 1.8.7也没有意识到Unicode的一般性,并假装一切都是一个8位ASCII字符串和一个字节的字符。 Ruby 1.9可以将多字节的UTF-8解析为单独的字符,并可能使这个练习变得更容易。

+1

Lib在这里提到了支持整理感知字符串比较的Lib:http://*.com/a/5472046/166921 –