数据结构定义和算法--排序--桶排序

算法原理

  1. 将排序的元素放到几个连续的桶里,每个桶里的元素进行排序;
  2. 桶里的元素排好之后再把所有桶里的元素按照顺序取出来,就是排好顺序的了;

数据结构定义和算法--排序--桶排序

使用条件

  1. 要排序的元素容易划分到m个桶里,并且桶与桶之间有天然的大小顺序;
  2. 每个桶里分到的元素比较平均;

适用场景

  1. 桶排序适合外部排序,即存储在外部磁盘的数据;

应用案例

  1. 需求描述:有10GB的订单数据,需要按照订单金额进行排序,但内存有限(只有几百兆)
  2. 解决思路:
  • 扫描一遍文件,看订单金额范围,比如1~10万元,那么就分100个桶;
  • 第一个桶存储金额1~1000元之间的订单,第二个桶存储1001~2000之间的订单,依此类推;
  • 每个桶对应一个文件夹,并按照金额大小进行排序编号(00, 01, 02, ...,99);
  • 将100个小文件夹依次放入内存进行快排;
  • 所有文件排序好后,只需按照文件名称从小到大依次读取每个小文件的订单即可;
  • 注意点:若单个文件无法全部载入内存,则对该文件继续按照前面的思路进行处理;