首页 > 英语园地

Scala的Seq集合中的排序实现

更新时间:2023-06-19 13:37:48 阅读：评论：0

Scala的Seq集合中的排序实现

对Scala Seq进⾏排序，常见的是使⽤sortBy、sorted、sortWith三个函数。

其中sortBy实现很简洁，如下

def sortBy[B](f: A => B)(implicit ord: Ordering[B]): Repr = sorted(ord on f)

其本质是调⽤sorted函数，使⽤隐式对象ord，将f参数转化为⽐较函数，之所以这样我猜是为了利⽤现有的Java排序实现。

on函数实现如下

def on[U](f: U => T): Ordering[U] = new Ordering[U] {

def compare(x: U, y: U) = pare(f(x), f(y))

}

on函数的作⽤：对于给定接收参数为U返回为T的f函数，使⽤outer（混⼊Ordering特质的实例，Ordering继承了Java的Comparator接⼝）创建⼀个⽐较函数，其⽐较函数等于

def compare(x:U, y:U) = Ordering[T].compare(f(x), f(y))

当使⽤sorted⽽不是sortBy和sortWith时，默认使⽤的是Ordering伴⽣对象中的预定义的⽐较函数。这些函数最终使⽤Java类型的compare⽅法来⽐较⼀些常见的基本类型的⼤⼩。

sortBy和sortWith⾃⾝都是调⽤了sorted⽅法，只不过它们传递的ord排序函数不同。

这两个⽅法调⽤sorted是使⽤显⽰传递参数，⽽不是隐式，直接调⽤sorted时，会在Ordering及其伴⽣对象域内查找可⽤的隐式排序函数），⽐较函数就是Java的⽐较器。

def sorted[B >: A](implicit ord: Ordering[B]): Repr = {

val len = this.length

//可变集合构建（从这可以看到Scala常规操作就是在函数式结构内部封装可变结构，⽽不对⽤户暴露可变性）

val b = newBuilder

//单个元素不⽤排序，直接返回当前集合

if (len == 1) b ++= this

el if (len > 1) {

//标记需要添加多少个元素

//当调⽤“result”返回集合结果时。⼀些⽣成器（builder）将根据此值优化它们的表⽰。如Set对个数为0~4的集合会进⾏优化处理

b.sizeHint(len)

msbval arr = new Array[AnyRef](len) //以前使⽤的ArraySeq⽤于更紧凑但速度较慢的代码

var i = 0

for (x <- this) {

//此处进⾏类型转换为了调⽤Java⽅法

arr(i) = x.asInstanceOf[AnyRef]

i += 1

}

//使⽤Java的Arrays.sort进⾏排序

java.util.Arrays.sort(arr, ord.asInstanceOf[Ordering[Object]])

i = 0

while (i < arr.length) {

//重新转换为原类型

b += arr(i).asInstanceOf[A]

i += 1

}

//返回排序结果

the myth}

Java的Arrays.sort⽅法主要对数组进⾏排序

public static<T>void sort(T[] a, Comparator<?super T> c){

if(c == null){

//没有⽐较器，调⽤sort，并判断是否选择旧的归并排序（归并）

sort(a);

}el{

//有⽐较器，仍然需要判断是否⽤户选择了旧的归并排序

if(LegacyMergeSort.urRequested)

legacyMergeSort(a, c);

//调⽤新的TimSort排序

TimSort.sort(a,0, a.length, c, null,0,0);

}

根据指定的⽐较器对指定的对象数组进⾏排序。数组中的所有元素都必须是由指定的⽐较器进⾏相互⽐较（即c.compare(e1，e2)不能对数组中的任何元素抛出CastException异常）。

对Scala⽽⾔，Seq可以存储不同类型的数据，但是由于底层排序是基于Java数组的，所以存储了不同类型数据的Seq将不能被sorted排序。

TimSort是⼀种稳定的、⾃适应的、迭代的归并排序，在部分排序的数组上运⾏时需要的⽐较远远少于 nlg(n)，⽽在随机未排序的数组上运⾏时提供的性能与传统的归并排序相当。

像所有正确的归并排序⼀样，这种排序是稳定的，运⾏需要 O(nlogn) 时间（最坏情况）。在最坏的情况下，这种排序需要n/2个对象引⽤的临时存储空间；在最好的情况下，它只需要少量的恒定空间。

本质是⼀种经过优化能很好利⽤元素已有序列状态的归并排序。

⽆⽐较器的Arrays.sort实现

public static void sort(Object[] a){

//可以使⽤系统属性java.util.Arrays.uLegacyMergeSort来选择旧的归并排序实现

if(LegacyMergeSort.urRequested)

legacyMergeSort(a);

fromtimetotime//ComparableTimSort实际是TimSort的⼀个近似副本实现，⽤于实现Comparable的对象数组，⽽不是使⽤显式⽐较器。很显然，这就是⼀个没有⽐较器的TimSort，不对其进⾏讨论。

ComparableTimSort.sort(a,0, a.length, null,0,0);

}

有⽐较器的TimSort.sort的实现

static<T>void sort(T[] a,int lo,int hi, Comparator<?super T> c,

T[] work,int workBa,int workLen){

asrt c != null && a != null && lo >=0&& lo <= hi && hi <= a.length;

//计算需要排序的元素个数

int nRemaining = hi - lo;

if(nRemaining <2)

return;//⼤⼩为0和1的数组始终是排序的

//如果数组很⼩，则使⽤不需要归并的“mini-TimSort”，这个值为32，⼩于32将不会使⽤归并，⽽使⽤binarySort（⼆分排序，它需要O(nlogn)次⽐较，但是最坏的情况需要O(n^2)次数据移动）

//MIN_MERGE常数应为2的幂。Tim Peter的C实现中为64，但是凭经验确定32在此实现中能更好地⼯作。万⼀您将此常量设置为⼀个不是2的幂的数字，则需要更改minRunLength计算

//对于binarySort，如果指定范围的初始部分已经排序，则此⽅法可以利⽤它：此⽅法假定索引lo（包

含）到start（不包含）中的元素已经排序。

//1.从数组开始处找到⼀组连接升序或严格降序（找到后翻转）的数

//2.使⽤⼆分查找的⽅法将后续的数插⼊之前的已排序数组，binarySort对数组a[lo:hi]进⾏排序，并且a[lo:start]是已经排好序的。

//算法的思路是对a[start:hi]中的元素，每次使⽤binarySearch为它在a[lo:start]中找到相应位置，并插⼊。

if(nRemaining < MIN_MERGE){

udto

int initRunLen =countRunAndMakeAscending(a, lo, hi, c);

//使⽤⼆分排序，计算出从哪开始⼆分排序并利⽤已有序的元素（截⽌到initRunLen，数组⼀定是升序的）

binarySort(a, lo, hi, lo + initRunLen, c);

yaphetsreturn;

}

TimSort<T> ts =new TimSort<>(a, c, work, workBa, workLen);

//从剩下需要排序的元素个数中，选取minRun⼤⼩，之后待排序数组将被分成以minRun⼤⼩为区块的⼀块块⼦数组

int minRun =minRunLength(nRemaining);

do{

//找到初始的⼀组升序数列，countRunAndMakeAscending会找到⼀个run

//这个run必须是已经排序的，并且该函数会保证它为升序，也就是说，如果找到的是⼀个降序的，会对其进⾏翻转

int runLen =countRunAndMakeAscending(a, lo, hi, c);

//若这组区块⼤⼩⼩于minRun，则将后续的数补⾜，利⽤binarySort对run进⾏扩展，并且扩展后，run仍然是有序的

if(runLen < minRun){

int force = nRemaining <= minRun ? nRemaining : minRun;

binarySort(a, lo, lo + force, lo + runLen, c);

runLen = force;

}

//当前的run位于a[lo:runLen]，将其⼊栈ts.pushRun(lo, runLen);

//为后续merge各区块作准备：记录当前已排序的各区块的⼤⼩（pushRun记录run中元素索引和元素个数）

ts.pushRun(lo, runLen);

//对当前的各区块进⾏merge

//寻找下⼀个run，lo之前是已经排序的

规章制度英文lo += runLen;

nRemaining -= runLen;//计算剩下未排序的元素

}while(nRemaining !=0);//直到将待排序数组排序完退出循环

//归并所有剩余run以完成排序

asrt lo == hi;

asrt ts.stackSize ==1;

}

countRunAndMakeAscending实现

private static<T>int countRunAndMakeAscending(T[] a,int lo,int hi,

Comparator<?super T> c){

asrt lo < hi;

int runHi = lo +1;

if(runHi == hi)

return1;

pare(a[runHi++], a[lo])<0){//降序的需要反转⼀下

国际经济与贸易考研while(runHi < hi && c.compare(a[runHi], a[runHi -1])<0)

runHi++;

reverRange(a, lo, runHi);

}el{//升序

while(runHi < hi && c.compare(a[runHi], a[runHi -1])>=0)

runHi++;

}

鳄鱼英语

//返回已经升序的元素个数

return runHi - lo;

}

minRunLength实现

private static int minRunLength(int n){

asrt n >=0;

int r =0;

while(n >= MIN_MERGE){whale

r |=(n &1);

n >>=1;

}

return n + r;

}

如果数组⼤⼩⼩于MIN_MERGE，返回n

如果数组⼤⼩为2的N次幂，则返回16（MIN_MERGE / 2）

其他情况下，逐位向右位移（即除以2），直到找到介于16和32间的⼀个数

private void mergeCollap(){

while(stackSize >1){

int n = stackSize -2;

if(n >0&& runLen[n-1]<= runLen[n]+ runLen[n+1]){

if(runLen[n -1]< runLen[n +1])

n--;

mergeAt(n);

}el if(runLen[n]<= runLen[n +1]){

mergeAt(n);

}el{

break;// Invariant is established

}摩洛幼儿英语

}

只对相邻的区块归并，注意：要归并的两个run是已经排序的

若当前区块数仅为2，If X<=Y，将X和Y归并

若当前区块数>=3，If X<=Y+Z，将X和Y归并，直到同时满⾜X>Y+Z和Y>Z

本文发布于:2023-06-19 13:37:48，感谢您对本站的认可！

本文链接：https://www.wtabcd.cn/fanwen/fan/78/991331.html

上一篇：java在源码中排在最前面的语句

下一篇：餐厅点餐的英语情景语句

标签：排序元素数组归并需要

留言与评论（共有 0 条评论）