排序算法
排序算法是计算机科学中最基础且重要的算法之一。根据不同的应用场景和需求,我们可以选择不同的排序算法。排序算法主要分为比较排序和非比较排序两大类。
排序算法的选择
选择排序算法时,需要考虑以下因素:
- 数据规模:小规模数据可以使用简单排序,大规模数据需要使用高效排序
- 数据分布:如果数据分布有特点,可以使用特定排序算法
- 稳定性要求:如果需要保持相等元素的相对顺序,选择稳定排序
- 空间限制:如果空间有限,选择原地排序
- 数据特点:如果数据基本有序,插入排序可能更高效
比较排序
比较排序是通过比较元素之间的大小关系来进行排序的算法。这类算法的时间复杂度下界为 O(n log n)。
冒泡排序(Bubble Sort)
特点:
- 稳定排序
- 原地排序
- 时间复杂度:O(n²)
- 空间复杂度:O(1)
核心思想: 通过相邻元素的比较和交换,将较大的元素逐渐"冒泡"到数组的末尾。
应用场景:
- 教学示例
- 小规模数据排序
- 数据基本有序的情况
js
function bubbleSort(arr) {
const n = arr.length;
for (let i = 0; i < n - 1; i++) {
let swapped = false;
for (let j = 0; j < n - i - 1; j++) {
if (arr[j] > arr[j + 1]) {
[arr[j], arr[j + 1]] = [arr[j + 1], arr[j]];
swapped = true;
}
}
if (!swapped) break; // 优化:如果一轮比较中没有发生交换,说明已经有序
}
return arr;
}
选择排序(Selection Sort)
特点:
- 不稳定排序
- 原地排序
- 时间复杂度:O(n²)
- 空间复杂度:O(1)
核心思想: 每次从未排序部分选择最小(或最大)的元素,放到已排序部分的末尾。
应用场景:
- 教学示例
- 小规模数据排序
- 交换操作成本较高的情况
js
function selectionSort(arr) {
const n = arr.length;
for (let i = 0; i < n - 1; i++) {
let minIndex = i;
for (let j = i + 1; j < n; j++) {
if (arr[j] < arr[minIndex]) {
minIndex = j;
}
}
[arr[i], arr[minIndex]] = [arr[minIndex], arr[i]];
}
return arr;
}
插入排序(Insertion Sort)
特点:
- 稳定排序
- 原地排序
- 时间复杂度:O(n²)
- 空间复杂度:O(1)
核心思想: 将未排序部分的元素逐个插入到已排序部分的适当位置。
应用场景:
- 小规模数据排序
- 数据基本有序的情况
- 在线算法(数据流式输入)
js
function insertionSort(arr) {
const n = arr.length;
for (let i = 1; i < n; i++) {
const key = arr[i];
let j = i - 1;
while (j >= 0 && arr[j] > key) {
arr[j + 1] = arr[j];
j--;
}
arr[j + 1] = key;
}
return arr;
}
归并排序(Merge Sort)
特点:
- 稳定排序
- 非原地排序
- 时间复杂度:O(n log n)
- 空间复杂度:O(n)
核心思想: 将数组分成两半,分别排序后再合并。
应用场景:
- 大规模数据排序
- 需要稳定排序的情况
- 外部排序(数据量大于内存)
js
function mergeSort(arr) {
if (arr.length <= 1) return arr;
const mid = Math.floor(arr.length / 2);
const left = mergeSort(arr.slice(0, mid));
const right = mergeSort(arr.slice(mid));
return merge(left, right);
}
function merge(left, right) {
const result = [];
let i = 0, j = 0;
while (i < left.length && j < right.length) {
if (left[i] <= right[j]) {
result.push(left[i++]);
} else {
result.push(right[j++]);
}
}
return result.concat(left.slice(i)).concat(right.slice(j));
}
快速排序(Quick Sort)
特点:
- 不稳定排序
- 原地排序
- 时间复杂度:平均 O(n log n),最坏 O(n²)
- 空间复杂度:O(log n)
核心思想: 选择一个基准元素,将数组分成两部分,一部分小于基准,一部分大于基准,然后递归排序。
应用场景:
- 大规模数据排序
- 需要原地排序的情况
- 数据随机分布的情况
js
function quickSort(arr, left = 0, right = arr.length - 1) {
if (left >= right) return arr;
const pivotIndex = partition(arr, left, right);
quickSort(arr, left, pivotIndex - 1);
quickSort(arr, pivotIndex + 1, right);
return arr;
}
function partition(arr, left, right) {
const pivot = arr[right];
let i = left;
for (let j = left; j < right; j++) {
if (arr[j] < pivot) {
[arr[i], arr[j]] = [arr[j], arr[i]];
i++;
}
}
[arr[i], arr[right]] = [arr[right], arr[i]];
return i;
}
堆排序(Heap Sort)
特点:
- 不稳定排序
- 原地排序
- 时间复杂度:O(n log n)
- 空间复杂度:O(1)
核心思想: 利用堆这种数据结构进行排序。
应用场景:
- 大规模数据排序
- 需要原地排序的情况
- 需要优先队列的情况
js
function heapSort(arr) {
const n = arr.length;
// 构建最大堆
for (let i = Math.floor(n / 2) - 1; i >= 0; i--) {
heapify(arr, n, i);
}
// 逐个提取元素
for (let i = n - 1; i > 0; i--) {
[arr[0], arr[i]] = [arr[i], arr[0]];
heapify(arr, i, 0);
}
return arr;
}
function heapify(arr, n, i) {
let largest = i;
const left = 2 * i + 1;
const right = 2 * i + 2;
if (left < n && arr[left] > arr[largest]) {
largest = left;
}
if (right < n && arr[right] > arr[largest]) {
largest = right;
}
if (largest !== i) {
[arr[i], arr[largest]] = [arr[largest], arr[i]];
heapify(arr, n, largest);
}
}
非比较排序
非比较排序不通过比较元素的大小关系来进行排序,通常可以达到线性时间复杂度。
计数排序(Counting Sort)
特点:
- 稳定排序
- 非原地排序
- 时间复杂度:O(n + k)
- 空间复杂度:O(n + k)
核心思想: 统计每个元素出现的次数,然后根据统计结果重构数组。
应用场景:
- 数据范围较小的情况
- 需要稳定排序的情况
- 数据分布均匀的情况
js
function countingSort(arr) {
const max = Math.max(...arr);
const count = new Array(max + 1).fill(0);
const result = new Array(arr.length);
// 统计每个元素出现的次数
for (const num of arr) {
count[num]++;
}
// 计算每个元素的位置
for (let i = 1; i <= max; i++) {
count[i] += count[i - 1];
}
// 构建结果数组
for (let i = arr.length - 1; i >= 0; i--) {
result[count[arr[i]] - 1] = arr[i];
count[arr[i]]--;
}
return result;
}
桶排序(Bucket Sort)
特点:
- 稳定排序
- 非原地排序
- 时间复杂度:平均 O(n + n²/k),最坏 O(n²)
- 空间复杂度:O(n + k)
核心思想: 将元素分配到有限数量的桶中,对每个桶进行排序,然后按顺序合并。
应用场景:
- 数据分布均匀的情况
- 数据范围较大的情况
- 需要稳定排序的情况
js
function bucketSort(arr, bucketSize = 5) {
if (arr.length === 0) return arr;
const min = Math.min(...arr);
const max = Math.max(...arr);
const bucketCount = Math.floor((max - min) / bucketSize) + 1;
const buckets = new Array(bucketCount);
for (let i = 0; i < bucketCount; i++) {
buckets[i] = [];
}
// 将元素分配到桶中
for (const num of arr) {
const bucketIndex = Math.floor((num - min) / bucketSize);
buckets[bucketIndex].push(num);
}
// 对每个桶进行排序
const result = [];
for (const bucket of buckets) {
insertionSort(bucket);
result.push(...bucket);
}
return result;
}
基数排序(Radix Sort)
特点:
- 稳定排序
- 非原地排序
- 时间复杂度:O(d(n + k))
- 空间复杂度:O(n + k)
核心思想: 按照位数进行排序,从最低位到最高位依次排序。
应用场景:
- 数据位数较少的情况
- 需要稳定排序的情况
- 数据范围较大的情况
js
function radixSort(arr) {
const max = Math.max(...arr);
const maxDigit = String(max).length;
for (let i = 0; i < maxDigit; i++) {
const buckets = Array.from({ length: 10 }, () => []);
for (const num of arr) {
const digit = getDigit(num, i);
buckets[digit].push(num);
}
arr = [].concat(...buckets);
}
return arr;
}
function getDigit(num, place) {
return Math.floor(Math.abs(num) / Math.pow(10, place)) % 10;
}
排序算法的应用
- 数据预处理:排序是许多算法的基础步骤
- 查找优化:排序后的数据可以使用二分查找
- 去重:排序后可以方便地去除重复元素
- 统计:排序后可以方便地进行各种统计
- 数据展示:排序后的数据更易于展示和理解
排序算法的优化
- 混合排序:结合多种排序算法的优点
- 并行排序:利用多核处理器进行并行排序
- 外部排序:处理大于内存的数据集
- 自适应排序:根据数据特点自动选择最优排序算法
- 稳定化处理:将不稳定排序算法改造为稳定排序