【数据结构与算法】之深入解析“删除有序数组中的重复项”的求解思路与算法示例

一、题目要求

  • 给你一个有序数组 nums ,请你原地删除重复出现的元素,使每个元素只出现一次 ,返回删除后数组的新长度。
  • 不要使用额外的数组空间,你必须在原地修改输入数组并在使用 O(1) 额外空间的条件下完成。
  • 说明:
    • 为什么返回数值是整数,但输出的答案是数组呢?
    • 请注意,输入数组是以「引用」方式传递的,这意味着在函数里修改输入数组对于调用者是可见的。
    • 你可以想象内部操作如下:
// nums 是以“引用”方式传递的。也就是说,不对实参做任何拷贝
int len = removeDuplicates(nums);

// 在函数里修改输入数组对于调用者是可见的。
// 根据你的函数返回的长度, 它会打印出数组中 该长度范围内 的所有元素。
for (int i = 0; i < len; i++) {
    print(nums[i]);
}
  • 示例 1:
输入:nums = [1,1,2]
输出:2, nums = [1,2]
解释:函数应该返回新的长度 2 ,并且原数组 nums 的前两个元素被修改为 1, 2 。不需要考虑数组中超出新长度后面的元素。
  • 示例 2:
输入:nums = [0,0,1,1,1,2,2,3,3,4]
输出:5, nums = [0,1,2,3,4]
解释:函数应该返回新的长度 5 , 并且原数组 nums 的前五个元素被修改为 0, 1, 2, 3, 4 。不需要考虑数组中超出新长度后面的元素。
  • 提示:
    • 0 <= nums.length <= 3 * 104;
    • -104 <= nums[i] <= 104;
    • nums 已按升序排列。

二、求解算法

① 双指针

  • 首先注意数组是有序的,那么重复的元素一定会相邻。
  • 要求删除重复元素,实际上就是将不重复的元素移到数组的左侧。
  • 考虑用 2 个指针,一个在前记作 p,一个在后记作 q,算法流程如下,比较 p 和 q 位置的元素是否相等:
    • 如果相等,q 后移 1 位;
    • 如果不相等,将 q 位置的元素复制到 p+1 位置上,p 后移一位,q 后移 1 位;
  • 重复上述过程,直到 q 等于数组长度,返回 p + 1,即为新数组长度。

【数据结构与算法】之深入解析“删除有序数组中的重复项”的求解思路与算法示例

  • Java 示例:
 public int removeDuplicates(int[] nums) {
    if(nums == null || nums.length == 0) return 0;
    int p = 0;
    int q = 1;
    while(q < nums.length){
        if(nums[p] != nums[q]){
            nums[p + 1] = nums[q];
            p++;
        }
        q++;
    }
    return p + 1;
}
  • 继续优化,考虑如下数组:

【数据结构与算法】之深入解析“删除有序数组中的重复项”的求解思路与算法示例

  • 此时数组中没有重复元素,按照上面的方法,每次比较时 nums[p] 都不等于 nums[q],因此就会将 q 指向的元素原地复制一遍,这个操作其实是不必要的。因此可以添加一个小判断,当 q - p > 1 时,才进行复制。
  • Java 示例:
public int removeDuplicates(int[] nums) {
    if(nums == null || nums.length == 0) return 0;
    int p = 0;
    int q = 1;
    while(q < nums.length){
        if(nums[p] != nums[q]){
            if(q - p > 1){
                nums[p + 1] = nums[q];
            }
            p++;
        }
        q++;
    }
    return p + 1;
}

② 双指针(LeetCode 官方解法)

  • 对给定的有序数组 nums 删除重复元素,在删除重复元素之后,每个元素只出现一次,并返回新的长度,上述操作必须通过原地修改数组的方法,使用 O(1) 的空间复杂度完成。
  • 由于给定的数组 nums 是有序的,因此对于任意 i<j,如果 nums[i]=nums[j],则对任意 i≤k≤j,必有 nums[i]=nums[k]=nums[j],即相等的元素在数组中的下标一定是连续的。利用数组有序的特点,可以通过双指针的方法删除重复元素。
  • 如果数组 nums 的长度为 0,则数组不包含任何元素,因此返回 0。
  • 当数组 nums 的长度大于 0 时,数组中至少包含一个元素,在删除重复元素之后也至少剩下一个元素,因此 nums[0] 保持原状即可,从下标 1 开始删除重复元素。
  • 定义两个指针 fast 和 slow 分别为快指针和慢指针,快指针表示遍历数组到达的下标位置,慢指针表示下一个不同元素要填入的下标位置,初始时两个指针都指向下标 1。
  • 假设数组 nums 的长度为 n,将快指针 fast 依次遍历从 1 到 n−1 的每个位置,对于每个位置,如果 nums[fast] ≠ nums[fast−1],说明 nums[fast] 和之前的元素都不同,因此将 nums[fast] 的值复制到 nums[slow],然后将 slow 的值加 1,即指向下一个位置。
  • 遍历结束之后,从 nums[0] 到 nums[slow−1] 的每个元素都不相同且包含原数组中的每个不同的元素,因此新的长度即为 slow,返回 slow 即可。
  • Java 示例:
class Solution {
    public int removeDuplicates(int[] nums) {
        int n = nums.length;
        if (n == 0) {
            return 0;
        }
        int fast = 1, slow = 1;
        while (fast < n) {
            if (nums[fast] != nums[fast - 1]) {
                nums[slow] = nums[fast];
                ++slow;
            }
            ++fast;
        }
        return slow;
    }
}
上一篇:【LeetCode】重排链表


下一篇:统计推断(十一) Sum-product algorithm