数据结构与算法学习笔记之从0编号的数组

2022-02-03 11:30:07

前言

数组看似简单，但掌握精髓的却没有多少；他既是编程语言中的数据类型，又是最基础的数据结构；

一个小问题：

　为什么数据要从0开始编号，而不是从1开始呢？

正文

带着问题进入学习

如何实现随机访问？

什么是数组？

数组（array）是一种线性表数据结构，它用一组连续的内存空间来储存一组具有相同类型的数据。

我们从定义来分析：

线性表：

是数据排成像一条线一样的结构。每个线性表上的数据最多有前后两个方向。诸如数组，链表，队列，栈等都是线性表结构。

连续的内存空间和相同类型的数据：

这个特性是数组“随机访问”速度飞快的缘由，这也导致了从数组中删除、插入数据，为了保证连续性，需要大量的工作量

计算机会给每个内存单元分配一个地址，计算机通过地址来访问内存中的数据。

当计算机随机访问数组中的某个元素时，它会首先通过下面的寻址公式，计算出该元素的内存地址：

a[i]_address = base_address + i * data_type_size

data_type_siza表示数组中的每一个元素的大小。如果是int类型的数据，data_type_size为4个字节；

数组和链表的区别

链表适合插入、删除，时间复杂度为O（1），数组适合查找，但是这里要注意一下，时间复杂度并不是O（1），即便是排好序的数组，你用二分法查找，时间复杂度也是O（logn），

正确的描述为:数组支持随机访问，根据下标随机访问的时间复杂度为O（1）

低效的“插入”“删除”

插入操作

假设数组的长度为 n，现在，如果我们需要将一个数据插入到数组中的第 k 个位置，为了把第 k 个位置腾出来，给新来的数据，我们需要将第 k～n 这部分的元素都顺序地往后挪一位，下面我们分析一下时间复杂度

如果在数组的末尾插入元素，那就不需要移动数据了，这时的时间复杂度为 O(1)，但如果在数组的开头插入元素，那所有的数据都需要依次往后移动一位，所以最坏时间复杂度是 O(n)，因为我们在每个位置插入元素的概率是一样的，所以平均情况时间复杂度为 (1+2+…n)/n=O(n)

如果数组中的数据是有序的，我们在某个位置插入一个新的元素时，就必须按照刚才的方法搬移 k 之后的数据，如果数组中存储的数据并没有任何规律，数组只是被当作一个存储数据的集合。在这种情况下，如果要将某个数组插入到第 k 个位置

为了避免大规模的数据搬移，我们还有一个简单的办法就是

直接将第 k 位的数据搬移到数组元素的最后，把新的元素直接放入第 k 个位置。

删除操作

和插入类似，

如果删除数组末尾的数据，最好情况时间复杂度为 O(1)；

如果删除开头的数据，则最坏情况时间复杂度为 O(n)；

平均情况时间复杂度也为 O（n）

提高效率：

将多次删除操作中集中在一起执行，可以先记录已经删除的数据，但是不进行数据迁移，而仅仅是记录，当发现没有更多空间存储时，再执行真正的删除操作。这也是 JVM 标记清除垃圾回收算法的核心思想。

数组访问越界问题

C语言中的数据越界是一种未决行为，一般比较难发现的逻辑错误。相比之下，Java会有越界检查。

用数组还是容器？

数组先指定了空间大小，容器如ArrayList可以动态扩容。

1.希望存储基本类型数据，可以用数组

2.事先知道数据大小，并且操作简单，可以用数组
3.直观表示多维，可以用数组
4.业务开发，使用容器足够，开发框架，追求性能，首先数组。

为什么数组要从 0 开始编号？

由于数组是通过寻址公式，计算出该元素存储的内存地址：
a[i]_address = base_address + i * data_type_size
如果数组是从 1 开始计数，那么就会变成：
a[i]_address = base_address + （i-1）* data_type_size

以上内容为个人的学习笔记，仅作为学习交流之用。

作者：Dawnzhang
出处：https://www.cnblogs.com/clwydjgs/p/9390488.html
版权：本文版权归作者
转载：欢迎转载，但未经作者同意，必须保留此段声明；必须在文章中给出原文连接；否则必究法律责任

小舟从此逝，江海寄余生。 --狐狸

码农公寓

前言

正文