深入浅出数据结构C语言版(1)——什么是数据结构及算法

在很多数据结构相关的书籍,尤其是中文书籍中,常常把数据结构与算法“混合”起来讲,导致很多人初学时对于“数据结构”这个词的意思把握不准,从而降低了学习兴趣和学习信心深入浅出数据结构C语言版(1)——什么是数据结构及算法。然而实际上,数据结构就是其字面意思:数据的结构。而“结构”这个词的标准意思又是“组成整体的各部分的搭配和安排”。所以,数据结构的意思就是“数据存储的结构”,而我们学习数据结构其实就是为了研究“应该以什么样的(抽象的)结构存储数据”。更广泛地说,数据结构不仅关心“数据如何存储”,还关心“存储哪些数据”。

那么,数据存储的不同结构(抽象的,因为数据的实际存储是物理的、底层的)会有什么区别,或者说我们为什么要学习数据结构呢?原因当然就是数据结构与我们的程序性能息息相关喽!为了举例说明这一点,我们先简要说明一下“链表”这种数据结构(后期会有相应文章讲解“链表”)。所谓“链表”,可以视作是“扩展的数组”,它与数组的不同之处在于其“元素”个数是不确定的(数组在创建时就需要指定大小,也就指定了元素个数),且“元素”间的位置也不再是相邻的。“链表”初始化后表内是没有“元素”空间的,当你需要添加元素时“链表”就在内存中随意找一个“元素”大小的空间加进“链表”中,然后写入数据到该空间。这样一来,“链表”就可以随着我们的需要动态地增大或减小其大小。至于为什么“元素不相邻却还能找到相关的其它元素”的原因,我们将在“链表”相应章节讲解,目前我们只需要知道其抽象概念及效果就好了。

现在,我们来假设一个程序(你也可以称为软件,可能会更高大上一点深入浅出数据结构C语言版(1)——什么是数据结构及算法),其接收用户的输入,当输入完全结束后,进行相应操作,然后输出结果。但是,已知用户的输入数量是不确定的,有时候只需要1、2MB内存来存储,而有时候高达几百MB,并且用户的内存就只有1GB可用,那么程序设计时,如果使用数组来暂存用户的输入,这个数组该是多大呢?(C程序数组的大小是创建时确定的,所以如果使用数组完成这项工作,你不得不考虑这个数组该是多大)如果数组设置成2MB大小,那么程序将无法应对用户大量输入的情况,而如果将数组设置为比如500MB,那么有可能大部分情况下准备的空间都是浪费的!深入浅出数据结构C语言版(1)——什么是数据结构及算法(如果只运行你这一个程序,浪费也就罢了,然而现在同时运行多个程序已经是常见的现象,若一个程序占用了过多的空间那么其它程序怎么办呢?)这个时候,显然“链表”才是该程序用于存储用户输入的更佳的数据结构。在特定的情况下,有的数据结构更合适而有的更不合适,我们要明白数据结构存在哪些选择,而哪个选择是更好的,才能写出更适合更优秀的程序。这就是为什么要学习数据结构的原因。

讲到这儿,数据结构的含义应该已经清楚了,接下来要说一说什么是算法。算法粗略地说就是“解决问题的方法”,而在编程中,我们解决问题往往就是处理数据(当然,广义的算法就是解决问题,比如先默认设置并进入下一步,有主动输入后再修改设置和必须输入后才完成设置进入下一步就可以说是两种算法,尽管它们与我们日后讨论的算法看起来不像是一种东西深入浅出数据结构C语言版(1)——什么是数据结构及算法)。比如最常听说的排序算法,就是将数据处理成排好顺序的状态。很多时候算法的优劣决定了程序的性能,当数据个数为数万个时,使用插入排序算法可能需要耗费几十秒的时间,而快速排序算法则只需要零点几秒,这显然是有巨大差别的,且数据越多这两者差别越大。因此,算法对于编程是极其重要的!深入浅出数据结构C语言版(1)——什么是数据结构及算法

那么,为什么数据结构与算法往往是一起讲解的呢?我们先好好地思考几个问题,然后应该就可以明白为什么了。首先,算法处理的是什么东西?显然是数据。那么数据是否需要被使用?毫无疑问是需要喽!那么,使用数据是不是就会用到算法呢?显然是的。想必这几个问题已经揭露了一个道理,就是:算法与数据是息息相关的。而数据的存储结构又是数据很重要的一项属性,所以我们说“算法需要有合适的数据结构支持,数据结构离开算法就没有什么意义”。基于这个原因,数据结构与算法往往都是要同时提起的。日后我们写的文章也会以提出某种情形——提出合适的数据结构——给出该数据结构相应的算法(比如链表),或者提出某种情形——提出合适的算法——选择合适的数据结构(比如二叉树)的形式来编排。

关于算法,还有很多其他需要了解的东西,比如时间复杂度、空间复杂度,但是限于篇幅,此处不予讨论,建议大家自己去了解,可以通过数据结构相关的书籍或是直接搜索相应的关键词。

上一篇:如何使用Ninja快速编译LLVM和Clang


下一篇:【Android环境搭建】解决安装使用SDK Manager更新时的问题