Data01-数据结构和算法绪论
一、数据结构和算法绪论
1.1 什么是数据结构?
数据结构是一门研究非数值计算的程序设计问题中的操作对象,以及它们之间的关系和操作等相关问题的学科。
程序设计=数据结构+算法
数据元素之间存在的一种或多种特定关系的集合
1.2 逻辑结构与物理结构
1、逻辑结构:数据对象中数据元素之间的相互关系。
集合结构:集合结构中的数据元素同属于一个集合
线性结构:线性结构中的关系为一对一
树形结构:数据元素之间存在着一对多的关系
图形结构:图形结构的数据元素是多对多的关系
2、物理结构:数据逻辑结构在计算机中的存储形式。
如何吧数据元素存储到计算机的存储器中。存储器主要针对内存而言的,像硬盘、软盘、光盘等外部存储器的数据组织通常用用文件结构来描述。
1.3 数据元素的存储形式
数据元素的存储形式有顺序存储结构、链式存储结构
顺序存储结构:把数据元素存储在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的。
链式存储结构:把数据元素存放在任意的存储单元里,这组存储单元可以是连续的也可以是不连续的。
二、算法
经典简单算法:1+2+3+4+……+100=?
2.1 什么是算法?
算法是解决特定问题我iu姐步骤的描述,在计算机中表现问指令的有限序列,并且每条指令表示一个或多个操作。
2.2 算法的特性
输入、输出、有穷行、确定性、可行性
1)输入:算法具有另个或多个输入
2)输出:算法至少有一个或多个输出
3)有穷性:算法在执行有限步骤之后,自动结束而不会出现无限循环,并且每一个步骤在可接受的时间内完成。
4)确定性:算法的每一个步骤都具有确定的含义,不会出现二义性。算法在一定条件下,只有一条执行路径,相同的输入只能有唯一的输出结果。
5)可性行:算法的每一步都必须是可行的,也就是说,每一步都能够通过执行有限次数完成。
2.3 算法设计的要求
1、正确性:
算法至少应该具有输入、输出和加工处理无歧义性、能正确反映问题的需求、能够得到问题的正确答案。大体分为以下四个层次:
(1)算法程序没有语法错误。
(2)算法程序对于合法输入能够产生满足要求的输出。
(3)算法程序对于非法输入能够产生满足规格的说明。
(4)算法程序对于故意刁难的测试输入都满足要求的输出结果。
2、可读性:
算法设计另一目的为了便于阅读、理解和交流。
3、健壮性:
当输入数据不合法时,算法也能做出相关处理,而不是产生异常、崩溃或莫名其妙的结果。
4、时间效率高和存储量低:
时间复杂度尽量低、空间复杂度尽量低。
三、时间复杂度和空间复杂度
3.1 算法效率的度量方法
1、事后统计方法:这种方法主要是通过设计好的测试程序和数据,利用计算机计时器对不同算法编制的程序运行时间进行比较,从而确定算法效率的高低。
事后统计方法的缺点:必须依据算法事先编好测试程序,通常要花费大量时间和精力。不同测试环境的差别也很大。
2、事前分析估算方法:在计算机程序编写前,依据统计方法对算法进行估算。
影响算法效率的因素:
1)算法采用的策略、方案
2)编译产生的代码质量
3)问题的输入规模
4)机器执行指令的速度
分析一个算法的运行时间时,重要的是要把基本操作的数量和输入模式关联起来。
3、函数的渐进增长:
给定函数f(n)和g(n),如果存在一个整数N,使得对于所有的n>N,f(n)总比g(n)大,那么,我们说f(n)的增长渐进快于g(n)。
注:加法常数对函数的影响不大
3.2 算法的时间复杂度
算法时间复杂度的定义:在进行算法分析时,语句总的执行次数T(n)是关于问题规模n的函数,进而分析T(n)随n的变化情况并确定T(n)的数量级。算法的时间复杂度,也就是算法的时间量度,记作:T(n)=O(f(n))。它表示随问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同,称作算法的渐近时间的增长率和f(n)的增长率相同,称作算法的渐进时间复杂度,简称为时间复杂度。其中f(n)是问题规模n的某个函数。
用O()来体现算法时间复杂度的记法。
一般情况下,随着输入规模的增大,T(n)增长最慢的算法为最优算法。
1、推倒O阶算法:
1)采用常数1取代运行时间中的所有加法常数。
2)在修改后的运行次数函数中,只保留最高阶项。
3)如果最高阶项存在且不是1,则去除与这个项相乘的常数。
4)得到最后的结果就是O阶。
常见O阶:
(1)常数阶:O(1)——非循环
(2)线性阶:O(n)——非嵌套循环
(3)平方阶:O(n^2)——2个嵌套循环
(4)对数阶:O(logn)——2^x=n得到x=log(2)n,所以循环复杂度为O(logn)
总结:循环的时间复杂度等于循环体的复杂度乘以该循环运行的次数。
2、函数调用的时间复杂度分析:
【例1】
public static void main(String[] args) {
int i;
int n = 10;
for(i=0; i<n; i++){
fn(i);
}
}
public static void fn(int count){
System.out.printf("%d",count);
}
分析:函数体是打印参数,fn函数的时间复杂度是O(1),所以整体的时间复杂度就是循环次数O(n)。
【例2】
public void fn1(int count){
int n = 10;
for(int j=count; j<n; j++){
System.out.printf("%d",j);
}
}
分析:fn1内部的循环次数随count的增加(接近n)而减少,所以根据算法的时间复杂度为O(n^2)。
【例3】
public static void main(String[] args) {
int i,j;
int n=0;
n++; //执行一次
fn(n,n); //执行n^2
for(i=0; i<n; i++){ //执行n^2
fn(i,n);
}
for(i=0; i<n; i++){ //执行n^2
for(j=i; j<n; j++){
System.out.println(j);
}
}
} public static void fn(int count, int n){
for(int j=count; j<n; j++){ //执行n
System.out.printf("%d",j);
}
}
分析:见代码注释,所有加在一起为1+3*n^2,根据计算规则可得算法时间复杂度为O(n^2)
3、常见时间复杂度举例:
4、常用时间复杂度所耗费的时间从小到大依次是:
O(1)<O(logn)<O(n)<O(nlogn)<O(n^2)<O(n^3)<O(2^n)<O(n!)<O(n^n)
3.3 最坏情况和平均情况
1、最坏运行时间是一种保证,在应用中,这是一种最重要的需求,通常除非特别指定,我们提到的运行时间都是最坏情况的运行时间。
2、平均运行时间是期望的运行时间。
3.4 算法的空间复杂度
写代码时,完全可以用空间来换取时间。
例:判断是否为闰年:
方法一:设计一种算法,对给定的一个数,通过计算判断是否为闰年。
方法二:先建立一个有2050个元素的数组然后把所有的年份按下标的数字对应,如果是闰年,则此数组元素的值是1,如果不是元素的值则为0,这样,所谓的判断某一年是否为闰年就变成了查找这个数组某一个元素的值的问题。
分析:方法一消耗CPU,方法二节省时间,消耗空间。这是一种典型的通过空间来换取时间的例子。
算法的空间复杂度定义:算法的空间复杂度通过计算算法所需的存储空间实现,算法的空间复杂度的计算公式记作:S(n)=O(f(n)),其中,n为问题规模,f(n)为语句关于n所占存储空间的函数。