数据结构
“”"
基础概念:
程序 = 数据结构 + 算法
数据结构 = 存储和组织数据的方式.
算法 = 解决问题的思维, 思路, 方式.
算法的特性:
独立性: 算法 = 思维, 是解决问题的思路和方式, 不依赖语言.
5大特性: 有输入, 有输出, 有穷性, 确定性, 可行性.
问: 如何衡量算法的优劣?
答: 时间复杂度.
例如: 下述的两个代码, 执行时长为: 代码的总步骤 * 每步的基本时间
方式1: 1001³ * 9 * 每步的基本时间
方式2: 1001² * 9 * 每步的基本时间
虽然上述的方式可以计算代码执行时间, 但是我们在考虑算法的时间复杂度的时候, 只考虑 主要条件, 而会忽略次要条件.
时间复杂度介绍:
它适用于衡量算法的优劣的, 一般采用大O标记法, 把次要条件都忽略, 最终形成的表达式就叫: 大O标记法.
名词解释:
问题规模: 程序(算法)的计算量, 计算范围...
主要条件: 随着问题规模变化而变化的代码.
次要条件: 随着问题规模变化而不变的代码.
计算方式:
常数项: O(1)
顺序结构: 加法
分支结构: 最高次项
循环结构: 乘法
分析的时候, 只参考 主要条件, 忽略 次要条件 和 常数项.
如果没有特殊说明的情况下, 我们分析时间复杂度, 指的都是: 最坏时间复杂度.
最优时间复杂度: 最理想, 最乐观的状态, 算法需要的最少步骤.
最坏时间复杂度: 算法的保证, 最多需要多少步能计算出结果.
常用的时间复杂度介绍:
从低到高分别是:
常数阶 < 对数阶 < 线性阶 < 常数对数阶 < 平方阶 < 立方阶
O(1) < O(logn) < O(n) < O(nlogn) < O(n²) < O(n³)
空间复杂度(了解):
概述: 算法执行过程中, 临时占用的内存空间大小.
分类:
O(1) < O(logn) < O(n) < O(n²) < O(n³)
细节:
内存是通过 字节 的形式来存储数据的, 每块空间都有自己的地址值.
“”"
import time
# 需求: 演示算法 -> 穷举法. 已知: a² + b² = c², 且 a + b + c = 1000, 问: a,b,c可以是哪些组合.
start = time.time()
# 方式1: 穷举法, 3层循环嵌套.
for a in range(0, 1001):
for b in range(0, 1001):
for c in range(0, 1001):
# if a + b + c == 1000 and a ** 2 + b ** 2 == c ** 2: # 122秒
if a ** 2 + b ** 2 == c ** 2 and a + b + c == 1000: # 235秒
print(a, b, c)
end = time.time()
print(f'程序共执行了: {(end - start):.2f} 秒') # 122.01秒
# 方式2: 穷举法 + 代入法, 2层循环嵌套.
start = time.time()
# 方式1: 穷举法, 3层循环嵌套.
for a in range(0, 1001):
for b in range(0, 1001):
c = 1000 - a - b
if a ** 2 + b ** 2 == c ** 2:
print(a, b, c)
end = time.time()
print(f'程序共执行了: {(end - start):.2f} 秒') # 0.34s
“”"
数据结构介绍:
概述:
数据结构 = 存储,组织属于的方式, 也是算法解决问题时的载体.
分类:
线性结构
非线性结构
线性结构:
特点:
每个节点有且只能有1个前驱节点(父节点) 和 1个后继节点(子节点)
举例:
栈, 队列, 链表...
分类:
顺序表:
概述:
采用 连续 的内存空间来存储.
根据存储方式不同, 又分为:
一体式存储: 信息区 和 数据区在一起.
分离式存储: 信息区 和 数据区分开存储.
扩容策略:
一体式: 扩容时, 信息区和数据区整体搬迁.
分离式: 只搬迁数据区, 然后用信息区重新关联即可.
思路:
方式1: 每次增加固定的容量, 假设: 每次扩容增加100个字节. 拿时间换空间.
方式2: 每次扩容容量翻倍. 拿空间换时间(推荐做法).
链表:
概述:
采用 非连续 的内存空间来存储.
非线性结构:
特点:
每个节点都可以有多个前驱节点(父节点) 和 多个后继节点(子节点)
举例:
树
图
...
“”"
"""
链表介绍:
概述:
它属于数据结构的一种, 属于: 线性结构(每个节点都只能有1个前驱节点 和 1个后继节点)
回顾: 顺序表的弊端
扩容时要求有足够的连续的内存空间, 否则扩容失败.
链表扩容:
比较简单, 有地儿就行, 可以不连续, 最后通过"链条"连接起来.
链表 = 通过 一条线把各个节点链接起来, 形成一个 链条就叫: 链表.
组成:
元素域(数值域) + 链接域(地址域)
分类:
单向链表:
每个节点由 元素域(数值域) + 链接域(地址域), 前边节点的链接域指向后1个节点的地址, 最后1个节点的链接域为: None.
单向循环链表:
每个节点由 元素域(数值域) + 链接域(地址域), 前边节点的链接域指向后1个节点的地址, 最后1个节点的链接域为: 第1个节点的地址.
双向链表:
每个节点由 链接域(地址域) + 元素域(数值域) + 链接域(地址域),
每个节点的链接域会分别指向: 前, 后节点的地址.
第1个节点的: 前链接域(地址域) 和 最后1个节点的 后链接域(地址域)为 None
双向循环链表:
每个节点由 链接域(地址域) + 元素域(数值域) + 链接域(地址域),
每个节点的链接域会分别指向: 前, 后节点的地址.
第1个节点的: 前链接域(地址域) 指向最后1个节点的 地址.
最后1个节点的 后链接域(地址域)指向第1个节点的 地址.
需求:
自定义代码, 采用面向对象思维, 模拟链表.
"""
“”"
案例: 自定义代码, 采用面向对象思维, 模拟: (单向)链表.
回顾:
链表 由节点组成, 节点 = 数值域(元素域) + 地址域(链接域)
分析:
节点类: SingleNode
属性:
item: 数值域(元素域)
next: 地址域(链接域)
链表类: SingleLinkedList
属性:
head: 指向头结点
“”"
# 定义节点类
class SingleNode(object):
def __init__(self, item):
self.item = item
self.next = None
#定义链表类
class SingleLinkedList(object):
def __init__(self, head=None):
self.head = head
# 判断链表为空
def is_Empty(self):
return self.head == None
# 返回链表长度
def length(self):
cur = self.head
count = 0
while cur is not None:
count += 1
cur = cur.next
return count
# 遍历打印链表
def travel(self):
cur = self.head
count = 0
while cur is not None:
print(cur.item)
cur = cur.next
# 链表头部增加元素
def add(self, item):
new_node = SingleNode(item)
new_node.next = self.head
self.head = new_node
# 链表尾部添加元素
def append(self, item):
new_node = SingleNode(item)
if self.is_Empty():
self.head = new_node
else:
cur = self.head
while cur.next is not None:
cur = cur.next
cur.next = new_node
if __name__ == '__main__':
# 创建对象
s1 = SingleLinkedList()
# 测试判空函数
print(s1.is_Empty())
# 测试添加元素
s1.add('坤坤')
# 测试遍历元素
s1.travel()
# 测试在尾部添加数据
s1.append('鸡叫')
# 测试遍历元素
s1.travel()