1.1:数据结构课程的任务是:讨论数据的各种逻辑结构、在计算机中的存储结构以及各种操作的算法设计。
1.2:数据:是客观描述事物的数字、字符以及所有的能输入到计算机中并能被计算机接收的各种集合的统称。
数据元素:表示一个事物的一组数据称作是一个数据元素,是数据的基本单位。
数据项:是数据元素中有含义的、不可分割的最小标识单位。
数据结构概念包含三个方面:数据的逻辑结构、数据的存储结构的数据的操作。
1.3数据的逻辑结构指数据元素之间的逻辑关系,用一个数据元素的集合定义在此集合上的若干关系来表示,数据结构可以分为三种:线性结构、树结构和图。
1.4:数据元素及其关系在计算机中的存储表示称为数据的存储结构,也称为物理结构。
数据的存储结构基本形式有两种:顺序存储结构和链式存储结构。
1 / 21
. 2.1:算法:一个算法是一个有穷规则的集合,其规则确定一个解决某一特定类型问题的操作序列。算法规则需满足以下五个特性:
输入——算法有零个或多个输入数据。
输出——算法有一个或多个输出数据,与输入数据有某种特定关系。 有穷性——算法必须在执行又穷步之后结束。 确定性——算法的每个步骤必须含义明确,无二义性。
可行性——算法的每步操作必须是基本的,它们的原则上都能够精确地进行,用笔和纸做有穷次就可以完成。
有穷性和可行性是算法最重要的两个特征。
2.2:算法与数据结构:算法建立数据结构之上,对数据结构的操作需用算法来描述。
算法设计依赖数据的逻辑结构,算法实现依赖数据结构的存储结构。
2.3:算法的设计应满足五个目标:
正确性:算法应确切的满足应用问题的需求,这是算法设计的基本目标。 健壮性:即使输入数据不合适,算法也能做出适当的处理,不会导致不可控结 高时间效率:算法的执行时间越短,时间效率越高。 果。 高空间效率:算法执行时占用的存储空间越少,空间效率越高。
2 / 21
. 可读性:算法的可读性有利于人们对算法的理解。
2.4:度量算法的时间效率,时间复杂度,(课本39页)。
2.5:递归定义:即用一个概念本身直接或间接地定义它自己。递归定义有两个条件:
至少有一条初始定义是非递归的,如1!=1.
由已知函数值逐步递推计算出未知函数值,如用(n-1)!定义n!。 第二章:线性表
1.1线性表:线性表是由n(n>=0)个类型相同的数据元素a0,a1,a2,…an-1,组成的有限序列,记作: LinearList = (a0,a1,a2,…an-1)
其中,元素ai可以是整数、浮点数、字符、也可以是对象。n是线性表的元素个数,成为线性表长度。若n=0,则LinearList为空表。若n>0,则a0没有前驱元素,an-1没有后继元素,ai(01.2线性表的顺序存储是用一组连续的存单元依次存放线性表的数据元素,元素在存的物理存储次序与它们在线性表中的逻辑次序相同。
线性表的数据元素数据同一种数据类型,设每个元素占用c字节,a0的存储地址为
3 / 21
.
Loc(a0),则ai的存储地址Loc(ai)为:Loc(ai) = Loc(a0)+ i*c
数组是顺序存储的随机存储结构,它占用一组连续的存储单元,通过下标识别元素,元素地址是下标的线性函数。
1.3:顺序表的插入和删除操作要移动数据元素。平均移动次数是 属数据表长度的一半。(课本第50页)
1.4:线性表的链式存储是用若干地址分散的存储单元存储数据元素,逻辑上相邻的数据元素在物理位置上不一定相邻,必须采用附加信息表示数据元素之间的顺序关系。
它有两个域组成:数据域和地址域。通常成为节点。(课本第55页及56页)
1.5单链表(课本56页)
单链表的遍历:Node 单链表的插入和删除操作非常简便,只要改变节点间的关系,不需移动数据元素。 单链表的插入操作:1):空表插入/头插入 2)中间插入/尾插入 4 / 21 . if(head == null) Node { head = new Node }else{ p.next = q; Node q.next = head; 的头指针head。 head = q; } 单链表的删除操作: 头删除:head = head.next; 中间/尾删除:if(p.next!=null){ p.next = p.next.next;} 循环单链表:如果单链表最后一个节点的next链保存单链表的头指针head值,则该单链表成为环形结构,称为循环单链表。(课本67) 5 / 21 . 若rear是单链表的尾指针,则执行(rear.next=head;)语句,使单链表成为一条循环单链表。当head.next==head时,循环单链表为空。 1.6:双链表结构:双链表的每个结点有两个链域,分别指向它的前驱和后继结点, 当head.next==null时,双链表为空。 设p指向双链表中非两端的某个结点,则成立下列关系:p=p.next.prev=p.prev.next。 双链表的插入和删除:1)插入 2)删除 q=new DLinkNode(x); p.prev.next = p.next; q.prev=p.prev;q.next =p; if(p.next=null){ p.prev.next = q;p.prev=q; (p.next).prev = p.prev;} 循环双链表:当head.next==head且head.prev==head时,循环双链表为空。 第三章:栈和队列 6 / 21 . 1.1栈:栈是一种特殊的线性表,其中插入和删除操作只允许在线性表的一端进行。允许操作的一端称为栈顶,不允许操作的一端称为栈底。栈有顺序栈和链式栈。 栈中插入元素的操作称为入栈,删除元素的操作称为出栈。没有元素的中称为空栈。 栈的进出栈顺序:后进先出,先进后出。(及75页的思考题)。 1.2:队列:队列是一种特殊的线性表,其中插入和删除操作分别在线性表的两端进行。 向队列中插入元素的过程称为入队,删除元素的过程称为出对,允许入队的一端称为队尾,允许出队的一端称为对头。没有元素的队列称为空队列。队列是先进先出。 第四章:串 1.1:串是一种特殊的线性表,其特殊性在于线性表中的每个元素是一个字符。一个串记为: s=“s0s1s2…sn-1” 其中n>=0,s是串名,一对双引号括起来的字符序列s0s1s2…sn-1是串值,si(i=0,1,2,…n-1)为特定字符集合中的一个字符。一个串中包含的字符个数称为串的长度。 7 / 21 . 长度为0的串称为空串,记作“”,而由一个或多个空格字符构成的字符串称为空格串。 子串:由串s中任意连续字符组成的一个子序列sub称为s的子串,s称为sub的主串。子串的序号是指该子串的第一个字符在主串中的序号。 串比较:两个串可比较是否相等,也可比较大小。两个串(子串)相等的充要条件是两个串(子串)的长度相同,并且各对应位置上的字符也相同。 两个串的大小由对应位置的第一个不同字符的大小决定,字符比较次序是从头开始依次向后。当两个串长度不等而对应位置的字符都相同时,较长的串定义为较“大”。 第五章:数组和广义表 1.1:数组是一种数据结构,数据元素具有相同的数据类型。一维数组的逻辑结构是线性表,数组是线性表的扩展。 1.2:一维数组:一维数组采用顺序存储结构。一个一维数组占用一组连续的存储单元。 设数组第一个元素a0的存储地址为Loc(a0),每个元素占用c字节,则数组其他元素ai的存储地址Loc(ai)为: Loc(ai)= Loc(a0)+i*c 8 / 21 . 数组通过下标识别元素,元素地址是下标的线性函数。一个下标能够唯一确定一个元素,所划给的时间是O(1)。因此数组是随机存取结构,这是数组最大的优点。 1.3:数组的遍历:有两种次序:行主序和列主序。 行主序:以行为主序,按行递增访问数组元素,访问完第i行的所有元素之后再访问第i+1行的元素,同一行上按列递增访问数组元素。 a00,a01,…a0(n-1), a10,a11,…a1(n-1),…a(m-1)0,a(m-1)1,…,a(m-1)(n-1) 2)列主序:以列为主序,按列递增访问数组元素,访问完第j列的所有元素之后再访问第j+1列的元素,同一列上按列递增访问数组元素。 数组的存储结构:数组也是由多个一维数组组合而成,组合方式有一下两种。 静态数组的顺序存储结构:可按行主序和列主序进行顺序存储。 按行主序存储时,元素aij的地址为:Loc(aij)= Loc(a00)+(i*n+j)*c 按列主序存储时,Loc(aij)= Loc(a00)+(j*m+i)*c 9 / 21 . 动态数组的存储结构。 二维数组元素地址就是两个下标的线性函数。无论采用哪种存储结构,数组都是基于一维数组的,因此也只能进行赋值、取值两种存取操作,不能进行插入,删除操作。 第六章: 树是数据元素(结点)之间具有层次关系的非线性结构。在树结构中,除根以外的结点只有一个直接前驱结点,可以有零至多个直接后继结点。根没有前驱结点。 树是由n(n>=0)个结点组成的有限集合(树中元素通常称为结点)。N=0的树称为空树;n>0大的树T; 有一个特殊的结点称为根结点,它只有后继结点,没有前驱结点。 除根结点之外的其他结点分为m(m>=0)个互不相交的集合 T0,T1,T3……..,Tm-1,其中每个集合Ti(0<=i 10 / 21 . 结点的前驱结点称为其父母结点,反之,结点大的后继结点称为其孩子结点。一棵树中,只有根结点没有父母结点,其他结点有且仅有一个父母结点。 拥有同一个父母结点的多个结点之间称为兄弟结点。结点的祖先是指从根结点到其父母结点所经过大的所有结点。结点的后代是指该结点的所有孩子结点,以及孩子的孩子等。 结点的度是结点所拥有子树的棵数。度为0的结点称为叶子结点,又叫终端结点;树中除叶子结点之外的其他结点称为分支结点,又叫非叶子结点或非终端结点。树的度是指树中各结点度的最大值。 结点的层次属性反应结点处于树中的层次位置。约定根结点的层次为1,其他结点的层次是其父母结点的层次加1。显然,兄弟结点的层次相同。 树的高度或深度是树中结点的最大层次树。 设树中x结点是y结点的父母结点,有序对(x,y)称为连接这两个结点的分支,也称为边。 11 / 21 . 设(X0,X1,….,Xk-1)是由树中结点组成的一个序列,且(Xi,Xi+1)(0<=i 森林是m(m>=0)棵互不相干的树的集合。给森林加上一个根结点就变成一棵树,将树的根节点删除就变成森林。 二叉树的性质1:若根结点的层次为1,则二叉树第i层最多有2 的i-1次方(i>=1)个结点。 二叉树的性质2:在高度为k的二叉树中,最多有2的k次方减一个结点。 二叉树的性质3:设一棵二叉树的叶子结点数为n0,2度结点数为n2,则n0=n2+1。 一棵高度为k的满二叉树是具有2的k次方减一个结点的二叉树。满二叉树中每一层的结点数目都达到最大值。对满二叉树的结点进行连续编号,约定根节点的序号为0,从根节点开始,自上而下,每层自左至右编号。 12 / 21 . 一棵具有n个结点高度为k的二叉树,如果他的每个节点都与高度为k的满二叉树中序号为0~n-1 的结点一一对应,则这棵二叉树为为完全二叉树。 满二叉树是完全二叉树,而完全二叉树不一定是满二叉树。完全二叉树的第1~k-1层是满二叉树第k层不满,并且该层所有结点必须集中在该层左边的若干位置上。 二叉树的性质4:一棵具有n个结点的完全二叉树,其高度k=log2n的绝对值+1 二叉树的性质5:一棵具有n个结点的完全二叉树,对序号为i的结点,有 若i=0,则i为根节点,无父母结点;若i>0,则i的父母结点的序号为[(i-1)/2]。 若2i+1 13 / 21 . 二叉树的遍历是按照一定规则和次序访问二叉树中的所有结点,并且每个结点仅被访问一次。 二叉树的三种次序遍历 1:先根次序;访问根节点,遍历左子树,遍历右子树。 2:中根次序;遍历左子树,访问右子树,遍历右子树。 3:后根次序;遍历左子树,遍历右子树,访问根节点。 先根次序遍历时,最先访问根节点;后根次序遍历时,最后访问根节点;中根次序遍历时,左子树上的结点在根节点之前访问,右子树上的结点在根节点之后访问。 二叉树的插入和删除操作P147 二叉树的层次遍历P149 习题P167 6—10,6—19 第七章 14 / 21 . 图是由定点集合及顶点间的关系集合组成的一种数据关边系。顶点之间的关系成为边。一个图G记为G=(V,E),V是顶点A的有限集合,E是边的有限集合。即 V={A|A属于某个数据元素集合} 19 / 21 . for(int j=i+1;j if(min!=i){ int temp=table[i]; table[i]==table[min]; table[min]=temp; } } } } 20 / 21 . 堆排序是完全二叉树的应用,是充分利用完全二叉树特性的一种选择排序。 堆定义:设n个元素的数据序列{k0,k1,。。。。kn-1},当且仅当满足下列关系 k1<=k2i+1且ki<=k2i+2 i=0,1,2,3,….,[n/2-1] 或ki>==k2i+1且ki>=2i+2i=0,1,2,3,…..[n/2-1]时,序列{k0,k1…….kn-1}称为最小堆或最大堆。将最小(大)堆看成是一颗完全二叉树的层次遍历序列,则任意一个结点的关键字都小于等于(大于等于)它的孩子节点的关键字值,由此可知,根结点值最小(大)。根据二叉树的性质5,完全二叉树中的第i(0<=i
因篇幅问题不能全部显示,请点此查看更多更全内容min=j;