深入理解C指针之六:指针和结构体
C的结构体可以用来表示数据结构的元素,比如链表的节点,指针是把这些元素连接到一起的纽带。 结构体增强了数组等集合的实用性,每个结构体可以包含多个字段。如果不用结构体,可能要分别为每个字段声明一个数组,使用结构体,可以声明一个结构体的数组来组合这些字段。
结构体基础
声明结构体的方式有很多种,这里先讨论两种:
//第一种声明方式
struct person{
char* firstname;
char* secondname;
char* title;
unsigned int age;
};
//第二种声明方式
typedef struct _person{
char* firstname;
char* secondname;
char* title;
}Person;
可以直接使用Person声明一个该结构体的实例,使用点表示法来访问其字段,也可以声明一个指向该结构体的指针,使用箭头操作符访问字段。
Person myperson;
myperson.firstname = (char*) malloc (strlen("jack") + 1);
strcpy(myperson.firstname,"jack");
myperson.age = 18;
Person* ptrPerson;
ptrPerson = (Person*) malloc (sizeof(Person));
ptrPerson -> firstname = (char*) malloc (strlen("rose") +1);
strcpy(ptrPerson -> firstname, "rose");
ptrPerson -> age = 16;
对于指针的箭头写法 ptrPerson -> age,你也可以使用解引+点的写法 (*ptrPerson).age来代替。这样写稍微复杂了一些而已。
为结构体分配内存时,分配的内存大小至少是各个字段的长度和。不过,实际长度通常大于这个值,结构体的各个字段之间可能会有填充。如果某些数据类型需要对齐到边界,就会产生填充。比如,短整数通常对其到能被2整除的地址上,整数对齐到能被4整除的地址上。这意味着:
* 谨慎使用算数运算符;
* 结构体数组的元素之间可能存在额外的内存。
printf("size of person is %d\n", sizeof(myperson));//size of person is 16
typedef struct _otherPerson{
char* firstname;
char* secondname;
char* title;
short age;
}OtherPerson;
OtherPerson otherPerson;
printf("size of otherperson is %d\n", sizeof(otherPerson));//size of otherperson is 16
把 int 改成 short ,发现结构体的大小还是16个字节,这是因为在 short age 处产生了填充。short类型实际还是占用了2个字节,只不过内存里产生了“缝隙”而已。
释放结构体
在为结构体分配内存时,运行时系统不会自动为结构体内部的指针分配内存。当结构体消失时,运行时系统也同样不会为其指针释放内存。假如我们声明了一个Person的结构体,Person person,然后为person的指针动态分配内存,那么使用完毕后必须记得手动释放动态分配的内存。因为person是一个局部变量,函数返回后person会消失,我们如果忘记释放内存,会导致内存泄露。如果使用Person* ptrPerson的方式,还要连ptrPerson的内存也释放掉。
重复分配然后释放结构体会产生一些开销,可能造成巨大的性能瓶颈。一个解决办法是为分配的结构体维护一个表。当用户不再需要某个结构体实例时,将其返回池中。当需要时,从池中获取一个对象。如果池中没有可用元素,就动态分配一个实例。这种方法能够按需使用和重复使用内存。可以用数组或链表等维护结构体池。如果使用数组来管理,需要注意数组的长度应该合适,不能太长或太短。
指针与数据结构
指针可以为数据结构提供更多的灵活性。这些灵活性可能来自动态内存分配,也可能来自切换指针引用的便利。内存无需像数组那样是连续的,只要总的内存大小正确就行。我们使用一个 Empolyee 结构体来说明几种常见数据结构。
typedef struct _empolyee{
char name[32];
unsigned char age;
}Empolyee;
typedef int (*COMPARE) (void*, void*);
typedef void(*DISPLAY) (void*);
int compareEmpolyee(Empolyee* e1, Empolyee* e2){
return strcmp(e1 -> name, e2 -> name);
}
void displayEmpolyee(Empolyee* e){
printf("name is %s age is %d\n", e-> name, e-> age);
}
链表是由一系列互相连接的节点组成的数据结构。通常会有一个节点成为头节点,其它节点顺序跟在头节点后面,最后一个节点称为尾节点。我们可以使用指针动态分配每个节点。链表有好几种类型,最简单的是单链表,一个节点到下一个节点只有一个连接,连接从头节点开始,到尾结点结束。循环链表没有尾节点,链表的最后一个节点又指向头节点。双链表用了两个链表,一个向前链接,一个向后链接,可以在两个方向上查找节点。
这张图大致描述了不同链表之间的链接方法。下面看一下怎么用结构体和指针实现一个简单的链表。
#include
#include
#include
typedef struct _employee{
char name[32];
unsigned char age;
}Employee;
typedef int (*COMPARE) (void*, void*);
typedef void(*DISPLAY) (void*);
typedef struct _node{
void* data;
struct _node* next;
}Node;
typedef struct _linkedList{
Node* head;
Node* tail;
Node* current;
}LinkedList;
int compareEmployee(Employee* e1, Employee* e2){
return strcmp(e1 -> name, e2 -> name);
}
void displayEmployee(Employee* e){
printf("name is %s age is %d\n", e-> name, e-> age);
}
void initializeList(LinkedList* list){
list -> head = NULL;
list -> tail = NULL;
list -> current = NULL;
}
void addHead(LinkedList* list, void* data){
Node* node = (Node*) malloc (sizeof(Node));
node -> data = data;
if(list -> head == NULL){
list -> tail = node;
node -> next = NULL;
}
else{
node -> next = list -> head;
}
list -> head = node;
}
void addTail(LinkedList* list, void* data){
Node* node = (Node*) malloc (sizeof(Node));
node -> data = data;
node -> next = NULL;
if(list -> head == NULL){
list -> head = node;
}
else{
list -> tail -> next = node;
}
list -> tail = node;
}
void delete(LinkedList* list, Node* node){
if(node == list -> head){
if(list -> head -> next ==NULL){
list -> head = list -> tail = NULL;
}
else
{
list -> head = list -> head -> next;
}
}
else
{
Node* tmp = list -> head;
while(tmp != NULL && tmp->next !=node)
{
tmp = tmp -> next;
}
if(tmp != NULL){
tmp -> next = node -> next;
}
if(node == list -> tail){
list -> tail = tmp;
}
}
free(node);
}
void displayList(LinkedList* list, DISPLAY display){
printf("\n********linkedlist********\n");
Node* current = list -> head;
while(current != NULL){
display(current -> data);
current = current -> next;
}
}
main(){
LinkedList linkedList;
Employee *samuel = (Employee*) malloc (sizeof(Employee));
strcpy(samuel -> name,"Samuel");
samuel -> age = 15;
Employee *sally = (Employee*) malloc (sizeof(Employee));
strcpy(sally -> name,"Sally");
sally -> age = 12;
Employee *susan = (Employee*) malloc (sizeof(Employee));
strcpy(susan -> name,"Susan");
susan -> age = 18;
initializeList(&linkedList);
addHead(&linkedList, samuel);
addHead(&linkedList, sally);
addTail(&linkedList, susan);
displayList(&linkedList, (DISPLAY)displayEmployee);
Node* getNode(LinkedList* list, COMPARE compare, void* data){
Node* node = list -> head;
while(node != NULL){
if(compare(node->data,data) == 0){
return node;
}
node = node -> next;
}
return NULL;
}
Node* susanNode = getNode(&linkedList, (int (*)(void*,void*))compareEmployee, susan);
delete(&linkedList, susanNode);
displayList(&linkedList, (DISPLAY)displayEmployee);
}
addHead 和 addTail 负责往链表的头部和尾部添加新的节点。getNode 通过一个函数指针根据数据查找节点,然后在删除节点的时候把节点传给删除函数。总体来说这个示例非常直白简单。
队列是一种线性数据结构,通常支持两种操作:入队和出队。入队操作把元素添加到队列中,出队操作从队列中删除元素。一般来说,第一个添加到队列的元素也是第一个离开队列的元素,这种行为被称为先进先出。
可以用链表实现队列。入队操作就是添加到链表头,出队操作就是从链表尾删除节点。我们需要再定义一个从链表尾删除节点的方法来支持队列操作。
void deleteTail(LinkedList* list){
Node* node = list -> tail;
if(node == NULL){
}
else
{
if(list -> head == list -> tail){
list -> head = list -> tail = NULL;
}
else
{
Node* tmp = list -> head;
while( tmp -> next != list -> tail){
tmp = tmp -> next;
}
list -> tail = tmp;
tmp = tmp -> next;
list -> tail -> next = NULL;
free(tmp);
}
}
}
栈数据结构也是一种链表。对于栈,元素被推入栈顶,然后被弹出。当多个元素被推入和弹出时,栈的行为是先进后出。
可以用链表来实现栈操作。入栈可以使用 addHead 函数实现,出栈操作需要再定义一个删除头节点的函数。
void deleteHead(LinkedList* list){
Node* node = list -> head;
if(node == NULL){
}
else
{
if(list -> head == list -> tail ){
list -> head = list -> tail = NULL;
free(node);
}
else
{
list -> head = list -> head -> next;
free(node);
}
}
}
最后来看看树。树的子节点连接到父节点,从整体看就像一颗倒过来的树,根节点表示 这种数据结构的开始元素。树可以有任意数量的子节点,但是二叉树比较常见,它的每个节点能有0个、1个或2个子节点。子节点要么是左节点,要么是右节点。没有子节点的节点称为叶子节点。我们可以动态分配节点,按需插入树中。
按照特定顺序向树中插入节点是很有意义的,这样可以让查询等操作变得容易。比如:插入新节点后,这个节点的所有左子节点的值都比父节点小,所有右子节点的值都比父节点的值大,这样的树称为二叉查找树。
typedef struct _tree{
void* data;
struct _tree* left;
struct _tree* right;
}TreeNode;
void insertNode(TreeNode** root, COMPARE compare, void* data){
TreeNode* node = (TreeNode*) malloc (sizeof(TreeNode));
node -> data = data;
node -> left = NULL;
node -> right = NULL;
if(*root == NULL){
*root = node;
return;
}
while(1){
if(compare((*root) -> data, data) > 0){
if((*root) -> left != NULL){
*root = (*root) -> left;
}
else{
(*root) -> left = node;
break;
}
}
else{
if((*root) -> right != NULL){
*root = (*root) -> right;
}
else
{
(*root) -> right = node;
break;
}
}
}
}
void inOrder(TreeNode* root, DISPLAY display){
if(root!=NULL){
inOrder(root -> left, display);
display(root -> data);
inOrder(root -> right, display);
}
}
void postOrder(TreeNode* root, DISPLAY display){
if(root!=NULL){
inOrder(root -> left, display);
inOrder(root -> right, display);
display(root -> data);
}
}
void preOrder(TreeNode* root, DISPLAY display){
if(root!=NULL){
display(root -> data);
inOrder(root -> left, display);
inOrder(root -> right, display);
}
}
TreeNode* tree = NULL;
insertNode(&tree,(COMPARE) compareEmployee, samuel);
insertNode(&tree,(COMPARE) compareEmployee, sally);
insertNode(&tree,(COMPARE) compareEmployee, susan);
inOrder(tree, (DISPLAY)displayEmployee);
postOrder(tree, (DISPLAY)displayEmployee);
preOrder(tree, (DISPLAY)displayEmployee);
这里实现了一个插入节点的方法,以及三种顺序的遍历树的方法。插入节点是按照大小排序来插入的,遍历树则根据何时执行操作(这里是display)分为中序(inOrder)、前序(preOrder)、后序(postOrder)三种方法。
* 中序:先往左,访问节点,再往右。
* 前序:访问节点,往左,再往右。
* 后序:往左,往右,再访问节点。
当然,你也可以自己定义把左边和右边完全翻转过来,先右边后左边。