C语言学习之柔性数组详解

一、前言

仔细观察下面的代码，有没有看出哪里不对劲？

struct S
{
    int i;
    double d;
    char c;
    int arr[];
};

还有另外一种写法：

struct S
{
    int i;
    double d;
    char c;
    int arr[];
};

你应该一眼就看到了，结构体的最后一个成员数组的写法是int arr[];或者是int arr[0]，这两种写法是等价的，意思是这个数组的大小是不确定的、未知的、可以变化的。

C99允许这种特殊的结构体存在。这样的结构体满足下面两个条件：

1.最后一个成员变量是一个大小可以变化的数组。

2.这个成员数组前面至少有另外一个成员变量。

我们称这个大小可以变化的成员数组为柔性数组。

注意，柔性数组不能是结构体里唯一一个成员，下面的代码是不允许的：

struct S
{
    int arr[];
};

这篇文章里，我将重点探讨柔性数组的用法、内存分布以及和优势。

二、柔性数组的用法

我不建议在栈上直接定义有柔性数组的结构体，也就是这么写：

struct S s;

因为柔性数组的大小是可以变化的，我建议在堆上申请空间，采取动态内存管理的方法，这样就能发挥出柔性数组大小可以改变的优势。

假设我们使用malloc()函数来开辟空间，一开始应该malloc出多大的空间呢？要回答这个问题，首先我们要知道sizeof(struct S)是多少。

事实上，sizeof(struct S)计算出来的结果是该结构体不考虑柔性数组的大小。如果我们想要给柔性数组开辟空间，malloc出来的大小应该是sizeof(struct S)加上柔性数组的大小。

假设这个柔性数组在结构体中的声明是int arr[0];，我想给这个数组的大小是40个字节，这样这个数组就能存储10个int，那么一开始malloc的大小就应该是sizeof(struct S)+10*sizeof(int)，具体的例子如下：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>

int main()
{
	struct S* ps = (struct S*)malloc(sizeof(struct S) + * sizeof(int));
	if (ps == NULL)
	{
		printf("malloc()->%s\n", strerror(errno));
		return;
	}

	return;
}

该结构体中的i,d,c等变量可以正常使用。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>

int main()
{
	struct S* ps = (struct S*)malloc(sizeof(struct S) + * sizeof(int));
	if (ps == NULL)
	{
		printf("malloc()->%s\n", strerror(errno));
		return;
	}

	ps->i =;
	ps->d =.14;
	ps->c = 'F';

	return;
}

柔性数组也可以像正常的数组一样访问，比如把1~10放进去。注意此时这个数组的容量是10个int，不能越界访问。使用的例子如下：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>

int main()
{
	struct S* ps = (struct S*)malloc(sizeof(struct S) + * sizeof(int));
	if (ps == NULL)
	{
		printf("malloc()->%s\n", strerror(errno));
		return;
	}

	ps->i =;
	ps->d =.14;
	ps->c = 'F';

	for (int i =; i < 10; i++)
	{
		ps->arr[i] = i +;
	}

	for (int i =; i < 10; i++)
	{
		printf("%d ", ps->arr[i]);
	}
	printf("\n");

	return;
}

我们还可以对柔性数组扩容，如果我们想让这个柔性数组的容量是20个int，整个结构体的新的大小就是sizeof(struct S)+20*sizeof(int)，因为sizeof(struct S)是不考虑柔性数组的大小时计算的结构体大小。只需要对ps进行realloc就行了。实现代码如下：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>

int main()
{
	struct S* ps = (struct S*)malloc(sizeof(struct S) + * sizeof(int));
	if (ps == NULL)
	{
		printf("malloc()->%s\n", strerror(errno));
		return;
	}

	ps->i =;
	ps->d =.14;
	ps->c = 'F';

	for (int i =; i < 10; i++)
	{
		ps->arr[i] = i +;
	}

	for (int i =; i < 10; i++)
	{
		printf("%d ", ps->arr[i]);
	}
	printf("\n");

	struct S* tmp = (struct S*)realloc(ps, sizeof(struct S) + * sizeof(int));
	if (tmp == NULL)
	{
		printf("realloc()->%s\n", strerror(errno));
		return;
	}
	else
	{
		ps = tmp;
	}

	return;
}

扩容后的柔性数组的空间更大了，我们可以把11~20都放进去。实现代码如下：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>

int main()
{
	struct S* ps = (struct S*)malloc(sizeof(struct S) + * sizeof(int));
	if (ps == NULL)
	{
		printf("malloc()->%s\n", strerror(errno));
		return;
	}

	ps->i =;
	ps->d =.14;
	ps->c = 'F';

	for (int i =; i < 10; i++)
	{
		ps->arr[i] = i +;
	}

	for (int i =; i < 10; i++)
	{
		printf("%d ", ps->arr[i]);
	}
	printf("\n");

	struct S* tmp = (struct S*)realloc(ps, sizeof(struct S) + * sizeof(int));
	if (tmp == NULL)
	{
		printf("realloc()->%s\n", strerror(errno));
		return;
	}
	else
	{
		ps = tmp;
	}

	for (int i =; i < 20; i++)
	{
		ps->arr[i] = i +;
	}
	
	for (int i =; i < 20; i++)
	{
		printf("%d ", ps->arr[i]);
	}

	return;
}

当然最后别忘了free掉ps，否则会导致内存泄漏。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>

int main()
{
	struct S* ps = (struct S*)malloc(sizeof(struct S) + * sizeof(int));
	if (ps == NULL)
	{
		printf("malloc()->%s\n", strerror(errno));
		return;
	}

	ps->i =;
	ps->d =.14;
	ps->c = 'F';

	for (int i =; i < 10; i++)
	{
		ps->arr[i] = i +;
	}

	for (int i =; i < 10; i++)
	{
		printf("%d ", ps->arr[i]);
	}
	printf("\n");

	struct S* tmp = (struct S*)realloc(ps, sizeof(struct S) + * sizeof(int));
	if (tmp == NULL)
	{
		printf("realloc()->%s\n", strerror(errno));
		return;
	}
	else
	{
		ps = tmp;
	}

	for (int i =; i < 20; i++)
	{
		ps->arr[i] = i +;
	}
	
	for (int i =; i < 20; i++)
	{
		printf("%d ", ps->arr[i]);
	}

	free(ps);
	ps = NULL;

	return;
}

对于柔性数组的使用，在上面的例子中，可以总结出几个要点：

1.malloc出来的大小是sizeof(struct S)加上柔性数组的大小，calloc同理。

2.扩容时realloc出来的新大小也是sizeof(struct S)加上柔性数组的新大小。

3.每次使用malloc和realloc等函数时，需要检查返回值，否则可能导致对NULL指针的解引用（这点是动态内存管理的常识了）。

4.一定要记得柔性数组的容量是多少，不要越界访问了，空间不够记得扩容。

5.记得free，防止内存泄漏。

三、柔性数组的内存分布

柔性数组是结构体的一个成员数组，在前面的例子中，整个结构体都是在堆上malloc出来的。此时，整个结构体都存储在堆上的一块连续的空间里，包括前面几个成员变量i,d,c和柔性数组arr。也就是这样：

只不过数组arr的大小是可以改变的，所以叫“柔性数组”。

有些朋友可能会说了，我不需要柔性数组也能实现类似这样的效果呀！我在结构体里存一个指针，指向一块malloc出来的空间，这块空间也是堆上的，可以动态管理。也就是说，像下面这样定义结构体：

struct S
{
    int i;
    double d;
    char c;
    int* arr;
};

这样似乎还简单一点，先malloc出一个struct S出来，malloc的大小就是sizeof(struct S)，像这样：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>

int main()
{
	struct S* ps = (struct S*)malloc(sizeof(struct S));
	if (ps == NULL)
	{
		printf("malloc()->%s\n", strerror(errno));
		return;
	}

	return;
}

然后再malloc出10个int的大小出来，用结构体中的arr指针来管理这块空间，像这样：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>

int main()
{
	struct S* ps = (struct S*)malloc(sizeof(struct S));
	if (ps == NULL)
	{
		printf("malloc()->%s\n", strerror(errno));
		return;
	}

	ps->arr = (int*)malloc( * sizeof(int));
	if (ps->arr == NULL)
	{
		printf(": malloc()->%s\n", strerror(errno));
		return;
	}

	return;
}

此时arr就可以当成一个数组来使用了，比如把1~10放进去。同样还是要注意不要越界访问。示例代码如下：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>

int main()
{
	struct S* ps = (struct S*)malloc(sizeof(struct S));
	if (ps == NULL)
	{
		printf("malloc()->%s\n", strerror(errno));
		return;
	}

	ps->arr = (int*)malloc( * sizeof(int));
	if (ps->arr == NULL)
	{
		printf(": malloc()->%s\n", strerror(errno));
		return;
	}

	for (int i =; i < 10; i++)
	{
		ps->arr[i] = i +;
	}
	
	for (int i =; i < 10; i++)
	{
		printf("%d ", ps->arr[i]);
	}
	printf("\n");

	return;
}

你如果觉得空间不够，还可以扩容。比如，你可以把结构体中的arr进行realloc，新的大小能存放20个int。示例代码如下：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>

int main()
{
	struct S* ps = (struct S*)malloc(sizeof(struct S));
	if (ps == NULL)
	{
		printf("malloc()->%s\n", strerror(errno));
		return;
	}

	ps->arr = (int*)malloc( * sizeof(int));
	if (ps->arr == NULL)
	{
		printf(": malloc()->%s\n", strerror(errno));
		return;
	}

	for (int i =; i < 10; i++)
	{
		ps->arr[i] = i +;
	}
	
	for (int i =; i < 10; i++)
	{
		printf("%d ", ps->arr[i]);
	}
	printf("\n");

	int* tmp = (int*)realloc(ps->arr, * sizeof(int));
	if (tmp == NULL)
	{
		printf("realloc()->%s\n", strerror(errno));
		return;
	}
	else
	{
		ps->arr = tmp;
	}

	return;
}

此时，你就可以把11~20也放进去。实现代码如下：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>

int main()
{
	struct S* ps = (struct S*)malloc(sizeof(struct S));
	if (ps == NULL)
	{
		printf("malloc()->%s\n", strerror(errno));
		return;
	}

	ps->arr = (int*)malloc( * sizeof(int));
	if (ps->arr == NULL)
	{
		printf(": malloc()->%s\n", strerror(errno));
		return;
	}

	for (int i =; i < 10; i++)
	{
		ps->arr[i] = i +;
	}

	for (int i =; i < 10; i++)
	{
		printf("%d ", ps->arr[i]);
	}
	printf("\n");

	int* tmp = (int*)realloc(ps->arr, * sizeof(int));
	if (tmp == NULL)
	{
		printf("realloc()->%s\n", strerror(errno));
		return;
	}
	else
	{
		ps->arr = tmp;
	}

	for (int i =; i < 20; i++)
	{
		ps->arr[i] = i +;
	}

	for (int i =; i < 20; i++)
	{
		printf("%d ", ps->arr[i]);
	}

	return;
}

最后别忘了把arr和ps都free掉，而且顺序不能错了。如果你先free掉了ps，结构体就没了，里面的arr就成为了野指针，内存就泄露了。实现代码如下：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>

int main()
{
	struct S* ps = (struct S*)malloc(sizeof(struct S));
	if (ps == NULL)
	{
		printf("malloc()->%s\n", strerror(errno));
		return;
	}

	ps->arr = (int*)malloc( * sizeof(int));
	if (ps->arr == NULL)
	{
		printf(": malloc()->%s\n", strerror(errno));
		return;
	}

	for (int i =; i < 10; i++)
	{
		ps->arr[i] = i +;
	}

	for (int i =; i < 10; i++)
	{
		printf("%d ", ps->arr[i]);
	}
	printf("\n");

	int* tmp = (int*)realloc(ps->arr, * sizeof(int));
	if (tmp == NULL)
	{
		printf("realloc()->%s\n", strerror(errno));
		return;
	}
	else
	{
		ps->arr = tmp;
	}

	for (int i =; i < 20; i++)
	{
		ps->arr[i] = i +;
	}

	for (int i =; i < 20; i++)
	{
		printf("%d ", ps->arr[i]);
	}

	free(ps->arr);
	ps->arr = NULL;
	free(ps);
	ps = NULL;

	return;
}

那这种实现的内存分布是怎么样的呢？这个结构体是存储在堆上的，用ps来管理，结构体里的一个指针arr又指向了堆上的另一块空间，如下图：

这种实现方式和柔性数组的方式感觉差不多呀！都是在堆上有个结构体，结构体里有个大小可以变化的数组。那为什么非要搞出来个柔性数组的概念呢？那是因为，柔性数组有它独特的优势。

四、柔性数组的优势

前面我们先用柔性数组实现了一种效果，又不使用柔性数组实现了相似的效果，对比两种实现方式，我们可以做一些总结：

1.使用上：柔性数组malloc了一次，free了一次；不使用柔性数组要malloc两次，free两次。柔性数组的使用更加简单，不容易出错。如果不使用柔性数组，可能会忘记free掉结构体里的arr指针，导致内存泄漏。

2.效率上：柔性数组的存储空间是连续的，访问时效率更高。

所以，虽然有相似的效果，我更推荐使用柔性数组的方式。

五、总结

在这篇博客里，重点需要掌握以下几点：

1.如果结构体里最后一个成员变量是一个数组，并且大小可以变化，这个成员数组就叫做柔性数组。一个结构体里，除了柔性数组外必须至少有一个成员变量。

2.使用sizeof计算含有柔性数组的结构体大小时，只计算除柔性数组之外的空间大小。

3.使用柔性数组，比不使用柔性数组操作更加简单，不易出错，且效率更高。