结构体的sizeof
结构体的sizeof涉及到字节对齐问题。
为什么需要字节对齐?计算机组成原理教导我们这样有助于加快计算机的取数速度,否则就得多花指令周期了。为此,编译器默认会对结构体进行处理(实际上其它地方的数据变量也是如此),让宽度为2的基本数据类型(short等)都位于能被2整除的地址上,让宽度为4的基本数据类型(int等)都位于能被4整除的地址上,依次类推。这样,两个数中间就可能需要加入填充字节,所以整个结构体的sizeof值就增长了。
字节对齐的细节和编译器的实现相关,但一般而言,满足三个准则:
1)结构体变量的首地址能够被其最宽基本类型成员的大小所整除。
2)结构体的每个成员相对于结构体首地址的偏移量(offset)都是成员大小的整数倍,如有需要,编译器会在成员之间加上填充字节(internal adding)。
3)结构体的总大小为结构体最宽基本类型成员大小的整数倍,如有需要,编译器会在最末一个成员后加上填充字节(trailing padding)。
注意:空结构体(不含数据成员)的sizeof值为1。试想一个“不占空间“的变量如何被取地址、两个不同的“空结构体”变量又如何得以区分呢,于是,“空结构体”变量也得被存储,这样编译器也就只能为其分配一个字节的空间用于占位了。
例子:
structS1
{
chara;
intb;
};
sizeof(S1);//值为8,字节对齐,在char之后会填充3个字节。
structS2
{
intb;
chara;
};
sizeof(S2);//值为8,字节对齐,在char之后会填充3个字节。
structS3
{
};
sizeof(S3);//值为1,空结构体也占内存。
联合体的sizeof
结构体在内存组织上市顺序式的,联合体则是重叠式,各成员共享一段内存;所以整个联合体的sizeof也就是每个成员sizeof的最大值。
例子:
unionu
{
inta;
floatb;
doublec;
chard;
};
sizeof(u);//值为8
数组的sizeof
数组的sizeof值等于数组所占用的内存字节数。
注意:1)当字符数组表示字符串时,其sizeof值将’/0’计算进去。
2)当数组为形参时,其sizeof值相当于指针的sizeof值。
例子1:
chara[10];
charn[]="abc";
cout<<"chara[10]"<<sizeof(a)<<endl;//数组,值为10
cout<<"charn[]=/"abc/""<<sizeof(n)<<endl;//字符串数组,将'/0'计算进去,值为4
例子2:
voidfunc(chara[3])
{
intc=sizeof(a);//c=4,因为这里a不在是数组类型,而是指针,相当于char*a。
}
voidfuncN(charb[])
{
intcN=sizeof(b);//cN=4,理由同上。
}
指针的sizeof
指针是用来记录另一个对象的地址,所以指针的内存大小当然就等于计算机内部地址总线的宽度。
在32位计算机中,一个指针变量的返回值必定是4。
指针变量的sizeof值与指针所指的对象没有任何关系。
例子:
char*b="helloworld";
char*c[10];
double*d;
int**e;
void(*pf)();
cout<<"char*b=/"helloworld/""<<sizeof(b)<<endl;//指针指向字符串,值为4
cout<<"char*b"<<sizeof(*b)<<endl;//指针指向字符,值为1
cout<<"double*d"<<sizeof(d)<<endl;//指针,值为4
cout<<"double*d"<<sizeof(*d)<<endl;//指针指向浮点数,值为8
cout<<"int**e"<<sizeof(e)<<endl;//指针指向指针,值为4
cout<<"char*c[10]"<<sizeof(c)<<endl;//指针数组,值为40
cout<<"void(*pf)();"<<sizeof(pf)<<endl;//函数指针,值为4
函数的sizeof
sizeof也可对一个函数调用求值,其结果是函数返回值类型的大小,函数并不会被调用。
对函数求值的形式:sizeof(函数名(实参表))
注意:1)不可以对返回值类型为空的函数求值。
2)不可以对函数名求值。
3)对有参数的函数,在用sizeof时,须写上实参表。
例子:
#include<iostream>
usingnamespacestd;
floatFuncP(inta,floatb)
{
returna+b;
}
intFuncNP()
{
return3;
}
voidFunc()
{
}
intmain()
{
cout<<sizeof(FuncP(3,0.4))<<endl;//OK,值为4,sizeof(FuncP(3,0.4))相当于sizeof(float)
cout<<sizeof(FuncNP())<<endl;//OK,值为4,sizeof(FuncNP())相当于sizeof(int)
/*cout<<sizeof(Func())<<endl;//error,sizeof不能对返回值为空类型的函数求值*/
/*cout<<sizeof(FuncNP)<<endl;//error,sizeof不能对函数名求值*/
}
---------------------
pragma pack的使用
这是给编译器用的参数设置,有关结构体字节对齐方式设置, #pragma pack是指定数据在内存中的对齐方式。
#pragma pack (n) 作用:C编译器将按照n个字节对齐。
#pragma pack () 作用:取消自定义字节对齐方式。
#pragma pack (push,1) 作用:是指把原来对齐方式设置压栈,并设新的对齐方式设置为一个字节对齐
#pragma pack(pop) 作用:恢复对齐状态
因此可见,加入push和pop可以使对齐恢复到原来状态,而不是编译器默认,可以说后者更优,但是很多时候两者差别不大
如:
#pragma pack(push) //保存对齐状态
#pragma pack(4)//设定为4字节对齐
相当于 #pragma pack (push,4)
#pragma pack (1) 作用:调整结构体的边界对齐,让其以一个字节对齐;<使结构体按1字节方式对齐>
#pragma pack ()
例如:
#pragma pack(1)
struct sample
{
char a;
double b;
};
#pragma pack()
注:若不用#pragma pack(1)和#pragma pack()括起来,则sample按编译器默认方式对齐(成员中size最大的那个)。即按8字节(double)对齐,则sizeof(sample)==16.成员char a占了8个字节(其中7个是空字节);若用#pragma pack(1),则sample按1字节方式对齐sizeof(sample)==9.(无空字节),比较节省空间啦,有些场和还可使结构体更易于控制。
应用实例
在网络协议编程中,经常会处理不同协议的数据报文。一种方法是通过指针偏移的方法来得到各种信息,但这样做不仅编程复杂,而且一旦协议有变化,程序修改起来也比较麻烦。在了解了编译器对结构空间的分配原则之后,我们完全可以利用这一特性定义自己的协议结构,通过访问结构的成员来获取各种信息。这样做,不仅简化了编程,而且即使协议发生变化,我们也只需修改协议结构的定义即可,其它程序无需修改,省时省力。下面以TCP协议首部为例,说明如何定义协议结构。其协议结构定义如下:
#pragma pack(1) // 按照1字节方式进行对齐
struct TCPHEADER
{
short SrcPort; // 16位源端口号
short DstPort; // 16位目的端口号
int SerialNo; // 32位序列号
int AckNo; // 32位确认号
unsigned char HaderLen : 4; // 4位首部长度
unsigned char Reserved1 : 4; // 保留6位中的4位
unsigned char Reserved2 : 2; // 保留6位中的2位
unsigned char URG : 1;
unsigned char ACK : 1;
unsigned char PSH : 1;
unsigned char RST : 1;
unsigned char SYN : 1;
unsigned char FIN : 1;
short WindowSize; // 16位窗口大小
short TcpChkSum; // 16位TCP检验和
short UrgentPointer; // 16位紧急指针
};
#pragma pack()