为什么GUI显示字符串的时候能识别长度,用sizeof和strlen 不能得到正确的长度。

为什么GUI显示字符串的时候能识别长度,用sizeof和strlen 不能得到正确的长度。

 

 

  1.     sizeof(...)是运算符,在头文件中typedefunsigned int,其值在编译时即计算好了,参数可以是数组、指针、类型、对象、函数等。
        它的功能是:获得保证能容纳实现所建立的最大对象的字节大小。
        由于在编译时计算,因此sizeof不能用来返回动态分配的内存空间的大小。实际上,用sizeof来返回类型以及静态分配的对象、结构或数组所占的空间,返回值跟对象、结构、数组所存储的内容没有关系。
        具体而言,当参数分别如下时,sizeof返回的值表示的含义如下:
        数组——编译时分配的数组空间大小;
        指针——存储该指针所用的空间大小(存储该指针的地址的长度,是长整型,应该为4);
        类型——该类型所占的空间大小;
        对象——对象的实际占用空间大小;
        函数——函数的返回类型所占的空间大小。函数的返回类型不能是void
  2.  strlen(...)是函数,要在运行时才能计算。参数必须是字符型指针(char*)。当数组名作为参数传入时,实际上数组就退化成指针了。
        它的功能是:返回字符串的长度。该字符串可能是自己定义的,也可能是内存中随机的,该函数实际完成的功能是从代表该字符串的第一个地址开始遍历,直到遇到结束符NULL。返回的长度大小不包括NULL

 

 

为什么GUI显示字符串的时候能识别长度,用sizeof和strlen 不能得到正确的长度。

 

如果要对上图获取长度用strlen和sizeof就不行 ,查看内存存放内容为用strlen 计算出来就为18个字节。但是为什么gui里面可以识别这个长度这里就涉及到utf-8的编码 和unicode编码。

 

 

Utf-8编码的具体形式为

 

  • 0xxxxxxx:单字节编码形式,这和 ASCII 编码完全一样,因此 UTF-8 是兼容 ASCII 的;
  • 110xxxxx 10xxxxxx:双字节编码形式;
  • 1110xxxx 10xxxxxx 10xxxxxx:三字节编码形式;
  • 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx:四字节编码形式

所以结合内存一看就可以看出这个是三字节编码 。那么GUI是就可以根据前面固定形式给出获取长度的函数

 


 

函数如下

为什么GUI显示字符串的时候能识别长度,用sizeof和strlen 不能得到正确的长度。

 

 

 

 

 


 

 

为什么GUI显示字符串的时候能识别长度,用sizeof和strlen 不能得到正确的长度。

 

就可以根据这个封装自己的函数

 

 

 

为什么GUI显示字符串的时候能识别长度,用sizeof和strlen 不能得到正确的长度。