若是你从来没听说过Unicode,那么你太out了!Unicode,中文名为通用字符集,是现在天下上最为通用的字符编码尺度,被普遍应用于盘算机领域中。若是你对Unicode一无所知,那么这篇文章就是为你准备的。
首先,我们需要体会压缩和编码。在盘算机中,我们经常需要将种种各样的数据(如文字、数字、图片、音频、视频等)存储到盘算机中,而盘算机的CPU只能处置二进制数字。以是我们需要将其他类型的数据转换为二进制数字,存储到盘算机的硬盘中。在文本数据中,我们需要将一个个字符转换为盘算性能够识其余二进制数字,这就需要字符编码。
UTF-8正是Unicode的一种编码方式,它是一种可以示意随便Unicode字符的编码方案,同时也是一种可变长度的编码方案。若何明晰可变长度?举个例子,字符A在UTF-8中的编码为01000001,占用1个字节;而中文字符“你”的编码为11100100 10111000 10101111,占用3个字节。这就是UTF-8编码的可变长度。
除了UTF-8,Unicode尚有许多其他的编码方式。详细来说,Unicode共有七种编码方式,划分是UTF-8、UTF-16、UTF-32、UCS-2、UCS-4、GB18030和BIG5。它们各有利弊,应凭证现真相形选择。
Unicode不仅被普遍应用于种种编程语言中,也对于互联网的生长有着至关重要的作用。由于互联网上存在着差异语言和文字的用户,为体会决这一问题,国际化事情组(I18N)开始了优化Unicode支持的起劲,从而给互联网生长带来了极大的辅助。
以上仅为Unicode的一个简朴先容,若是你对Unicode尚有疑问,可以自行搜索进一步体会。迎接在谈论区留言,一起交流学习!