知识点为专业的中小学教育资源网站,提供在线作文素材及各学科问题解答等学习知识。

utf-8是什么编码?如何设置excel编码格式为utf8?

时间:2022-09-16 14:40:30 来源:投稿 栏目:问答

     UTF-8是针对Unicode的一种可变长度字符编码;它可以用来表示Unicode标准中的任何字符,而且其编码中的第一个字节仍与ASCII相容,使得原来处理ASCII字符的软件无须或只进行少部份修改后,便可继续使用。

    UTF-8(8位元,UniversalCharacterSet/UnicodeTransformationFormat)是针对Unicode的一种可变长度字符编码。它可以用来表示Unicode标准中的任何字符,而且其编码中的第一个字节仍与ASCII相容,使得原来处理ASCII字符的软件无须或只进行少部份修改后,便可继续使用。因此,它逐渐成为电子邮件、网页及其他存储或传送文字的应用中,优先采用的编码。
    基本特征
    UCS字符U+0000到U+007F(ASCII)被编码为字节0×00到0x7F(ASCIⅡ兼容)。这意味着只包含7位ASCIl字符的文件在ASCIⅡ和UTF-8两种编码方式下是一样的。
    所有大于0x007F的UCS字符被编码为一个有多个字节的串,每个字节都有标记位集。因此,ASCIl字节(0x00-0x7F)不可能作为任何其他字符的一部分。表示非ASCIl字符的多字节串的第一个字节总是在0xC0到0XFD的范围里,并指出这个字符包含多少个字节。多字节串的其余字节都在0x80到0xBF范围里。这使得重新同步非常容易,并使编码无国界,且很少受丢失字节的影响。
    UTF-8编码字符理论上可以最多到6个字节长,然而16位BMP字符最多只用到3字节长,BigendianUCS-4字节串的排列顺序是预定的,字节0xFE和OxFF在UTF-8编码中从未用到。
    编码字节数
    UTF-8使用1~4字节为每个字符编码:
    ·一个US-ASCIl字符只需1字节编码(Unicode范围由U+0000~U+007F)。
    ·带有变音符号的拉丁文、希腊文、西里尔字母、亚美尼亚语、希伯来文、阿拉伯文、叙利亚文等字母则需要2字节编码(Unicode范围由U+0080~U+07FF)。
    ·其他语言的字符(包括中日韩文字、东南亚文字、中东文字等)包含了大部分常用字,使用3字节编码。
    ·其他极少使用的语言字符使用4字节编码。
    UTF-8编码规则:
    如果只有一个字节则其最高二进制位为0;如果是多字节,其第一个字节从最高位开始,连续的二进制位值为1的个数决定了其编码的字节数,其余各字节均以10开头。
    如何设置excel编码格式为utf8?
    工具/原料
    方正飞越
    win7家庭普通版
    excel2010
    方法/步骤
    1、首先打开需要编辑的Excel表格,点击打开左上角文件中的“另存为”。
    2、然后在弹出来的窗口中点击打开工具中的“web选项”。
    3
    3、然后在弹出来的窗口中点击打开“将此文档另存为”下面的选择框,选择“utf8”,之后回车确定即可。
声明

1.《utf-8是什么编码?如何设置excel编码格式为utf8?》本文来源网友投稿,文章内容并不代表本站的观点或立场;

2.如您对本文章内容或者版权归属问题请联系我们处理;

本文相关内容