HTML 字符集

HTML 字符集

为了正确显示HTML页面,浏览器必须知道要使用什么字符集(字符编码)。

HTML字符集

在HTML中使用的正确字符编码是什么?

对于HTML5,默认字符编码为UTF-8。

并非总是如此。早期网络的字符编码为ASCII。

后来,从HTML 2.0到HTML 4.01,ISO-8859-1被认为是标准。

有了XML和HTML5,UTF-8终于出现了,并解决了许多字符编码问题。

下面是字符编码标准的简要说明。


在开始时:ASCII

计算机信息(数字,文本和图片)以二进制1和0(01000101)存储在电子设备中。

为了标准化字母数字字符的存储,创建了美国信息交换标准码(ASCII)。它为每个可存储字符定义了一个唯一的7位二进制数字,以支持0-9之间的>数字,大写/小写英文字母(az,AZ)以及一些特殊字符(如!)。$ +-()@ <>。

由于ASCII使用一个字节(字符为7位,传输奇偶校验控制为一位),因此它只能表示128个不同的字符。另外,这些字符中的32个被保留用于其他控>制目的。

ASCII的最大缺点是它排除了非英文字母。

如今,ASCII仍在广泛使用,尤其是在大型主机系统中。

要仔细查看,请研究我们的《完整ASCII参考》


在Windows中:ANSI

ANSI(也称为Windows-1252)是Windows(直到Windows 95)中的默认字符集。

ANSI是ASCII的扩展,增加了国际字符。它使用一个完整的字节(8位)表示256个不同的字符。

由于ANSI是Windows中的默认字符集,因此所有浏览器都支持它。

要仔细查看,请研究我们的完整ANSI参考


在HTML 4中:ISO-8859-1

由于大多数国家/地区使用ASCII以外的字符,因此HTML 2.0标准中的默认字符编码已更改为ISO-8859-1。

ISO-8859-1是ASCII的扩展,增加了国际字符。与ANSI一样,它使用一个完整的字节表示比ASCII两倍的字符。

当浏览器在网页中检测到ISO-8859-1时,它们通常默认为ANSI,因为ANSI与ISO-8859-1相同,只是ANSI具有32个额外的字符。

如果HTML 4网页使用的字符集不同于ISO-8859-1,则应在标记中指定该字符集,例如:

HTML5的默认字符集为UTF-8。
所有HTML 4处理器均支持UTF-8,所有HTML5和XML处理器均支持UTF-8和UTF-16。

要仔细查看,请研究我们的完整ISO-8859-1参考


在HTML5中:Unicode UTF-8

由于上面列出的字符集是受限制的,并且在多语言环境中不兼容,因此Unicode联盟开发了Unicode标准。

Unicode标准涵盖了(几乎)世界上所有的字符,标点和符号。

Unicode支持独立于平台和语言的文本处理,存储和传输。

HTML5中的默认字符编码为UTF-8。

要仔细查看,请阅读我们的《完整Unicode参考》

原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/59258.html

(0)
上一篇 2021年8月9日
下一篇 2021年8月9日

相关推荐

发表回复

登录后才能评论