ASCII 字符集 & HTML 特殊符号
ASCII 字符集
ASCII 参考手册
ASCII 字符集被用于因特网上不同计算机间传输信息。 ASCII ,它的全称是"美国信息交换标准代码
"。它设计于60年代早期,是计算机和诸如打印机、磁带驱动器之类的硬件设备的标准字符集。
ASCII 是 7 比特字符集,包含了 128 个不同的字符值。
ASCII 支持 0-9 的数字,A-Z大写和小写英文字母,以及一些特殊字符。
被广泛使用于现代计算机、HTML和因特网上的字符集都是基于 ASCII 。
以下表格列举了128个 ASCII 字符以及对应的 HTML 实体编码。
ASCII 可印刷字符
字符集 编号 描述
32 空格 ! 33 exclamation mark " 34 quotation mark # 35 number sign $ 36 dollar sign % 37 percent sign & 38 ampersand ' 39 apostrophe ( 40 left parenthesis ) 41 right parenthesis * 42 asterisk + 43 plus sign , 44 comma - 45 hyphen . 46 period / 47 slash 0 48 digit 0 1 49 digit 1 2 50 digit 2 3 51 digit 3 4 52 digit 4 5 53 digit 5 6 54 digit 6 7 55 digit 7 8 56 digit 8 9 57 digit 9 : 58 colon ; 59 semicolon < 60 less-than = 61 equals-to > 62 greater-than ? 63 question mark @ 64 at sign A 65 uppercase A B 66 uppercase B C 67 uppercase C D 68 uppercase D E 69 uppercase E F 70 uppercase F G 71 uppercase G H 72 uppercase H I 73 uppercase I J 74 uppercase J K 75 uppercase K L 76 uppercase L M 77 uppercase M N 78 uppercase N O 79 uppercase O P 80 uppercase P Q 81 uppercase Q R 82 uppercase R S 83 uppercase S T 84 uppercase T U 85 uppercase U V 86 uppercase V W 87 uppercase W X 88 uppercase X Y 89 uppercase Y Z 90 uppercase Z [ 91 left square bracket \ 92 backslash ] 93 right square bracket ^ 94 caret _ 95 underscore ` 96 grave accent a 97 lowercase a b 98 lowercase b c 99 lowercase c d 100 lowercase d e 101 lowercase e f 102 lowercase f g 103 lowercase g h 104 lowercase h i 105 lowercase i j 106 lowercase j k 107 lowercase k l 108 lowercase l m 109 lowercase m n 110 lowercase n o 111 lowercase o p 112 lowercase p q 113 lowercase q r 114 lowercase r s 115 lowercase s t 116 lowercase t u 117 lowercase u v 118 lowercase v w 119 lowercase w x 120 lowercase x y 121 lowercase y z 122 lowercase z { 123 left curly brace | 124 vertical bar } 125 right curly brace ~ 126 tilde
ASCII 设备控制字符
ASCII 设备控制字符最初被设计为用来控制诸如打印机和磁带驱动器之类的硬件设备。
在HTML文档中这些代码不会起任何作用。
字符 编号 描述 NUL 00 null character SOH 01 start of header STX 02 start of text ETX 03 end of text EOT 04 end of transmission ENQ 05 enquiry ACK 06 acknowledge BEL 07 bell (ring) BS 08 backspace HT 09 horizontal tab LF 10 line feed VT 11 vertical tab FF 12 form feed CR 13 carriage return SO 14 shift out SI 15 shift in DLE 16 data link escape DC1 17 device control 1 DC2 18 device control 2 DC3 19 device control 3 DC4 20 device control 4 NAK 21 negative acknowledge SYN 22 synchronize ETB 23 end transmission block CAN 24 cancel EM 25 end of medium SUB 26 substitute ESC 27 escape FS 28 file separator GS 29 group separator RS 30 record separator US 31 unit separator DEL 127 delete (rubout)
Unicode 标准
由于上面列出的字符集都有容量限制,而且不兼容多语言环境,Unicode 联盟开发了 Unicode 标准。
Unicode 标准涵盖了世界上的所有字符、标点和符号。
不论是何种平台、程序或语言,Unicode 都能够进行文本数据的处理、存储和交换。
也就是说,Unicode 标准将所有的字符包含在一个集合里,计算机只要支持这一个字符集,就能显示所有的字符,不会出现乱码。
Unicode 标准从 0 开始,为每个符号指定一个编号,叫做"码点"(code point)。
Unicode 联盟
Unicode 联盟开发了 Unicode 标准。他们的目标是用标准的 Unicode 转换格式 (UTF) 来取代现有的字符集。
Unicode 标准已经获得了成功,在 XML、Java、ECMAScript (JavaScript)、LDAP、CORBA 3.0、WML 中,Unicode 已经得到了实现。在许多操作系统以及所有的现代浏览器中,Unicode 同样得到了支持。
Unicode 联盟与领导性的标准发展组织进行合作,比如 ISO、W3C 以及 ECMA。
Unicode 可以被不同的字符集兼容。最常用的编码方式是 UTF-8 和 UTF-16:
字符 编号 描述
UTF-8 UTF8 中的字符可以是 1-4 个字节长。UTF-8 可以表示 Unicode 标准中的任意字符。UTF-8 向后兼容 ASCII。UTF-8 是网页和电子邮件的首选编码。
UTF-16 16 比特的 Unicode 转换格式是一种 Unicode 可变字符编码,能够对全部 Unicode 指令表进行编码。UTF-16 主要被用于操作系统和环境中,比如微软的 Windows 2000/XP/2003/Vista/CE 以及 Java 和 .NET 字节代码环境。
提示: 最前面的 256 个 Unicode 字符集字符对应于 256 个 ISO-8859-1 字符。
提示: 所有 HTML 4 处理器均已支持 UTF-8,而所有 XHTML 和 XML 处理器支持 UTF-8 和 UTF-16!
HTML 符号实体参考手册
HTML 符号实体 如果我们希望浏览器正确地显示在 HTML 中预留的字符,我们必须在 HTML 源码中插入字符实体。
字符实体有三部分:一个和号 '&’ 和一个实体名称(或者一个 '#’ 和一个实体编号),以及一个分号';’。
本字符实体参考手册包括了数学符号、希腊字符、各种箭头记号、科技符号以及形状。
注释: 实体名称对大小写敏感。
HTML 支持的数学符号
字符 实体编号 实体名称 描述 ∀ ∀ ∀ for all ∂ ∂ ∂ part ∃ ∃ ∃ exists ∅ ∅ ∅ empty ∇ ∇ ∇ nabla ∈ ∈ ∈ isin ∉ ∉ ∉ notin ∋ ∋ ∋ ni ∏ ∏ ∏ prod ∑ ∑ ∑ sum − − − minus ∗ ∗ ∗ lowast √ √ √ square root ∝ ∝ ∝ proportional to ∞ ∞ ∞ infinity ∠ ∠ ∠ angle ∧ ∧ ∧ and ∨ ∨ ∨ or ∩ ∩ ∩ cap ∪ ∪ ∪ cup ∫ ∫ ∫ integral ∴ ∴ ∴ therefore ∼ ∼ ∼ similar to ≅ ≅ ≅ congruent to ≈ ≈ ≈ almost equal ≠ ≠ ≠ not equal ≡ ≡ ≡ equivalent ≤ ≤ ≤ less or equal ≥ ≥ ≥ greater or equal ⊂ ⊂ ⊂ subset of ⊃ ⊃ ⊃ superset of ⊄ ⊄ ⊄ not subset of ⊆ ⊆ ⊆ subset or equal ⊇ ⊇ ⊇ superset or equal ⊕ ⊕ ⊕ circled plus ⊗ ⊗ ⊗ circled times ⊥ ⊥ ⊥ perpendicular ⋅ ⋅ ⋅ dot operator
HTML 支持的希腊字母
字符 实体编号 实体名称 描述 Α Α Α Alpha Β Β Β Beta Γ Γ Γ Gamma Δ Δ Δ Delta Ε Ε Ε Epsilon Ζ Ζ Ζ Zeta Η Η Η Eta Θ Θ Θ Theta Ι Ι Ι Iota Κ Κ Κ Kappa Λ Λ Λ Lambda Μ Μ Μ Mu Ν Ν Ν Nu Ξ Ξ Ξ Xi Ο Ο Ο Omicron Π Π Π Pi Ρ Ρ Ρ Rho undefined Sigmaf Σ Σ Σ Sigma Τ Τ Τ Tau Υ Υ Υ Upsilon Φ Φ Φ Phi Χ Χ Χ Chi Ψ Ψ Ψ Psi Ω Ω Ω Omega α α α alpha β β β beta γ γ γ gamma δ δ δ delta ε ε ε epsilon ζ ζ ζ zeta η η η eta θ θ θ theta ι ι ι iota κ κ κ kappa λ λ λ lambda μ μ μ mu ν ν ν nu ξ ξ ξ xi ο ο ο omicron π π π pi ρ ρ ρ rho ς ς ς sigmaf σ σ σ sigma τ τ τ tau υ υ υ upsilon φ φ φ phi χ χ χ chi ψ ψ ψ psi ω ω ω omega ϑ ϑ ϑ theta symbol ϒ ϒ ϒ upsilon symbol ϖ ϖ ϖ pi symbol
HTML 支持的其他实体
字符 实体编号 实体名称 描述 Œ Œ Œ capital ligature OE œ œ œ small ligature oe Š Š Š capital S with caron š š š small S with caron Ÿ Ÿ Ÿ capital Y with diaeres ƒ ƒ ƒ f with hook ˆ ˆ ˆ modifier letter circumflex accent ˜ ˜ ˜ small tilde   en space   em space   thin space ‌ zero width non-joiner ‍ zero width joiner ‎ left-to-right mark ‏ right-to-left mark – – – en dash — — — em dash ' ‘ ‘ left single quotation mark ' ’ ’ right single quotation mark ‚ ‚ ‚ single low-9 quotation mark " “ “ left double quotation mark " ” ” right double quotation mark „ „ „ double low-9 quotation mark † † † dagger ‡ ‡ ‡ double dagger · • • bullet … … … horizontal ellipsis ‰ ‰ ‰ per mille ′ ′ ′ minutes ″ ″ ″ seconds ‹ ‹ ‹ single left angle quotation › › › single right angle quotation ‾ ‾ ‾ overline € € € euro ™ ™ or ™ ™ trademark ← ← ← left arrow ↑ ↑ ↑ up arrow → → → right arrow ↓ ↓ ↓ down arrow ↔ ↔ ↔ left right arrow ↵ ↵ ↵ carriage return arrow ⌈ ⌈ ⌈ left ceiling ⌉ ⌉ ⌉ right ceiling ⌊ ⌊ ⌊ left floor ⌋ ⌋ ⌋ right floor ◊ ◊ ◊ lozenge ♠ ♠ ♠ spade ♣ ♣ ♣ club ♥ ♥ ♥ heart ♦ ♦ ♦ diamond