ASCII 字符集 & HTML 特殊符号

ASCII 字符集

ASCII 参考手册

ASCII 字符集被用于因特网上不同计算机间传输信息。 ASCII ,它的全称是"美国信息交换标准代码"。它设计于60年代早期,是计算机和诸如打印机、磁带驱动器之类的硬件设备的标准字符集。

ASCII 是 7 比特字符集,包含了 128 个不同的字符值。

ASCII 支持 0-9 的数字,A-Z大写和小写英文字母,以及一些特殊字符。

被广泛使用于现代计算机、HTML和因特网上的字符集都是基于 ASCII 。

以下表格列举了128个 ASCII 字符以及对应的 HTML 实体编码。

ASCII 可印刷字符

字符集 编号 描述

32    空格
!    33    exclamation mark
"    34    quotation mark
#    35    number sign
$    36    dollar sign
%    37    percent sign
&    38    ampersand
'    39    apostrophe
(    40    left parenthesis
)    41    right parenthesis
*    42    asterisk
+    43    plus sign
,    44    comma
-    45    hyphen
.    46    period
/    47    slash
0    48    digit 0
1    49    digit 1
2    50    digit 2
3    51    digit 3
4    52    digit 4
5    53    digit 5
6    54    digit 6
7    55    digit 7
8    56    digit 8
9    57    digit 9
:    58    colon
;    59    semicolon
<    60    less-than
=    61    equals-to
>    62    greater-than
?    63    question mark
@    64    at sign
A    65    uppercase A
B    66    uppercase B
C    67    uppercase C
D    68    uppercase D
E    69    uppercase E
F    70    uppercase F
G    71    uppercase G
H    72    uppercase H
I    73    uppercase I
J    74    uppercase J
K    75    uppercase K
L    76    uppercase L
M    77    uppercase M
N    78    uppercase N
O    79    uppercase O
P    80    uppercase P
Q    81    uppercase Q
R    82    uppercase R
S    83    uppercase S
T    84    uppercase T
U    85    uppercase U
V    86    uppercase V
W    87    uppercase W
X    88    uppercase X
Y    89    uppercase Y
Z    90    uppercase Z
[    91    left square bracket
\    92    backslash
]    93    right square bracket
^    94    caret
_    95    underscore
`    96    grave accent
a    97    lowercase a
b    98    lowercase b
c    99    lowercase c
d    100    lowercase d
e    101    lowercase e
f    102    lowercase f
g    103    lowercase g
h    104    lowercase h
i    105    lowercase i
j    106    lowercase j
k    107    lowercase k
l    108    lowercase l
m    109    lowercase m
n    110    lowercase n
o    111    lowercase o
p    112    lowercase p
q    113    lowercase q
r    114    lowercase r
s    115    lowercase s
t    116    lowercase t
u    117    lowercase u
v    118    lowercase v
w    119    lowercase w
x    120    lowercase x
y    121    lowercase y
z    122    lowercase z
{    123    left curly brace
|    124    vertical bar
}    125    right curly brace
~    126    tilde

ASCII 设备控制字符

ASCII 设备控制字符最初被设计为用来控制诸如打印机和磁带驱动器之类的硬件设备。

在HTML文档中这些代码不会起任何作用。

字符    编号    描述
NUL    00    null character
SOH    01    start of header
STX    02    start of text
ETX    03    end of text
EOT    04    end of transmission
ENQ    05    enquiry
ACK    06    acknowledge
BEL    07    bell (ring)
BS    08    backspace
HT    09    horizontal tab
LF    10    line feed
VT    11    vertical tab
FF    12    form feed
CR    13    carriage return
SO    14    shift out
SI    15    shift in
DLE    16    data link escape
DC1    17    device control 1
DC2    18    device control 2
DC3    19    device control 3
DC4    20    device control 4
NAK    21    negative acknowledge
SYN    22    synchronize
ETB    23    end transmission block
CAN    24    cancel
EM    25    end of medium
SUB    26    substitute
ESC    27    escape
FS    28    file separator
GS    29    group separator
RS    30    record separator
US    31    unit separator

DEL    127    delete (rubout)

Unicode 标准

由于上面列出的字符集都有容量限制,而且不兼容多语言环境,Unicode 联盟开发了 Unicode 标准。

Unicode 标准涵盖了世界上的所有字符、标点和符号。

不论是何种平台、程序或语言,Unicode 都能够进行文本数据的处理、存储和交换。

也就是说,Unicode 标准将所有的字符包含在一个集合里,计算机只要支持这一个字符集,就能显示所有的字符,不会出现乱码。

Unicode 标准从 0 开始,为每个符号指定一个编号,叫做"码点"(code point)。

Unicode 联盟

Unicode 联盟开发了 Unicode 标准。他们的目标是用标准的 Unicode 转换格式 (UTF) 来取代现有的字符集。

Unicode 标准已经获得了成功,在 XML、Java、ECMAScript (JavaScript)、LDAP、CORBA 3.0、WML 中,Unicode 已经得到了实现。在许多操作系统以及所有的现代浏览器中,Unicode 同样得到了支持。

Unicode 联盟与领导性的标准发展组织进行合作,比如 ISO、W3C 以及 ECMA。

Unicode 可以被不同的字符集兼容。最常用的编码方式是 UTF-8 和 UTF-16:

字符 编号 描述
UTF-8 UTF8 中的字符可以是 1-4 个字节长。UTF-8 可以表示 Unicode 标准中的任意字符。UTF-8 向后兼容 ASCII。UTF-8 是网页和电子邮件的首选编码。

UTF-16 16 比特的 Unicode 转换格式是一种 Unicode 可变字符编码,能够对全部 Unicode 指令表进行编码。UTF-16 主要被用于操作系统和环境中,比如微软的 Windows 2000/XP/2003/Vista/CE 以及 Java 和 .NET 字节代码环境。

提示: 最前面的 256 个 Unicode 字符集字符对应于 256 个 ISO-8859-1 字符。

提示: 所有 HTML 4 处理器均已支持 UTF-8,而所有 XHTML 和 XML 处理器支持 UTF-8 和 UTF-16!

HTML 符号实体参考手册

HTML 符号实体 如果我们希望浏览器正确地显示在 HTML 中预留的字符,我们必须在 HTML 源码中插入字符实体。

字符实体有三部分:一个和号 '&’ 和一个实体名称(或者一个 '#’ 和一个实体编号),以及一个分号';’。

本字符实体参考手册包括了数学符号、希腊字符、各种箭头记号、科技符号以及形状。

注释: 实体名称对大小写敏感。

HTML 支持的数学符号

字符    实体编号    实体名称    描述
∀    ∀    &forall;    for all
∂    ∂    &part;    part
∃    ∃    &exist;    exists
∅    ∅    &empty;    empty
∇    ∇    &nabla;    nabla
∈    ∈    &isin;    isin
∉    ∉    &notin;    notin
∋    ∋    &ni;    ni
∏    ∏    &prod;    prod
∑    ∑    &sum;    sum
−    −    &minus;    minus
∗    ∗    &lowast;    lowast
√    √    &radic;    square root
∝    ∝    &prop;    proportional to
∞    ∞    &infin;    infinity
∠    ∠    &ang;    angle
∧    ∧    &and;    and
∨    ∨    &or;    or
∩    ∩    &cap;    cap
∪    ∪    &cup;    cup
∫    ∫    &int;    integral
∴    ∴    &there4;    therefore
∼    ∼    &sim;    similar to
≅    ≅    &cong;    congruent to
≈    ≈    &asymp;    almost equal
≠    ≠    &ne;    not equal
≡    ≡    &equiv;    equivalent
≤    ≤    &le;    less or equal
≥    ≥    &ge;    greater or equal
⊂    ⊂    &sub;    subset of
⊃    ⊃    &sup;    superset of
⊄    ⊄    &nsub;    not subset of
⊆    ⊆    &sube;    subset or equal
⊇    ⊇    &supe;    superset or equal
⊕    ⊕    &oplus;    circled plus
⊗    ⊗    &otimes;    circled times
⊥    ⊥    &perp;    perpendicular
⋅    ⋅    &sdot;    dot operator

HTML 支持的希腊字母

字符    实体编号    实体名称    描述
Α    Α    &Alpha;    Alpha
Β    Β    &Beta;    Beta
Γ    Γ    &Gamma;    Gamma
Δ    Δ    &Delta;    Delta
Ε    Ε    &Epsilon;    Epsilon
Ζ    Ζ    &Zeta;    Zeta
Η    Η    &Eta;    Eta
Θ    Θ    &Theta;    Theta
Ι    Ι    &Iota;    Iota
Κ    Κ    &Kappa;    Kappa
Λ    Λ    &Lambda;    Lambda
Μ    Μ    &Mu;    Mu
Ν    Ν    &Nu;    Nu
Ξ    Ξ    &Xi;    Xi
Ο    Ο    &Omicron;    Omicron
Π    Π    &Pi;    Pi
Ρ    Ρ    &Rho;    Rho
     undefined         Sigmaf
Σ    Σ    &Sigma;    Sigma
Τ    Τ    &Tau;    Tau
Υ    Υ    &Upsilon;    Upsilon
Φ    Φ    &Phi;    Phi
Χ    Χ    &Chi;    Chi
Ψ    Ψ    &Psi;    Psi
Ω    Ω    &Omega;    Omega

α    α    &alpha;    alpha
β    β    &beta;    beta
γ    γ    &gamma;    gamma
δ    δ    &delta;    delta
ε    ε    &epsilon;    epsilon
ζ    ζ    &zeta;    zeta
η    η    &eta;    eta
θ    θ    &theta;    theta
ι    ι    &iota;    iota
κ    κ    &kappa;    kappa
λ    λ    &lambda;    lambda
μ    μ    &mu;    mu
ν    ν    &nu;    nu
ξ    ξ    &xi;    xi
ο    ο    &omicron;    omicron
π    π    &pi;    pi
ρ    ρ    &rho;    rho
ς    ς    &sigmaf;    sigmaf
σ    σ    &sigma;    sigma
τ    τ    &tau;    tau
υ    υ    &upsilon;    upsilon
φ    φ    &phi;    phi
χ    χ    &chi;    chi
ψ    ψ    &psi;    psi
ω    ω    &omega;    omega

ϑ    ϑ    &thetasym;    theta symbol
ϒ    ϒ    &upsih;    upsilon symbol
ϖ    ϖ    &piv;    pi symbol

HTML 支持的其他实体

字符    实体编号    实体名称    描述
Œ    Œ    &OElig;    capital ligature OE
œ    œ    &oelig;    small ligature oe
Š    Š    &Scaron;    capital S with caron
š    š    &scaron;    small S with caron
Ÿ    Ÿ    &Yuml;    capital Y with diaeres
ƒ    ƒ    &fnof;    f with hook
ˆ    ˆ    &circ;    modifier letter circumflex accent
˜    ˜    &tilde;    small tilde
          &ensp;    en space
          &emsp;    em space
          &thinsp;    thin space
‌    ‌    &zwnj;    zero width non-joiner
‍    ‍    &zwj;    zero width joiner
‎    ‎    &lrm;    left-to-right mark
‏    ‏    &rlm;    right-to-left mark
–    –    &ndash;    en dash
—    —    &mdash;    em dash
'    ‘    &lsquo;    left single quotation mark
'    ’    &rsquo;    right single quotation mark
‚    ‚    &sbquo;    single low-9 quotation mark
"    “    &ldquo;    left double quotation mark
"    ”    &rdquo;    right double quotation mark
„    „    &bdquo;    double low-9 quotation mark
†    †    &dagger;    dagger
‡    ‡    &Dagger;    double dagger
·    •    &bull;    bullet
…    …    &hellip;    horizontal ellipsis
‰    ‰    &permil;    per mille
′    ′    &prime;    minutes
″    ″    &Prime;    seconds
‹    ‹    &lsaquo;    single left angle quotation
›    ›    &rsaquo;    single right angle quotation
‾    ‾    &oline;    overline
€    €    &euro;    euro
™    ™ or ™    &trade;    trademark
←    ←    &larr;    left arrow
↑    ↑    &uarr;    up arrow
→    →    &rarr;    right arrow
↓    ↓    &darr;    down arrow
↔    ↔    &harr;    left right arrow
↵    ↵    &crarr;    carriage return arrow
⌈    ⌈    &lceil;    left ceiling
⌉    ⌉    &rceil;    right ceiling
⌊    ⌊    &lfloor;    left floor
⌋    ⌋    &rfloor;    right floor
◊    ◊    &loz;    lozenge
♠    ♠    &spades;    spade
♣    ♣    &clubs;    club
♥    ♥    &hearts;    heart
♦    ♦    &diams;    diamond
(0)

相关推荐