畅想未来の水星☆
百度空间 | 百度首页 
 
文章列表
 
2009-10-09 00:48

通信的目的是传递信息。

信道是指信号传输的通道。
将原始电信号变换成其频带适合信道传输的信号,并在接收端进行反变换,这种变换和反变换通常称为调制或解调。原始电信号又成为基带信号,而已调信号则常称为频带信号。

单工通信:消息只能单方向传输.例如遥控;
半双工通信:通信双方都能收发消息,但不能同时进行收发.例如无线电对讲机;
全双工通信:通信双方可同时进行收发消息.例如普通电话。

所谓串行传输,是将数字信号码元序列按时间顺序一个接一个地在信道中传输。
如果将数字信号码元序列分割成两路或两路以上的数字信号码元序列同时在信道中传输,则称为并行传输。

---
信道模型:调制信道和编码信道.编码信道包含调制信道。

| 编码器 {->调制器 (->发转换器->媒介->收转换器->) 解调器->} 译码器 |
调制信道():关注已调信号的变换,指 调制器输出端 到 解调器输入端;
编码信道{}:关注数字序列的变换,指 编码器输出端 到 译码器输入端。

---
调制信道分为恒参信道和随参信道.
恒参信道:乘性干扰不随时间变化或基本不变化.
1.有线电信道:架空明线、对称电缆、同轴电缆
2.光纤信道
3.无线电'视距中继
4.卫星中继信道

光纤信道由光源、光纤线路及光电探测器等三个基本部分构成。目前,光纤信道广泛采用数字调制方式,即用光载波脉冲的有和无来代表二进制数字。因此,光纤信道是一个典型的数字信道。

随参信道:
1.短波电离层反射通道
2.对流层散射信道

短波是指波长为10-100m(频率为3-30MHz)的无线电波.它即可沿地表面传播(地波),也可由电离层反射传播(天波).
离地面高60-600km的大气层称为电离层.是由分子、原子、离子及自由电子组成的.电离层是半导电媒介.
离地面10-12km以下的大气层称为对流层.在对流层中,由于大气湍流运动等原因产生了不均匀性,故引起颠簸的散射.

---
所谓载波调制,就是按调制信号(基带信号)的变化规律去改变载波某些参数的过程。
调制的载波可以分为两类:用正弦型信号作为载波;用脉冲串或一组数字信号作为载波。通常,调制可以分为模拟(连续)调制或数字调制两种方式。

目前常见的模-数变换可以看成是一种用脉冲串作为载波的数字调制,它又称为脉冲编码调制。

调制可以进行频谱搬移,把调制信号的频谱搬移到所希望的位置上,从而将调制信号转换成适合信道传输或便于信道多路复用的已调信号。

最常用的模拟调制方式是用正弦波作为载波的幅度调制和角度调制。常见的调幅(AM)、双边带(DSB)、残留边带(VSB)和单边带(SSB)等调制就是幅度调制的几个典型实例;而频率调制(FM)就是角度调制中被广泛采用的一种。

角度调制:通过改变载波的频率或相位达到,都可以看成是载波角度的变化。


“复用”是一种将若干个彼此独立的信号合并为一个可在同一信道上传输的复合信号的方法。

常见的信道复用采用按频率区分或按时间区分信号。按频率区分信号的方法称为频分复用(FDM);按时间区分信号的方法称为时分复用(TDM)。

---
在数字通信中,有些场合可以不经过载波调制和解调过程而让基带信号直接进行传输。这种不使用载波调制解调装置而直接传送基带信号的系统,我们称它为基带传输系统。该结构由信道信号形成器、信道、接收滤波器以及抽样判决器组成。
与之相应我们把包括了载波调制解调过程的传输系统称为频带传输系统。

---
在大多数数字通信系统中,都选择正弦信号作为载波,是因其形式简单,便于产生和接收。和模拟调制一样,数字调制也有调幅、调频和调相三种基本形式,并可以派生初多种其他形式。数字调制信号,在二进制时有振幅键控(ASK)、移频键控(FSK)和移相键控(PSK)三种基本信号形式。

二进制振幅键控信号,若一个信号状态始终为零,相当于处在断开状态,此时常称为通断键控信号(OOK信号)。

多进制数字调制是利用多进制数字基带信号去调制载波的振幅、频率或相位。
多进制数字振幅调制又称多电平调制。
多进制数字频率调制又称多频制。
多进制数字相位调制又称多相制。多相制中使用最广泛的是四相制和八相制。如四相绝对移相键控(QPSK)、四相相对移相键控(QDPSK)。

振幅相位联合键控(APK):APK信号可以看做两个正交调制信号之和,有时也称为星座调制,因为在其矢量图平面上信号分布如星座。当前应用较多的一种APK信号,是十六进制的正交振幅调制(16QAM)信号。
所谓正交振幅调制(QAM)是用两个独立的基带波形对两个相互正交的同频载波进行抑制载波的双边带调制,利用这种已调信号在同一带宽内频谱正交的性质来实现两路并行的数字信息传输。

---
若模拟信号在数字通信系统中传输,则需要发送端的模-数和接收端的数-模转换装置。
采用得最早和目前应用比较广泛的“模-数转换”方法是脉冲编码调制,即PCM,简称脉冲调制。

抽样定理是指:一个频带限制在(0,f)赫内的时间连续信号m(t),如果以T≤1/2f秒内的间隔对它进行等间隔抽样,则m(t)将被所得到的抽样值完全确定。
抽样定理告诉我们:如果对某一带宽有限的时间连续信号(模拟信号)进行抽样,且抽样速率达到一定数值时,那么根据这样抽样值就能准确地确定原信号。该定理为模拟信号的数字传输奠定了理论基础。

所谓脉冲编码调制(PCM),就是将模拟信号的抽样量化值变换为代码。
把量化后的信号变换为代码的过程称为编码,反之为译码。编码器目前应用较为广泛的是逐次比较(反馈)型。

差分脉冲编码调制(DPCM),基本思想是将“语音信号样值同预测样值的差”作量化编码。

时分复用借助“把时间帧划分成若干时隙和各路信号占用各自时隙”的方法来实现在同一信道上传输多路信号;
频分复用是“把可用的带宽划分成频隙和各路信号占用各自频隙”的方法来实现在同一信道上传输多路信号。

例如时分多路数字电话系统的语音信号采用数字方式传输时,其量化编码的方式可用采用(差分)脉冲调制。我国规定采用PCM30/32路制式。

---
为了能在数字信道中传输模拟话音或图像信号,必须使模拟信号数字化。

早在1972年,CCITT(现已改称为ITU-T)已制定出关于PCM语音编码的国际建议G.711。其规定每话路抽样率为8kHz,每样点量化为8bit,即每话路传信率或数码率为64kb/s.

制定图像压缩编码标准的国际组织有两个:国际标准化组织(ISO)和ITU-T。ISO为静止图像编码制定了JPEG系列标准,为活动图像编码制定了MPEG系列标准;ISO为活动图像编码制定了H系列,包括H.261,H.262,H.263等。

图形压缩编码的过程:模拟图像信号输入->模-数(A/D)->变换->压缩编码->输出。
为了压缩数码率,在A/D变换之后,常插入一次变换,大体分为预测变换和函数变换两类。
预测变换是利用邻近像素之间的相关性来压缩码率的。常用的预测方法为差分脉冲编码调制(DPCM)。
函数变换是利用变换域参数分布特征来实现压缩编码的。可用的变换有离散傅里叶变换(DFT)、离散余弦变换(DCT)沃尔什变换(WT)及小波变换等。其中以DCT在图像压缩编码中使用的最为广泛。
经过变换压缩的数字图像信号,还可以使用高效信源编码方法(如Haffman编码)进一步降低其比特数。

未完待续...
by 水星cici (手打)

 
2009-09-21 00:05

SD卡

Secure Digital,缩写为SD,中文翻译为 安全数码卡,是一种记忆卡的标准,它被广泛地于便携式装置上使用,例如数码相机、个人数码助理(PDA)和多媒体播放器等。SD卡的技术建是基于MultiMedia卡(MMC)格式上,但SD卡比MMC卡略厚。而SD卡也有较高的资料传送速度,而且不断地更新标准。大部份SD卡的侧面设有写保护控制,以避免一些资料意外地写入,而少部分的SD卡甚至支援数位版权管理(DRM)的技术。一般SD卡的大小约为32mm × 24mm × 2.1mm,但可以薄至1.4mm,与MMC卡相同。
SD系列记忆卡都是SanDisk完成测试后送交SD卡协会认证规格,因此几乎所有专利权都掌控在SanDisk手上。

---
SDHC,全名“Secure Digital High Capacity”,是SD卡协会(SD Card Association)在2006年3月发表SD 2.0规格的Secure Digital(以下简称“SD”)高容量版本。
SDHC与SD的主要差异在于,旧版本用FAT16档案系统,意思是管理档案所在位置的表格用16位元表示,所以最多只能管理65536个范围,再考虑每个范围能储存32KB的资料量,所以65536 × 32KB = 2GB,SD卡容量上限只能到达2GB。为解决FAT16格式可支援容量有限的问题,SDHC改用了FAT32格式;依规格定义,容量最大可达到32GB。

使用和选购SDHC记忆卡时,必须注意相容性。因为SDHC记忆卡与现有SD 1.1读卡设备和读卡机并不相容,但SD卡可以和SDHC的读卡器和读卡设备相容。

---
miniSD卡被SD协会 (SD Association) 于2003年时确立为标准SD卡的极细小型规格,这种miniSD卡特别设计于移动电话上,并随卡附上minSD转接器,令它能够兼容所有配置了标准SD卡插槽的设备中。

---
microSD是一种极细小的快闪存储器卡。
microSD的格式源自SanDisk创造,原本这种记忆卡称为T-Flash,及后改称为TransFlash;而重新命名为microSD的原因是因为被SD协会(SDA)采纳(2005年)。

---
规格
SD卡 miniSD卡 microSD卡
阔度 24 mm 20 mm 11 mm
长度 32 mm 21.5 mm 15 mm
厚度 2.1 mm 1.4 mm 1 mm
体积 1,596 mm3 589 mm3 165 mm3
重量 接近2g 接近1g 接近0.5g
操作电压 2.7 - 3.6V 2.7 - 3.6V 2.7 - 3.6V
写入装置保护 YES NO NO
终止保护 YES NO NO
接脚数目 9 脚 11 脚 8 脚

CF卡

CompactFlash(CF卡)最初是一种用于便携式电子设备的数据存储设备。作为一种存储设备,它革命性的使用了闪存,于1994年首次由SanDisk公司生产并制定了相关规范。当前,它的物理格式已经被多种设备所采用。从外形上CF卡可以分为两种:CF I型卡以及稍厚一些的CF II型卡。从速度上它可以分为CF卡、高速CF卡(CF+/CF 2.0规范)、CF3.0、CF4.0,更快速的CF4.1标准也在2007年被采用。CF II型卡槽主要用于微型硬盘等一些其他的设备。

CF是与出现更早且尺寸更大的PCMCIA I型内存卡竞争的第一批闪存标准之一,它最初是建立在英特尔的或非型 (NOR) 闪存的基础上,之后改为使用与非型 (NAND) 闪存。CF是最老也是最成功的标准之一,尤其适合专业相机市场。

现时 CF 卡仍比其他小型记忆卡有着最高容量(自 CF 1.0 标准开始已支援 137GB 之理论上限,至 2007 年第三季,最大容量为 64GB),更高之实际存取速度(SanDisk Extreme IV型CF卡的写入速度和读取速度可达40MB/s, CF 4.0 标准支援最高 133MB/s),比其他小型记忆卡更开放的规格及使用条款,较佳的兼容性(自 CF 1.0 标准起极少出现重大的改动)。

PC卡

PC卡(旧称 PCMCIA)是可插入膝上型电脑,提供额外功能的电子产品。
初是由“个人电脑储存卡国际联盟”(Personal Computer Memory Card International Association)设定了这种卡的标准,故命名为“PCMCIA”卡。之后,此种界面卡的新版本称为“CardBus”。

PC卡的物理尺寸与一张信用卡相仿,根据厚度不同共有三种不同的尺寸:一型卡厚3.3毫米,二型卡厚5.0毫米,三型卡厚10.5毫米。它们的长度均为85.6毫米,宽度均为54.0毫米。

PC卡的电器规范使它也能被CF卡使用。这样PC卡CF适配器仅需要一个套接(socket)接口。它有时也被用来作为DVB广播的通用界面。

PCMCIA已经发展出新一代ExpressCard(曾命名为“新卡”)来代替现有的CardBus标准。ExpressCard相比CardBus更快更简单。通过ExpressCard插槽,主机可提供PCI Express和USB 2.0速度的连接。它支持热插拔。

ExpressCard提供两种尺寸,ExpressCard/34(34 毫米宽)和 ExpressCard/54(54 毫米宽,L型);两种卡的连接口都是(34 毫米)。 标准卡的长度是75 毫米(比CardBus短10.6 毫米),5毫米厚,但在凸出卡插槽的部分(例如天线)的厚度可以超过5.5毫米。

MMC卡

多媒体记忆卡(Multimedia Card,MMC卡)是一种快闪记忆卡标准。在1997年由西门子及SanDisk共同开发,技术基于东芝的NAND快闪记忆技术,因此较早期基于IntelNOR快闪记忆技术的记忆卡,例如CF卡更细小。MMC卡大小与一张邮票差不多,约24mm x 32mm x 1.4mm。
RS-MMC卡是MMC卡(Multi Media Card)卡的缩小版本,它只有MMC卡的一半大小,厚度略比SD卡薄。
RS-MMC卡有一种名为“双电压高速RS-MMC卡”,也称Mobile RS-MMC卡。这种卡具有两种工作电压,既可以在 1.8v 的电压下工作,也可以在 3.3v 的电压下工作。

MS卡

Memory Stick,简称为MS卡、记忆棒、记忆条等,它是一种可移除式的快闪记忆卡格式,并由索尼公司制造,并于1998年10月推出市场;它亦被概括了整个Memory Stick的记忆卡系列。这个系列包括了Memory Stick PRO(容许更佳的最大储存容量和更快的传输速度)、Memory Stick Duo(Memory Stick 的小型格式版本,包括 PRO Duo 和 PRO-HG Duo)、比Duo更小的 Memory Stick Micro (M2) 及较PRO速度更快的 PRO-HG 。

整理 by 水星cici
 
2009-09-20 22:24

RCA端子(RCA jack,或RCA connector),俗称莲花头,是一种应用广泛的端子,可以应用的场合包括了模拟视频,模拟音频,数字音频与色差分量传输等。
RCA插头常以颜色区分,黄色用于复合视讯,模拟立体声音讯中以白色(或黑色)作左声道,红色作右声道。

起源
RCA端子也被称为“phono connector”,直译为“留声机接口”,因为起初这种端子是设计来连接留声机和无线电接受装置——半导体收音机诞生之前的事情。
美国无线电公司(Radio Corporation of America,RCA)在1930年代的大多收音机中采用了这样的连接方式,也正是这种接头得名的原因。

------
AV端子(又称复合端子)原文为Composite video connector,是家用影音电器用来传送类比视讯如NTSC、PAL、SECAM)的常见端子。AV端子通常是黄色的RCA端子,另外配合两条红色与白色的RCA端子传送音讯。在专业应用当中,也有使用BNC端子以求获得更佳讯号品质。
在AV端子中传送的是类比电视讯号的三个来源要素:Y、U、V,以及作为同步化基准的脉冲信号。
“复合”含义就是同一信道中传输亮度和色度信号的模拟信号。

---
BNC(同轴电缆卡环形接口)接口主要用于连接高端家庭影院产品以及专业视频设备。BNC电缆有5个连接头,分别接收红、绿、蓝、水平同步和垂直同步信号。BNC接头可以让视频信号互相间干扰减少,可达到最佳信号响应效果。此外,由于BNC接口的特殊设计,连接非常紧,不必担心接口松动而产生接触不良。

---
S端子(S-Video)连接采用Y/C(亮度/色度)分离式输出,使用四芯线传送信号,接口为四针接口。接口中,两针接地,另外两针分别传输亮度和色度信号。因为分别传送亮度和色度信号,S端子效果要好于复合视频。不过S端子的抗干扰能力较弱,所以S端子线的长度最好不要超过7米。

色差(Component)通常标记为Y/Pb/Pr,用红、绿、蓝三种颜色来标注每条线缆和接口。绿色线缆(Y),传输亮度信号。蓝色和红色线缆(Pb和Pr)传输的是颜色差别信号。色差的效果要好于S端子,因此不少DVD以及高清播放设备上都采用该接口。如果使用优质的线材和接口,即使采用10米长的线缆,色差线也能传输优秀的画面。

------
色差端子(英文:Component Video Connector)是把类比视频中的明度、彩度、同步脉冲分解开来各自传送的端子。

分量传送的视频有许多种方式,例如将三原色直接传送的RGB方式,以及从RGB转换为明度(Y)与色差(Cb/Cr或Pb/Pr)的方式。

色差在设计上利用了“人眼对明度较敏感,而对色度较不敏感”的特性,将视讯中的色彩信息加以削减,转换公式如下:

明度: Y=0.299*R + 0.587*G + 0.114*B
色差: Cb=0.564*(B-Y) = -0.169*R - 0.331*G + 0.500*B
Cr=0.713*(R-Y) = 0.500*R - 0.419*G - 0.081*B

所谓的“色差”即为颜色值与明度之间的差值。转换过后的颜色信息量被删减了约一半,但由于人眼的特性,使得色差处理过后的影像与原始影像的差异很难被察觉。最终的色差数据与RGB数据相比节省了1/3的带宽。

以上的转换系数被称为“色彩数组”,上述的例子为SDTV所使用的数组,HDTV所使用的则是另一个不同的规格(如下述)。

明度: Y=0.2126*R + 0.7152*G + 0.0722*B
色差: Pb=0.5389*(B-Y) = -0.1146*R - 0.3854*G + 0.5000*B
Pr=0.6350*(R-Y) = 0.5000*R - 0.4542*G - 0.0458*B

色差端子影像讯号的规格
为了要将影像进行储存、编辑、以及传送,将之以统一格式处理,避免传输过程中有所改变而造成画质下降,因此规范了色差端子影像讯号规格。


ITU-R BT.601
旧名称为CCIR 601,国际电信联盟(ITU)所制订的标准规格。为现今标准电视放送规格标准。对应NTSC (525/60)与PAL(扫描线625/50)、对应4:3和16:9纵横比画面。虽然色彩成份为RGB 4:4:4跟色差(YCbCr) 4:2:2为既订的,但是,这里记录的是作为广播放送用的一般的色差方式。

组成成分:明度(Y)、色差(Cb及Cr)
取样频率:13.5MHz(Y)和 6.75MHz(Cb,Cr)
取样方法:4:2:2(色差Cb与Cr取样频率都只有明度取样频率的一半,Y:Cb:Cr=4:2:2)
量化位元数:标准8bit、扩充10bit
这种规格的机器通常可连接serial digital interface(SDI)规格 SMPTE 259M 为标准的介面。为了跟HDTV有所区别又称SD-SDI。


BTA S-001B
由ARIB(日本电波产业协会)所规范的1125/60HDTV。对应ITU的国际规格ITU-R BT.709-3 PartII。 由于RGB和色差(YPbPr)分别订在4:4:4、4:2:2在这里我们将之以一般播放的色差方式表示。

组成成分:明度(Y)、色差(Pb及Pr)
取样频率:74.25MHz(Y)及37.125MHz(Pb,Pr)
取样方式:4:2:2(色差Pb,Pr的取样频率为明度的一半)
量化位元数:8bit及10bit(S-002B规范)
此规格的机器可连接并列(BTA S-002B)及串列规格(BTA S-004B/SMPTE 292M)的介面。后者为了与SDTV做区分,称为HD-SDI。 此外,也有供BETACAM用的类比色差方式。
---
VGA(Video Graphics Array)端子(其他的名称包括RGB端子,D-sub 15,或mini D15),是一种3排共15针的DE-15。VGA端子通常在电脑的显示卡、显示器及其他设备。是用作传送类比讯号。它传输红、绿、蓝模拟信号以及同步信号(水平和垂直信号)。

设计者 IBM(基于D-subminiature)
设计年代 1987

---
DVI的英文全名为Digital Visual Interface,中文称为“数位视讯介面”。是一种视讯介面标准,设计的目标是透过数位化的传送来强化个人电脑显示器的画面品质。目前广泛应用于LCD,数位投影机等显示设备上。DVI介面可以传送未压缩的数位视频资料到显示装置。本规格部分相容于HDMI标准。

DVI接口有多种规范,常见的是DVI-D(Digital)和DVI-I(Intergrated)。DVI-D只能传输数字信号,大家可以用它来连接显卡和平板电视。DVI-I则在DVI-D可以和VGA相互转换。

概要
DVI介面的协定会使得像素的亮度与色彩讯号从讯号来源(如显示卡)以二进位方式传送到显示装置。当显示装置以其原生解析度被驱动时,仅需读取DVI传来的每个像素的数值资料并且套用到正确的位置即可。相对于类比方式传送的像素资料会受到邻接像素资料以及电磁杂讯以及其他的类比失真影响,在此方法中,输出端暂存器中的每个像素都直接对应显示端的每个像素。使得画面品质有基本的保障。
在此之前以类比方式传送视讯资料的标准,如VGA是为了以映像管(阴极射线管)为基础的显示装置而设计,传送的单位是水平扫瞄线,因此并未使用数位化的离散信号。类比传送的视讯信号是以变更输出电压来控制扫瞄中的电子流束的密度,并借此来表现亮度以及彩度。
然而当LCD等数位化的显示装置开始实用化之后,以类比方式传送讯号至数位显示装置时,该装置必须以特定频率将扫瞄线讯号取样再转换回数位格式。若取样出现误差就会使得画面品质劣化。且当讯号来源为电脑时,显示卡将数位的画面讯号转换为类比输出,再被LCD显示器转换回数位画面的流程显然是多余的。因此DVI也随着LCD显示器成为主流而被广泛使用。

设计者 数位显示工作小组
设计年代 1999年4月

---
HDMI, 高清晰度多媒体介面(英文:High Definition Multimedia Interface,简称HDMI)是一种全数位化影像和声音传送介面,可以传送无压缩的音频信号及视频信号。HDMI可用于机顶盒、DVD播放机、个人电脑、电视游乐器、综合扩大机、数位音响与电视机。HDMI可以同时传送音频和影音信号,由于音频和视频信号采用同一条电缆,大大简化了系统的安装。

在传送时,各种视频资料将被HDMI收发晶片以“Transition Minimized Differential Signaling”(TMDS)技术编码成资料封包。规格初制订时其最大画素传输率为165Mpx/sec,足以支援1080p画质每秒60张画面,或者UXGA解像度(1600x1200);后来在HDMI 1.3规格中扩增为340Mpx/sec,以符合未来可能的需求。

设计者 HDMI组织
设计年代 2002年12月


整理 by 水星cici
 
2009-09-02 23:55

智能卡(Smartcard 或 IC Card),又称智慧卡、聪明卡、集成电路卡,是指粘贴或嵌有集成电路芯片的一种便携式卡片塑胶。卡片包含了微处理器、I/O接口及内存,提供了资料的运算、存取控制及储存功能,卡片的大小、接点定义目前是由ISO规范统一,主要规范在ISO7816中。常见的有电话IC卡、身份IC卡,以及一些交通票证和存储卡。

历史
IC卡是一种外形与信用卡一样,卡上含有一个符合ISO 标准的集成电路芯片卡片,又称“集成电路卡”、智能卡,英文名称“Integrated Circuit Card”或“Smart card”,是法国人Ro-land morono于1974年发明的,将具有存储加密及数据处理能力的集成电路芯片模组封装于和信用卡尺寸一样大小的塑胶片基中,便构成了IC卡。法国布尔(BULL)公司于1976年首先制成IC卡产品,并开始应用在各个领域。

组成
基片:现在多为PVC材质,也有塑料或是纸制
接触面:金属材质,一般为铜制薄片,集成电路的输入输出端连结到大的接触面上,这样便于读写器的操作,大的接触面也有助于延长卡片使用寿命;触点一般有8个(C1 C2 C3 C4 C5 C6 C7 C8, C4和C8设计为将来保留用),但由于历史原因有的智能卡设计成6个触点(C1 C2 C3 C5 C6 C7)。另外,C6原来设计为对EEPROM供电,但因后来EEPROM所需的程式电压(Programming Voltage)由芯片内直接控制,所以C6通常也就不再使用了。
集成芯片:通常非常薄,在0.5mm以内,直径大约1/4厘米,一般成圆形,方形的也有,内部芯片一般有CPU RAM ROM EPROM.

参数
智能卡与接口设备(IFD?)电压分别有3V 5 V ± 10%,即 2.7 V to 5.5 V.
GSM智能卡也是5V,但手机内部其他部件都是3V,所以和智能卡有个额外的电压转换部件。

依资料传输方式分类
接触式 (Contact card) 读写需要IO线路接触。
非接触式 (Contact less card) 使用RF、红外线、感应电动势、非IO线路接触,(非接触技术类似RFID技术)。
混合式(Hybrid-card 或 Combi-card)同时拥有接触与非接触接口。

目前主要应用在
身份辨识-运用内含微电脑系统对资料进行数学运算,确认其唯一性。
点数计算-内建计数器(counter)替代成货币、红利点数、等,数字型的资料。


运作
卡片内部运作除了硬件之外还有其软件,通常会需要一个核心COS(Card Operating System)提供服务,其内部软件系统架构如下: 硬件 (Hardware) → COS → AP (Application)

相关标准
ISO 7816(接触式智能卡,规定了规格/电气特性/通讯协议/部件等各方面) ISO 14443(非接触式智能卡)

---
触点号        分配 触点号      分配
C1 电源电压(VCC) C5 地 (GND)
C2 复位(RST) C6 编程电压 (VPP)
C3 时钟(CLK) C7 输入/输出 (I/O)
C4 保留待未来使用 C8 保留待未来使用
其中:
GND 地,基准电压。
VCC 电源输入。
I/O 串行数据的输入/输出。
CLK 时钟信号输入。
RST 复位信号输入。
VPP 编程电压输入,由卡选用。

T=0,异步半双工字符传输协议
T=1,异步半双工块传输协议

---
命令总是由接口设备启动,他以一个5字节的报头通知卡做什么,并且允许在卡发出的过程字节的控制下传输数据字节。

接口设备通过五个连续字节传送一个报头,这五个字节指定为CLA,INS,P1,P2,P3。
    ——CLA是指令类别,值’FF’为PTS保留(见8.3.3)。
    ——INS是指令类别中的指令代码。指令代码只有当最高有效半字节不是‘6’和‘9’时才有效。
    ——P1、P2是一个完成指令代码的参考符号(例如地址)。
    ——P3对指令期间被传输的数据字节(D1…Dn)的数目n编码。在输出数据的传输命令中,P3=0表示从卡发送256个字节的数据。在输入数据的传输命令中,P3=0代表无数据输入。
这样,在一个5字节报头传输之后,接口设备等待一个过程字节。

过程字节的值将指明接口设备请求的动作。已规定了三种类型的过程字节:
    —— NULL的值为60。
    ——在ACK中,除了值‘6X‘和‘9X‘以外,在ACK字节中的七个最高有效位(b8至b2)全都等于INS字节中相应位或与之互补。
    ——SW1的值为‘6X’或‘9X’,但不包括‘60’。
    在每一个过程字节中,卡可以用一个ACK或NULL字节来把这个命令继续进行下去,或以适当的不应答表示不赞同,或用结束序列SW1-SW2结束这个命令。

---
《ISO7816-4.doc》
5.3 APDU报文结构
应用协议中的一个步骤由发送命令、接收实体处理它以及发回的响应组成。因此,特定的响应对应于特定的命令,称作为命令响应对。
应用协议数据单元(APDU)可包含有命令报文或响应报文,它从接口设备发送到卡,或者相反地由卡发送到接口设备。

命令APDU
命令APDU由下列内容组成:
——必备的4字节首标(CLA INS P1 P2);
——有条件的可变长度主体([Lc字段][数据字段][Le字段])。

在命令APDU的数据字段中呈现的字节数用Lc来表示。
在响应APDU的数据字段中期望的字节最大数用Le(期望数据的长度)来表示。当Le字段只包含0时,则要求有效数据字节的最大数。(对于短的长度不超过256,或者对于扩展的长度不超过65536)

命令APDU的4种结构:
1.命令首标
2.命令首标 Le字段
3.命令首标 Lc字段 数据字段
4.命令首标 Lc字段 数据字段 Le字段


响应APDU
响应APDU由下列内容组成:
——有条件的可变长度主体;
——必备的2字节尾标(SW1 SW2)。

响应APDU结构:
主体          尾标
[数据字段] SW1 SW2


SW1—SW2 含      义
正常的处理
‘9000’ —无进一步限定
‘61XX’ —SW2指示仍然有效的响应字节数


5.4.5 状态字节
响应的状态字节SW1—SW2表示了卡内的处理状态。

INS
‘A4’ SELECT FILE 6.11
‘CO’ GET RESPONSE 7.1节

---
《某芯片用户手册》

6.19 智能卡接口控制器(SIM)

ISO7816 标准是个标准的半双工接口,本模块作为主设备,控制SIM 卡的操作,SIM 卡
作为从设备只有在两种情况下产生应答信号:
收到RST 信号后发送ATR、接到命令后应答。

因此,SIM 卡驱动模块作为主设备,主要完成两个操作:发送RST 等待ATR,发送命令并等
待SIM 卡的应答。

TX, XMT, 发送transmit
RX, RCV, 接收Receive

---
ATR(answer to reset) 复位应答
SIM模块和SIM卡建立初始通信需要交换一些协议数据,这个交换通过ISO7816规定的ATR协议来完成。ATR协议通过SIM模块对sim_rst信号的控制来实现.
SIM卡有可能会在sim_rst为低期间或sim_rst为高期间返回应答信号。如果sim_rst保持高电平40000个sim_clk周期后仍然没有收到SIM卡的ATR应答信号,则表明SIM不存在或者传输通道有问题。

SIM卡返回的ATR应答信号的第一个字符表示SIM卡支持传输方式是直接模式还是反转模式,这个字符定义为初始字符。如果SIM返回的是11011100,则表示SIM卡支持直接模式;如果SIM卡返回的是11000000,则表示SIM卡支持的是反转模式。

根据定义,复位应答是一系列字节的值,这些字节是由卡作为对复位命令的响应发送给接口设备的。在I/O电路上,每个字节在一个异步字符中传输。
    每个成功的复位操作都会导致I/O上的一个初始字符TS,TS后面按照下面的次序跟有最多32个字符:
    T0…………………………………………格式字符,强制性
    TA(i) TB(i) TC(i) TD(i)…………… 接口字符,可选的
    T1 T2…Tk…………………………………历史字符,可选的
    Tck……………………………………… 检测字符,有条件的
• 初始字符定义了所有后继字符的解码协议。。
• 格式字符声明了第一组接口字符和所有历史字符。
• 接口字符由格式字符声明的位图技术来指明。
• 历史字符由编码在格式字符中的一个数字来指明。
• 校检字符依赖于某些接口字符中参数T的值。
为了表示简明,以下用[TS] T0 TA(i)…T1…Tck表示字节及传送字节的字符。


例:
ATR: 3b | 6c | 0 0 | 4e 54 49 43 32 64 8 1 4a 3 0 0

ATR-ATlength:16

SIM模块支持自动初始字符检测。当SIM模块准备ATR接收时,可以先通过SIM_CNTL寄存器的ICM比特将接收机设置初始字符检测模式。然后SIM模块会根据收到的初始字符,自动调整接收方式,并自动改变SIM_CNTL寄存器的传输模式IC比特。


ETU(Elementary Time Unit)
一个ETU的时间可以由软件选定,在ISO7816标准中规定了几个ETU传输时间的标准规格,其中标准时间为372个sim_clk时钟,另外还有一些增强速率的时间。SIM模块支持所有的ISO7816规定的ETU模式。


每帧数据采用Byte字符方式,一个Byte由8比特组成。每帧的传输由起始位、 字符数据(8位)、校验位和停止位组成,其中起始位为一个ETU(Elementary Time Unit)的低电平,数据位占用8个ETU的时间,校验位占用一个ETU的时间,停止位比特为高电平,占用2个ETU的时间。

ISO7816协议中还规定了一种紧凑的传输方式,此时停止比特只有1位,一个数据帧包含11个ETU,可以通过SIM_GUARD寄存器的RCVR11来配置SIM模块支持这种传输方式。


FIFO不是寄存器,而是通过寄存器写入的, FIFO是16*8, 但发送缓冲寄存器(SIM_XMT_BUF)是8位.

整理 by 水星cici

 
2009-08-26 23:09
条件接收是数字电视中的一个术语。
条件接收(Conditional Access,缩写为CA)是对内容的一种保护,它要求在满足一定的条件下才能访问某种内容。
---
CAS:条件接收系统,conditional access system
条件接收是容许被授权的用户使用某一业务,未经授权的用户不能使用这一业务的一种授权控制技术。

CAM:条件接收模块,conditional access module
实现业务授权管理和接收控制的功能模块.
---
CAM 卡的工作原理,从广义上讲就是TS流的解扰的过程,即CAM卡从加扰的TS流中过滤出含有控制字(Control Word)信息的TS数据包,然后将含有CW的密文数据(section data)送至smart card解密,得到CW后将其送至FPGA中对加扰的码流进行解扰,最后将解扰后的透明流传送给机顶盒解码。

条件接收系统原理
节 目有条件接收的核心是控制字CW(Control Word)传输的控制。在采用MPEG 2标准的数字电视系统中,与节目流有条件接收系统相关的有两个数据流:授权控制信息 ECM(Entitle Control Message)和授权管理信息EMM(Entitle Manage Message)。由业务密钥SK(Service Key)加密处理后的CW在ECM中传送,ECM中还包括节目来源、时间、内容分类和节目价格等节目信息。对CW加密的SK在EMM中传送,SK在传送前 要经过用户个人分配密钥PDK (Personal Distribute Key)的加密处理,EMM中还包含地址、用户授权信息。这是一种三层加密机制,那为何要用如此复杂的系统来完成在广播网络上的安全和控制机制呢?
为 了使订户能得到相应的服务,要对传输码流进行加扰,其过程就是在发端将原始信息由伪随机序列进行实时扰乱控制。接收端也有一个和发端结构相同的伪随机序列 产生器,只要收发两端间的序列同步(即用同一个初始值启动),接收端的伪随机序列(解扰序列)就可用来将加扰信息恢复为原始信息,为了达到同步要求,必须 由发端向收端发送一个去同步伪随机序列的起始控制字(是一个随机数)。 起始控制字(CW)作为解扰密钥使用。解扰密钥是系统安全的基本要素,该值虽在不断地随机变更(1秒可能变化几次),但还不够安全,因为CW是随加扰信息 一起通过公用网传送的,任何人都可读取研究它,一旦CW被窃密者读取破解,那么整个系统就瘫痪了,所以必须予以保护。为此对CW本身(以及系统数据的其它 部分)要用一个加密密钥通过加密算法对它进行加密保护,这个加密密钥只是一个用来变化加密算法结果的任意数。固定这个密钥是不适用的(安全性差),应当采 用变化密钥,通过CA控制器用人工的或其它自然方式产生新的随机数。 在具体应用中,这个密钥可以按网络经营商要求经常加以改变,通常由服务提供商产生用来控制其提供的服务,所以把它称为业务密钥SK(Service Key)。SK的使用和用户付费条件有关,一般情况下用户可以一个月付一次费,SK也按月变化,在有些特定系统中也被称为月密钥。业务密钥的时限是由服务 提供的时限确定的,在网络运营商提供的特殊服务中,如单次付费收视PPV(Pay-per-View)和即时付费收视IPPV(Impulse PPV)中 SK的时限就可能只是几个小时。
这里存在一个问题,因为在任何时间只有一个有效的业务密钥SK,在新旧密钥更迭期间,一些授权用 户将获得新密钥,而尚未授权用户仍是原来的旧密钥。寻址用户并分发密钥的时间由整个系统的用户数目和系统为此分配的带宽决定,但肯定有一个过渡时间,在此 期间哪个密钥应被用来加密系统的信息和数据呢?解决的方法就是给每个用户储存两个密钥,一个当前使用,一个“下一次”使用。 这两个密钥分别称作“偶密钥”和“奇密钥”(该称呼与密钥的实际使用没有任何关系,仅是一个名称),含有识别它为偶或奇的特征比特,解扰器接收到后将该密 钥存储在适当位置。如果当前使用偶密钥加密,则同时分配新密钥为奇密钥,在系统确定所有用户收到新密钥后偶密钥失效,同时新分配的奇密钥就启动来解密数 据,下一次密钥的分配就以新的偶密钥开始。为了让随时接入的用户也能收看到当前的节目,系统一般也会寻址播出当前的密钥。 CW虽已由SK加密,但这个密钥如果还是可以让任何人读取,那就意味着特定服务的定购者和非定购者将享有同等权利,网络运营商还是难以控制到特定的用户, 安全性还是存在问题,必须对SK再进行加密保护。这个加密过程就完全按照各个用户的特征来进行,由于共用网络寻址模式中数据包是按用户地址传送的,每个终 端设备有一个不重复的唯一的地址码,这就给出了一个解决方法,就是用地址码来对SK加密。
在实际使用中,终端设备的地址一般是公开的,且基本 不变,所以往往用和这个地址码相关联的一个数列来进行加密,因为这个数列(密钥)是由个人特征确定的,往往称为个人分配密钥(PDK)。PDK一般由CA 系统设备自动产生并严格控制,在终端设备处该序列数一般由网络运营商通过CA系统提供的专用设备烧入解扰器的PROM中,不能再读出。为了能提供不同级 别、不同类型的各种服务,一套CA系统往往为每个用户分配好几个PDK,来满足丰富的业务需求。 在已实际运营的多套CA系统(主要在欧美)中使用的运营商对终端用户的加密授权方式有很多种:如人工授权、磁卡授权、IC卡授权、智能卡授权(用IC构成 有分析判断能力的卡)、中心集中寻址授权(由控制中心直接寻址授权,不用插卡授权)、智能卡和中心授权共用的授权方式等。智能卡授权方式是目前机顶盒市场 的主流,也被我国广电总局确定为我国入网设备的标准配件。
 
2009-08-15 23:58

《道德经》是中国古代哲学著作。又称《老子》,被道教作为重要经典收入道藏。共81章,分上、下篇。现在通行本上篇言道,下篇言德。

---
上篇 道经

  第一章 道可道,非常道。名可名,非常名。 无,名天地之始,有,名万物之母。故常无欲,以观其妙; 常有欲,以观其徼[jiao(三声)]。 此两者同出而异名,同谓之玄,玄之又玄,众妙之门。
  第二章 天下皆知美之为美,斯恶已。皆知善之为善,斯不善已。故有无相生,难易相成,长短相较,高下相倾,音声相和,前后相随。是以圣人处无为之事,行不言之教;万物作焉而不辞,生而不有,为而不恃, 功成而弗居。夫唯弗居,是以弗去。
  第三章 不尚贤,使民不争;不贵难得之货,使民不为盗;不见可欲,使民心不乱。 是以圣人之治,虚其心,实其腹, 弱其志,强其骨。常使民无知无欲。 使夫智者不敢为也。为无为,则无不治。
  第四章 道冲而用之或不盈,渊兮似万物之宗;挫其锐,解其纷,和其光,同其尘,湛兮似或存。吾不知谁之子,象帝之先。
  第五章 天地不仁,以万物为刍狗; 圣人不仁,以百姓为刍狗。天地之间,其犹橐龠乎﹖虚而不屈,动而愈出。 多言数穷,不如守中。
  第六章 谷神不死,是谓玄牝。玄牝之门,是谓天地根。绵绵若存,用之不勤。
  第七章 天长地久。天地所以能长且久者,以其不自生,故能长生。是以圣人后其身而身先;外其身而身存。非以其无私邪,故能成其私。
  第八章 上善若水。水善利万物而不争,处众人之所恶[WU(四声)], 故几于道。 居善地,心善渊,与善仁,言善信,正善治,事善能,动善时。夫唯不争,故无尤。
  第九章 持而盈之,不如其已;揣而锐之,不可长保。金玉满堂,莫之能守; 富贵而骄,自遗其咎。功成身退,天之道也。
  第十章 载营魄抱一,能无离乎﹖抟气致柔,能婴儿乎﹖涤除玄览,能无疵乎﹖爱国治民,能无知乎﹖天门开阖,能为雌乎﹖ 明白四达,能无为乎﹖ 生之,畜之。生而不有,为而不恃,长而不宰,是谓玄德。
  第十一章 三十辐共一毂,当其无,有车之用。 埏埴以为器,当其无,有器之用。凿户牖以为室,当其无,有室之用。故有之以为利,无之用。
  第十二章 五色令人目盲,五音令人耳聋,五味令人口爽,驰骋畋猎令人心发狂,难得之货令人行妨。是以圣人为腹不为目,故去彼取此。
  第十三章 宠辱若惊,贵大患若身。何谓宠辱若惊﹖宠为下,得之若惊,失之若惊,是谓宠辱若惊。 何谓贵大患若身﹖ 吾所以有大患者,为吾有身,及吾无身,吾有何患﹖故贵以身为天下,若可寄天下;爱以身为天下,若可托天下。
  第十四章 视之不见名曰夷,听之不闻名曰希,搏之不得名曰微。此三者,不可致诘,故混而为一。其上不皎,其下不昧。绳绳不可名,复归于无物。是谓无状之状,无物之象,是谓惚恍。迎之不见其首,随之不见其后。执古之道,以御今之有。能知古始,是谓道纪。
  第十五章 古之善为士者,微妙玄通,深不可识。夫唯不可识,故强为之容﹕豫兮若冬涉川,犹兮若畏四邻,俨兮其若客,涣兮若冰之将释,敦兮其若朴,旷兮其若谷,浑兮其若浊。孰能浊以静之徐清﹖孰能安以久动之徐生﹖保此道者不欲盈,夫唯不盈,故能蔽不新成。
  第十六章 致虚极,守静笃。万物并作,吾以观复。夫物芸芸,各复归其根。归根曰静,是曰复命。复命曰常,知常曰明。不知常,妄作凶。知常容,容乃公,公乃王,王乃天,天乃道,道乃久,没身不殆。
  第十七章 大上,下知有之,其次亲而誉之,其次畏之,其次侮之。信不足焉,有不信焉。悠兮其贵言,功成事遂,百姓皆谓我自然。
  第十八章 大道废,有仁义;智慧出,有大伪;六亲不和,有孝慈;国家昏乱,有忠臣。
  第十九章 绝圣弃智,民利百倍;绝仁弃义,民复孝慈;绝巧弃利,盗贼无有。此三者以为文不足,故令有所属﹕见素抱朴,少私寡欲。
  第二十章 绝学无忧,唯之与阿,相去几何﹖善之与恶,相去若何﹖人之所畏,不可不畏。荒兮其未央哉﹗众人熙熙,如享太牢,如春登台。我独泊兮其未兆,如婴儿之未孩;乘乘兮,若无所归。众人皆有余,而我独若遗。我愚人之心也哉﹗ 沌沌兮,俗人昭昭,我独若昏。俗人察察,我独闷闷。澹兮其若海,漂兮若无止。众人皆有以,而我独顽似鄙。我独(欲)异于人,而贵食母。
  第二十一章 孔德之容,惟道是从。道之为物,惟恍惟惚。惚兮恍兮,其中有象;恍兮惚兮,其中有物。窈兮冥兮,其中有精;其精甚真,其中有信。自今及古,其名不去,以阅众甫。吾何以知众甫之状哉﹖以此。
  第二十二章 曲则全,枉则直,洼则盈,敝则新,少则得,多则惑。是以圣人抱一为天下式。不自见故明,不自是故彰,不自伐故有功,不自矜故长。夫唯不争,故天下莫能与之争。古之所谓曲则全者,岂虚言哉﹗诚全而归之。
  第二十三章 希言自然。故飘风不终朝,骤雨不终日。孰为此者﹖天地。天地尚不能久,而况于人乎﹖故从事于道者,道者同于道,德者同于德,失者同于失。同于道者,道亦乐得之;同于德者,德亦乐得之;同于失者,失亦乐得之。 信不足焉,有不信焉。
  第二十四章 企者不立,跨者不行,自见者不明,自是者不彰,自伐者无功,自矜者不长。其在道也,曰余食赘行。物或恶之,故有道者不处。
  第二十五章 有物混成,先天地生。寂兮寥兮,独立而不改,周行而不殆,可以为天下母。吾不知其名,字之曰道,强为之名,曰大。大曰逝,逝曰远,远曰反。故道大,天大,地大,人亦大。域中有四大,而王居其一焉。人法地,地法天,天法道,道法自然。
  第二十六章 重为轻根,静为躁君。是以圣人终日行不离辎重。虽有荣观,燕处超然。奈何万乘之主,而以身轻天下﹖轻则失本,躁则失君。
  第二十七章 善行无辙迹,善言无瑕谪;善数不用筹策;善闭无关楗而不可开,善结无绳约而不可解。是以圣人常善救人,故无弃人;常善救物,故无弃物,是谓袭明。故善人者,不善人之师;不善人者,善人之资。不贵其师,不爱其资,虽智大迷,是谓要妙。
  第二十八章 知其雄,守其雌,为天下溪。为天下溪,常德不离,复归于婴儿。知其白,守其黑,为天下式。为天下式,常德不忒,复归于无极。知其荣,守其辱,为天下谷,常德乃足,复归于朴。朴散则为器, 圣人用之,则为官长,故大制不割。
  第二十九章 将欲取天下而为之,吾见其不得已。天下神器,不可为也,不可执也,为者败之,执者失之。是以圣人无为,故无败,无执,故无失.故物或行或随,或歔或吹。或强或羸,或挫或隳。是以圣人去甚,去奢,去泰。
  第三十章 以道佐人主者,不以兵强天下。其事好还。师之所处,荆棘生焉。大军之后,必有凶年。善者果而已,不以取强。果而勿矜,果而勿伐,果而勿骄。果而不得已,果而勿强。物壮则老,是谓不道,不道早已。
  第三十一章夫佳兵者,不祥之器,物或恶之,故有道者不处。君子居则贵左,用兵则贵右。兵者不祥之器,非君子之器,不得已而用之,恬淡为上。胜而不美,而美之者,是乐杀人。夫乐杀人者,则不可以得志于天下矣。吉事尚左,凶事尚右。偏将军居左,上将军居右,言以丧礼处之。杀人之众,以哀悲泣之,战胜,以丧礼处之。
  第三十二章 道常无名,朴虽小,天下莫能臣也。侯王若能守之,万物将自宾。天地相合,以降甘露,民莫之令而自均。始制有名,名亦既有,夫亦将知止,知止所以不殆。 譬道之在天下,犹川谷之于江海。
  第三十三章 知人者智,自知者明。胜人者有力,自胜者强。知足者富。强行者有志。不失其所者久。死而不亡者寿。
  第三十四章 大道泛兮,其可左右。万物恃之而生而不辞,功成不名有。衣养万物而不为主,常无欲,可名于小;万物归焉而不为主,可名为大。以其终不自为大,故能成其大。
  第三十五章 执大象,天下往。往而不害,安平太。乐与饵,过客止。道之出口,淡乎其无味,视之不足见,听之不足闻,用之不可既。
  第三十六章 将欲歙之,必固张之;将欲弱之,必固强之;将欲废之,必固兴之;将欲夺之,必固与之。是谓微明。柔弱胜刚强。鱼不可脱于渊,国之利器不可以示人。
  第三十七章 道常无为而无不为。侯王若能守之,万物将自化。化而欲作,吾将镇之以无名之朴。无名之朴,夫亦将无欲。不欲以静,天下将自定。

下篇 德经

  第三十八章 上德不德,是以有德;下德不失德,是以无德。上德无为而无以为;下德为之而有以为。上仁为之而无以为;上义为之而有以为。上礼为之而莫之应, 则攘臂而扔之。故失道而后德,失德而后仁,失仁而后义,失义而后礼。夫礼者,忠信之薄,而乱之首。前识者,道之华,而愚之始。是以大丈夫处其厚,不居其薄;处其实,不居其华。故去彼取此。
  第三十九章昔之得一者,天得一以清,地得一以宁,神得一以灵,谷得一以盈,万物得一以生,侯王得一以为天下正。其致之,天无以清将恐裂,地无以宁将恐废,神无以灵将恐歇,谷无以盈将恐竭,万物无以生将恐灭,侯王无以贵高将恐蹶。故贵以贱为本,高以下为基。是以侯王自称孤﹑寡﹑不谷。此非以贱为本邪﹖非乎﹖故致数舆无舆,不欲琭琭如玉,珞珞如石。
  第四十章 反者道之动,弱者道之用。天下万物生于有,有生于无。
  第四十一章 上士闻道,勤而行之;中士闻道,若存若亡;下士闻道,大笑之。不笑,不足以为道。故建言有之﹕明道若昧,进道若退,夷道若类,上德若谷,大白若辱,广德若不足,建德若偷,质真若渝,大方无隅,大器晚成,大音希声,大象无形,道隐无名。夫唯道,善贷且成。
  第四十二章 道生一,一生二,二生三,三生万物。万物负阴而抱阳,冲气以为和。人之所恶,唯孤﹑寡不毂,而王公以为称。故物或损之而益,或益之而损。人之所教,我亦教之。强梁者不得其死,吾将以为教父。
  第四十三章 天下之至柔,驰骋天下之至坚。无有人无间,吾是以知无为之有益,不言之教,无为之益,天下希及之。
  第四十四章 名与身孰亲﹖身与货孰多﹖得与亡孰病﹖ 是故甚爱必大费,多藏必厚亡,知足不辱,知止不殆,可以长久。
  第四十五章 大成若缺,其用不弊。大盈若冲,其用不穷。大直若屈,大巧若拙大辩若讷。躁胜寒,静胜热。清静为天下正。
  第四十六章 天下有道,却走马以粪。 天下无道,戎马生于郊。 祸莫大于不知足;咎莫大于欲得。故知足之足,常足矣。
  第四十七章 不出户,知天下;不窥牖,见天道。其出弥远,其知弥少。是以圣人不行而知,不见而名,不为而成。
  第四十八章 为学日益,为道日损。损之又损,以至于无为。无为而无不为。取天下常以无事,及其有事,不足以取天下。
  第四十九章 圣人无常心,以百姓心为心。善者吾善之;不善者吾亦善之,德善.信者吾信之;不信者,吾亦信之,德信。圣人在天下怵怵,为天下浑其心,百姓皆注其耳目,圣人皆孩之。
  第五十章 出生入死。生之徒,十有三;死之徒,十有三;人之生,动之死地,亦十有三。夫何故﹖以其生生之厚。盖闻善摄生者,陆行不遇兕虎,人军不被甲兵;无所投其角,虎无所措其爪,兵无所容其刃。夫何故﹖以其无死地。
  第五十一章 道生之,德畜之,物形之,势成之。是以万物莫不尊道而贵德。道之尊,德之贵,夫莫之命而常自然。故道生之,德畜之。长之育之,亭之毒之,养之覆之。生而不有,为而不恃, 为而不有。 长而不宰。是谓玄德。
  第五十二章 天下有始,以为天下母。既得其母,以知其子,既知其子,复守其母,没身不殆。塞其兑,闭其门,终身不勤。开其兑,济其事,终身不救。见小曰明,守柔曰强。用其光,复归其明无遗身殃,是为习常。
  第五十三章 使我介然有知,行于大道,唯施是畏。大道甚夷,而民好径。朝甚除,田甚芜,仓甚虚;服文彩,带利剑,厌饮食,财货有余。是为夸盗。非道也哉﹗
  第五十四章 善建者不拔,善抱者不脱,子孙以祭祀不辍。 修之于身,其德乃真;修之于家,其德乃余;修之于乡,其德乃长;修之于国,其德乃丰;修之于天下,其德乃普。故以身观身,以家观家,以乡观乡,以国观国,以天下观天下。吾何以知天下然哉﹖以此。
  第五十五章 含德之厚,比于赤子。毒虫不螫,猛兽不据,攫鸟不搏。骨弱筋柔而握固。未知牝牡之合而全作,精之至也。终日号而不嗄,和之至也。知和曰常,知常曰明。益生曰祥。心使气曰强。物壮则老,谓之不道,不道早已。
  第五十六章 知者不言,言者不知。塞其兑,闭其门,挫其锐,解其分,和其光,同其尘,是谓玄同。故不可得而亲,不可得而疏;不可得而利,不可得而害;不可得而贵,不可得而贱,故为天下贵。
  第五十七章 以正治国,以奇用兵,以无事取天下。吾何以知其然哉﹖以此。天下多忌讳,而民弥贫;民多利器,国家滋昏;人多伎巧,奇物滋起;法令滋彰,盗贼多有。故圣人云﹕“我无为而民自化,我好静而民自正,我无事而民自富,我无欲而民自朴。”
  第五十八章 其政闷闷,其民淳淳;其政察察,其民缺缺。祸兮福之所倚,福兮祸之所伏。孰知其极﹖其无正。正复为奇,善复为妖。人之迷,其日固久。是以圣人方而不割,廉而不刿,直而不肆,光而不耀。
  第五十九章 治人事天,莫若啬。夫唯啬,是谓早服;早服谓之重积德;重积德则无不克,无不克则莫知其极;莫知其极,可以有国;有国之母,可以长久。是谓深根固柢,长生久视之道。
  第六十章 治大国,若烹小鲜。以道莅天下,其鬼不神;非其鬼不神,其神不伤人;非其神不伤人,圣人亦不伤人。夫两不相伤,故德交归焉。
  第六十一章 大国者下流。天下之交。天下之牝,牝常以静胜牡,以静为下。故大国以下小国,则取小国;小国以下大国,则取大国。故或下以取,或下而取。大国不过欲兼畜人,小国不过欲人事人。夫两者各得其所欲,大者宜为下。
  第六十二章 道者万物之奥。善人之宝,不善人之所保。美言可以市尊,美行可以加人。人之不善,何弃之有﹖故立天子,置三公,虽有拱璧以先驷马,不如坐进此道。古之所以贵此道者何﹖不曰﹕以求得,有罪以免邪﹖故为天下贵。
  第六十三章 为无为,事无事,味无味。大小多少,报怨以德。图难于其易,为大于其细;天下难事必作于易,天下大事必作于细。是以圣人终不为大,故能成其大。夫轻诺必寡信,多易必多难。是以圣人犹难之,故终无难矣。
  第六十四章 其安易持,其未兆易谋。其脆易泮,其微易散。为之于未有,治之于未乱。合抱之木,生于毫末;九层之台,起于垒土;千里之行,始于足下。为者败之,执者失之。是以圣人无为故无败,无执故无失。民之从事,常于几成而败之。 不慎终也。 慎终如始,则无败事。是以圣人欲不欲,不贵难得之货;学不学,复众人之所过。以辅万物之自然,而不敢为。
  第六十五章 古之善为道者,非以明民,将以愚之。民之难治,以其智多。故以智治国,国之贼;不以智治国,国之福。知此两者亦稽式。常知稽式,是谓玄德。玄德深矣,远矣,与物反矣,然后乃至大顺。
  第六十六章 江海所以能为百谷王者,以其善下之,故能为百谷王。是以欲上民,必以言下之。欲先民,必以身后之。是以圣人处上而民不重,处前而民不害。是以天下乐推而不厌,以其不争,故天下莫能与之争。
  第六十七章 天下皆谓我道大,似不肖。夫唯大,故似不肖。若肖,久矣其细也夫﹗我有三宝,持而保之。一曰慈,二曰俭,三曰不敢为天下先。慈故能勇;俭故能广;不敢为天下先,故能成器长。今舍慈且勇,舍俭且广,舍后且先,死矣﹗夫慈以战则胜,以守则固。天将救之,以慈卫之。
  第六十八章 善为士者不武,善战者不怒,善胜敌者不与,善用人者为之下,是谓不争之德,是谓用人之力,是谓配天,古之极。
  第六十九章 用兵有言﹕“吾不敢为主而为客,不敢进寸而退尺。”是谓行无行,攘无臂,仍无敌,执无兵。祸莫大于轻敌,轻敌几丧吾宝。故抗兵相加,哀者胜矣。
  第七十章 吾言甚易知,甚易行。天下莫能知,莫能行。言有宗,事有君。夫唯无知,是以不我知。知我者希,则我者贵。 是以圣人被褐怀玉。
  第七十一章 知不知上,不知知病。夫唯病病,是以不病。圣人不病,以其病病,是以不病。
  第七十二章 民不畏威,大威至矣。无狭其所居,无厌其所生。夫唯不厌,是以不厌。是以圣人自知不自见;自爱不自贵。故去彼取此。
  第七十三章 勇于敢则杀,勇于不敢则活,此两者或利或害。天之所恶,孰知其故﹖是以圣人犹难之。天之道,不争而善胜,不言而善应,不召而自来,繟然而善谋。天网恢恢,疏而不失。
  第七十四章 民不畏死,奈何以死惧之﹖若使民常畏死,而为奇者,吾得执而杀之,孰敢﹖常有司杀者杀,夫代司杀者杀,是谓代大匠斫,夫代大匠斫者,希有不伤其手矣。
  第七十五章 民之饥,以其上食税之多,是以饥。民之难治,以其上之有为,是以难治。民之轻死,以其求生之厚,是以轻死。夫唯无以生为者,是贤于贵生。
  第七十六章 人之生也柔弱,其死也坚强。万物草木之生也柔脆,其死也枯槁。故坚强者死之徒,柔弱者生之徒。是以兵强则不胜,木强则折。强大处下,柔弱处上。
  第七十七章 天之道,其犹张弓与﹖高者抑之,下者举之;有余者损之,不足者补之。天之道,损有余而补不足。人之道则不然,损不足以奉有余。孰能有余以奉天下,唯有道者。是以圣人为而不恃,功成而不处,其不欲见贤。
  第七十八章 天下莫柔弱于水,而攻坚强者莫之能胜,其无以易之。弱之胜强,柔之胜刚,天下莫不知莫能行。是以圣人云﹕“受国之垢,是谓社稷主;受国不祥,是为天下王。”正言若反。
  第七十九章 和大怨,必有余怨,安可以为善﹖是以圣人执左契,而不责于人。有德司契,无德司彻。天道无亲,常与善人。
  第八十章 小国寡民。使有什伯之器而不用,使民重死而不远徙。虽有舟舆,无所乘之,虽有甲兵,无所陈之。使人复结绳而用之,甘其食,美其服,安其居,乐其俗。邻国相望,鸡犬之声相闻,民至老死,不相往来。
  第八十一章 信言不美,美言不信。 善者不辩,辩者不善。知者不博,博者不知。圣人不积,既以为人,己愈有;既以与人,己愈多。天之道,利而不害;圣人之道,为而不争。

 
2009-08-12 22:37

国家标准代码,简称国标码,是中华人民共和国的中文常用汉字编码集,亦为新加坡采用。

现时中华人民共和国官方强制使用GB 18030标准,但较旧的计算机仍然使用GB 2312。

较常见的国家汉字标准代码列表:

GB 2312-80
信息交换用汉字编码字符集 基本集(又称 GB 或 GB0)
GB 13000.1-93
信息技术 通用多八位编码字符集(UCS)第一部分(相当于 ISO 10646-1:1993 中文版)
GB 18030-2005
信息技术 中文编码字符集
---

GB 2312或GB 2312-80是一个简体中文字符集的中国国家标准,全称为《信息交换用汉字编码字符集·基本集》,又称为GB0,由中国国家标准总局发布,1981年5月1日实施。GB2312编码通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。

GB 2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB 2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。

GB2312的出现,基本满足了汉字的计算机处理需要,它所收录的汉字已经覆盖中国大陆99.75%的使用频率。

对于人名、古汉语等方面出现的罕用字,GB 2312不能处理,这导致了后来GBK及GB 18030汉字字符集的出现。


--
GB 13000,中华人民共和国国家标准的国家标准代码之一,全称 GB 13000.1-93《信息技术 通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面》。此标准等同采用国际标准化组织 ISO/IEC 10646.1:1993《信息技术 通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面》。

GB 13000的字符集包含20,902个汉字。
--
GBK全名为汉字内码扩展规范,英文名Chinese Internal Code Specification。K 即是“扩展”所对应的汉语拼音(KuoZhan11)中“扩”字的声母。GBK 来自中国国家标准代码GB 13000.1-93。
GBK最初是由微软对GB2312的扩展,也就是CP936字码表 (Code Page 936)的扩展(原来的CP936和GB 2312-80一模一样),最初出现于Windows 95简体中文版中,由于Windows产品的流行和在大陆广泛被使用,中华人民共和国国家有关部门将其作为技术规范。注意GBK并非国家正式标准,只是国家技术监督局标准化司、电子工业部科技与质量监督司发布的“技术规范指导性文件”。
虽然GBK收录了所有Unicode 1.1及GB 13000.1-93之中的汉字,但是编码方式与Unicode 1.1及GB 13000.1-93不同。仅仅是GB 2312到GB 13000.1-93之间的过渡方案。
--
GB 18030,全称:国家标准GB 18030-2005《信息技术 中文编码字符集》,是中华人民共和国现时最新的内码字集,是GB 18030-2000《信息技术 信息交换用汉字编码字符集 基本集的扩充》的修订版。与GB 2312-1980完全兼容,与GBK基本兼容,支持GB 13000及Unicode的全部统一汉字,共收录汉字70244个。

---
GB/T 15273.1-94
ISO 8859-1 -1987

---
通用字符集(Universal Character Set,UCS)是由ISO制定的ISO 10646(或称ISO/IEC 10646)标准所定义的字符编码方式,采用4字节编码。

通用字符集又称Universal Multiple-Octet Coded Character Set,中国大陆译为通用多八位编码字符集.

-------
Unicode(统一码、万国码、单一码、标准万国码)是业界的一种标准,它可以使电脑得以呈现世界上数十种文字的系统。Unicode 是基于通用字元集(Universal Character Set)的标准来发展,并且同时也以书本的形式(The Unicode Standard,目前第五版由Addison-Wesley Professional出版,ISBN-10: 0321480910)对外发表。

Unicode组织(The Unicode Consortium)是由一个非营利性的机构所运作,并主导Unicode的后续发展,其目标在于:将既有的字元编码方案,以 Unicode编码方案来加以取代,特别是既有的方案在多语环境下,皆仅有有限的空间以及不相容的问题。

Unicode 组织在 1991 年首次发布了 The Unicode Standard(ISBN 0-321-18578-1)。 Unicode 的开发结合了国际标准化组织(International Organization for Standardization,简称 ISO)所制定的ISO/IEC 10646,即通用字元集(Universal Character Set,简称 UCS)。Unicode 与 ISO/IEC 10646 在编码的运作原理相同,但 The Unicode Standard 包含了更详尽的实现资讯、涵盖了更细节的主题,诸如字元编码(bitwise encoding)、校对以及呈现等。

Unicode 截至目前为止历次的版次与发布时间如下:

Unicode 1.0:1991年10月
Unicode 1.0.1:1992年6月
Unicode 1.1:1993年6月
Unicode 2.0:1997年7月
Unicode 2.1:1998年5月
Unicode 2.1.2:1998年5月
Unicode 3.0:1999年9月;涵盖了来自ISO 10646-1的十六位元通用字元集(UCS)基本多文种平面(Basic Multilingual Plane)
Unicode 3.1:2001年3月;新增从ISO 10646-2定义的辅助平面(Supplementary Planes)
Unicode 3.2:2002年3月
Unicode 4.0:2003年4月
Unicode 4.0.1:2004年3月
Unicode 4.1:2005年3月
Unicode 5.0:2006年7月
Unicode 5.1:2008年4月

大概来说,Unicode 编码系统可分为编码方式和实现方式两个层次。

编码方式
Unicode 的编码方式与 ISO 10646 的通用字符集(Universal Character Set,UCS)概念相对应,目前实际应用的 Unicode 版本对应于 UCS-2,使用16位的编码空间。也就是每个字符占用2个字节。这样理论上一共最多可以表示 216 即 65536 个字符。基本满足各种语言的使用。
上述16位 Unicode 字符构成基本多文种平面(Basic Multilingual Plane,简称 BMP)。最新(但未实际广泛使用)的 Unicode 版本定义了16个辅助平面,两者合起来至少需要占据21位的编码空间,比3字节略少。但事实上辅助平面字符仍然占用4字节编码空间,与 UCS-4 保持一致。

实现方式
Unicode 的实现方式不同于编码方式。一个字符的 Unicode 编码是确定的。但是在实际传输过程中,由于不同系统平台的设计不一定一致,以及出于节省空间的目的,对 Unicode 编码的实现方式有所不同。Unicode 的实现方式称为Unicode转换格式(Unicode Translation Format,简称为 UTF)。

UTF-8 编码,这是一种变长编码,它将基本7位ASCII字符仍用7位编码表示,占用一个字节(首位补0)。而遇到与其他 Unicode 字符混合的情况,将按一定算法转换,每个字符使用1-3个字节编码,并利用首位为0或1进行识别。这样对以7位ASCII字符为主的西文文档就大大节省了编码长度(具体方案参见UTF-8)。

在 UTF-16 编码实现方式中使用了大尾序(Big-Endian, 简写为UTF-16 BE)、小尾序(Little-Endian, 简写为UTF-16 LE)的概念,以及可附加的BOM(Byte Order Mark)解决方案,目前在PC机上的Windows系统和Linux系统对于UTF-16编码默认使用UTF-16 LE。

目前通用的实现方式是 UTF-16小尾序(BOM)、UTF-16大尾序(BOM)和 UTF-8。在微软公司Windows XP操作系统附带的记事本(Notepad)中,“另存为”对话框可以选择的四种编码方式除去非 Unicode 编码的ANSI(对于英文系统即ASCII编码,中文系统则为GB2312或Big5编码) 外,其余三种为“Unicode”(对应UTF-16 LE)、“Unicode big endian”(对应UTF-16 BE)和“UTF-8”。


在Microsoft Word下,按下 Alt 键不放,输入 0 和某个字符的 Unicode 编码(十进制),再松开 Alt 键即可得到该字符,如Alt + 033865会得到 Unicode 字元叶。另外按Alt + X 组合键,MS Word 也会将光标前面的字符同其十六进制的四位 Unicode 编码进行互相转换。
---
Unicode和ISO 10646的关系
历史上存在两个独立的尝试创立单一字符集的组织,即国际标准化组织(ISO)和多语言软件制造商组成的统一码协会(Unicode Consortium)。前者开发的 ISO/IEC 10646 项目,后者开发的Unicode项目。因此最初制定了不同的标准。
1991年前后,两个项目的参与者都认识到,世界不需要两个不兼容的字符集。于是,它们开始合并双方的工作成果,并为创立一个单一编码表而协同工作。从Unicode 2.0开始,Unicode采用了与ISO 10646-1相同的字库和字码;ISO也承诺,ISO 10646将不会替超出U+10FFFF的UCS-4编码赋值,以使得两者保持一致。

统一码协会公布的Unicode标准包含了ISO/IEC 10646-1实现级别3的基本多文种平面。在两个标准里,所有的字符都在相同的位置并且有相同的名字。

---
中日韩统一表意文字(英语:CJK Unified Ideographs),也称统汉字(Unihan),目的是要把分别来自中文、日文、韩文、越文中,本质相同、形状一样或稍异的表意文字(主要为汉字,但也有仿汉字如方块壮字、日本国字、韩国独有汉字、越南的喃字)于ISO 10646及Unicode标准内赋予相同编码。

越南文后来加入此计划,所以亦有 CJKV(中日韩越统一表意文字)的称呼。Unicode亦开始收录越汉字——喃字。

CJKV,是汉语(Chinese)、日语(Japanese)、韩语(Korean)、越南语(Vietnamese)的集合名词,其也组成了主要的东亚语言。CJKV这名词主要应用于软件产业与国际化与本地化领域。

中韩日越所使用的这些汉字总数,使用仅能呈现256字符的八位元字符编码系统自然是不足,至少必须使用十六位元固定宽度的字符编码、或是多位元可变长度的字符编码系统才能包含所有的汉字数量。十六位元固定宽度的字符编码(例如 Unicode 2.0 以及 2.0 之前的版本)目前已不再采用,取而代之的是可以包含更多的汉字的编码方式,例如 Unicode 5.0 包含了多达7万多的汉字,以及中华人民共和国政府现今所使用的GB18030字集。

即使中日越韩的编码具有共通的字集,然而用以呈现这些字集的常用编码方式是由各国政府以及软件公司所各自独立发展,并且彼此间并不相容。Unicode尝试着将这些不同的字集加以统一,即所谓的 Han unification(中日韩统一表意文字、或称中韩日越统一表意文字)。

---
CJK中韩日统一表意文字历史:
最初期的统一汉字(20,902字)
扩展A区包含有6,582个新的汉字,位置在 U+3400—U+4DB5
扩展B区包含有42,711个新的汉字,位置在 U+20000—U+2A6D6
按计划,中日韩统一表意文字扩展C区将收录4,149个汉字,包括来自中国大陆、澳门、台湾、日本、越南等尚未被编码的汉字。这些汉字预计会收录在下一版的 Unicode 版本中,位置在 U+2A700—U+2B734。
----
基本多文种平面(Basic Multilingual Plane, BMP),或称第零平面(Plane 0),是Unicode中的一个编码区段。编码从U+0000至U+FFFF。


CJK Unified Ideographs Extension A (3400–4DBF)
中日韩统一表意文字 (4E00–9FFF)
----
为鉴于Unicode原有的16位空间不足以应用,于是从Unicode 3.1版本开始,设立了16个扩展字码空间,称为辅助平面,使 Unicode 的可使用空间由6万多字增至约100万字。原有的Unicode空间称为基本平面或基本多文种平面(Basic Multilingual Plane,缩写BMP),俗称第0平面(Plane 0)。辅助平面字符要用上4字节来储存。

其中,第二辅助平面又称为表意文字补充平面(Supplementary Ideographic Plane,缩写SIP,或简称Plane 2),整个范围在 U+20000~U+2FFFD。整个平面配置的都是一些罕用的汉字或地区的方言用字,如粤语用字及越南语的字喃。现时摆放了“中日韩统一表意文字扩展B区”,共43,253个汉字,以及中日韩兼容表意文字增补(CJK Compatibility Ideographs Supplement)。预计“中日韩统一表意文字扩展C区”和“中日韩统一表意文字扩展D区”也会使用此平面。

----
《CJK统一汉字编码字符集》— 国家标准 GB13000.1 是完全等同于国际标准《通用多八位编码字符集 (UCS)》 ISO10646.1。《GB13000.1》中最重要的也经常被采用的是其双字节形式的基本多文种平面。在这65536个码位的空间中,定义了几乎所有国家或地区的语言文字和符号。其中从0x4E00到 0x9FA5 的连续区域包含了 20902 个来自中国(包括台湾)、日本、韩国的汉字,称为 CJK (Chinese Japanese Korean) 汉字。CJK 是《GB2312-80》、《BIG5》等字符集的超集。

---
UTF-8(8 位元 Universal Character Set/Unicode Transformation Format)是一种针对 Unicode 的可变长度字符编码。它可以用来表示 Unicode 标准中的任何字符,且其编码中的第一个字节仍与 ASCII 相容,这使得原来处理 ASCII 字符的软件无须或只须做少部份修改,即可继续使用。因此,它逐渐成为电子邮件、网页及其他储存或传送文字的应用中,优先采用的编码。

UTF-8 使用一至四个字节为每个字符编码:

128 个 US-ASCII 字符只需一个字节编码(Unicode 范围由 U+0000 至 U+007F)。
带有附加符号的拉丁文、希腊文、西里尔字母、亚美尼亚语、希伯来文、阿拉伯文、叙利亚文及它拿字母则需要二个字节编码(Unicode 范围由 U+0080 至 U+07FF)。
其他基本多文种平面(BMP)中的字符(这包含了大部分常用字)使用三个字节编码。
其他极少使用的 Unicode 辅助平面的字符使用四字节编码。

UTF-8的设计有以下的多字符组序列的特质:

单字节字符的最高有效位元永远为0。
多字节序列中的首个字符组的几个最高有效位元决定了序列的长度。最高有效位为110的是2字节序列,而1110的是三字节序列,如此类推。
多字节序列中其余的字节中的首两个最高有效位元为10。

UTF-8的编码方式
UTF-8是UNICODE的一种变长度的编码表达方式 《一般UNICODE为双字节(指UCS2)》,它由Ken Thompson于1992年建立,现在已经标准化为RFC 3629。UTF-8就是以8位为单元对UCS进行编码,而UTF-8不使用大尾序和小尾序的形式,每个使用UTF-8储存的字符,除了第一个字节外,其余字节的头两个位元都是以 "10" 开始,使文字处理器能够较快地找出每个字符的开始位置。

但为了与以前的ASCII码相容(ASCII为一个字节),因此 UTF-8 选择了使用可变长度字节来储存 Unicode:

Unicode和UTF-8之间的转换关系表 UCS-4编码 UTF-8字节流
U-00000000 – U-0000007F: 0xxxxxxx
U-00000080 – U-000007FF: 110xxxxx 10xxxxxx
U-00000800 – U-0000FFFF: 1110xxxx 10xxxxxx 10xxxxxx
U-00010000 – U-001FFFFF: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
U-00200000 – U-03FFFFFF: 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
U-04000000 – U-7FFFFFFF: 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

在ASCII码的范围,用一个字节表示,超出ASCII码的范围就用字节表示,这就形成了我们上面看到的UTF-8的表示方法,这様的好处是当UNICODE文件中只有ASCII码时,储存的文件都为一个字节,所以就是普通的ASCII文件无异,读取的时候也是如此,所以能与以前的ASCII文件相容。
大于ASCII码的,就会由上面的第一字节的前几位表示该unicode字符的长度,比如110xxxxxx前三位的二进制表示告诉我们这是个 2BYTE的UNICODE字符;1110xxxx是个三位的UNICODE字符,依此类推;xxx 的位置由字符编码数的二进制表示的位填入。越靠右的 x 具有越少的特殊意义。只用最短的那个足够表达一个字符编码数的多字节串。注意在多字节串中,第一个字节的开头"1"的数目就是整个串中字节的数目。。
ASCII字母继续使用1字节储存,重音文字、希腊字母或西里尔字母等使用2字节来储存,而常用的汉字就要使用3字节。辅助平面字符则使用4字节。

在UTF-8文件的开首,很多时都放置一个U+FEFF字符(UTF-8 以 EF,BB,BF 代表),以显示这个文字档案是以UTF-8编码。

UTF-8的特性
UTF-8图表说明 UTF-8
Smallest code point 0000
Largest code point 10FFFF
Code unit size 8 bits
Byte order N/A
Minimal bytes/character 1
Maximal bytes/character 4
UCS 字符 U+0000 到 U+007F (ASCII) 被编码为字节 0x00 到 0x7F(ASCII 兼容),这也意味着只包含 7 位 ASCII 字符的文件在 ASCII 和 UTF-8 两种编码方式下是一样的。
所有 >U+007F 的 UCS 字符被编码为一个多个字节的串,每个字节都有标记位集。因此,ASCII 字节 (0x00-0x7F) 不可能作为任何其他字符的一部分。
表示非 ASCII 字符的多字节串的第一个字节总是在 0xC0 到 0xFD 的范围里,并指出这个字符包含多少个字节。多字节串的其余字节都在 0x80 到 0xBF 范围里,这使得重新同步非常容易,并使编码无国界,且很少受丢失字节的影响。
可以编入所有可能的 231个 UCS 代码
UTF-8 编码字符理论上可以最多到 6 个字节长,然而 16 位 BMP 字符最多只用到 3 字节长。
Bigendian UCS-4 字节串的排列顺序是预定的。
字节 0xFE 和 0xFF 在 UTF-8 编码中从未用到,同时,UTF-8以字节为编码单元,它的字节顺序在所有系统中都是一様的,没有字节序的问题,也因此它实际上并不需要BOM。
与 UTF-16 或其他 Unicode 编码相比,对于不支援 Unicode 和 XML 的系统,UTF-8 更不容易造成问题。
【注】

UTF为UCS / Unicode Transformation Format“Unicode转换格式”的缩写。
UCS的中文全称为:信息技术--通用多八位编码字符集 (Universal Multi-octet Coded Character Set),由ISO/IEC 10646 标准描述。


---
by 水星cici
http://hi.baidu.com/hici

 
2009-08-09 00:26

昨天收到百度空间管理员“du掌柜”发来的系统消息,百度空间隆重推出了“游戏中心”测试版。目前有荣光医院、开心宝贝、德克萨斯扑克、小游戏、狗狗、礼物六款应用。

在跟开心网、校内网(现叫人人网)等SNS网站靠齐啊,先试玩一把狗狗游戏看看。

---
体验精彩游戏,您是VIP!

亲爱的ciciywg,

百度空间隆重推出了“游戏中心”测试版,很高兴您成为我们选中的第一批限量抢先试用用户!

在“游戏中心”里,您可以和好友们一起斗智斗勇玩扑克,还可变身院长显医术,或是养只狗狗来陪伴……多款精彩互动游戏,将拉近您和好友的距离,还可让您结实更多新鲜朋友。

若您愿意,也可将这个还未公开的神秘地址分享给您的空间好友们,组织大家一起玩。精彩的网络生活,即将从这里开始啦!

还等什么,点击链接进入“游戏中心”抢先体验吧:
http://apps.hi.baidu.com/

对本测试版“游戏中心”有任何的建议和意见,欢迎您反馈到duzhanggui@baidu.com

感谢您对百度空间的关注与支持!

Du掌柜

 
2009-06-27 00:48
北京时间6月26日凌晨,“流行音乐之王”迈克尔-杰克逊(Michael Jackson)在洛杉矶病逝,终年50岁。刚听到这个消息时很震惊,细看知道不会是愚人节玩笑,本来还在期待他的伦敦复出演唱会。

无可否认,迈克尔·杰克逊曾经像一道横空的霹雳,照彻和震撼过一代人的青春生涯。他的呐喊或歌唱,时而如狮虎,时而如百灵,融合极具独创性的魔幻舞姿,挟风云雷电席卷而来,所向披靡。几乎没有一个年轻人能够拒绝他的音乐。

迈克尔-杰克逊已逝,弃下众多歌迷而去,一个时代结束了。
 
2009-06-01 23:19
今天是萱萱来到这个世上的第10天,也是过的第一个儿童节。萱萱到来以后的生活也会发生巨大的变化。今天去海妇办理了出生医学证明,子萱的名字也算是确定了。萱萱的QQ号都早准备好了的,呵呵。

萱萱出生时身长50cm,体重3020g,顺产,40孕周+2。

萱萱现在挺可爱,基本只知道吃、睡、拉和哭,哈哈。有时间再整理下照片改天奉上。

Update 2009-6-7:
上传了几张萱萱的照片,地址在此http://picasaweb.google.com/ciciywg/jNCDHH
 
     
 
 
文章分类
 
 
 
生活(36)
 
游戏(12)
 
电影(14)
 
技术(30)
 
励志(21)
 
文字(32)
 
 
书籍(10)
 
     
 
水星cici的共享
 
   
 
个人档案
 
ciciywg
男, 27岁
北京 海淀区 
上次登录:
2天前
加为好友
 
   
 
文章合辑
 
 
 
 
     
 
我的网址
 
 
 
 
 
 
 
 
     
 
我的搜藏
 
     
 
背景音乐
 
 
订阅我的空间
 
已有人次访问本空间
 
订阅RSS  什么是RSS?

您也想拥有这样的空间?请点此申请。
     
 
最近访客
 
 

solunya

jiaoyupx

被嬡遗莣De亾

石头脑袋橙子心

guljan0211

LY19780928

勤上书山

ssyzyg
     


©2009 Baidu