1.漢字的輸入編碼 為了能直接使用西文標準鍵盤(pán)把漢字輸入到計算機,就必須為漢字設計相應的輸入編碼方法。當前采用的方法主要有以下三類(lèi): 數字編碼 常用的是國標區位碼,用數字串代表一個(gè)漢字輸入。區位碼是將國家標準局公布的6763個(gè)兩級漢字分為94個(gè)區,每個(gè)區分94位,實(shí)際上把漢字表示成二維數組,每個(gè)漢字在數組中的下標就是區位碼。區碼和位碼各兩位十進(jìn)制數字,因此輸入一個(gè)漢字需按鍵四次。
數字編碼輸入的優(yōu)點(diǎn)是無(wú)重碼,且輸入碼與內部編碼的轉換比較方便,缺點(diǎn)是代碼難以記憶。
拼音碼 拼音碼是以漢字拼音為基礎的輸入方法。使用簡(jiǎn)單方便,但漢字同音字太多,輸入重碼率很高,同音字選擇影響了輸入速度。
字形編碼 字形編碼是用漢字的形狀來(lái)進(jìn)行的編碼。把漢字的筆劃部件用字母或數字進(jìn)行編碼,按筆劃的順序依次輸入,就能表示一個(gè)漢字。
為了加快輸入速度,在上述方法基礎上,發(fā)展了詞組輸入\聯(lián)想輸入等多種快速輸入方法。但是都利用了鍵盤(pán)進(jìn)行“手動(dòng)”輸入。理想的輸入方式是利用語(yǔ)音或圖象識別技術(shù)“自動(dòng)”將拼音或文本輸入到計算機內,使計算機能認識漢字,聽(tīng)懂漢語(yǔ),并將其自動(dòng)轉換為機內代碼表示。目前這種理想已經(jīng)成為現實(shí)。
2.漢字內碼 漢字內碼是用于漢字信息的存儲、交換、檢索等操作的機內代碼,一般采用兩個(gè)字節表示。英文字符的機內代碼是七位的ASCII碼,當用一個(gè)字節表示時(shí),最高位為“0”。為了與英文字符能相互區別,漢字機內代碼中兩個(gè)字節的最高位均規定為“1”。
注意:有些系統中字節的最高位用于奇偶校驗位,這種情況下用三個(gè)字節表示漢字內碼。
3.漢字字模碼 字模碼是用點(diǎn)陣表示的漢字字形代碼,它是漢字的輸出形式。
根據漢字輸出的要求不同,點(diǎn)陣的多少也不同。字模點(diǎn)陣的信息量很大,所占存儲空間也很大。因此字模點(diǎn)陣只能用來(lái)構成漢字庫,而不能用于機內存儲。字庫中存儲了每個(gè)漢字的點(diǎn)陣代碼。當顯示輸出或打印輸出時(shí)才檢索字庫,輸出字模點(diǎn)陣,得到字形。
圖2.1 漢字的字模點(diǎn)陣及編碼
注意,漢字的輸入編碼、漢字內碼、字模碼是計算機中用于輸入、內部處理、輸出三種不同用途的編碼,不要混為一談。
機內碼 國標碼:是指我國1981年公布的“中華人民共和國國家標準信息交換漢字編碼”,代號為“GB2312-80”。
由連續的兩個(gè)字節組成。 2.機內碼:在計算機內表示漢字的代碼是漢字機內碼,漢字機內碼由國標碼演化而來(lái),把表示國標碼的兩個(gè)字節的最高位分別加“1”,就變成漢字機內碼 3.輸入碼:漢字輸入碼是指直接從鍵盤(pán)輸入的各種漢字輸入方法的編碼,屬于外碼。
4.字型點(diǎn)陣碼:用點(diǎn)陣方式來(lái)構造漢字字型,然后存儲在計算機內,構成漢字字模庫。目的是為了能顯示和打印漢字。
(1)區位碼先轉換成十六進(jìn)制數表示 (2)(區位碼的十六進(jìn)制表示)+2020H=國標碼; (3)國標碼+8080H=機內碼 漢字的機內碼是指在計算機中表示一個(gè)漢字的編碼。機內碼與區位碼稍有區別。
漢字區位碼的區碼和位碼的取值均在1~94之間,如直接用區位碼作為機內碼,就會(huì )與基本ASCII碼混淆。為了避免機內碼與基本ASCII碼的沖突,需要避開(kāi)基本ASCII碼中的控制碼(00H~1FH),還需與基本ASCII碼中的字符相區別。
為了實(shí)現這兩點(diǎn),可以先在區碼和位碼分別加上20H,在此基礎上再加80H(此處“H”表示前兩位數字為十六進(jìn)制數)。經(jīng)過(guò)這些處理,用機內碼表示一個(gè)漢字需要占兩個(gè)字節,分別 稱(chēng)為高位字節和低位字節,這兩位字節的機內碼按如下規則表示: 高位字節=區碼+20H+80H(或區碼+A0H) 低位字節=位碼+20H+80H(或位碼+AOH) 由于漢字的區碼與位碼的取值范圍的十六進(jìn)制數均為01H~5EH(即十進(jìn)制的01~94),所以漢字的高位字節與低位字節的取值范圍則為A1H~FEH(即十進(jìn)制的161~254)。
例如,漢字“啊”的區位碼為1601,區碼和位碼分別用十六進(jìn)制表示即為1001H,它的機內碼的高位字節為B0H,低位字節為A1H,機內碼就是B0A1H。 2603 = 1A03H 區位碼 + A0A0H = BAA3H 機內碼 漢字的編碼知識 信息編碼各國有各國不同的編碼,國際上統一使用的編碼為ASCII(美國標準信息交換代碼),我國使用的有國標碼BG(中文),和BIG5(中文繁體)兩種。
附帶要知道:中文字庫(字庫文件名,大小,擴展名,存放位置) 中文輸入方法(語(yǔ)音輸入,鍵盤(pán)輸入,手寫(xiě)輸入,掃描輸入等) 1.漢字的編碼 (1)國標碼:是指我國1980年公布的“信息交換漢字編碼字符集”,代號為“GB2312-80”。由連續的兩個(gè)字節組成。
(2)機內碼:在計算機內表示漢字的代碼是漢字機內碼,漢字機內碼由國標碼演化而來(lái),把表示國標碼的兩個(gè)字節的最高位分別加“1”,就變成漢字機內碼。 (3)輸入碼:漢字輸入碼是指直接從鍵盤(pán)輸入的各種漢字輸入方法的編碼,屬于外碼。
(4)字型點(diǎn)陣碼:用點(diǎn)陣方式來(lái)構造漢字字型,然后存儲在計算機內,構成漢字字模庫。目的是為了能顯示和打印漢字。
編碼的轉換舉例 漢字 區位碼 16進(jìn)制 國標碼 機內碼 文 4636 2E24H 4E44H CEC4H “文”的區位碼為4636,區碼和位碼分別用16進(jìn)制表示即為“2E24H”, 0010 1110 0010 0100轉換成國標碼“4E44H”,0100 1110 0100 0100機內碼為“CEC4H”, 1100 1110 1100 0100 2.漢字的輸入方法 漢字輸入方法目前有兩大類(lèi)四種。 (1)鍵盤(pán)輸入法。
這是最常用的,利用各種漢字輸入方法的編碼敲擊鍵盤(pán)來(lái)輸入漢字; (2)非鍵盤(pán)輸入法。目前主要有三種方法。
手寫(xiě)筆輸入法:利用漢字識別技術(shù),通過(guò)書(shū)寫(xiě)筆在感應板上書(shū)寫(xiě)漢字把其輸入的方法。 語(yǔ)音輸入法:利用語(yǔ)音識別技術(shù),通過(guò)口說(shuō)來(lái)輸入漢字。
掃描識別輸入,是將印或寫(xiě)在紙上的漢字通過(guò)掃描儀輸入計算機,再經(jīng)相應軟件處理后轉換成漢字機內碼。 3.漢字字符集的概念 有兩種漢字字符集。
(1)國標碼字符集GB2312-80:該字符集收錄了6763個(gè)常用漢字,其中一級漢字3755個(gè),二級漢字3008個(gè)。另外還收錄了各種符號682個(gè),合計7445個(gè)。
(2)GBK漢字集:GBK即漢字擴充內碼規范,又稱(chēng)大字符集,一共收錄了20900個(gè)漢字。在Windows簡(jiǎn)體中文版中,又增加了101個(gè)補充字,一共有21001個(gè)字。
它包容了GB2312-80的6763個(gè)常用漢字,臺灣BIG5碼收錄了13000多個(gè)漢字,是目前見(jiàn)到的收錄漢字最多的漢字系統。
584,5682177778,12234.1798,76868.587129955,829475我發(fā)誓,我要抱你一起去吹吹風(fēng),與你愛(ài)相隨。
一起走吧,去溜噠溜噠。我不介意你久久吻我,被愛(ài)就是幸福。
1部: 1240最?lèi)?ài)是你; 1314一生一世; 1372一廂情愿; 1314925一生一世就愛(ài)我; 1392010一生就愛(ài)你一個(gè); 1414意思意思; 147一世情; 1573一往情深; 1711一心一意; 2部: 200愛(ài)你哦; 20160愛(ài)你一萬(wàn)年; 20184愛(ài)你一輩子; 2037為你傷心; 20475愛(ài)你是幸福; 20609愛(ài)你到永久; 20863愛(ài)你到來(lái)生; 230愛(ài)上你; 246餓死了; 246437愛(ài)是如此神奇; 20910愛(ài)我久一點(diǎn); 259695愛(ài)我就了解我; 259758愛(ài)我就娶我吧; 2627愛(ài)來(lái)愛(ài)去; 282餓不餓; 296愛(ài)走了; 2925184愛(ài)就愛(ài)我一輩子; 3部: 300想你哦; 30920想你就想你; 309420想你就是愛(ài)你; 3013想你一生; 32012想念你的愛(ài); 32069想愛(ài)你很久; 3207778想和你去吹吹風(fēng); 3399長(cháng)長(cháng)久久; 330335想想你想想我; 3344生生世世; 356上網(wǎng)了; 35910想我久一點(diǎn); 3731真心真意; 4部: 440295謝謝你愛(ài)過(guò)我; 4457速速回機; 4422335時(shí)時(shí)刻刻想想我; 456是我啦; 460想念你; 505求救(SOS); 510我依你、我已來(lái); 507680我一定要追你; 51020我依然愛(ài)你; 51095我要你嫁我; 51396我要睡覺(jué)了; 514無(wú)意思; 515206我已不愛(ài)你了; 518720我一輩子愛(ài)你; 51830我依舊想你; 520我愛(ài)你; 520x10000我愛(ài)你一萬(wàn)年; 521我愿意; 52308我愛(ài)上你啦; 52406我愛(ài)死你了; 526我餓了; 5260我暗戀你; 530我想你; 530184我想你一輩子; 5366我想聊聊; 53406我想死你了; 5376我生氣了; 53517230我想我已經(jīng)愛(ài)上你; 53719我深情依舊; 53770我想親親你; 53782我心情不好; 53880我想抱抱你; 53980我想揍扁你; 5406我是你的; 543720我是真心愛(ài)你; 54335無(wú)事想想我; 5452830無(wú)時(shí)無(wú)刻不想你; 546我輸了; 5460我思念你; 5490我去找你; 54920我始終愛(ài)你; 55646我無(wú)聊死了; 556520我不能不愛(ài)你; 5620我很愛(ài)你; 562009487我若愛(ài)你我就是白癡; 5670我要娶你; 57350我只在乎你; 57386我去上班了; 574839我其實(shí)不想走; 57410我心屬于你; 578補習班; 58晚安; 586我不來(lái); 584520我發(fā)誓我愛(ài)你; 587我抱歉; 592我好餓; 59420我就是愛(ài)你; 609到永久; 6120懶得理你; 6785753老地方不見(jiàn)不散; 6868溜噠溜噠; 687對不起; 7部: 70345請你相信我; 706起來(lái)吧; 70626請你留下來(lái); 706519184請你讓我依靠一輩子; 7086七零八落; 7087請你別走; 70885請你幫幫我; 721親愛(ài)的; 729去喝酒; 7319天長(cháng)地久; 740氣死你; 737420今生今世愛(ài)你; 7408695其實(shí)你不了解我; 73748096今生今世伴你左右; 745氣死我; 7474074去死去死你去死; 756辛苦了; 74839其實(shí)不想走; 765去跳舞; 7678吃飽了嗎; 770880520親親你抱抱你我愛(ài)你; 7731心心相印; 77543猜猜我是誰(shuí); 77895緊緊抱著(zhù)我; 7998去走走吧;。
數字有四種寫(xiě)法:
1、中文小寫(xiě)數字:一、二、三、四、五、六、七、八、九;
2、中文大寫(xiě)數字:零、壹、貳、叁、肆、伍、陸、柒、捌、玖;
3、阿拉伯數字:0、1、2、3、4、5、6、7、8、9;
4、羅馬數字采用七個(gè)羅馬字母作數字,即Ⅰ(1)、X(10)、C (100)、M (1000),V (5)、L(50)、D (500)。
擴展資料:
1、進(jìn)位數碼與大、小寫(xiě)數字的對照表
阿拉伯數字 :10,20,30,40,50,60,70,80,90,100
中文大寫(xiě)數字:拾,貳拾/念,叁拾,肆拾,伍拾,陸拾,柒拾,捌拾,玖拾壹佰
中文小寫(xiě)數字:十,二十/廿,三十/卅,四十/卌,五十/圩六十/圓,七十/進(jìn),八十/枯,九十/枠,一百
2、羅馬數字
(1)相同的數字連寫(xiě),所表示的數等于這些數字相加得到的數,如 Ⅲ=3;
(2)小的數字在大的數字的右邊,所表示的數等于這些數字相加得到的數,如 Ⅷ=8、Ⅻ=12;
(3)小的數字(限于 Ⅰ、X 和 C)在大的數字的左邊,所表示的數等于大數減小數得到的數,如 Ⅳ=4、Ⅸ=9;
(4)在一個(gè)數的上面畫(huà)一條橫線(xiàn),表示這個(gè)數增值 1,000 倍,如
=5000。
參考資料:搜狗百科詞條--中文數字
聲明:本網(wǎng)站尊重并保護知識產(chǎn)權,根據《信息網(wǎng)絡(luò )傳播權保護條例》,如果我們轉載的作品侵犯了您的權利,請在一個(gè)月內通知我們,我們會(huì )及時(shí)刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習?shū)B(niǎo). 頁(yè)面生成時(shí)間:3.694秒