電腦常見的文字編碼－burgesspennn8

索布語翻譯

因為經常瀏覽對岸的網站，有些時辰老是因為對岸盜版資本太厚實，而不能不倒戈翻譯

首要常見的文字編碼，以ANSI為其大宗。與今朝風行而勉力支援的Unicode有所分歧。

在Windows記事本裡面，有幾種存儲的體例。

附註：

後來，因為沒有門徑在統一段文字，行使同一個編碼去呈現不同國度的說話。

UTF-8記實體式格局是8 bit一個單元，分歧的文字採用不固定的長度記實翻譯

是以分歧的字會有分歧的記憶體佔用巨細翻譯

這些都是ANSI編碼的一種，所以假如去用一樣的文字去轉換成另外編碼辨識，就會構成亂碼。

利用時，若是轉換成繁體的話，可以存成Unicode-LE，如許就能夠正常辨識。

UTF-8 和 UTF-16兩大類

功能許多，包括MP3的ID3或是APE的標籤等等都可以做編碼轉換。

ANSI是美國所制訂的一種編碼，主要原本是用來存儲英文字元等翻譯

備註二：

離別是ANSI、Unicode(=Unicode Little Endian)、Unicode Big Endian、UTF-8等編碼。

其他說話國度透過相同的ANSI編碼，去做自己國家的說話文字對應，因此產生了中國GB、台灣Big5、日本Shift-JIS等。

(確切測試：Nokia 6300的S40系統，還有Sony Ericsson的W350i皆正常支援。)

大尾序(BE)的話，Macintosh 的文件是以 BE( Big Endian ) 來存的翻譯

首要的離別是「尾序( Endian )」的不同。

特別前陣子在下載電子書之類的，因為都是簡體的，所以研究了一下文字編碼，希望可以稍微領會一點。

然則UTF-16有兩種的存儲體例，一種是Unicode-LE、一種是Unicode-BE。

所以成長了一種叫做Unicode的通用編碼翻譯Unicode主要就是將全球的說話文字都收錄，而且對應翻譯

別的一種叫做UTF-16，其主要是用16 bit為一單元，根基上與UTF-8相容，

以下是鉦昱翻譯公司對於編碼所蒐集到的資訊，若是說有什麼毛病的，誰看到了麻煩告訴我一下翻譯

小尾序(LE)的話，Microsoft 或 Linux 的文件是以 LE( Little Endian ) 來存的翻譯

備註一：

主要分成1 Byte、2 Bytes、3 Bytes三種大小，其中，中日韓的文字大多落在3 Bytes，故若是將ANSI轉換成UTF-8，檔案凡是較大。

所以我們台灣經常使用的Microsoft系統，大多是Unicode-LE為主。

假如說想要將TXT轉換中文的編碼，可以操縱ConvertZ這個小程式。

以兩個2 Bytes對應一個文字來進行存儲。

是以可以在統一段文字中，出現不同的國度說話，同時轉換到分歧的電腦語言系統，也都不會亂碼，因為辨識的都是相同的Unicode。

利用手機觀看TXT檔案的話，輔以對岸玩家所寫的MOTO-TXT，只要支援JAVA的手機應該都可使用。

常見的Unicode標準裡面，有幾種編碼存儲方式。

文章出自: http://windsoul0312.pixnet.net/blog/post/29915007-%E9%9B%BB%E8%85%A6%E5%B8%B8%E8%A6%8B%E7%9A%84%E6%9有關各國語文翻譯公證的問題歡迎諮詢鉦昱翻譯公司02-23690937

fc7xe3nbg63

burgesspennn8

fc7xe3nbg63 發表在痞客邦留言(0) 人氣()

E-mail轉寄

burgesspennn8

歡迎光臨fc7xe3nbg63在痞客邦的小天地

電腦常見的文字編碼

歷史上的今天

留言列表

站方公告

活動快報

LG 20...

我的好友

熱門文章

文章分類

最新文章

最新留言

動態訂閱

文章精選

文章搜尋

新聞交換(RSS)

誰來我家

參觀人氣

POWERED BY