別離是ANSI、Unicode(=Unicode Little Endian)、Unicode Big Endian、UTF-8等編碼翻譯
主要常見的文字編碼,以ANSI為其大宗。與今朝風行而努力支援的Unicode有所分歧。
所以成長了一種叫做Unicode的通用編碼。Unicode首要就是將全球的語言文字都收錄,並且對應。
大尾序(BE)的話,Macintosh 的文件是以 BE( Big Endian ) 來存的。
另外一種叫做UTF-16,其首要是用16 bit為一單元,根基上與UTF-8相容,
以兩個2 Bytes對應一個文字來進行存儲。
UTF-8 和 UTF-16兩大類
利用時,若是轉換成繁體的話,可以存成Unicode-LE,這樣就可以正常辨識。
行使手機觀看TXT檔案的話,輔以對岸玩家所寫的MOTO-TXT,只要支援JAVA的手機應該都可使用翻譯
首要分成1 Byte、2 Bytes、3 Bytes三種巨細,個中,中日韓的文字大多落在3 Bytes,故若是將ANSI轉換成UTF-8,檔案平日較大。
UTF-8記錄方式是8 bit一個單位,分歧的文字採用不固定的長度紀錄。
附註:
(確切測試:Nokia 6300的S40系統,還有Sony Ericsson的W350i皆正常支援。)
後來,因為沒有法子在統一段文字,哄騙統一個編碼去顯現分歧國家的語言。
首要的分別是「尾序( Endian )」的不同翻譯
ANSI是美國所制訂的一種編碼,首要本來是用來存儲英文字元等翻譯
備註一:
功能良多,包孕MP3的ID3或是APE的標籤等等都可以做編碼轉換。
在Windows記事本裡面,有幾種存儲的體式格局。
尤其前陣子鄙人載電子書之類的,因為都是簡體的,所以研究了一下文字編碼,進展可以略微了解一點翻譯
其他說話國度透過溝通的ANSI編碼,去做自己國家的說話文字對應,因此產生了中國GB、台灣Big5、日本Shift-JIS等。
是以分歧的字會有不同的記憶體佔用巨細翻譯
所以我們台灣經常使用的Microsoft系統,大多是Unicode-LE為主。
這些都是ANSI編碼的一種,所以假如去用一樣的文字去轉換成別的編碼辨識,就會形成亂碼。
然則UTF-16有兩種的存儲方式,一種是Unicode-LE、一種是Unicode-BE。
小尾序(LE)的話,Microsoft 或 Linux 的文件是以 LE( Little Endian ) 來存的。
是以可以在統一段文字中,顯現分歧的國度說話,同時轉換到分歧的電腦說話系統,也都不會亂碼,因為辨識的都是溝通的Unicode翻譯
常見的Unicode標準裡面,有幾種編碼存儲體例。
因為經常瀏覽對岸的網站,有些時候老是因為對岸盜版資本太厚實,而不能不倒戈翻譯
備註二:
若是說想要將TXT轉換中文的編碼,可以使用ConvertZ這個小程式。
以下內文出自: http://windsoul0312.pixnet.net/blog/post/29915007-%E9%9B%BB%E8%85%A6%E5%B8%B8%E8%A6%8B%E7%9A%84%E6%9有關各國語文翻譯公證的問題歡迎諮詢天成翻譯公司02-77260931
請先 登入 以發表留言。