(Traditional Chinese BIG5)=(正體中文大五碼)=(淏极笢恅湮拻鎢)=(喲圔) Unicode 補完計畫 2.50 (Win98/SE/ME/2K/XP/2K3) 注意:Windows 98/SE/ME 版本為 alpha release,請在閱讀所有文件、自己負責的 前提下安裝。  軟體名稱:Unicode 補完計畫 2.50 (Win98/SE/ME/2K/XP/2K3)  ∥版本:2.50  ∥分類:補綴工具  ∥環境:Win98/SE/ME/2K/XP/2K3  ∥性質:自由軟體(freeware)  ∥網頁:http://cpatch.org/unicode/  ∥論壇:http://leoboard.cpatch.org/cgi-bin/forums.cgi?forum=21  NLS 核心、後製、NSIS 安裝:巫培源 (Witch Five)  ∥mailto:witchfive@cpatch.org  ∥ICQ:16896247  ∥網頁: http://cpatch.org/witchfive/  企劃:柯志杰 (but)  ∥mailto:but@cpatch.org  規劃:黃國書 (Kii Ali)  ∥mailto:kiiali@cpatch.org  ∥ICQ:5107476  ∥網頁: http://cpatch.org/kiiali/  部分版權 (C) 櫻花輸入法 Roy Hu   部分版權 (C) 中國海有限公司 ■改名聲明 1.為推展上的順利,從 2.20b 版開始,與原有「Unicode 補完計畫」合  併,並以之為存續名稱。原名稱「BIG5 Extension」將轉為副標題。 2.原先對 BIG5 Extension 的承諾與使用支援,並不會有任何改變。 3.軟體的開發者 (witch, but, ka) ,以及軟體的本質 (以 NLS 方式取  得 unicode <-> ansi 新增對應,維持最大的相容),目前皆沒有改  變的計畫。 ■軟體散布   本套件(包括編碼表、輸入法、附屬程式工具等全部內容)為自由軟 體 (freeware)。任何人得自行安裝、複製、散佈本軟體。惟不得改變套件 內容之完整。亦不得未經許可,販賣、出租本套件,或其他直接或間接營 利之行為。但書刊、雜誌有必要時,允許將本套件收錄於附贈的光碟。本 條款僅適用於此版本,作者保留於未來版本修正約定條款的權力。   另外,歡迎轉貼此軟體的 readme 全文 (就是你現在看的這篇文章) ,到任何的留言板、討論版、BBS,或是寄送到個人 email。 ■公開測試版   這是 Alpha (公開測試) 版本,我們非常需要你的錯誤回報。如發生任 何問題,非常希望你能到論壇上面回報,並說明你的環境與碰到的問題,詳 見論壇的說明。論壇網址: http://leoboard.cpatch.org/cgi-bin/forums.cgi?forum=21 ■軟體描述   長久以來繁體中文編碼 BIG5 總是會碰到字數不足的窘境。日文假名 打不出來,還要灌櫻花輸入法什麼的,可是別人又說這個 IME 日文不一樣 ,一樣都是日文假名,問題一堆,怎麼那麼複雜啊?不單是假名,就連漢 字也東缺西缺,就像咱們的前行政院長「游錫? 」,在緊要關頭,他老是 變成「? 」問號,真是讓人生氣。 ◎ 你想自由地轉貼日文、簡體中文到 BBS 上、到 MP3 標籤裡,卻老是貼   出一堆 ???? 問號? ◎ 你想用日文 IME 輸入日文? 你想用注音輸入法輸入簡體中文?   這個軟體能擴充 BIG5 字碼,更相容於 Unicode。我們目前支援了 ShiftJIS、GB2312 大部分的文字,在 BBS、FTP、telnet 等眾多 ANSI 環 境下,立刻支援簡體字、假名,與許多符號。   你只需要想像,裝了神奇的 Unicode 補完計畫以後,部分原本不屬於 BIG5 的眾多 Unicode 字元 (簡體字、日文假名......),會被加入 BIG5 標準規格裡面,這樣你就可以懂了吧? ■原理 與 一堆雜七雜八的 ... 核心原理詳述,請參閱以下網址,這是一切的根本: http://cpatch.org/unicode/tech/index.html 以下我儘量把我理解的東西寫一寫吧,我是從上面那個網址的前身 (cosdream 時代) 開始接觸這玩意的,我前後花了兩年時間自己作功課才能全盤搞懂它, 我知道在看的各位俊男美女每個都比我聰明得多,如果您真有心想瞭解這個很 多人稱「邪惡的東西」到底在幹嘛,應該不用像我那麼久才能懂。 這是一系列的東西,先從古早的古早說起好了。 剛開始電腦在美國出現時,美國國家標準局鑑於資訊交換的重要及為統一 文字符號的編碼標準,讓不同廠牌機型的電腦皆能使用同一套標準化的信息交 換碼,於是特別制定了 ASCII 碼 (America Standard Code for Information Interchange,美國資訊交換標準碼),作為數據傳輸的標準碼。需注意的是這 個標準本身只有使用 7 個位元 (0 ∼ 127 用來表示英文字母、數字及其它符 號) ,後來 IBM 把它加了一個位元,變成現在使用的 8 個位元,並且定義了 128 ∼ 255 的字符,也由於早期 x86 電腦業界幾乎可以說是 IBM 本身的奮 鬥史,故這個 IBM 版的 ASCII 就變成目前電腦系統中使用最普遍也最廣泛的 英文標準碼。 這部份資料可參見: http://zh.wikipedia.org/wiki/ASCII http://zh.wikipedia.org/wiki/EASCII 微軟在 Dos 時代為了西方各國的需求,將各國的語言歸納後編號,定義 了所謂的 CodePage,如:美國用的英文就是 CodePage 437,我們用的正體中 文 Big5 是 CodePage 950,這個編號一直沿用至今。最初 CodePage 只是用 來定義他的表中,編號 xx 的字該長怎樣,編號 yy 的字該長怎樣。 後來 Unicode 標準出現了,微軟在 Windows 3.1 時代與 Apple 合作開 發了 TrueType 字型標準,就直接拿 Unicode 當作 TrueType 字型本身的「 序列碼」。 什麼是「序列碼」?我們知道「字型」本身其實就是一個大圖庫,那麼他 得有一個表頭去記錄他內含的哪個圖型是在編號第幾號,如此在實際取圖出來 應用時才知道要取哪一個,這個紀錄表就叫「序列碼」,在 TrueType 標準中 ,序列碼就是該字的 Unicode 碼。雖說如此,不過微軟在 Windows 下實作抓 取字型顯示的部份作了偷吃步:他把 CodePage → Unicode 的表放到 GDI 裡 面,如此便可加速 TrueType 字型的取字時間。 時間再往後推,Windows 95 出現了,微軟搞了個 VFAT 標準,他跟之前的 FAT 標準最大的差異在 VFAT 支援「長檔名」,而這長檔名的儲存法是這樣的 ,他使用 Unicode 去存長檔名的部份,而產生的短檔名則使用各語系 Windows 本身的 CodePage 編碼去存。也因為如此,所以在 Windows 95 系統目錄下開 始有了一個檔案叫作 Unicode.bin,這個檔的主要作用就是存放該 CodePage 的 CodePage → Unicode & CodePage ← Unicode 表,以讓檔案系統能正常運 作。這個檔負責的 CodePage ← Unicode 轉換,遇到「無對應」的字會以「底 線」顯示。 時間再往後推,到了 web browser 大戰的年代前期,微軟決定開發 IE 來跟 Netscape 對打,從 IE 4 開始,微軟為了「網路無國界」、多語顯示的 需求,擴充了 CodePage 架構,把 CodePage 表中加入了 CodePage → Unicode 及 CodePage ← Unicode 兩張表,又由於微軟的戰略運用,Internet Explorer 整合了原先的 Explore,從有內建 IE 的 Windows 版本開始,微軟就一直在 偷偷的用 Unicode 去代替 CodePage 了。這個檔負責的 CodePage ← Unicode 轉換,遇到「無對應」的字會以「問號」顯示。 到這裡為止,Windows 98/ME 使用的 2 個內含 CodePage ←→ Unicode 表 的檔案就出線了:專管 Explore Big5 顯示的 CP_950.NLS,與檔案系統使用的 Unicode.bin。不過提到這別忘了在顯示部份還有一個抓字型圖的 GDI.EXE,他 本身只有 CodePage → Unicode 的表。   Windows 2000/XP 是 NT 核心的作業系統,其內部所有的訊息都是使用 Unicode 在傳遞,微軟為了讓 2000/XP 能吃下 98 時代的眾多不支援 Unicode 舊軟體,所以會讓系統在背景無時不刻的作 CodePage ←→ Unicode 的轉換動 作。換句話說,您在 Windows 系統內 (包括 98) 看到的一切,您以為那是您熟 悉的 Big5,其實那些都早就被轉成 Unicode 了,只不過他以 Big5 的排列順序 出現而已。「開始」選單是這樣,檔案總管顯示的是這樣,甚至您用 IE 開啟一 個 Big5 網頁,也是這樣的結果。 或許微軟本身也發覺了,在一個系統中同時使用三份相同內容的表在作不同 的事,是蠻笨的作法,所以在 NT 系統下,這三個檔被整合成一個,以 Big5 而 言,就是 C_950.NLS 這個檔案。 至此,Unicode 補完計畫動到的所有 Windows 系統檔,已經全部列出來了。 接下來的部份,請參閱 http://cpatch.org/unicode/tech/index.html,我 說過,這是一切的根本,而且我並無法寫的比他更容易讓人理解,所以我就不多 廢話了。 至於為什麼在裝了補完後,一定要作改名才能存取原本的舊檔案,如果您搞 懂 http://cpatch.org/unicode/tech/index.html 在講什麼、前面這些基礎知識 您也都搞懂了,那這個問題基本上您就已經理解了。我試著再解釋看看。 前面有提到 VFAT 如何存長、短檔名了 (忘記的人請再拉回去看) ,今天假 設您有一個檔叫作「ややややや.txt」,您的系統未安裝補完前,他在磁碟上的 長、短檔名會是這樣 (為求方便理解,我直接列出 hex 碼): 檔名:ややややや.txt 長檔名:F6F8F6F8F6F8F6F8F6F8002E007400780074 → Unicode 格式 然後,今天您裝了補完計畫,因為日文被我們從 Unicode 造字區改對應到 Unicode 日文區去了,如果您的應用程式是個不支援 Unicode 的程式 (如:ACDSee 、Nero、Winamp) ,他在跟系統要檔名列表時,系統會先去取檔名列表回來,但 是系統發現這個要求的動作不是使用支援 Unicode 的 API 來呼叫的,所以系統 會在背景把取得的列表處理過再傳給應用程式,這時應用程式看到的檔名是長這 樣的: 檔名:ややややや.txt 長檔名:C6E8C6E8C6E8C6E8C6E82E747874 → CodePage 格式 您可以看到,雖然該應用程式有取到長檔名,但是他的內容已經被系統自動轉 碼過了,本質已經變了。如果您這時命令應用程式去操作這個檔,那麼系統會在收 到應用程式要求後,再對該 CodePage 長檔名在內部作一次轉換的動作,於是最後 系統會用這個檔名去操作您的檔案: 檔名:ややややや.txt 長檔名:30423042304230423042002E007400780074 → Unicode 格式 但是您磁碟上的檔名並不是上面這個,所以最終結果就會發生系統回報「找不 到檔案」、「無法開啟」的錯誤訊息。 要解決這個問題,在 2K/XP 下可以透過系統提供的 Unicode API 去作改檔名 的動作,讓您的舊檔名能正確對應到轉換過的 Unicode 字碼,這支程式我們也有 提供,叫作 UcFileRenamer。98 下則到目前為止沒有簡單的方法可以處理這個, 因為 98 下沒有 Unicode API,或許您會說微軟有提供所謂的 Unicode Layer,但 那個也只是一個 Unicode API 的接收器而已,要使用它應用程式要在編譯時把它 加入一起編,重點是他最後還是會把收到的 Unicode API 轉換過後,用舊系統 API 去作您要它作的事,回傳值也一樣會在內部轉換過後再傳回去應用程式手上,所以 這個東西對我們的需求,根本沒用。 最後回應一下 MozTW 最近在提的,讓補完計畫只作 Big5 → Unicode 對應, 而 Unicode → Big5 的對應則回歸微軟 CP950,基本上 FireFox/Mozilla 本身不 會碰觸檔案系統,所以他可以這麼搞,但補完計畫並不一樣,因為補完計畫改的是 系統本身在使用的 Big5 ←→ Unicode 對照表,所有跟 Unicode 有關的東西都會 因此被影響到,包括上面提的「檔案操作」問題,所以補完計畫在這部份必需實作 雙向對應。 ■測試網頁 測試: 1.使用 IE 觀看測試:以 ie 開啟「測試頁」,看能不能看到「左簡右繁  」、「日文假名」。 2.未安裝者,出現「部分空白」。 3.已安裝者,正常顯示。 測試頁位置 http://cpatch.org/witchfive/1/C.HTM http://cpatch.org/witchfive/1/J.HTM ■版本歷程 請參照 history.txt。 ■答客問 Unicode 補完計畫 2.50 ◆Q1 裝上這個,有什麼立刻的好處? ◆Q2 這跟「BIG5 Extension」有什麼不一樣? ◆Q3 這跟「中國海」有什麼不一樣? ◆Q4 已經安裝「Unicode 補完計畫」,要不要先解除安裝? ◆Q5 我們的輸入法不支援這些字啊? ◆Q6 其他語言版本的Windows下,能不能安裝?有什麼影響? ◆Q7 他是不是「國家標準」? 是不是免費、自由的? ◆Q8 其他廢話 ◆Q9 香港字、臺灣地名人名字與 HKSCS 的技術問題 ◆Q10 目前總對應字數達成率 ◆Q11 如果我使用 Win98 ,又想拿 5.x 版的細明體更新系統 ◆Q12 這跟「BIG5 2003」有什麼不一樣? ◆Q1 裝上這個,有什麼立刻的好處?  1.解決──簡體中文、日文假名、日文漢字、日本國字   1) 轉貼 BBS 時,所產生一大堆 ???? 問號問題。   2) 正常顯示、正常列印放大縮小,不需要安裝造字。   3) 因為他根本就不是造字!你電腦裡本來就有這些字!我們是將這     5300 字釋放出來。  2.游鍚「坤」,王建「火宣」,生物上的「酉每」之類的特別外字,   原本未納入 BIG5 標準,現在全部納入。不需要再造字。提供絕大   部分繁體字地區 (含香港/臺灣/人名等) 常見外字。  3.可顯示、列印,如果您的文件存成 Unicode 格式,甚至可在網路交換, 即使對方未安裝任何造字、也未安裝本軟體,也一樣 ok。是的,所見即 所得。 ◆Q2 這跟「BIG5 Extension」有什麼不一樣?   從 Unicode 補完計畫 V2.20 beta 起,已與 BIG5 Extension 合併。  兩者相同。 ◆Q3 這跟「中國海」有什麼不一樣?  中國海的網址  http://www.chinasea.com.tw  坦白說,在拜讀「高衡緒」先生所排列出來的中國海字型,對其人在字型  與內碼的思考與規劃,完全拜服。但很可惜的,因 unicode 興起,註定  在商業市場上落敗,而且未納為標準 (雖然一度是個人在 DOS 使用下的  標準。)  只是,中國海是「造字」格式,因此必須另外安裝造字檔案。對應到的  unicode 碼位段落,都在 unicode 造字區。交換訊息時會有問題。「  Unicode 補完計畫」根本不是造字,只是把對應的碼位,重新排列到  unicode 的標準位置上。因此在網路上以 unicode 環境交換時 (比如 IE  /ICQ),根本不生問題。  不管對方有沒有安裝,只要基於 unicode 平臺 (IE6/ICQ/MSN) 交換訊息  ,不需要擔心流通問題。 ◆Q4 1)已經安裝「Unicode 補完計畫」,要不要先解除安裝?    2)已經安裝「BIG5 Extension 舊版」,要不要先解除安裝?    3)已經安裝「中國海字型」,要不要先解除安裝?    1) 已安裝 Unicode 補完計畫──「不」需要解除安裝。  2) 已安裝 BIG5 Extension 舊版──「不」需要解除安裝。  2) 已安裝中國海──不用解除安裝。  因此可以讓你達到「最佳交換相容性」「最佳個人使用性」的雙重效果。  在 unicode 上交換,沒有問題,個人使用也可以最爽的狀態。 ◆Q5 我們的輸入法不支援這些字啊?  誰說的。  Windows 2000/XP 微軟內建「標準注音」「標準倉頡」「標準大易」「微  軟新注音」「微軟新倉頡」,早就支援了。Win98/Me 從此版開始也加入支 援,而使用的輸入碼表是從 XP 的上列輸入法「偷」來的。  ※註:注音輸入法只有支援簡體中文,不支援日文漢字。  並且,安裝這個程式後最大的好處,不必再受一堆限制了。我大可直接使  用 MS IME 來打日文,何必繼續使用櫻花飽受切換輸入法之苦呢?  ※註:因為部分 ANSI 軟體設計問題,可能需要打在記事本再複製貼上。 ◆Q6 1)簡體中文版 OS 下,能不能安裝?有什麼影響?    2)英文版 OS 也可以嗎?  可以。 (包含 Win98/win2k/xp)    1) 對一般作業,不會產生任何影響。  2) 以 IE6 觀看繁體中文的網頁時,產生擴增的效果。 ◆Q7 他是不是「國家標準」? 是不是免費、自由的?  臺灣目前沒有任何 ANSI 內碼屬於「國家標準」,祇有「交換碼」才規範。  臺灣政府單位 (如經濟部標準檢驗局,或行政院主計處等) 一貫的態度,認  為一般末端使用者所用的「中文編碼系統」不應硬性規定成國家標準。經濟  部中央標準局 (今標檢局) 在民國 75.08.04 公布 CNS 11643 通用漢字標  準交換碼為國家標準,並於民國 81.05.21 公布擴充後的標準,並修訂名稱  為 CSIC 「中文標準交換碼」。  簡單說,沒有什麼是「內碼的國家標準」。至於一般末端使用者,不太可能  接觸或使用交換碼。  目前祇有 BIG5 可算是業界標準。在 2003 年下半,由中推會接受委託協調  完成的 BIG5-2003,雖然他是最接近「國家標準」的東西,但他一樣不是國 家標準 ── 國家標準是 CNS11643,Big5-2003 只是列在 CNS11643 規格書 的一個參考附錄。Unicode 則是 ISO standard ,祇有相容於 Unicode,才 能順利在各應用平臺交換,並與國際接軌。 註:有關各種 Big5 的相關資料,請參考此 link。 http://moztw.org/docs/big5/  所以我們很希望他成為「標準」。就像以往想要使用日文假名時,就安裝  櫻花、中國海一樣。  不用覺得很困難,事實上只要有需要在 BBS、telnet 等環境使用簡體、  日文的人,都踴躍安裝,相信成為非公認標準,絕不是一件難事。事實上  Unicode 補完計畫 2.0 已經在使用日文的族群中很普及了。  我們很願意在 Free Software 的理念下,自由地經由商業或非商業管道散 佈這個軟體,不需要任何條件、利益、或事前通知。我們不可能,也沒有意 願以此做謀利手段。  所以,趕快安裝吧! ◆Q8 其他廢話  BIG5 字碼的缺陷很多。大陸 1980 年起使用的 GB 2312 也是, 只有  6763 個漢字及符號。這大概可以滿足很多人的數字比較狂。    但 1993 年公布的《漢字擴展規範 GBK 1.0 》,讓大陸朋友在看繁體中  文時,或使用繁體中文軟體,絲毫沒有亂碼、問號、缺字。對簡體中文用  戶而言,這種爛問題,簡直是無法想像。  繁體中文 OS 缺字就是缺字,不是「我們不會用到簡體字」就可以含混帶  過,人家就不缺。臺灣政府雖有心整頓 BIG5 標準,卻無魄力與決心,亦  無遠見解決簡體中文顯示、亂碼、問號、缺字種種問題。BIG5+ 、BIG5e  都是這種理念下的過渡產物,但卻始終未能普及。說真的, BIG5 使用者  的處境,還真夠可憐。  我們當然也知道 CNS-11643,但只恐不能解決問題。  不客氣的說,BIG5 是臨時趕工出來的標準,被閹割而自我設限的,在這  上面的 OS 作業系統,都會有缺陷。    我們只想解決 BIG5 1.0 的問題。而且,已經解決了! ◆Q9 香港字、臺灣地名人名字與 HKSCS 的顧慮 詳閱此處 http://leoboard.cpatch.org/cgi-bin/topic.cgi?forum=21&topic=72&show=0 ◆Q10 目前總對應字數達成率  其實這樣算不太妥當,BIG5 畢竟不是 s-jis、 GB2312 或是 HKSCS。 目前達成率: 1. 只要是 GB2312 中出現的「漢字」,全面雙向對應。 2. 只要是 S-JIS 中出現的「漢字」,全面雙向對應。 3. HKSCS 中出現的「漢字」,只要它的 unicode 碼落在 U+4E00∼U+9FA5 內, 全面雙向對應。但即使如此,補完計畫跟 HKSCS 在純 Big5 下還是完全不相 容的,因為他們的碼位不同。如:U+90A8,對應到 HKSCS 是 0x9068,對應 到在補完計畫是 0x9540 ── 它們只能在 Unicode 層面下作交換,而不能 在 Big5 下相容。 4. 舊中國海字集造字部份,原則上漢字全數保留,其它符號、數字等的字符, 只要 2 Bytes Unicode 內有對應字的就會儘量留下 (Unicode v3.1)。 5. 韓國文字,受限於 Big5 碼位幾近用完,目前恕無法提供支援。    ps: 這些是指 [gb2312、s-jis、hkscs] ←→ unicode ←→ big5 的情況。 ◆Q11 如果我使用 Win98 ,又想拿 5.x 版的細明體更新系統 請先參閱末端「 Win98 已知缺字問題」,並參考這裡。 http://cpatch.org/witchfive/pastepic/newttf/newttf.html ◆Q12 這跟「BIG5 2003」有什麼不一樣? 基本上有下列的不同: 1. 8A40 ∼ A0FE、FA64 ∼ FEFE 這些 Big5-2003 的造字區被補完計畫用掉了。 2. C7F3 ∼ C8FE 這些 Big5-2003 的保留區被補完計畫用掉了。 3. 扣掉上述兩項,為了讓使用者能儘量「看」到字、看到原本的字,補完計畫跟 Big5-2003 還有這 40 碼不同,不過在這份說明文件中並無法呈現出差異,請 有興趣的人自行到這個網址觀看: http://cpatch.org/witchfive/1/uao-big52k3-diff.htm ■檔案下載 (win98/SE/ME/2000/XP/2003) Unicode 補完計畫 2.50 3 MB http://search.cpatch.org/download/patchutil/unicodeaton/unicodeaton_250.exe ■安裝方式 NSIS 2.10 多語言安裝格式。 1.依照螢幕指定進行。 2.重新開機。 3.如需要使用「櫻花輸入法」「日文輸入法」「MS-IME 日文輸入法」,請在 安裝時直接「勾選」即可。安裝程式會自動幫你把勾選的輸入法都掛進來。 4.Win98 部分,如果你自認用不到「簡體字」,你可以不裝「中國海字集」。 如果你要使用「簡體字」,則仍需要安裝中國海字集。 Win2k 不需要中國 海字集。 5.WinME 使用者請準備好軟碟片與軟碟機,如果都沒有,那您必需自己手動把 補完的系統檔移到定位。 在安裝完補完後,用 cd 開機或其它的方式 (如果您使用雙系統可以切換到 XP 開機),首先先找到您的 Windows\System 目錄,然後把此目錄中的 CP_950-.nls →→ CP_950.nls unicode-.bin →→ unicode.bin gdi-.exe →→ GDI.EXE 如果您的 Windows 目錄有 TTFCACHE 這個隱藏檔,請自行刪掉一次。 6.使用非正體中文 Windows XP 的使用者,如果您遇到「C_950.nls 被莫明 鎖定而無法安裝」問題,您可以使用 UnLocker 把它線上解鎖,然後直接再 重裝一次即可。 http://ccollomb.free.fr/unlocker/ 7.給 Win 2K/XP/2003 使用者:請安裝完後 儘.快.重.開.機 藉已取回 Windows 系統對 windows\system32 目錄的防護能力。 8.如果您要自己手動裝中國海字集,請使用下面方法安裝: 1)你要先去抓「中國海字集」: http://input.cpatch.org/font/easy/cswsmin.zip 2)抓完後,把它解到你的 windows 目錄內,然後用「記事本」編輯解出來的 cswmin.reg,把此行: "SystemDefaultEUDCFont"="c:\\winfont\\cswsmin.TTE" 改成: "SystemDefaultEUDCFont"="c:\\windows\\cswsmin.TTE" 3)儲存後,離開「記事本」,再用「檔案總管」對 cswmin.reg 按二下執行, 匯入此登錄值。匯入完成後,系統需要重新啟動。 ■回應與論壇 中文化專業論壇 http://leoboard.cpatch.org/cgi-bin/forums.cgi?forum=21 ■共通的一些問題 & 解法: 0)部份問題 & 解答含有圖片內容,請至此 link 觀看完整的內容: http://leoboard.cpatch.org/cgi-bin/topic.cgi?forum=21&topic=286&show=0 1)問:如何確認你想用的字型在 unicode 下日文假名有沒有缺字? 答:請使用 2K/XP 內附的「字元對應表」檢視你想要使用的字型,看看 在 Unicode 內碼 U+3041 有沒有字,如果 U+3041 沒有出現「や」 的話,代表這個字型在 unicode 下缺字。 2)問:我使用 KKMan,在 bbs 下「漢字」都變成亂碼。 答:KKMan 3.0 之前的版本對 Big5 內碼定義受限,它只承認傳統的 A140 ∼ F9FE,但 Big5 包含造字區之合法字碼範圍為 8140 ∼ FEFE。這造成舊版 KKMan 對「造字」完全不具相容性。但補完計 畫會使用到這些造字範圍,所以那些「字」就被舊版 KKMan 變 成亂碼了。 目前新的 KKMan 3.0 已經解決此問題,請更新您手上的 KKMan 或 者請你跳槽使用 PCMan。 3)問:日文的疊字符號「ぼ」在文件 & BBS 中可以正常顯示 (變粗體) 但是放到檔名中就會變成「□」。 答:這是因為「從古至今」出現過的「所有版本」的「細明體」都「沒 有這個字」。 我們已經把這個字對到正確的位置,可是因為「細明體」缺字,所 以也無法顯示。 在部份環境,如 IE 或 BBS,軟體「可能」會自動找到其他字型來 補,這在 IE 下通常是有效的。BBS 這部份,就 PCMan 的測試而 言,字型集保持在「CHINESE_BIG5」狀態下,通常也會自動找到其 他字型的字來補。 但「檔案總管」就是一個不會去自動抓字型補的環境,這沒辦法。 事實上從控制台把桌面環境全部改用「日文字型」 ── 如:MS Gothic ── 就能看的到了。不過應該沒有必要這樣做就是了。 4)問:我裝了補完計畫後,FrontPage 2003 就不能開啟了,一開就錯誤 跳出。 答:我們並不知道導致這個問題的原因為何,無論如何,下面這個方法 是由熱心的 mina 網友所提供的,如果您也有這樣的問題,請試試 這個方法 or 改用 FrontPage 2002。 http://leoboard.cpatch.org/cgi-bin/topic.cgi?forum=21&topic=329 ■已知問題 1.Win98  1)Win98 使用 ANSI (950) 字碼頁為運作核心,而非 unicode。   Win2k 則使用 unicode 為核心。 2)Win98 下,無法直接使用「舊檔名」的檔案,舊檔名檔案需要經過「改 名」才能使用。  3)Win98 下純「問號型式」的程式亂碼  (如簡體中文的程式, 在繁體  中文 Win98 執行 ) & 「底線型式」的程式亂碼,則業已解決。  4)Win98 「需要」再安裝中國海字集,以作為 ANSI 顯示, 這樣才能正  常顯示純文字檔案。因為 Win98 內部核心為 ANSI  所以當它使用 ANSI  字時,並不需要像 Win2K 一樣再去作「轉換」, 換 NLS 只能解決  unicode 端的問題;Win2k 無此問題。 5)問:裝 2.30 後,所有的「資料匣」皆無法用「檔案總管」開啟。 答:此 bug 已修正,請至原 link 重新抓取,重新安裝。 6)問:裝 2.30 後,舊日文檔名都無法開啟。 答:請使用任何方法 (如下面這個) 把舊檔名改成新的,改完後就 ok。 == 1.備份此檔:c:\windows\system\unicode.bin 2.將 c:\Program Files\Unicode-At-On\Backup\unicode.bin 複製到 c:\windows\system 內,選「覆蓋」。 ps:此檔系統不會鎖定,請放心操作。 3.重新開機。 4.用有支援「長檔名」的壓縮程式 (建議用 rar),把你要改名的檔全部 「搬移」到壓縮檔內。 5.將 1. 備份的檔案,還原回去,並覆蓋掉 c:\windows\system\unicode.bin。 6.重新開機。 7.把 4. 產生的壓縮檔內的東西解出來。 改名完成 ... 有點白痴的作法 ... == 7)問:裝 2.30 後,所有未改名的「日文檔名」都變「空白」。 答:請安裝「中國海字集」,不過並不建議如此作。最好的方法是「改 名」,把「舊」檔名改成世界通用的「新」檔名。 8)問:裝 2.30 後,所有改過名的「日文檔名」都變「空白」。 答:你的「細明體」沒更新 or 更新失敗,請更新「細明體」。 9)問:裝 2.30 後,在裝任一補完計畫前燒錄的 cd 上,日文檔名檔案無 法讀取。 答:用下面這支程式可以把檔案讀下來,並且在轉存到 hd 時會順便「 改檔名」,but 這是「要錢的」軟體,而且要「註冊版」才能轉存 ,或許對岸同胞那可找到某種 lucky number 也說不定 ... ^^; ... 建議在讀下來後,用「新檔名」重燒一張。 Arrowkey CD/DVD Diagnostic http://www.arrowkey.com/cddvd_diagnostic.html 10)問:我依照「改名方法」只做到第三步就可以看之前的日文檔資料夾了 那還要做下面的嗎?? 答:您如果不把它作完的話,那麼 1.您在某些軟體中遇到的「底線」將不會被補完,底線依舊。 2.您產生的「假名檔案」還是「舊」檔名,等於您還是在用 2.20。 3.您自己燒的含假名字元檔名 cd,自己還是不能讀取,等於您還是 在用 2.20。 總而言之,您在用 2.20 時遇到的「檔案交流問題」,如果您不把 「改名」步驟作完的話,那麼這些問題就會一直存在。也失去更新 到能解決這些問題的 2.30 的意義了。 11)問:我的系統是 cwin98 & jwin98 並存的,我的「日文檔名」全部都是 在 jwin98 下產生的,我需要依照「改名方法」改名嗎? 答:如果您的「日文檔名」是使用未安裝 unicode 補完計畫 2.30 以上 版本的 cwin98 輸入的,那 200% 肯定是要改檔名的。 如果您確定那些日文檔名都是用 jwin 輸入的,那麼只要您的日文 檔名是長檔名 (非「8.3」的) ,除非有內含一些奇怪的符號,否則 是不用改名的,在裝好 unicode 補完計畫 2.30 以上版本的 cwin98 下直接就可以使用。 至於那些因為不符長檔名規則而只有「短檔名」的檔,就要碰運氣 了,最好是在 jwin 下透過「改名」把它們變成「長檔名」的檔案 ,如此一來,這些檔案就一定能在裝好 unicode 補完計畫 2.30 以 上版本的 cwin98 下直接使用。 2.win2k/xp  無以上問題。 3.缺字問題:  Win98   MingLiU.TTC Ver 2.10 Size: 7,067,224 bytes  Win2k/XP MingLiU.TTC Ver 3.21 Size: 8,823,308 bytes  限於華康與微軟的版權,我們不能直接提供更新版本的「細明體」  字型。你可以直接取用 Win2k/XP 的字型。我只能說,無論  是 2.10 或 3.21 ,在 unicode 標準上,漏造了不少字。  比如圈圈 1 到圈圈 20 ,簡中/日/韓 都有提供,唯讀繁中  「細明體」沒有。  華康另外一套號稱 Unicode 全字集,還算齊全。也有細明體可用。  不管如何,至少記得把 Win2k 的字型,轉移到 Win98 上使用。  好處顯而易見,至少不缺那麼多字了。 ■附錄: 1.UcFileRenamer 再次感謝「胡克儀」兄提供 2k/xp 下的改名程式! 本程式的使用法與前一版提供的差不多,每次執行完都會產生「日誌檔案」 ,位置在 %USERPROFILE%\RenameLogs 目錄內,「日誌檔案」的檔名是以該 「日誌檔案」產生時的時間命名,其格式如下: yyyymmdd-hhnnss.log yyyy -> 年,四位數 mm -> 月,二位數 dd -> 日,二位數 hh -> 時,二位數 nn -> 分,二位數 ss -> 秒,二位數 2.Unicode 補完計畫 for Linux (glibc 2.3.2) 這是由 Tiberius 網友所製作的東西,由於我們對 Linux 平台上的情況並 不清楚,請有興趣的朋友自行前往了解。相關聯結如下: http://leoboard.cpatch.org/cgi-bin/topic.cgi?forum=21&topic=359&show=0 http://forums.gentoo.org.tw/viewtopic.php?t=41230 3.Unicode 補完計畫 for Palm 這是由 hobart & mactaris 網友自行製作的 project,目前有 CJKOS & 掌 龍中文的對應版本。相關聯結如下: 起源:PALM 上繁簡日漢字同時使用 [Unicode 補完計畫] 前篇 http://forum.palmislife.com/viewthread.php?tid=22308&fpage=12 [狂想曲] 繁簡日漢字同時使用 (Unicode 補完計畫) [CJKOS版本] http://forum.palmislife.com/viewthread.php?tid=22580&fpage=4 [狂想曲] 繁簡日漢字同時使用 (Unicode 補完計畫) [掌龍版本] http://forum.palmislife.com/viewthread.php?tid=22962&fpage=4 4.Unicode 補完計畫 @ Wikipedia http://zh.wikipedia.org/wiki/Unicode補完計畫