论坛风格切换切换到宽版
  • 8511阅读
  • 11回复

BIG5 Extension 計畫(1) [复制链接]

上一主题 下一主题
离线kiiali
 
发帖
805
金钱
0
威望
0
只看楼主 倒序阅读 0 发表于: 2003-02-13
BIG5 Extension 計畫(1)
by Kii Ali
■聲明
文中提到「Unicode 補完計畫」相當多次,但並無任何不敬之意。
相對的,如非得窺他的修改想法,本文即無由成形。我只不過站
在他打破的迷思上,再向前推進罷了。該網站如下。
http://student.thu.edu.tw/~s892941/japan/
我們兩者的重點也不同,他著重在日文字母,也打算碰一點日本漢字
,工程也比較小。而我則主攻簡體中文,對於日文字母和日本漢字,
則順道解決。之所以取名 Extension ,是相對於 GB2312 與 GBK
extension 而來。在擴增的想法上,固然是很相當。但顯然不是把
東西裝上四個輪子,就可以叫做車子。
我希望能成功地,猜對他的想法。如下。

■緣起和廢話
這是 2002年11月左右,對中國大陸福建省福州市的「炎之川」所提
到的內容。
======
這一點,在大陸的 GBK 的擴編已經納入繁體字的範圍,所以 unicode
或 utf-8 都可以看到。而 BIG5 本身並沒有規範簡體字的位置,所
以硬要在 BIG5 出現簡體字,都是各家的造字,Unicode 完全不承
認,這很麻煩。
簡單說好了,你們在 IE 裡面複製下來的文字,可以是正確的 編碼,
即是是繁體字,也可以在簡體中文的操作系統正常顯示。我們在 IE
裡面複製到的簡體字,在 ANSI 環境之下就一定會變成 ? 問號。
應該看得懂我在說什麼吧。呃,這是 BIG5 會被消滅的隱憂。它的確
是不夠健全的系統。不過 GBK 也早晚會被 Unicode 合併掉,所以結
果一樣。 (苦笑)
======
記得 2003 年過年前,我深夜打電話給 IC ,想把這個疑惑說明。
福至心靈的想到不是有個什麼「Unicode 補完計畫」,於是我們在
電話談了一小時,把女朋友冷落到氣得自己去睡覺,把「補完計畫
」給安裝起來。電腦被女朋友鎖起來踼回新莊家中,只好在腦袋空
想,感謝 IC 能忍受我天花亂墜一堆 ANSI vs unicode 的 mapping
table 的觀念。
IC 被我催眠的腦袋模糊,我不曉得他在電話的那一頭是不是有睡
著。不過安裝完後,「咦,我的自然注音輸入法,居然出現日文
字了,本來都是一堆空白說。」同時 IC 也監測到,「補完計畫」
去偷偷改掉了 c_950.nls 這個檔案。
■想法
1.unicode 可以用來在網路通訊。凡是在 unicode 上可以傳送的,
對方收到,一定可以看到正確訊息。不管對方有沒有安裝相應
的系統皆然。
2.「補完計畫」把當年倚天中文,增列在 BIG5 當中的日文字,
順利對應到 unicode 顯示。無論在 BBS 的傳送或是 IE 上的
轉貼皆然。當然,沒有補完的地方,還是 ??? 一堆問號。
3.以下:
BIG5 的現有編碼範圍。當然這部分的編碼範圍,也包括前面
所提到「倚天中文增列日文字」部分。
  BIG5   (原): A140 - F97E , A1A1 - F9FE
如果我們把「可用造字區」和「可用顯示」部分,填入簡體字,
使它取得一個 BIG5 編碼,並跟 unicode 對應。也就是整個
BIG5 擴增如下:
  BIG5   (現): 8240 - FE7E , 82A0 - FEFE
那麼,所有日文字母、日文漢字、簡體字,只要是漢字的範圍,
所引起 ??? 問號剪貼的問題,全部都會消失。
因此,自然也不會有下面這種問題。
---------
有些網站告訴我,因為台灣的 BIG-5 碼跟日本的 ShiftJIS 碼是不
一樣的,內碼是不一樣的,當然輸入法不一樣也是正常的……
可是有些漢字好像沒有問題阿@_@? 可是奇怪的是,我在日本網
站留言的時候,如果用注音輸入法打中文,可以成功的留言耶!?
而且很奇怪的是,如果我把日本網站的文章複製,後來在BBS裡貼
上,所有的假名都變成 ???? ,可是有一些漢字卻留下來了!?
---------

■如何處理
文言文:
1.修改 Win 2k/xp 當中的 ANSI (code page 950) vs unicode 的
mapping table 。
白話文:
1.台灣的 BIG5 的擴編範圍,完整納入簡體中文、常用造字和
日文字母、日文漢字的範圍,成為 BIG5 extension。
2.並且讓 unicode 承認,以便在網路上傳送資訊。

■有什麼效果?
1.可以直接在 ICQ2002 ,或是微軟的 office 系列,(支援
unicode 版本),直接輸入簡體中文和日文,對方一定都看
得到 (不管他有沒有安裝 BIG5 extension 均可)。
2.可以在 ICQ 舊版/ UltraEdit / 一般 BBS (支援 ansi) ,直接
輸入簡體中文和日文。

2.1 如果對方有安裝「補完計畫」,只能看到日文。
2.2 如果對方安裝 BIG5 extension ,可以全部看到。
2.3 即使對方安裝「中國海字型」造字,還是可以全部看到。
3.直接複製簡體中文網站的內容,到 ICQ 或 UltraEdit
底下,再不會出現 ??? 一堆問號。

4.使用 GoSurf / MyIE / NetCaptor 等外掛瀏覽器,在繁體中文
作業系統看簡體中文的網頁時,「標題」再不會出現 ??? 一堆
問號。

5.跟大陸網友對話,把 ICQ 2002 的對話內容複製下來到 Ultra
Edit ,再不會出現 ??? 一堆問號,而會是標準的簡體中文,
任你刪改和儲存。
6.就是你要寫「游鍚坤」,也不用再寫「游鍚方方土」,或是在
生物學上為「酉每」這個字寫不出來,而大傷腦筋。因為本來
就有這個字。
7.更重要的,以前常常莫名其妙出來的問號問題,不管是檔案名稱,
或是一般文字,預期幾乎看不到了。
8.最重要的,此時你的系統已經配備完整的繁體簡體中文能力,
不用再辛苦的切換系統到簡體。如果用標準注音,輸入法
也不用再外掛,因為本來就支援。

再也不是被閹割的 BIG5 作業系統。
如果你知道大陸在瀏覽繁體中文網頁,或是改變檔案名稱,
絕少碰到這種 ??? 一堆問號,相信你會很有這種感覺。
如果還願意使用華康出版的 Unicode 字型,那就真的是一點
限制也沒有。 (同樣是華康出品,「新細明體」比起大陸「宋
體」,還是被閹割了不少字)。

■有別人有什麼不同?
1.與「補完計畫」比較
補完計畫目前只支援到倚天造字中的日文字母。其他的簡體漢字,
一概沒有支援。在 unicode/ansi 程式之前互貼,還是再度會出現
??? 一堆問號。
2.與「中國海字集」比較
支援得很澈底,但使用的人不多。但是只能在 ANSI 底下使用。
如果拿來傳送,通常別人看不到居多。
3.與「香港政府字集」比較
香港政府的造字,會一併在這個計畫裡面解決。會讓原本沒有
unicode 和 big5 對應的香港字,取得正確對應。
4.與「臺灣中推會 BIG5+」比較
他們也是造字集,自然會有不支援 unicode 的問題。而且我個
人比較懷疑,這個造字集有多少人使用?

■計畫進度/限制
很抱歉,這才是計畫而已,還沒有可供下載的成品。如果有,我
一定會擺在自己的每個中文化作品裡面,讓所有人強迫中獎
而且,這個檔案壓縮後大小只有 90-110K 左右。是的,就這麼小。
1.這是我答應 IC 要寫出來的東西。如果 IC 也看不懂,哇,那 KA
要進下一步就很難了。
2.簡體中文,就算只考慮 GB2312 的範圍 (不考慮 GBK extension)
,要把它對應到 BIG5 ,其實遠遠超過中文化作者所能負荷的範
圍。事實上,這根本不是中文化的事情,卻跟系統牢牢相關。

是的,不太多,大概一萬字左右。扣掉與 BIG5 同樣 unicode 範
圍的字,最少也要有四五千字的簡體字吧。再加上一些零零星星
的日文字母和日本漢字、常用造字、香港字...
這真像是制定標準。這是最困難的地方。
我是有一些想法,或許可做,但還不是非常成熟。應該是可以做
到才是。力氣是確定要花下去的。
3.BIG5 extension ,簡體字的 ANSI 編碼,初步要以誰為準?我
以為是「中國海字集」,畢竟當初它的確定義過簡體字的範圍,
雖然用過的人實在不多。

因為其他各家,完全不考慮簡體字在 BIG5 當中顯示的可能。
自然沒得參考。只是這樣指定頗有爭議。
4.BIG5 extension 的範圍,能不能把塞入這麼多的簡體字,有一些
疑問。會有取捨的問題。
■可行性
不曉得可行性如何?與任何批評。還希望您的意見。
自 2003 年起,Kii Ali 所有繁體版作品 "Help" 將譯為「幫助」,回歸軟體原始本意,不再遵照微軟的過度翻譯,而造成使用上的誤解。
离线will
发帖
*
金钱
*
威望
*
只看该作者 1 发表于: 2003-02-15
還在消化中
离线crosspost
发帖
*
金钱
*
威望
*
只看该作者 2 发表于: 2003-02-17
From: "Maverick" <maverick@cpatch.org>
簡單的說起來,KA 現在就是希望可以把 GB 的簡體字想辦法從 Unicode 對應到 Big5 的造字區讓 Big5 可以正確的看到簡體中文就是了?雖然我沒有這方面的需要,不過有人有熱血,總不能當頭就一盆冷水往他頭上潑下去 (我就是沒有 JQ 這種當面嗆聲的勇氣 )。
只不過,現在做出這種對應到底有什麼好處?讓中文能夠通行無阻?台灣這邊和大陸文字上面最大的差距是在用語上面,而不是文字上面。簡體字看得懂的人還不算太少,畢竟有些時候我們都在使用,但是他們的用語和台灣地區的習慣差別實在太大,只是單純的把 GB->Big5 出來的文件通常是很難讓人看懂得,這才是問題所在。GB 會把繁體字型放入我想多半還是因為香港吧?香港明明是中國的一部份了還在用對岸的 Big-5 + 香港政府造字集 對他們來說應該會有一些不滿,更何況他們認為台灣遲早也會回歸成為他們的一部份,早點決定把繁體字加入 GB 裡面對他們來說絕對是利多。反過來說,Big5 裡面放入簡體字有什麼好處?台灣人會習慣性使用簡體字但是也還不至於把繁體忘記的地步,加進去以後對一般人存脆只是「看得到」、「不用轉碼」這樣而已,意義不大。真的想要「天下大同」的話還是等 Unicode 比較快,只是東補一塊西拼一塊對整體的發展沒有太大的幫助。
當然,現在裝了「Unicode 補完計劃」也不過是因為在 Win2k/XP 底下裝這個比起裝「中國海」或是「櫻花輸入法」方便多了,這種東西也會在 Unicode 取代一切以後消失。KA 有熱血我只能精神上支持,但是需要用到的人有多少?我只能說至少我應該不會需要。
PS. 日文字50音還有一些造字都是原本有在 Big5 字集的文字,不過 MS 不知道為什麼就是沒有放進去。至於簡體中文嘛...我印象中是沒有看過。所以除非有新的標準造字對應,否則字碼應該是會一團亂吧?
离线kiiali
发帖
805
金钱
0
威望
0
只看该作者 3 发表于: 2003-02-17
From: Kii Ali <kiiali@cpatch.org>
At 2003/02/14 10:54 +0800, Maverick wrote:
>可以正確的看到簡體中文就是了?雖然我沒有這方面的需要,不過有人有熱血,總不能
>當頭就一盆冷水往他頭上潑下去 (我就是沒有 JQ 這種當面嗆聲的勇氣 )。
嗆聲是好的。只是嗆聲得嗆出一些東西。
記得以前在聽 siva 提到某些概念時,他會一直詢問這個「
概念可行不可行」的問題。以前不完全理解,現在比較能體
會。一是評估可行性,二是評估做出來的東西,對末端使用
者有沒有意義,能夠發揮效果的點在那裡。因為第三者總是
習慣聽到「完整的想法」,而不是連 Milestone 都還沒有
的初步想法,偏偏這對「想法的提出者」是很累的事。要把
一個「想法」,變成完整的「專案」是很可怕的事情,好像
自己馬上就要背上責任似的。但自己以為,只有擁有這種想
法的人,才是最 initial 。想法本身,就讓人興奮,這是
小弟偶爾會去找 siva 挖東西的原因。那不在想法能解決的
事情,而在想法本身的創造性。
現實的情形常常是,我們會先把「說帖」做好,先試圖找各
種理由與問題,說服自己,願意不願意開發這個計畫。並且
做出幾個 FAQ ,當做別人可能詢問的題庫來回答。如果是
自己都不能說服,那當然就別提。如果自己也覺得可行,就
放出一點消息,讓外界評估。你說我們在放出試探性氣球,
也對。
因為我們害怕,投下去的精力,不管有成無成,都是一種負擔。
就某方面而言,潑冷水是一種好處。包括技術上的難度、消
費者接受度、或是各種政策上的質疑。
如果只就成就而言,只提出一個空架子,自然不如提出之後
,連帶實行完成。提出的規格當然可以宣稱,只是規格能不
能做得到而已。
>更何況他們認為台灣遲早也會回歸成為他們的一部份,早點決定把繁體字加入 GB
>裡面對他們來說絕對是利多。反過來說,Big5 >裡面放入簡體字有什麼好處?
我倒是沒有想到這種多的政策問題。
某些字就是不能顯示,那就會是現實,而不是政策。之前所
提到的兩岸用詞困擾,你會覺得難以理解,我會覺得用語已經
有開始合流的趨勢,但那是趨勢,還不是最終結果。那是彼
此站的評論基礎,不一樣所致。你看現況,我看未來。
如果以對岸的例子來看,你檢視以往的 GB2312 規格,到現
在的 GBK ,兩個編碼的原則和想法是完全不一樣的。前者依
照發音排列,後者依照部首的規則。如果以的對岸的例子來
看,多增加的 GBK extension 有什麼好處?還是多了一堆不
相容的因素?還是能解決一些未來發生的問題?大陸人偶爾
要看到繁體字的機會,並不能算太少。
當然我不會忘記臺灣使用群體,基本上對簡體字的需求並不太大
的事實。而我們對日文的需求或許還大一點。這是大家能夠
容認 BIG5 這麼久的原因。
我自然也不會對這個計畫,太過樂觀。
>PS. 日文字50音還有一些造字都是原本有在 Big5 字集的文字,不過 MS
>不知道為什麼就是沒有放進去。
你可以看看這裡,當然不是很讓人爽快的答案。不過當時倚天推出的
標準,的確只是 (倚天標準) 而非 (BIG5 標準)。答案當中也提到了
香港字集和 BIG5+ 這兩個延伸版本,似乎也都採用了「不打算支援」
的態度。
http://www.unicode.org/faq/han_cjk.html#5
Q: Why is Unicode missing some characters from the Big Five characters set?
A: The "Big Five" character set is an industrial standard commonly used for traditional Chinese. There are, however, several versions of the Big Five in common use, generally representing extensions of the formal standard. There are two main versions, "plain Big Five" and "ETEN Big Five" as well as numerous vendor- or platform- specific extensions. In recent years, there have been further extensions such as the Hong Kong Extension to Big Five and Big Five Plus.
The initial, unextended Big Five was the standard version of the character set at the time that the Unicode Standard, Version 1.0, was under development, and Unicode was designed to cover its ideographic repertoire completely. This is reflected in the data files supplied by the Unicode Consortium. Some vendors provide vendor-specific tables showing mapping data for their custom Big Five extensions and Unicode. The Unicode Consortium does not, however, provide data on every known dialect of the Big Five, so it is possible that a particular dialect of the Big Five is not included in the tables provided by Unicode. [JJ]
自 2003 年起,Kii Ali 所有繁體版作品 "Help" 將譯為「幫助」,回歸軟體原始本意,不再遵照微軟的過度翻譯,而造成使用上的誤解。
离线s793016
发帖
*
金钱
*
威望
*
只看该作者 4 发表于: 2003-02-18
[這篇文章最後由s793016在 2003/02/23 02:12pm 編輯]

... 我大約一年前得知「unicode 補完計劃」,但我的 os 是 winme 不能用,於是
想自己作「unicode 補完計劃 win 9x + 中國海字集版」,先用 big5e + 4dos bat
練填表功時發現:cp_xxx.nls 內 big5 -> unicode 空間足夠,但 unicode -> big5
因為使用三層索引,導致空間不足 ... 但 c_xxx.nls 就無此問題 ...
後來只好暫時修正目標為只給 mozilla/netscape 用,結果發現:mozilla/netscape
用自己的一套而不使用 cp_xxx.nls,故「unicode 補完計劃」注定無法補完mozilla/negtscape ...
再次修正目標,mozilla/netscape 自有的「ansi <-> unicode 表」放在ucvtw.dll/uconv.dll 中,故只要把表建好,再把這兩個 dll 產生並蓋掉即可,前
後花了三個月建表完成,結果 ... 沒人能幫我 compile ... ~><~ ...
當時我也沒有 compile mozilla 的能力 (我當時用 p2-300),只好就此放著 ... @_@
直到去年 10 月間,當好有機會把電腦換成了 p4 2.4g,才開始想辦法自己 compile
這兩個,去年 11 月時正式成功 & 公開發表 ... ... 至今已改版四次,最新版為
v0.05,可以直接在 mozilla/netscape 下把 s-jis & gb2312 的網頁 copy 出來,再
直接貼到 bbs 等純 big5 環境上去,mozilla/netscape 會自動轉碼成 big5 + 中國海字集,而不會產生「?」...
我還是很希望作「unicode 補完計劃:中國海字集版」,不過,我在為 ucvtw/uconv
改版時發現一個問題:同一個漢字,big5、gb2312、s-jis 所對映的 unicode 碼完全
不同 ... 這導致您文中提到的「有些會成功轉換、有些會變成 ???」... 我想,若是
只改 cp_950.nls 的話,您只能單向由 s-jis -> unicode -> big5 正常,等到逆向
時 (big5 -> unicode -> s-jis) ,就會因為後段管 s-jis 的 cp_93x.nls 沒增加對
映而掛掉 ...
提供您我找到的 c_xxx.nls & cp_xxx.nls 格式解說

我參考上表整理出來的,只有 win9x 部份

我練功時寫的,for 4dos only,使用 cp_950.nls 當 database,以 big5 內碼 or
字找對映的 unicode 碼,也可以用 unicode 碼 or 字找對映的 big5 內碼


我的成果:給 mozilla/phoenix/netscape win32 平台專屬,可直接看 big5 日文
「ucvtw.dll/uconv.dll v0.05 中國海字集版」 & 使用說明

希望對您有幫助 ... ^^;
离线kiiali
发帖
805
金钱
0
威望
0
只看该作者 5 发表于: 2003-02-24
[這篇文章最後由kiiali在 2003/02/24 02:05pm 編輯]

有幫助啊,實在太有幫助了。
其實看了很慚愧,你都看懂了,而且也都做完了,理論上這個計畫
要由你來執行才對,小弟只能在旁邊敲邊鼓罷了。只是怎麼沒有留下
相關的資料和網址過來?
要解決 gb2312 的對應問題,原先的構想是要取得 2300 字左右的
檢化字總表,日前總算拿到這份資料。中國海當中定義的簡體字形
超過此數,我想是沒有問題的。要解決 s-jis 當中的日本漢字問題,
就得花一些腦筋,雖然中國海當中也有定義。
至於符號呢?怎麼辦?我不曉得你那裡有沒有想過這個問題。
挖 unicode.org 的部分吧,那一堆特別好看的中國海符號,理論上
是找得到每一個對應的字元。訂出修改的 milestone 和構想是
必要的。
當然,我想你也知道改 c_932.nls 的方式,結構和原理應該是相
同的。只是我們改了,但是一般日本人不可能用我們改的版本。那
可能會沒有用。換句話說,我們的實作只能限於 c_950.nls 的
繁體中文範圍。
我想,就等你的新東西了。如果你改完了,那我幹嘛還要花力氣
去重親審視一次呢? (去抓了 unicode 一堆規格回來看說)
極為期待當中。
自 2003 年起,Kii Ali 所有繁體版作品 "Help" 將譯為「幫助」,回歸軟體原始本意,不再遵照微軟的過度翻譯,而造成使用上的誤解。
离线kiiali
发帖
805
金钱
0
威望
0
只看该作者 6 发表于: 2003-02-24
喔,我好像太興奮了。
現在「總算」看到連結了,拜讀中。
自 2003 年起,Kii Ali 所有繁體版作品 "Help" 將譯為「幫助」,回歸軟體原始本意,不再遵照微軟的過度翻譯,而造成使用上的誤解。
离线s793016
发帖
*
金钱
*
威望
*
只看该作者 7 发表于: 2003-02-24
[這篇文章最後由s793016在 2003/02/28 09:30pm 編輯]

QUOTE
下面引用由kiiali2003/02/24 02:02pm 發表的內容:
有幫助啊,實在太有幫助了。
其實看了很慚愧,你都看懂了,而且也都做完了,

沒做完 ... 只不過表弄得差不多了 ... 成品只有 mozilla/netscape/phoenix 的
部份算勉強能用 ... cp_950.nls & c_950.nls 都還沒開工 ... @_@a
QUOTE
理論上這個計畫要由你來執行才對,小弟只能在旁邊敲邊鼓罷了。

沒差啦 ... 看完您的 bgconv 說明,覺得您實在是太有毅力了 ... 如果您願意的
話,我可以提供對照表 ... ^^;
QUOTE
只是怎麼沒有留下相關的資料和網址過來?...

留了幾天 ... 又自己砍掉了 ... ;b
QUOTE
要解決 gb2312 的對應問題,原先的構想是要取得 2300 字左右的
檢化字總表,日前總算拿到這份資料。中國海當中定義的簡體字形
超過此數,我想是沒有問題的。要解決 s-jis 當中的日本漢字問題,
就得花一些腦筋,雖然中國海當中也有定義。

簡化字總表 ... 我是找 gb2312 定義的字碼範圍,然後用程式整個產生出
來 ... ^^;
中國海的「簡體字」雖多,但還是會缺字,原因 ... 您在 bgconv 的說明
中已有寫了 ... s-jis 也是一樣的狀況 ...
QUOTE
至於符號呢?怎麼辦?我不曉得你那裡有沒有想過這個問題。
挖 unicode.org 的部分吧,那一堆特別好看的中國海符號,理論上
是找得到每一個對應的字元。訂出修改的 milestone 和構想是
必要的。

... 我必需說,理論與實際有著極大的差距 ... 您可以在沒裝「中國海字
集」的電腦上,用安裝完小弟的 mozilla_chinese 的 win32 版 netscape
7.x/mozilla 1.x 去看「此頁」,看看能看到多少個 ...
QUOTE
當然,我想你也知道改 c_932.nls 的方式,結構和原理應該是相
同的。只是我們改了,但是一般日本人不可能用我們改的版本。那
可能會沒有用。換句話說,我們的實作只能限於 c_950.nls 的
繁體中文範圍。

如果您要能 BIG5、GB、s-jis 皆雙向互換的話,對 c_9xx.nls 修改是有
必要的 ... 就算您只在正體中文 win 下使用也一樣 ...
以一個字為例:「內」... big-5 與 u+5167 對應,gb & s-jis 與 u+5185
對應,如果您不去 c_9xx.nls 中增加單向對應 u+5167 給該 codepage 的
「內」的話,這個 big5 「內」透過 c_xxx.nls 轉成該 codepage 字時就會
變成「?」...
QUOTE
我想,就等你的新東西了。如果你改完了,那我幹嘛還要花力氣
去重親審視一次呢? (去抓了 unicode 一堆規格回來看說)

... 我一個人大概只能作到 c_950.nls & cp_950.nls (不保證能用,因為資
訊不足) ... 其它兩個就要靠您們了 ... ^^;
QUOTE
極為期待當中。

要我手邊什麼東東就說吧 ... 不過現在只有
1.big5 + 中國海 <-> unicode 對照表
2.cp_950.nls 填表用 .btm (含 index 壓縮)
离线kiiali
发帖
805
金钱
0
威望
0
只看该作者 8 发表于: 2003-02-24
要我手邊什麼東東就說吧 ... 不過現在只有
1.big5 + 中國海 <-> unicode 對照表
2.cp_950.nls 填表用 .btm (含 index 壓縮)
(1)那就只好這兩個了。資料是永遠不嫌多的。
如果實在貼不上去板面,就 email attach 過來吧。我自己手上雖然有完整的對照,但等於「中國海」這部分的編碼,還要再重新清出來。 (所以 bgconv 的中國海部分,老實說,是沒有做完的,你應該早看出來了。我只有補充完符號部分而已。)
如果能藉你的力,應該可以省力不少吧 (笑)
(2)你的意思是說,做出來的 c_932.nls 只是給臺灣使用者,自己用?
當然我知道,這是現實。不過如果剪貼之後,要看到的結果的人,是那一堆沒有改換 c_932.nls 的人,他們一樣會看到一堆 ??? 問號。
所以情形就會變成是,有換 nls 的台灣人,在日本的留言板,都可以看到正常的台灣漢字或日本漢字。 當然是只限有換者。
(3)有關繁體/正體的辦義,你應該有看過這一篇報告吧。的確是有點爭論不完的 (笑)
http://leoboard.cpatch.org/cgi-bin/topic.c...opic=41&show=25
自 2003 年起,Kii Ali 所有繁體版作品 "Help" 將譯為「幫助」,回歸軟體原始本意,不再遵照微軟的過度翻譯,而造成使用上的誤解。
离线s793016
发帖
*
金钱
*
威望
*
只看该作者 9 发表于: 2003-02-24
1.e-mail ok 了 ... 請去收信 ...
QUOTE
(2)你的意思是說,做出來的 c_932.nls 只是給臺灣使用者,自己用?
當然我知道,這是現實。不過如果剪貼之後,要看到的結果的人,是那一堆沒有改換 c_932.nls 的人,他們一樣會看到一堆 ??? 問號。
所以情形就會變成是,有換 nls 的台灣人,在日本的留言板,都可以看到正常的台灣漢字或日本漢字。 當然是只限有換者。

不完全對 ... 看對方的「編碼」而定 ...
如果您貼到 s-jis 環境中,因為 c_932.nls 本地端有修改過,找得到對應的字
會以 s-jis 送出 ...
如果您貼到 unicode 環境中,因為是用 unicode 送出,除非對方對應 unicode
的字型缺字,否則對方一定能看,只不過他將不能「靠自己的力量存成 s-jis」
,因為他的 c_932.nls 中沒有那個字的對應 ...
詳細說明,請詳閱「unicode 補完計劃」網站 ...
3.基本上,我是認同此段的 ...
為什麼叫正體中文而非繁體中文?