论坛风格切换切换到宽版
  • 20523阅读
  • 33回复

[Beta]中文字串提取器 [复制链接]

上一主题 下一主题
离线曾半仙
 

发帖
2409
金钱
20
威望
2
只看楼主 倒序阅读 0 发表于: 2003-10-16
用来繁体软件简体化时候,提取ASCII资源用的.
前几天在tw下了一个文曲星连线的更新补丁,翻译了资源,发现翻译BIG5的ascii->GB2312实在麻烦,
不知道是否已有此类工具,不过我找到的多是专门提取英文的,于是作了一个,
可分别提取纯中文,中英文混合,纯英文的;
注意中英文混合只是指一个字串同时含有中英文的,
所以,他跟纯中文/英文提取的选项属于并列,
提取大文件的时候,有点慢,虽然优化了,呵呵.
功能都已经完成,以下就是做Skin化了,可能一两个星期都搞不定要做什么样子的界面,先放出来,有需要的兄弟们可以拿去用.

http://dangban.nyist.net/pub/gamerip/StrRipr.exe

刚修复一个BUG,汗....
现在已经是我拿一个软件试过的,改好了.
98用户如果看到字题超烂,请打开UE把13DDB处的F5改为F4即可.
离线曾半仙

发帖
2409
金钱
20
威望
2
只看该作者 1 发表于: 2003-10-16
注意,提取以后转码的时候,表用智能转码的,会添加额外的换行,还会将词的长短改变,回写的时候就要出错拉.
我用的是点点通的,他翻译后的绝对连非法ascii都会保留,而格式不会变得
离线拳拳

发帖
1879
金钱
0
威望
0
只看该作者 2 发表于: 2003-10-16
Thx~
如果能增加提取 unicode 就更好了
同类的工具有 黄权燊 的 cxat,非常不错,值得借鉴
离线曾半仙

发帖
2409
金钱
20
威望
2
只看该作者 3 发表于: 2003-10-16
Unicode的我还没搞懂如何辨别简繁体,呵呵
cxat倒真没用过,明天去找一个研究
离线云海

发帖
244
金钱
190
威望
19
只看该作者 4 发表于: 2003-10-16
祝该作品早日得成正果,翘首以待,——汉字与汉字的边界原不该如此明显,苦了汉化人了,呵呵。
离线wongs
发帖
78
金钱
0
威望
0
只看该作者 5 发表于: 2003-10-16
中文分成兩個字集, 確是中國人的煩腦. 但卻可以提高我們翻譯的水準.
很多鬼佬都不知道一種語言會有多個完全不同的字集.
离线曾半仙

发帖
2409
金钱
20
威望
2
只看该作者 6 发表于: 2003-10-16
呵呵,我也是这次才知道GB2312,GBK,BIG5分别对应的编码范围,
准备接下来再做一个转码的程序,要具有Evdict那种翻译前后字节数不变的特性,
用了几个其他的转码程序,实在是看网页用的.
Unicode以后研究,偶不搞VB汉化,没得发言权
离线网上的鱼

发帖
899
金钱
0
威望
0
只看该作者 7 发表于: 2003-10-17
速度还行:C850。SDR256M。OS:WIN2000+SP4 提取对象:WINGATE507
提取出来都在一整行,中如何用,没有使用帮助或提示?
应该还得加入调用文字编辑工具选项的功能,总不能跑来跑去的:)
一天到晚游网的鱼
离线曾半仙

发帖
2409
金钱
20
威望
2
只看该作者 8 发表于: 2003-10-17
没有,没有,这里就说明一下吧,
本来就是写来自用的,目前来说,
如果专门用来把BIG5软件的ASCII资源转为GB的,还是很合适的,
这个是不打断回车的,提取的时候遇见回车也一并提取,爽吧,当然如果设置不混合提取,就会断开了.
转码以后,在回写里面,打开原程序,并选到翻译后的文本文件,点回写,就会写入.
如果是手工翻译,文本格式是这样的:
地址,大小,文本
每条后面一个回车
拳拳啊,是你置的顶吧,麻烦你给取消置顶把它沉下去吧,呵呵
刚刚看了一下同类的工具,发现如果做几个辅助工具,才算美满
得有过滤的,和简繁转换的,我看看啥时候都做完了,再传到世纪FTP上
离线拳拳

发帖
1879
金钱
0
威望
0
只看该作者 9 发表于: 2003-10-17
不是我弄的,咱没这个权限呢。
话说回来,凡是有人愿意开发汉化辅助工具的都会置顶的:-D