论坛风格切换切换到宽版
  • 6084阅读
  • 8回复

海子的 Athena-A 提取非标字串不全 [复制链接]

上一主题 下一主题
离线大老胡
 

发帖
117
金钱
820
威望
82
只看楼主 倒序阅读 0 发表于: 2013-03-22
如图:(红色框内所示)




不知为何,只提取了后半部分。

附:软件 FlashCookieCleaner.rar (712 K) 下载次数:10
离线Eden

发帖
13
金钱
70
威望
7
只看该作者 1 发表于: 2013-03-23
确实呢,应该被检测到的
会不会受到 B1252H 的1D20所影响呢
把它改成2000H看看会不会被查到撒
离线大老胡

发帖
117
金钱
820
威望
82
只看该作者 2 发表于: 2013-03-23
终于手工搞定。

有兴趣的试试吧。 FlashCookieCleaner.rar (682 K) 下载次数:20
离线wanfu

发帖
2734
金钱
12170
威望
1217
只看该作者 3 发表于: 2013-03-24
这应该是未将 2000-206F 区间的 Unicode 常用标点符号考虑进去的缘故。
也是未按 DELPHI UNICODE STRING 字符串定义中的代码页去判断字符编码,而是仅依照英文的 Uincode 字节范围去判断字节串的缘故
离线大老胡

发帖
117
金钱
820
威望
82
只看该作者 4 发表于: 2013-03-25
呵呵,大侠就是大侠,看问题深刻,不过点睛的 Lephone Localize Plus 也提不出来。
离线wanfu

发帖
2734
金钱
12170
威望
1217
只看该作者 5 发表于: 2013-03-25
回 4楼(大老胡) 的帖子
大老胡:呵呵,大侠就是大侠,看问题深刻,不过点睛的 Lephone Localize Plus 也提不出来。 (2013-03-25 12:34)

大侠倒不敢当,只是知道一点字符的编码知识而已。Lephone Localize Plus 提取不了也是因为同样的原因。
Athena-A 和 Lephone Localize Plus 无法提取这个字串,不能说它们程序设计上有问题,而应该说这个软件的作者使用标点符号有点问题。201C 和 201D 就是中文标点符号中的 “ 和 ”,英文中双引号一般都使用 " 的,估计大概这个作者是个亚洲国家的人。

离线大老胡

发帖
117
金钱
820
威望
82
只看该作者 6 发表于: 2013-03-25
回 5楼(wanfu) 的帖子
佩服,果然厉害,分析的完全正确。

将中文引号手工改为英文引号 [“ 22 00H]后果然提取出来了。


离线海子

发帖
352
金钱
320
威望
32
只看该作者 7 发表于: 2013-04-06
试试这两种方法:





宇宙经过120亿年的漫长进化才有一个独一无二的你存在这个世界上,其概率如此之小,已无法用数字来描述...
离线大老胡

发帖
117
金钱
820
威望
82
只看该作者 8 发表于: 2013-04-06
回 7楼(海子) 的帖子
海子:试试这两种方法:....... (2013-04-06 20:30) 

此法可行,但比较麻烦,如果类似情况比较多,效率就会很低。

不知能否改进为自动识别?