2011年7月27日星期三

一个关于建立人类自然语言中间层的设想

也许大家已经注意到了,google 翻译 (也许是目前存在的最nb的在线翻译了)将A语言翻译到B语言的翻译方式是先将A语言翻译成英语,再从英语翻译到B语言。

这里就出现了一个问题,因为本身英语里面的多义词,翻译时候产生的多义词再次翻译时候就会出错。



举个例子 这是一个朋友的状态

あした試験がある.先生は難しいと言いました

用google 翻译 翻成中文

有一个测试的明天。这位老师说,硬

囧。

但我们仔细看看,如果用它先翻译到英文:

Have a test tomorrow. The teacher said that hard

这句话虽然稍有不通,但逻辑上已经很清楚了。

也就是说,是由于英语(这是作为中间过程存在的)词hard本身词义的二义性造成了翻译的问题。



于是,我在想何不创造一套专门用来做自然语言中间层的机器语言,这个语言可能对人没有可读性,但里面的词语都有严格的语法,并且绝没有二义性。这样,除了本身就利用了语言二义性的双关语之外,别的内容都可以实现相当可读性的翻译。

我设想的这样的语言(下面成为R语言)的词义将会是如下的表示方式:

假设在这个语言R 中,一个词元(这里用词元来专指R语言中的词汇)(310)的意思是红(是,一个人红了的这个红,而非红色的红)

在R词典里 这个词元将这样表示:
310:
CN: 红 火 有名
EN: hot famous

这样用多个词来定义。
翻译某词 Q(Q是A语言词,向B语言翻译)时,在词典中A语言所对应项里面找含有Q的词元,根据现有翻译技术和语义语境,定出Q在句子中想表达的含义,选出词元M.
再在词元M的B语言对应项里面取出根据B语言语法合适的词,放入句子组成合适的B语言的话。
完成翻译。

词典甚至可以变成这个形式:

310: 
CN: 红(0.3) 火(0.2) 有名(0.9) 
EN: hot(0.25) famous(0.95) 

括号里面的数字代表和词元意思相符的程度

这样,一个词元就是一个矢量 只要构建了一个足够的矢量 就可以完成很好的机器翻译。

所谓 矢量语义学?

2011年7月25日星期一

无论如何,下一个朝代里面,应该坚决禁止出现共产党标语和标志;禁止公开的共产党口号,书籍,音像制品;禁止社会主义性质政党。无论任何情况下,共产主义都不能再次成为这个国家路线选择的一个选项,如此才能避免这个国家再次走向灾难深重的专制。

2011年7月18日星期一

Google Maps Api offline

由于Google Maps api 被墙 很难受。于是找了离线版,整理后放在google code 上供大家使用

链接http://code.google.com/p/gmaps-offline-v3/

Google Maps api offline 离线版google maps api v3

使用说明
将trunk目录下代码下载放入网站目录任意目录下

请将mapapi.js中的var scrpit_path="/static/js/"; 中/static/js/替换为实际的路径(相对网站根目录)

引用此mapapi.js即可 不需要引用在线脚本

2011年7月12日星期二

kindle3碎屏记

本人身在帝都,穷学生一个
年初在淘宝买了一个kindle3,用起来很爽。
6月底某天不知怎么,手指轻触屏幕竟然碎了(应该是之前有撞击),大窘。
听说amazon客服很好,于是抱着练口语的想法决定试试。

首先是如何给客服电话的问题。
去官网上的Contact Us 选择kindle issue 会要求你输入号码他会打过来,同时也给了电话号码,可以打过去。
给美帝打电话貌似很贵,这时祭出神器1:Google Talk
使用ssh伪装为美国地址,登录gmail,可以在gtalk的位置看到Call Phone 这个给美国和加拿大打电话都是免费的! 于是拨过去

给客服说kindle 屏幕碎了,告诉她我的帐号。因为要求美国的地址和信用卡,无奈,说自己“暂时”不在美国,如果要replacement和朋友联系,邮寄到朋友(在美国)的地址。说定了之后,和美国的朋友商量,让他帮我跟客服联系,客服已经在我的帐户做了注明,朋友联系他就继续处理,告诉信用卡号,和地址。
然后我就收到邮件,告诉我,不需要退还原来的。登录amazon,看到上面的原来的kindle已经被deregiste了,重新给我注册了***'s 2nd kindle ,并且已经发货(这时只是第二天上午)。
第三天,朋友告诉我已经到货(朋友住在LA)。下面的问题就是如何运回国内。
如果走快递,大概需要150刀……比kindle还贵了,不能忍,于是走usps的First Class International Mail ,13.65刀,7月2日中午寄出,7月12日在北京收到。
搞定


现在手里有一个碎屏的kindle3 有没有人有兴趣啊?可以拿去当mp3听……花几百修好也可以继续用~
本人身在帝都,穷学生一个
年初在淘宝买了一个kindle3,用起来很爽。
6月底某天不知怎么,手指轻触屏幕竟然碎了(应该是之前有撞击),大窘。
听说amazon客服很好,于是抱着练口语的想法决定试试。

首先是如何给客服电话的问题。
去官网上的Contact Us 选择kindle issue 会要求你输入号码他会打过来,同时也给了电话号码,可以打过去。
给美帝打电话貌似很贵,这时祭出神器1:Google Talk
使用ssh伪装为美国地址,登录gmail,可以在gtalk的位置看到Call Phone 这个给美国和加拿大打电话都是免费的! 于是拨过去

给客服说kindle 屏幕碎了,告诉她我的帐号。因为要求美国的地址和信用卡,无奈,说自己“暂时”不在美国,如果要replacement和朋友联系,邮寄到朋友(在美国)的地址。说定了之后,和美国的朋友商量,让他帮我跟客服联系,客服已经在我的帐户做了注明,朋友联系他就继续处理,告诉信用卡号,和地址。
然后我就收到邮件,告诉我,不需要退还原来的。登录amazon,看到上面的原来的kindle已经被deregiste了,重新给我注册了***'s 2nd kindle ,并且已经发货(这时只是第二天上午)。
第三天,朋友告诉我已经到货(朋友住在LA)。下面的问题就是如何运回国内。
如果走快递,大概需要150刀……比kindle还贵了,不能忍,于是走usps的First Class International Mail ,13.65刀,7月2日中午寄出,7月12日在北京收到。
搞定


现在手里有一个碎屏的kindle3 有没有人有兴趣啊?可以拿去当mp3听……花几百修好也可以继续用~

2011年7月2日星期六

Make it a better world



技术在改变人们的生活,但还远远不够,因为成本以及其他一切的原因,技术远没能做到他的极致。
作为一个Geek,我们都拥有梦想。而作为Geek,最为崇高而远大的梦想,莫过于能以技术真正的改变人的生活,建立一个技术的乌托邦。
现在的科学即使不再发展,单纯技术上的潜力也仍然无比巨大。而一些本可以做到但由于技术之外的原因没能做到的事情,乃是我们的耻辱。
我希望能有一个世界,这个世界上,如果愿意,每个人都能享受技术带来的成果,每个人都能活在人类文明创造出的最美的世界。

Make it a better world, you can be a part of it.




wsmlby AT gmail.com