北京的春天
从南方回到北京,对这边到处灰头灰脸的形象看着很不习惯;我离开北京的时候,这边还是冬天,我在宝安机场一降落,就感到了春天和清新干净的空气。在深圳,两周前,我已经T恤短裤的到处跑,在外边活动了;而甫一回北京,马上又有一种从春天回到冬天的感觉,连带着稍微有点感冒。周六在家里窝了一天,最后在小区里找一个地方拍拍篮球,搞的一身灰;周日里想着无论如何要出去走走,呼吸点户外的空气。
骑着我的运动越野奔到清华,看到几个交警正在一个大十字路口训练校内的保安指挥交通,挺好玩的。跑到紫荆那边打一会篮球,那边打球条件不错,现在很多校内运动场都已经拿铁丝网围起来了搞封闭,就那一大片还是完全开放的。打球的状态奇好,中远投都很稳,还勉强能灌篮,觉得那个篮框比标准的要稍微矮一些,因为我原地起跳也能摸到篮圈;刚玩的有点兴致,就被人电话叫走了,于是陪着某人逛清华。
找了半天玉兰花,最后在礼堂草坪那个“清华学堂”的房子侧面发祥一树玉兰花有一半刚开,玉兰花的花形比较好看,不过那个气味啥的就不太好闻了;就在那个树的旁边还有一棵粉色的玉兰花,刚露出花苞;倒是那个迎春花,看着比较灿烂,金黄一片做背景不错。溜达到图书馆后边,那边有两棵比较大的桃树,开满了粉白色的花,引来无数人在那边照像,真是少见多怪啦;不知道那种桃树是啥品种,估计是只开花不结果的那种,因为那个花开的太多了,太早了。某人告诉我,现在奥运场馆周围的花草树木啥的,已经全被调整好生理周期,全是八月份开花,都已经被生化培育搞的变态了,啥世道啊?想一下在深圳看到的四季桂花,就是那种基本上一年四季都能让你感到丹桂飘香的桂树,我最后闻着那种桂花味道都有点恶心了。
最后逛到荷塘后面的小土山那儿,有些李花看着不错,一片雪白,透着清香;不过,把那化拉近了来闻,都是在花香当中夹杂着许多土腥味,这边的灰尘实在是太大了。在那个山坡上还show一下我的车技,在下一个陡坡的时候,我犹豫了一下想推着下去,结果旁边三四个哥们一看我那么帅的车车,起哄着鼓励着我冲下去;我稍作迟疑,把车座调低一点,使重心能移到后边来,就那么冲下去了,给他们欣赏一把;这种路况对我而言根本不算啥,香山后山马道那种线路都走过了,这种挑战就太轻量级了。工字厅那边也没有啥好看的,那个著名的重瓣海棠刚露出一点树丫;不过就在那个“为人民服务”的正厅前边,很郑重的新栽了两棵石榴树桩,凑近一看,说是什么82级校友敬赠啥的,估计是有人发家了的回馈。
后来逛到北大,去见了一个研究计算语言学的博士mm,到她实验室去呆了一会,其实我们已经熟识有三四年时间了;经过俞士汶(http://icl.pku.edu.cn/member/yusw/index.files/Page486.htm)、朱学锋的办公室的门口的时候,我才被八卦到原来这两个人是夫妻;呵呵,那估计语言所跟夫妻店差不了太多。王阳元与他的夫人杨芙清一个搞微电子硬件,一个搞软件;两个院士,几年前是北大计算机的绝对权威,号称科技界的比翼鸟。原来这种现象并非独一无二的啊,羡慕敬仰一下先。计算机语言学,目前他们的主要目标就是整理出一个中文的wordnet出来;简单的说,就是把语言语法语义规则,用形式化的语言描述一下,最好能转化为计算机算法,然后整理出一些中文信息处理的基础辞典;可以用于中文分词,信息检索语义相关性,中文输入法联想词库等,都属于基础工作。最后,让她给我推荐一本语言哲学方面的书,因为最近打算把这块深入一下,推荐了《语言本能:探索人类语言进化的奥秘》;我回家找到了电子版,翻了几页,写的真的很不错;想深刻领悟语言本质,或者提高一下语言技巧的,可以看下;在这里有介绍和下载链接(http://www.xindoor.com:8080/html/33/t-5533.html)。
从她那里知道几点有趣的语言现象,其一就是现代汉语中,兼类的动词和名词增多,而动词在向名词漂移。例如:这件事情教育了我,北大的文化教育;这两个句子中的“教育”一词,在前者中是动词,而在后者中是名词。改革现行科举制度,社会主义政治体制改革中;这两个句子中的“改革”一词,在前者中是动词,而在后者中是名词。而且经过大量的语料统计可以证明,同一个词,作为名词出现的概率在增加,作为动词出现的概率在减小。我当时仅仅把这个作为语法现象理解了一下,刚才我想到这其实是社会生活当中几个现象决定的:其一,就是生活节奏在加快,把原来的一个动作事件,现在概称简略为事件代号;忽略细节,高层抽象一下,当然动词就变为名词了;其次,这是社会中只重结果,不看过程的现象决定的;同一个词指代过程的时候,当然是动词,到只指过程结果的时候,当然是名词了。
还有同一个词的活用,使得根据词行来判断,在处理语料当中遇到困难。譬如,由faint这个词发展而来的“晕”字,在时下的网络语境当中,可以表达很多含义:其一,真的昏过去了;其二,表示很好玩,搞笑;其三,表示鄙视,不能理解;其四,表示对一个事情困惑,迷惑等。这样,在不像人这么智能的计算机信息处理过程当中,要怎么处理呢?只好把同一个词分作四个词,分别表示为晕1、晕2、晕3、晕4。在计算语义相关性的向量夹角模型中,在词组向量中,也分别要占据四个位置。可是,难点是,在一句话当中,你如何让计算机自动标引出来到底是晕1还是晕3啊?反正,我知道的是,某前在这类基础辞典的维护过程中,还是人力作为主要手段,计算机自动处理作为辅助手段,来构建的。我有个同学,原来就在百度维护这种辞典,做了几年之后,就辞职去继续读书了;也难怪,成天手工去搞这么单调无聊的工作,真的要晕掉了。
后来,随便在未名湖溜达了一会,就感觉鹅黄绿的杨柳在风中比较飘逸;经过那个西南联大纪念碑的时候,想起以前在某校友哥们的情色小说中提到的,在那个石碑旁的石凳上,发生的往事;tmd,那个故事给人印象太时刻了,以至于我每次经过那里都会条件反射般的遐想那个场景;北大太熟悉了,都没有啥新意。逛到俄文楼前面,李大钊的塑像前,我才想起来前不久刚从一份历史资料中看到他的确切死因,似乎并不能单纯的怪当时的张作霖北京政府暴虐;李大钊就是从小给我很深很好印象的一位,因为他侄子写他的文章中的那句话“做事情不要三心二意,学要学的踏实,玩要玩的痛快”,曾被我爸引用过无数遍来教育我;而在历史教科书上李的死显得非常突兀,语言不详,其实合理的事实应当不是那个样子的。似乎是当时联络苏联政府,意图搞政变,最后被张政府抓住了,来了个快刀斩乱麻;不是这样的话,为啥要把雕像立在俄文楼前面啊?而张作霖最后被暗杀,也是苏联政府干的,然后嫁祸于日本人,想借此不让日本人在东三省插足。
最后,送某人上车,送我一个路边摊买的三阶魔方,我想了半天都没有归回原位;不过,我对魔方的机械设计,比对归位感兴趣多了,想了半天都弄不明白那些小方块是怎么连结到那个立方体当中去的;似乎每个小块和相邻的都没有连接啊?就像是依靠磁性吸上去的一样,但似乎又不是这样。我觉得魔方,最神奇的地方就是在这里啦;如果找出来枢轴都在什么地方,那么还原魔方就是一个物理机械问题,而不是一个数学问题了吧?
回到住处,很困,八点半就睡下了;结果睡到四点钟就醒了,半天睡不着;就干脆抱着笔记本看点或者写点东西来打发时间。











