欢迎访问duelearning的博客
理子构成理论
直通系统
<理子构成理论>
超越IBM 公司概念检索系统
-用理子理论解释并构成全人类知识体系-
方华
公元 2005 年 九月于美国 康奈狄克州
在解开理子袋之前
最近,美高科技巨人IBM公司公开发行了它的概念搜寻技术名为UIMA(无特定结构信息管理体系)。经细究其内容,发现UIMA系统的哲学基地是不牢固的;尽管其软件工程技术部分的设计也许是无懈可击的。在此文章里,本人试图从UIMA观点出发来引入更深层的思考,以便阐明概念在人类推理系统结构内的角色,或者说在人类"理解交换"和人类知识体系内的角色。因本人的论点完全建立在一个简炼化的公式上,一种概念性结构,其名为"理子"。从升华的哲学角度看,该结构模仿DNA分子结构。因此,本理论可被形容为"象分子一样"。
概念是什么?
在其UIMA概念性概要阐述中,IBM研究人员没有澄清关于概念的关键含义。从其上下文暗示中推究得知,他们所指的概念实质上还是关键词.它们只不过是被隐蔽起来的关键词。这样就留下了一个没有被回答的关键问题:概念是什么? 现在我们别无选择,留下能做的只有一个,那就是理性上的飞跃,以此将使我们走出这个概念性洞穴带来的黑暗。
解开理子袋
现在暂且撇开"概念"这个问题,让我们问自己更基本的问题,以此渴望得到意义更广的答案和结论:在人类推理,学习,理解交换和知识中,是否存在任何最基本的结构要素?这种广度和深度来问问题,不可避免地使得每一个寻求真理的到历史里去寻找(哲学上各方面的历史)。似乎不幸的是,你也可以猜到,苦苦地寻找并未给我带来直接的答案。尽管如此,多多少少的暗示处处可见,这包括从古至今的和来自西方和非西方的。首先,我们说所有的人类推理,科学上的和非科学上的,宗教上的和非宗教上的,无例外的都是基于规则。在科学上,它们被叫作"规律""规则""原理""命题""定理"等等,在非科上,它们被叫作"法律""规则""教条""规据"等等。无论从何方面,宗教或非宗教,这类子集(subset)享有一个共同特性,那就是它们都被认为具有说解现象的能力(其内容是否为真理而另当别论)。我们称它为则理子集。作为科学工作者,在数不胜数的则理子集里,我所喜爱的有很多,比如说,牛顿三定律,量子理论,DNA双股螺旋理论,等等。然而,搞科学并不使我否认这样一个事实,那就是圣经里也是具有许多了不起的则理。那些则理一直使它的信徒们保持约两千年的忠贞不渝。
现在我们可以画个一般性的结构。该结构需具有则理或则理样要素,这里统一简称为"L"(来自英文的Law);以及现象子集,其内涵为所有含义需要被解释的对象,这里统一简称为"P"(来自英文的Phenomenon)。这样我们是否可以说有了结论了?就是系列的"LP"?近一步分析得知,一个则理本身应享有一简单的命名以表示其整体性。也就是说一个则理内是包含其马两个以上单点性涵义。现象本身,其内容包含"语词","文字","影像","声音",等等",是没涵义的。它们是需要被解释的对象。这样一来,我们需要一类要素。这些要素应具备携带非整体的单点性涵义。直觉和逻辑告诉我们,唯一称职的就是概念,这里统一简称为"C"(来自英文的Concept)。至此,我们有了一个人类最基本的思维结构单位。它可以被书写成以下多种形式:LCP,LPC,CPL,CLP,PCL和PLC。然而,逻辑和常理只允许一种形式,既LCP。让我们就地立下此规,并称其为"理子"。
在现代信息技术和生物信息学出现之前,假定既使有类似的发现,LCP是不会被公众所理解,也不会有任何用处。为了使得如此有关思维的"思维片段"有真实的意义,就向人类自身进化过程一样,要靠上帝(广义的)或机遇。首先,由沃森(Watson)和克里克(Crick)二人共同代来的DNA双股螺旋结构的发现,给人们展示出前所未有的生命内幕。这一发现的生物学以及有关的高科技方面上义意已被反复印证。证据量以指数上升。但具有讽刺含义的是,DNA的发现,从哲学角度看,对人类思维上的影响,还未被探讨过。例如,在由著名法国学者奥姆尼思(Roland Omnes)教授所箸的,名为"量子哲学-理解和分析现代科学"一书中,奥老倾述其梦(于原箸63页),想有朝一日寻找到一个解释现代科学哲学的万能模式。然而,有关于DNA,他在此书中(于原箸253页)仅提到一次。况且仅指出其生物学上的革命性作用而已。
现在,一方面,我们有了DNA,一个结构已知的富含密码子之源;另外,从上述推论中,我们已得知人类基本思维单位理子的存在,并且其结构模仿DNA中的密码子。这些理子,正等代由象化学键般的作用,将其联结起来而使得其有了意义。对于理子"LCP",现在唯一缺失的就是联结键,其标志为"-"。 这里, 我们仅需一点算数和浮浅的集合论的 知识,这样就可列出以下式子:对于"一块知识",我们可写成(-LCP-)1,然后,类推得出 一个数量级以上的知识量,其标记为(-LCP-)n."n"是来自英文中"natural number" 的第一个字母,意为"自然数"或称为"正整数"。这里我愿提醒一下读者们,自然数是没有尽头的。10的100次方的巨大的数字英文称Googol也属于自然数。但它并不是最大的。
现在,让我们再回到理子的话题上来.这里给个具体的例子,如L1C4P,意思为:一个单独成立的则理子集,结合上有四个概念子集,以及不可胜数的现象子集。牛顿第二定律正是如此。"F=ma",这里是一个定律,其里面有四个概念("F"为"力";"m"为"质量";"a"为"加速度";以及"="所包容的所有的数学概念的总体(可被写为"x=y×z"),以及无数个现象子集。其例子有:"迦利略坠物试理",或"美航天局发射火箭"等。如果往下继续组建这个理子链(-L1C4Pn-),联结左侧键的应是量子力学中的理子们,标为"-L量子力学 CnPn-"; 而右侧为应用理论中的理子们,如弹道发射学等。 如将它们联成个理子串, 简单描述可如此:-Ln量子力学CnPn-L1牛顿第二定律C4{F,m,a,=}Pn-Ln 弹道发射学 CnPn-。当然,这是极其简廉的表达。
要将人类全部的知识以这样的理子结构建成起来,还有一个关键点要提,那就是时间标记(简称"时标")。时标给思考和推理带来了绝对的历史性涵义,以及必要的参考点。该参考点的关键性将体现在正规推理过程中。同时,理子间的结合键,就象化学键一样,具有联结其它理子的本性。这种向化学分子反应过程的理子反应,用常言表示就是"推理"。它包括"演译"和"推纳"等。
综上所述,一个合理推出,表达全部人类知识结构的公式,可描述如下:
该表达式可读成:"现在,这些是就关于所有事情的,我们人类所有的全部知识"。("T"为"时间";"@T0"为"在零时",指在具体研讨中的时间点,常为"现在","此刻"等;"R_"为"负实数"子集,意为着在"此刻"之前的所有时间点)
有了理子,我们可做什么?
现在,让我们来回到现实。不象IBM's UIMA中所说的,与其相反,人类用自然语 言或其它方式表达的内容都包涵在它们内在的推理结构中。这些被表达的内容大多数是被研究过地;或者正在进行。所以,在发表的材料中,所被阐述的理论,联带着所有有关的概念们,可组织构件成系列的理子链(该组成过程甚至可以不需很多的人工时;多数可由计算机处理)。当然,对于尚未有统一解释的同一组现象(现象子集中的内容),有关理论可有多个。这样,从理论上讲,用现在已有的生物信息学和信息工程学技术,一个真正的概念搜索工具,是可以获得的。同样明显的是,许多以前被认为是"不可思议"的事,将可思议了。这类设想中,我最愿提议的一个就是:"直接式理解交换"系统,简称"直通"系统。
对直通系统的简单解释,可用生物信息学中的一个类比,来简炼清晰的描述。此类比叫"DNA微观列阵技术"。现在,让我们为下述事件,展开一下想象力:有成千上万的DNA片段,有序地放在一个芯片样的支撑物上;这时,让我们用理子片段,取代DNA片段。按照理子的本性,我们可称所有在"芯片"上的信息,为全部的专家知识量(包含全部的则理,概念,和现象子集);要检测的标本,相当于任何一个非专家的知识库。该知识库包含了该个体在某领域里的全部知识量,其中包括有关实际经历和技能。一旦杂交反应完成,报告将给出相应的配对成度的结果;意思就是:被测试者的具体的知识量和内容,可迅速和直接地得到。
理论上,我们可以继续深究直通系统。比如,有些人,出于不明原因,将不会完全理解某些具体的则理。其中包括许许多多永远被认为是离奇的概念群。但是,他或她知道:无论那黑盒子里是什么,许多可靠和有利的结果可以永远得到。前题是,只要遵守一些表浅易懂的规则。开机动车是个例子;服用药品是另一个。现在,让我点清我的观点。这类情况,可被称为"被辅助性智能",简称"辅能"。通常,人们称之为"工具"。辅能作为特殊的一类工具。它专门从智能上帮助人们。换句话说,当人们要去做超出本人智能的事情的时候,辅能可帮助做到。辅能使得每个人完美地配戴好所有的知识,以完成所在的具体工作。
为IBM研究者及同行们的结束语
无论我的理子理论对错与否,在开发概念检索技术之前,有关"概念是什么?"的问题,必须有个哲学上的圆满答案。有些时候,我们必需迫使自己,忍痛断脐,以脱离怜旧的阴影,象哲人柏拉图2000多年前所警示的那样,去迎视那未见过的光茫。
- 作者: duelearning 2005年09月28日, 星期三 08:46 回复(2) | 引用(0) 加入博采