4.1 非规范知识处理的基本理论概述

陆汝钤院士提出要系统地解决知识的非规范性问题,并定义知识的非规范性为知识的不确定性(模糊、不确定、随机和不精确知识)、或知识的不完整性(内容不完整的知识和结构不完整的知识)、或知识的不协调性(含矛盾的知识、带噪声的知识和含冗余的知识)、或知识非恒常性(时变知识和启发式知识)。实际上,每种领域的知识往往都体现了多种非规范性的交叉和复合,而且知识处理任务常常说不清到底涉及何种非规范性,包括非规范知识的难计算性、难表实性、非直观性、不可知性等。进一步地,陆汝钤院士提出“动态非规范性”的概念,即和一个系统有关的知识的非规范性不能从这个系统的一个快照中获取,而是需要长期的观察,甚至试验才能得到的非规范性。出现动态非规范性的场合一般称为复杂系统,如Web系统、社会系统、经济系统、概念系统、软件系统、认知系统、情感系统、生命系统和量子系统。一般说来,动态非规范性包括开放性、演化性、突变性、涌现性、化合性、非局部性、非单调性、多尺度性等。陆汝钤院士认为静态非规范性研究和动态非规范性研究不是串行的关系,而应分属不同的研究方向。

陆汝钤院士总结概括了非规范知识处理的基本理论,如表4-1所示。非规范知识处理中涉及的核心技术包括以下10种。

1.表示技术:如需求工程中矛盾需求的表示、医学知识的本体论表示、概率和非概率的网络模型,以及生物信息学中代谢网络、信号传导网络和基因调控网络能否采用“三网合一”表示的研究等;

2.存储技术:如海量知识库的知识组织技术、语义网平台的知识组织技术等;

3.搜索技术:如数据库快速搜索技术、第二代浏览器研究、搜索引擎研究、基于内涵逻辑的网络搜索技术、分布式Web搜索等;

4.析取技术:如网页知识提取技术、非规范数据挖掘技术、含变异符号串的Motif学习技术、生物信息网络Motif学习技术等;

5.分类技术:如半监督学习和无监督学习技术、归纳逻辑程序设计技术、随机关系学习技术、页面分类技术等;

6.融合技术:如页面聚类、复杂网络聚类、本体对齐技术、DNA序列比对技术等;

7.提纯技术:如网页过滤技术、噪声去除技术、数据清污技术等;

8.插补技术:如含缺失数据的归纳学习、数据高维模式的发现等;

9.变换技术:如支持向量机的核变换技术、函数变换技术等;

10.软计算技术:如神经计算、演化计算、遗传算法、蚁群算法、免疫进化算法、粒子群算法、软约束逻辑程序设计等。

表4-1 非规范知识处理的基本理论

img

续表

img