论分类

作者:姜玲
2007/5/28 15:40:26
本文关键字: ttnn 2007年02期

作者:yushan 20070122

分类方法是我喜欢的话题,Qing的成长性是一个关键问题,这就涉及到柔性分类,其实也是定量与定性表达、模糊表达所相关的。正好前几天在我的博客上也感叹了一-通分类问题,就一起放在这里凑趣吧:

高手过招的试金石:你究竟会几种分类方法?

我们搞企业模型的,分类是看家本事:想一下,你是不是只会树型分类呢?
职能域的划分,业务过程的划分,原子活动的划分,只要你是负责任的,这每一个划分都足以令人踌躇不已。信息分类编码,有面分类和线分类,它们的根本区别是什么?-一件产品,既可以按用途和功能分类,也可以按隶属部件分类,还可以按它的几何特征分类。到底应该怎么分?还有,按主题分类有什么特点,它与一般树型分类、面分类-到底有什么不同?会计科目体系的明细科目应该如何下?一个分类体系里允许不同的分类原则么?信息资源目录体系为什么是按照主题、行业、服务和资源这四个面来划分-呢?
如果你根本没有想过这些,那说明你的企业建模相当盲目,有点糊弄外行吆。
如果问科学是什么?洗尽铅华,我要说最朴素的科学就是分类。
从文科逻辑的观点看,分类方法就是形成概念的方法。想一下,你是不是只会从对象"去伪存真、去粗取精"这一种抽象概念方法呢?
从数学形式化的观点看,分类是一种排序。想一下,你是不是只会线性排序和树型排序这两种方法呢?还想到过更具柔性的排序方法吗?
顺便说,《表达的探究》一书总结了许多巧妙的排序方法,值得注意,它同时也是巧妙的分类方法,也是形成概念的方法。
详细请参见表达的探究网站:yushan58.bokee.com

作者:Qing 20070123

余山老师提出的这些待思考的问题,可能大家或多或少都想过吧。只是没什么结果,分类这种东西真是比较奇怪。看起来简单,一想深了就复杂无比。因此也可以说谁都会-分类,可谁能真的分得让其他人信服就难了。将人分个三六九等,容易。却不知道为什么要如此分,如此分的目的何在。

这就扯到我们作客户分群一样,我指的是采用聚类技术的分群,无目的的分群。这也是对客户进行分类,综合所有信息进行分类。(在数据挖掘领域,分类跟此处我们谈的-"分类"不同,前者的含义是识别分类,后者是分出类别)。到头来,分群的结果觉着挺好,解读出来了,却不知道下一步。悲哀。让我说,客户分群只是一种认识客户的-初级阶段,还是得跟目的结合起来。比如要作一项社会边缘人分析,就对边缘人分群,而不是对所有人分群。如果要关注边缘人的性生活,就得考虑一些跟性有关的因素进-去分群,而不是扔进去一堆东西大杂烩。

唉,其实干我们这行不就是糊弄人吗,而被糊弄的人也许知道我们在糊弄,也许不知道。知道的也未必会说出来,乐得让你糊弄呢。

作者:yushan 20070124

Qing在分类问题上不够乐观,据说成熟的人生观都是悲观主义的,这大概也是知识探索的基调吧,所谓知不可为而为之。

我试图提几个分类的元标准:
稳定性:大的分类框架尽量不要变动,
独立性:各个分类应该尽量是各自独立的,最大信息量
表达完全性与准确性的平衡:通用普遍与专指度高,这是个矛盾要求,所以见水平,
可扩展性:也就是Qing的成长性问题,它其实是表达完全性的另一个说法,
一时想不出了,欢迎大家来补充,

作者:Qing 20070124

对于稳定性,可否这样理解。比如一个根节点,分出三个类,它们就是最基本的分类。以后任何的类别都将归入这三类当中,而不会出现与他们并行的其他类别。当然,也许一开始分得更细,三个大类各自分出下一层的子类,以后所有的类别都归入到这些子类里面,而不是另起炉灶。

至于独立性和可扩展性,理解是跟我提到的成长性相似。在那个话题里面,一方面是强调概念认识的不成熟,需要考虑未来的扩展。一方面强调,要让子分类能够独立发展下去。最终通过周期性地重构来达到分类体系的完善。

不知道这个理解是否与此处提及的几个标准一致,还请余山老师举几个例子来说明一下。

作者:yushan 20070125

尊Qing版主指示,举例如下,仅供参考:

稳定性:
比如电子政务的功能框架分类,世界上各个国家的部门机构组织都不一样,先进国家大概只十几个部门,而我们国家为四十多的部门。并且改革以来,我们的政府机构就一直在变动,若以此来做为划分的基础,就是一个不稳定的框架。所以,联合国为电子政务提供了一个比较抽象的国家功能框架,是按职能来划分的,这样既可以适用不同的国家,也可以适应像中国这样一直在变动的国家机构。

再比如,一个图书馆的目录分类体系,也应该是尽量稳定的,一次大的修改是非常费时的。用面分类常常就是为了克服树型分类在稳定性方面的某些困难。

凡是先组式的分类架构都适合专业检索,先组度越高,专指度也越高。最高的先组就是惯用词组,不能拆,比如黄色网站。树型分类的深度越大,先组度就越大,所以专指度也越大。所以,要完成通用的检索,一个可能还不知道的搜索,它的分类就应该结构性越小越好。它的极端就是所有的词都是平级的,好似没有分类,这正是主题词法的精髓。

按主题集中,按事物来集中,而不是按一个先组的分类框架来集中。它其实也有结构,但是隐蔽的,是概念术语的结构,甚至只是文字语言上的字典结构。

独立性比较好理解,最理想的是任何一个元素不能同时属于两个类,不要有交叉。更专业地说,应该是正交的。比如企业模型对事项的分类有两个重要角度:一种可以按承办部门聚类,一种是按所属的外部用户来聚类,它们一纵一横,比较符合正交关系。前者是以组织机构为中心的事项集合,后者以用户为中心,它常常就是跨部门的事项组合,很有实用价值。

责编:姜玲
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
畅享
首页
返回
顶部
×
畅享IT
    信息化规划
    IT总包
    供应商选型
    IT监理
    开发维护外包
    评估维权
客服电话
400-698-9918
Baidu
map