|
论分类作者:yushan 20070122 分类方法是我喜欢的话题,Qing的成长性是一个关键问题,这就涉及到柔性分类,其实也是定量与定性表达、模糊表达所相关的。正好前几天在我的博客上也感叹了一-通分类问题,就一起放在这里凑趣吧: 高手过招的试金石:你究竟会几种分类方法? 我们搞企业模型的,分类是看家本事:想一下,你是不是只会树型分类呢? 作者:Qing 20070123 余山老师提出的这些待思考的问题,可能大家或多或少都想过吧。只是没什么结果,分类这种东西真是比较奇怪。看起来简单,一想深了就复杂无比。因此也可以说谁都会-分类,可谁能真的分得让其他人信服就难了。将人分个三六九等,容易。却不知道为什么要如此分,如此分的目的何在。 这就扯到我们作客户分群一样,我指的是采用聚类技术的分群,无目的的分群。这也是对客户进行分类,综合所有信息进行分类。(在数据挖掘领域,分类跟此处我们谈的-"分类"不同,前者的含义是识别分类,后者是分出类别)。到头来,分群的结果觉着挺好,解读出来了,却不知道下一步。悲哀。让我说,客户分群只是一种认识客户的-初级阶段,还是得跟目的结合起来。比如要作一项社会边缘人分析,就对边缘人分群,而不是对所有人分群。如果要关注边缘人的性生活,就得考虑一些跟性有关的因素进-去分群,而不是扔进去一堆东西大杂烩。 唉,其实干我们这行不就是糊弄人吗,而被糊弄的人也许知道我们在糊弄,也许不知道。知道的也未必会说出来,乐得让你糊弄呢。 作者:yushan 20070124 Qing在分类问题上不够乐观,据说成熟的人生观都是悲观主义的,这大概也是知识探索的基调吧,所谓知不可为而为之。 我试图提几个分类的元标准: 作者:Qing 20070124 对于稳定性,可否这样理解。比如一个根节点,分出三个类,它们就是最基本的分类。以后任何的类别都将归入这三类当中,而不会出现与他们并行的其他类别。当然,也许一开始分得更细,三个大类各自分出下一层的子类,以后所有的类别都归入到这些子类里面,而不是另起炉灶。 至于独立性和可扩展性,理解是跟我提到的成长性相似。在那个话题里面,一方面是强调概念认识的不成熟,需要考虑未来的扩展。一方面强调,要让子分类能够独立发展下去。最终通过周期性地重构来达到分类体系的完善。 不知道这个理解是否与此处提及的几个标准一致,还请余山老师举几个例子来说明一下。 作者:yushan 20070125 尊Qing版主指示,举例如下,仅供参考: 稳定性: 再比如,一个图书馆的目录分类体系,也应该是尽量稳定的,一次大的修改是非常费时的。用面分类常常就是为了克服树型分类在稳定性方面的某些困难。 凡是先组式的分类架构都适合专业检索,先组度越高,专指度也越高。最高的先组就是惯用词组,不能拆,比如黄色网站。树型分类的深度越大,先组度就越大,所以专指度也越大。所以,要完成通用的检索,一个可能还不知道的搜索,它的分类就应该结构性越小越好。它的极端就是所有的词都是平级的,好似没有分类,这正是主题词法的精髓。 按主题集中,按事物来集中,而不是按一个先组的分类框架来集中。它其实也有结构,但是隐蔽的,是概念术语的结构,甚至只是文字语言上的字典结构。 独立性比较好理解,最理想的是任何一个元素不能同时属于两个类,不要有交叉。更专业地说,应该是正交的。比如企业模型对事项的分类有两个重要角度:一种可以按承办部门聚类,一种是按所属的外部用户来聚类,它们一纵一横,比较符合正交关系。前者是以组织机构为中心的事项集合,后者以用户为中心,它常常就是跨部门的事项组合,很有实用价值。 责编:姜玲 微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友 著作权声明:kaiyun体育官方人口
文章著作权分属kaiyun体育官方人口
、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。 |
热门博文 |
|