一个系统访问日志的分析需求的设计

  作者:姜玲
2007/4/30 14:53:16
本文关键字: ttnn 2006年09期

赛翁 20060921

大家好:

我是BI新人,做了不到1年时间。一直在这个论坛看各位的帖子,虽然很多主题暂时不能和资深BI人员一样,有太深入的理解,但是确实让我对BI能有更进一步的认识。这个论坛的很多主题都是从业4,5年的人员才能插得上话得,很多象我这样的初级人士只能看看而已。我想刘庆应该不会是想把这个论坛变为一个高端论坛吗,是不是也应该多些我们初级的人士也可以参与讨论的主题呢?

正好我有一个工作中的问题,看看是否可以让大家讨论一下。

这儿有个log表:page_id 页面ID,visit_time,访问时间,user_id,user_city

我想了解用户访问BI系统的情况。主要是访问的菜单和访问的用户。通过这些情况指导BI系统实现的重点和方向。

我现在就是把这个需求作为一个分析需求来看,我想设计一个结构可以对这个进行分析。按大家的说法是不是叫主题分析。当然这个东西肯定够不到那个级别,但是真够级别做主题分析的,估计在这儿发贴讨论也是讨论不清楚的。所以大家觉得是不是把这个小东西按主题分析的思路给我们谈谈该怎么设计,这样对于初学者的BI设计思维也许会很有帮助把。

我的思路是:纬度有地市,用户id,页面id,日;值是访问次数

分析结果我经验不多,好像是:访问最多的用户排行,访问最多的页面排行,日,月,年,同比,环比。再还有什么方向可分析了?

设计表,我只会设计一个表为

visit_num,访问次数,page_id,page_name,user_id,user_name,user_city,day

定时把日志表的数据汇总到这个表中,然后在这个表上写查询来满足分析要求。


不好意思,以前是做应用系统的,我感觉这个设计还是不象做BI的人设计的。希望可以给大家一个例子,听听资深人士给我们设计一下。

我想把简单的一个需求,用最完整,规范的BI方式来做设计,大家比较好理解,从中也可以对比自己设计的不足,从而对BI有更进一步的认识。

最后,希望各位老大可以在百忙中抽空对这个简单的分析做个设计,也好让我们这些新人能够得到提高。让bi队伍质量得以提高。

Qing 20060921

赛翁客气了。
 
说实在的,的确期望在ttnn里面能够多谈高端的话题,谈想法,谈方法,谈实践。但它会不会变成一个"高端论坛",是在于参与讨论的朋友们,你们喜欢讨论什么话题,有兴趣讨论的,自然会有人参与。比如说赛翁在这里提出的这个关于访问日志的设计,应该不算是初级。我以为你想探讨的是分析思路,而不是具体实现,用什么工具实现之类的。
 
这访问日志应当也算是BI的范畴,会有诸如报表的展现,它的目的是为了帮助系统设计者来优化自己的系统,跟一个企业优化自己的业务流程类似。市面上已经有一些专门做这类访问统计的系统的,其设计思路可以参考一下。他们的设计框架应该比较全,只是这些设计为了什么目的,大多是隐藏在他们设计的背后。
 
对这块内容我不是非常了解,所以只是给出粗浅的分析思路。如果刚开始进行这样的工作,首先提出几个问题,这个访问日志统计能够帮助谁?能够提供什么样的分析?

1、能够帮助系统管理员,让他们及时知道系统访问负荷,监控是否有异常现象;

2、帮助系统设计人员,让他们知道这个系统的哪个部分(页面)是最受欢迎的,以便针对性加强优化;

3、让他们知道客户的终端都是那些类型(如版本、语言、分辨率),以优化自己的交互界面设计;

4、假设这是一个OLAP分析系统,要知道哪些cube访问频繁,哪些根本就不访问,cube中的哪些维度是经常组合在一起分析的。这可以优化cube的维度设计;

5、要知道那些用户最常使用系统,都是来自何处,一次来判断谁是系统的最优先服务对象;

6、要知道这些用户的访问习惯,从哪儿进入系统,从哪儿离开系统,在哪些页面停留时间最长,页面跳转是否有一些固定的模式?一次来优化系统的结构;

7、领导可能也会是这个系统的用户,但他只关心总体的页面访问次数,和访问用户数(以及他们的变化),以此来跟别的部门或别的单位炫耀。
 
以上列出种种问题,可以充当这个访问日志统计的需求,当然,这个需求肯定不完善,且需要细化。但思路是如此的,明确要做的东西为谁服务,怎么服务。
 
确定了需求,然后在考虑该怎么设计满足这个需求。其实BI中面向主题的特点没什么特别的地方,跟做应用系统中常提的OO有什么两样?在这里面挑选出一些名词来,将他们作为主题。例如页面、用户。
 
当然可以建立这两个主题,围绕页面,考虑要从哪些角度来观察页面的访问量;同样围绕用户,考虑从哪些角度观察,这些维度,也可以理解为OO的属性。譬如页面,有页面停留时间、前导页面、后续页面、页面所属模块等等。用户呢,可以从部门、地区、访问路径的模式(当然得先总结出几种模式出来)等等,就拼了命多想些维度。

至于最终的实现,就不在这里讨论了。我看赛翁是准备要实现这个小系统的,等完成了,不妨跟大家分享一下。
 

责编:姜玲
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
畅享
首页
返回
顶部
×
    信息化规划
    IT总包
    供应商选型
    IT监理
    开发维护外包
    评估维权
客服电话
400-698-9918
Baidu
map