刘庆20060308忽悠到了广州,住在黑人区,办公在花果山,热多了。晚上都可以穿着短袖漫步在街上,可惜这附近似乎没有什么繁华的地方。网络也不方便,很多限制,不爽。上次记得谁表露出对实时数据仓库的反感,这个"实时"也曾困扰我许久,因为它的意义总是在摇摆不定。例如人们说企业应用集成,它比"一体儿"更加实时一点;说操作型商务……
|
刘庆20060308忽悠到了广州,住在黑人区,办公在花果山,热多了。晚上都可以穿着短袖漫步在街上,可惜这附近似乎没有什么繁华的地方。网络也不方便,很多限制,不爽。上次记得谁表露出对实时数据仓库的反感,这个"实时"也曾困扰我许久,因为它的意义总是在摇摆不定。例如人们说企业应用集成,它比"一体儿"更加实时一点;说操作型商务……
Zhou.sinuo20060309在银行系统内标志帐户的系统帐号前9位为该帐号的归属机构,因此当机构发生撤并时系统帐号也会随之发生变化;业务系统内会将老的帐号_update成新的帐号,而dw内的帐号还是老的系统帐号,这样当计算该账户的日均余额或是其他累计值时该账户的数据就会发生错误,现在只能采用发生撤并时也_update dw内这些发生撤并帐号的办法,总觉……
BI4Fun20060303一提到BI系统,就自然有几个所谓的代名词出现:决策支持系统、数据仓库系统、数据分析系统、企业业绩管理系统等等,其实数据仓库(Data Warehouse),商业智能(BI)并不是一回事情,不是一个含义,如果你真希望发现他们的差别,你可以使用Googel去搜索一下。跟用户简单的需求调研后就开始什么ETL设计,模型设计,安全设计,WE……
innovate20060301我今天看到itpub.net的帖子“浅谈数据仓库”http://www.itpub.net/496965.html 突然想起忘说一个主题:indicate。就我看到2003年普遍上的移动经营分析项目,要得到客户需要的查询、报表或者其他需求时,往往是用事实表一点一点地算出客户要得指标,然后sum,coun……
ETL工具的使用者是谁?在大部分BI项目组,都有一个专职的ETL工程师,负责ETL的正常调度和错误处理,此人是主要使用者。另外就是项目组其他成员,这些人一般都会SQL语句,会写存储过程,还懂一点业务,是数据仓库建设的中坚力量,他们直接影响了数据仓库好坏,但一般不会象ETL工程师一样,深入追究具体的ETL步骤,他们只关心数据流,数据的依赖关系。ETL工具做为数……
Innovate20060225to happy:不好意思,我有个事情没有澄清清楚,分表可以分为业务分表,和过渡分表。你说的那种情况基本属于过渡分表,目的就是为了分散ETL压力,而最后需要汇总成一个事实表。对于过渡分表,很多国内公司使用tmp_xx,我觉得很遗憾,且不说感觉这是个临时表,就命名来说,项目里其他人可能不知道这个表是干嘛的。最主要的是,过渡分表并……
Innovate20060222在各个网站和论坛,一说到数据仓库,基本都想到了"ETL※DW※OLAP",一说到数据仓库设计,就是按照行业规范和客户需求调研,设计主题,然后设计对应的事实表、维表。但是,这就是真正的数据仓库总体设计么?关于上面说的主题设计,以及前端展现,这是给客户的最终用户看的,他们只关心你能给他们带来什么,是否满足他们的……
到了清朝,当时的BI人生活的很不好,因为没什么项目啊,大家对这玩意儿很轻视,毕竟不是衣食住行的东西。为了振兴这个行当,很多人想将BI吹起来,一次峰会上,代表们在务虚,说,要将蛋糕作大,作甚么呢?对,做政府行业的BI,中国几千年的历史不是闹着玩的,积累下来好多数据库和一堆乱七八糟的文字,什么GDP、人口、企业数据随着朝代交替,不断地版本升级,甚至是推倒重来。于……
在很久很久以前的中国,一批从事BI的先辈,就当他们忙忙碌碌,为生计奔波,为名利追逐的时候,其中有一位特立独行的人。虽然他也是深陷BI,却总能够跳出这个圈子,从大自然中领略无限风光。有好事者采访他问之诀窍,他回答说,"无他,不要天天想着工作,没事偷着乐罢。"这位似游侠一般的人士名叫小庄,生性懒惰,因为谋生,选择了做BI这条路。其实这个专业跟……
最近向师傅的几篇etl工具设计系列挺有意思,特别是到需要自己编写etl工具吗?这一章,有点无招胜有招的意思。哈哈,说了一通如何设计这个工具,最后告诉你,不要去设计。其实我也是不赞成自己编写ETL工具,当然如innovate所分类的,是在大金额和大数据量的项目情况下。 向师傅估算的ETL工具开发成本还是太乐观了,一个产品的开发是长时间的,就算这个成本能够开发出……
众多入门的朋友都会至少学习基本数据仓库概念,包括Inmon提出的基础概念,懂得要建设星型、雪花型,稍微深入研究的朋友,就会知道,数据仓库系统,特别是大中型系统,并不能直接将数据从各个数据源拿过来清洗、过滤、ETL就可以用了,而是各个步骤需要stagingarea去过渡,增加系统效率和可维护性。再深入研究Inmon或者Kimball数据仓库理论的朋友,就是知道……
年前的聚会,朋友们出谋划策,逐渐地,『ttnn』已经有形成一个招牌之势,专注于BI领域的一个招牌。blog、邮件列表、杂志,之后是什么呢?其实从最开始的blog,到后来的邮件列表,都是为了一种知识积累的目的。blog是一种个人的知识积累,可是它交互性不强,其实作为个人知识平台不甚理想,倒适合为一个个人情感宣泄之地。于是有了邮件列表,这种形式的交互性要强一些,……