google和BI

作者:姜玲
2007/4/11 16:56:17
本文关键字: ttnn 2006年07期
Google和BI有什么关系?这个站在风头浪尖的公司,用"火"字来形容不为过。将BI跟它扯上关系,似乎有些攀高亲的意思。现在,BI确实已经和搜索技术联系起来,后者正是google的擅长所在。而对于BI厂商,在产品中融入搜索的功能似乎也是一个潮流,例如BO在前几个月发布的一个什么版本中也着重强调它的模糊搜索功能。

对于非结构化的文本搜索方面,ttnn中曾经好几次谈到这个话题。搜索、文本挖掘,这些技术是相似的,特别是后者中,出现了"挖掘"的字样,很明显和数据挖掘这个术语关联到一块。以前曾经听一个公司介绍他们的文本挖掘产品,主要特点就是订阅关键字,然后从各新闻网站中采集到相关的内容。此处的相关,按照这个产品的说法,并非简单的文字匹配,还考虑到语义。例如搜索BI,也能够将相近的,诸如"商业智能"、"商务职能"都纳入搜索范围的。并且可以会一些关联性分析之类的东东,例如关键词主要出现的位置,和哪些词一起出现的频率。这种技术应用在竞争情报分析上面还是挺有趣的。现在,搜索引擎大多也在提供类似的功能,google有alert,也是通过订阅关键字,返回相关的网页链接。百度也有这样的东东。但显然,他们的特点在于搜索,也就是信息采集阶段,分析的功能还是不够强。

如果将对这种非结构化的信息处理和传统数据仓库中ETL相比,搜索就相当于E的位置,它负责抽取。而网络上各种新闻、文档,也就成了数据源。如果要对非结构化信息进行分析,还是得转换成结构化的,也就必须要经过转换,甚至装载的步骤。

这种需求似乎也正在出现,最近一段时间,就听到客户需要这么一个东东——能够搜索本地文档的工具。这些文档包括mail、pdf、word文档等等。一听到这样的需求,不就是google desktop提供的功能吗?正好自己机器上装了,便演示一把,果然不错。但还需要改进的是,能够有权限控制,不同的用户能够搜索到不同级别的文档。另外,当然就看能不能将这个界面整合到自己的portal当中去了。

除了搜索技术,去年年底的时候,google曾经买下一家作web分析的公司(Urchin),并且将它作为一种免费的服务放在网上。一开始,只要有google帐号的都可以自动申请服务,后来改成审批申请了。这项服务可以为网站监控流量,从哪里来,往哪里去,访问次数等等,提供一些可视化报表来展现。分析部分是非常简单的,普通的报表展现。后台则是要求你在网页上嵌入一段代码,可以采集到网站的访问信息。当这项免费服务推出的时候,那些原来在这项领域中,现在成为google竞争对手的公司,想必非常恼火吧。

再看看数据分析一块,最常用的数据分析工具是什么?Excel算是吧,或者称之为一种spreadsheet产品。现在google也有类似的玩意儿,在http://spreadsheets.google.com,也可以申请帐号一试。不过还好,功能还是比较简单,顶多是些公式计算的功能,远没有达到MS Excel那样复杂的程度,譬如作图就不行。但也有其本身的特点,因为是在网络上面的,因此google似乎就是强调可以share spreadsheet。

不过其实可以看到google这些产品和服务,多还是围绕它搜索的核心的,说得虚一些,都可以叫做信息采集。配一些简单的分析功能,倒能形成比较完整的服务,但如果要说专业,还不算。因此,google也选择了和专业BI厂商合作,譬如它的企业级搜索产品Onebox,就已经和Cognos、SAS展开合作。

BI的内容不少。这些大家伙们其实也都是比较专注的,其中单独的模块都能形成独特的产品,譬如元数据、数据质量,更别提这一块信息采集了。只是国内的这种市场并没有细分,"专注"对于公司来说确实是一个不小的考验。
责编:姜玲
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
畅享
首页
返回
顶部
×
畅享IT
    信息化规划
    IT总包
    供应商选型
    IT监理
    开发维护外包
    评估维权
客服电话
400-698-9918
Baidu
map