商业信息(BI)市场的竞争很激烈且环境很拥挤。历史上,大型企业,如甲骨文和IBM,它们参与了功能大战,以图证明精打细算(如果不是超出预算的话)的定价的合理性,并且严重依赖于高接触的推销手段。更糟糕的是,供应商希望你的IT部门与供应商自己的顾问合作来配置他们的产品,并将其与你的每个记录型系统集成在一起,这往往需要额外的成本。
一旦安装并运行传统的商业智能系统,管理人员必须等待每周或每月的行业报告,这意味着要一个月的时间来做决策,外加一个月的实施时间。添加一个报告需要向进度严重落后的IT提出请求,而这可能需要数周或数月的时间来进行设计和编码。
这一切都随着2004年推出的自助式商业智能而改变,例如我将在这个比较中介绍的五个平台—Domo、Power BI、Qlik Sense、QuickSight和Tableau。自助式商务智能的过渡部分得益于在几天而不是几个月内做出商业决策的能力。最近,云计算和高速互联网接入已成为自助式商业智能的关键技术驱动力。
当然,传统的商业智能虽然有所衰退,但依然活蹦乱跳。财报尤其要求100%的准确性,这通常需要数周才能生成报告。报告可能是一个单独的用例,它也许并不能一直得到自助式服务的商业智能产品的良好服务,后者强调交互式视觉发现,尽管一些较新的平台试图完全取代传统的商业智能系统。
同时,传统的商业智能平台也在不断发展。有些已经增加了足够的自助式服务、可视化发现和分析,以满足现有客户的需求。
挑选自助式商业智能平台的标准
在你选择自助式商业智能平台时进行自己的评估是很关键的,因为很多供应商推出的功能可能没有为你的企业带来真正的好处。例如,如果贵公司已经拥有高性能的数据湖(data lake),那么你可能不希望支付将所有数据导入自己的商店的商业智能平台的差价。同样,你可能更倾向于将商业智能系统集成到现有的协作平台,而不是使用专用的商业智能协作功能,因为要求员工使用两个协作系统的做法通常是不会成功的。
如果你的大部分数据都在Azure上,那么你可能需要排除仅在Amazon Web Services上运行的商业智能系统,反之亦然。如果可能的话,出于性能上的理由,你希望将数据和分析合并在一起。
供应商倾向于引用对他们的产品最有利的分析报告。不要信任供应商的一带而过的摘要,或者轻信他们向你展示的图表:向他们索取并阅读整个报告,这个报告会提及注意事项、劣势、优势和特性。还要以怀疑的态度来对待分析师的报告中夹带的私货:大多数大型分析公司对付费的客户更感兴趣,而不是非它们的客户的供应商,尽管个别分析师的真诚尝试是公正且中立的。
以下是评估自助式商业智能平台时的七个关键领域的问题。
数据源
你要确保商业智能平台可以读取所有数据源。其次,你要知道平台在处理数据前是否必须将数据导入到自己的工场中,或者是否可以即时处理数据查询。
如果必须导入数据,分析速度是否足够快,以证明花时间导入是合理的?商业智能系统能否自动更新原始数据源的数据?
如果商业智能系统中的数据存储要收费,请尽情猜测5年内你将拥有多少数据,并将其数量增加三倍。存储该金额的成本是否会影响你的预算?
另一个关键问题是:商业智能系统是否可以在你存储数据的地方运行呢?如果不可以,迁移数据的难度有多大?
数据转换
当你要收集数据时,数据往往是很“脏”的。行中可能缺字段,或者可能包含无意义的值。行中的多个字段可能具有相互不一致的值。文本字段可能包含拼写错误、拼写变体或术语变体,使其不能自动组合在一起。有些字段,特别是自由形式的评论可能会很长,而且用处不大。
此外,字段可能是非参数化的(如文本),为了分析的目的,需要将其编码为数字,尽管有些商业智能系统在内部实现了自动化。字段的数字范围可能有数量级的差异,需要将它们归一化。可能一些值要从另一些值推断出来,例如,如果源数据中不存在性别,可能需要从名字和/或标题中推断出性别。
你可能要给商业智能系统编写SQL SELECT语句,或者它可能自动导入自身。如果要编写数据库查询,它是否可以帮助你选择字段并创建连接(join)呢?
凡此种种的问题意味着你应该在你的一些数据上测试一个商业智能系统。构建一个提取/转换/加载链,同时查看和绘制数据。看看它们显现的难易程度。将其与其它商业智能系统进行比较。不要低估数据清理要花掉的时间,这多半会占用总分析时间的80%。
分析能力
你要以几种方式分析已清理的数据。在最简单的层面上,你将以各种格式绘制数据,并对历史数据和趋势进行直接的统计分析。除此之外,你要探究数据以了解特定的功能,并构建模型以测试你对原因的看法。最后,你可能需要根据统计模型甚至机器学习模型来预测未来的绩效指标(例如销售和库存需求)。
你将遇到的一个功能大战体现在所提供的图表类型的数量。当吹的天花乱坠的图表类型不适用于你的数据时,这通常是毫无意义的。另一方面,有些图表类型非常重要:例如,我不愿意使用没有地理显示支持的系统,因为查看位置表中的原始数据与查看地图上不同的颜色或不同的气泡大小的视觉和直观影响是不同的。
另一个功能大战是对分析的支持。是的,你确实应该具备在商业智能平台内执行简单的统计的能力,至少要懂回归模型。更深入的话可能会与用户产生“阻抗失配”。
例如,将机器学习和深度学习支持添加到探索性商务智能分析的选项中,这对管理者和业务分析师而言可能是一个难以企及的目标。数据科学家则是另一回事,但他们通常具有专门的专业工作空间来创建机器学习(ML)模型和深层神经网络,他们使用的工作流程通常需要统计知识和编程技能,而这些流程对他们在这方面的要求远高于典型的商业智能用户。
另一方面,自然语言支持和分析常见数据模式的内置智能使生疏的用户更容易使用平台。将机器学习应用于用户体验往往是好事,即便要求业务分析师训练深度学习模型也许是徒劳的。
现在有些商业智能平台使用内存数据库和并行性来加速查询。未来,你可能会看到更多高度并行化的基于GPU的数据库被内置到商务智能服务——第三方正在建设这些展示了惊人的速度提升的数据库。
你经常需要在分析过程中修改或增加数据转换,例如通过添加反映其它列之间的差异或比率的列,就像财务分析中经常进行的操作一样(如债务/权益)。这样的修改有时可以改变ETL(提取,转换和加载)管道到ELT(提取,加载和转换)的导入过程。某些供应商仅支持ETL或ELT之中的一个,但大多数使用ETL的商业智能系统在分析步骤中都提供了额外的转换。
易学易用性
尽管自助式商务智能系统是针对管理者和业务分析人员,但它是很复杂的,它有很多移动部件。在我尝试过的商业智能平台中,用户体验和学习资料的平台间质量差别很大。在评估中试着让技能水平参差不齐的用户参与进来,以了解他们的反应。另外一定要测试文档本身。最好的文档搜索、索引和组织以及最差的文件之间存在巨大差异。有时候,我常常不得不要求销售工程师在经历重要但失败的个人努力之后为我找一个教程。
演示的灵活性
有些商业智能系统几乎对任何变量的选择都显示出算得上有见地的图表。另一些商务智能系统等待你点击你想要查看的图表类型。如果你知道你的需求,那么用哪一种方法都可以,如果你不知道的话,最好是让系统根据你选择的变量的数量和种类提供帮助。
商业智能系统往往区分始终是数字的度量和可能是非参数化的维度。有些维度,例如城市、州和国家可以转化为经度和纬度等度量。有时候,你想看到符合维度标准的度量,例如“按产品展示我们的利润率”或“按店铺显示我们的同比销售额”,以及另一些时候你希望看到符合其它度量标准的度量,例如,“向我展示利润与中西部地区所有商店的销售额”。
一旦你看到了一个有意义的图表,你往往想放大特定的功能、调整显示,并添加注释。商业智能系统在这个领域的差异很大,所以做这个练习是值得的。
协作的选择
你可以共享的具体内容因系统而异,或者按照你是否想要完全与授权用户、只读注册用户或未注册用户共享。在某些情况下,只读用户可以从你提供的图表中对数据进行排序和筛选;在其它情况下,他们只能看到你的分析的幻灯片。
这个区别通常会影响你是否能够为整个公司或只为特定的受众提供商业智能产品,当然还有定价。
成本和收益
所指的成本不仅仅是供应商的年费,还包括存储数据的成本,将平台托管在本地或云端的成本,还有人员培训的成本。这样做的好处包括减少劳动力和决策时间,做出更好的决策,并最终提高利润并加快发展速度。
当今可用的最好的自助式商务智能工具
考虑到这些因素,让我们来看一下五个引领市场的商业智能平台(按字母顺序排列)。
Domo
Domo是一个在线商业智能工具,它结合了大量数据连接器(data connector)、ETL系统和统一的数据存储、大量可视化、集成社交媒体和报告功能。Domo自称它不仅仅是一个商业智能工具,因为它的社交媒体工具可以产生“可行动的洞察”,但实际上每个商业智能工具都会产生有利于业务的行动,或最终被丢弃在垃圾堆的行动。
Domo是一个非常优秀且功能强大的商业智能系统。它支持大量的数据源和大量的图表类型,而且集成的社交媒体功能很棒(如果夸大其辞的话)。但是,Domo比Tableau、Qlik Sense、QuickSight和Power BI更难以学习和使用,专业版每年的费用为每用户1920美元,企业版每年的费用为每用户2280美元,它的成本高出好几倍。
根据你的需要,Tableau、Qlik Sense或Power BI极有可能是比Domo更好的选择。
Power BI
Power BI是微软加入自助式商业智能战场的产品,它包含了一个托管在Azure上的服务的Web界面和Windows桌面的Power BI Desktop应用程序。它的价格比竞争对手要优惠:标准账户是免费的,专业账户每个月的费用是每用户9.99美元,而Power BI Desktop是免费的。
网站和桌面应用程序都会定期更新。Power BI Desktop每月更新一次;网站更新后很难看出区别。
对于某些数据源,Power BI具有预定义的图表,仪表盘和报表。例如,默认的Visual Studio Online仪表盘和报告提供了Git、拉取请求和版本控制活动、在你为你的账户配置的项目之间的一目了然的视图。对于其它来源,Power BI预计会看到其数据的某些标记。例如,它支持Excel工作表命名表,Excel数据模型表和Power View工作表。如果在Excel工作表中只有原始数据,则需要返回并创建一个或多个命名表;如果你在导入前确保数据类型是正确的,它也会有所帮助。
对于使用Windows、Office和Azure生态系统的公司来说,Power BI是一个合理的选择。对于那些希望为组织中的每个人提供商业智,对成本很敏感的公司来说,这也是一个不错的选择。缺点是Power BI不像Qlik Sense或Tableau那样具备很多的分析功能或对图表的控制权。
Qlik Sense
Qlik有“模式1”或在QlikView中有传统的商业智能产品,并在Qlik Sense扩展了自助式商业智能。2014年问世的Qlik Sense是一款自助式商业智能和可视化产品,它基于与QlikView相同的内存关联的数据索引引擎。在2016年,Qlik将之前仅在QlikView可用的报告引擎添加到QlikSense中。
Qlik Sense 2.0是一个非常强大的数据发现和交互式分析工具。它几乎可以连接到所有的SQL数据库,并且可以对可视化进行很好的控制。但是,它不像Tableau那样易于学习、使用或灵活地呈现可视化效果。
商业智能的数据导入往往是一个混乱的过程。Qlik Sense 2.0会尝试在不同的表中关联相同的名称的字段,还会比较数据并就类似字段提供推荐。这个新功能被称为智能数据加载(Smart Data Load)。
Qlik Sense 2.0还引入了Qlik DataMarket,这是可用的公共和商业数据的来源,它可以分为六类:商业、货币、人口、社会、气候和经济。当你分析私人数据时,有公开数据的话会有很大的帮助。
Qlik通常以压缩格式的形式将数据保存在内存中。然而,有时候你的数据多得无法存储到可用内存中,在这种情况下,Qlik Sense可以使用“直接发现”模式将内存中的数据与数据库中的数据相结合。在直接发现模式下,有些字段只能作为可在表达式中使用的元数据/符号表加载到内存中。驻留在数据库中的实际数据将根据需要进行查询。
使用Qlik Sense时,你可以将书签保存到当前工作表的当前选择状态,并且可以将书签合并到故事中,并添加文本和其它注释以使故事不言自明。如果你正在使用故事进行实况演示,你可以深入到任何可视化的源代码来回答问题,然后在回答问题时返回到故事。
Qlik的关联式绿白灰体验,在这里所显示的值的颜色指示状态(已选—可选—不可选)有助于你发现相关数据和无关数据,而无需挖掘,这是一个很高明的手段。我也喜欢Qlik定义表达式的方法,但我更喜欢Tableau的方法。Qlik Sense可以很好地控制可视化的外观,这一点比微软的Power BI做得好,但又不如Tableau做得好。
QuickSight
亚马逊的QuickSight完全运行在AWS云端,它对亚马逊的数据源享有良好的访问权限,能够平等地访问其它数据源,并以基础价格提供基本的分析和数据处理。在这里讨论的其它产品中,QuickSight与Power BI最像,只是前者没有依赖桌面产品来创建数据集,或依赖Power BI Desktop / Service组合提供的分析能力水平。
QuickSight像Power BI、Qlik Sense和Tableau一样连接到无数的数据源,并让你准备数据集。一旦拥有了数据集,你就可以创建具有一个或多个可视化分析,你可以将其组织到仪表盘和故事中。你可以共享组织中的数据集、仪表盘和故事。QuickSight使这个过程非常简单直接,但是它缺少一些有用的可视化功能。
公司中的第一个用户永远是免费的,有四个用户的团队可以免费试用60天。除试用版外,对于额外增加的用户,标准版每月的价格为每用户9美元,企业版每月的价格为每用户18美元。
第一个QuickSight用户可以获得1G的SPICE(超高速并行内存优化计算引擎,Superfast Parallel In-memory optimized Calculation Engine)存储空间,而额外的用户有10G的SPICE存储空间。额外的SPICE存储成本:标准版为每月每G要25美分,企业版每月每G要38美分。企业版增加了静态安全数据加密,并连接到组织的AWS Active Directory。
SPICE是QuickSight的用于可视化的高性能内存数据存储,从文件导入的数据必须要用到SPICE,而SPICE对于SQL数据库中的数据来说则是可选的。每个SPICE表格的容量限制为10G。
对于在AWS上托管众多数据源、分析需求和开发时间有限的工场,使用QuickSight似乎是一件想都不用想的事情。QuickSight增加了简单的分析和可视化功能,但只是象征性收点钱。
Tableau
Tableau称其产品能提供“以你的思维方式工作的分析”,并表示这些工具利用了“人们快速发现可视化模式,展现日常机会和灵感瞬间般的天生能力”。这有一定的道理,尽管这个道理在很多其它的商业智能工具上也说得通。
分析工作流程的可视化发现阶段是最诱人的部分,但大多数人不该花大部分时间在这个地方。根据我的经验,导入和调整数据可以轻易地消耗你花在一个商业智能产品上的80%的时间。
既然Tableau可以执行跨数据库连接,你可能会导入多个数据源并将其连接起来,如果贵公司大到(或者有钱到)需要Tableau,你可能会将大部分数据源托管在数据仓库中。
然后,你要逐行过滤和调整数据。最后,你将真正地达到可以开始创建可视化对象的程度,尽管你在摸索时不得不执行额外的数据转换。但是Tableau能轻而易举地完成数据调整和转换,就像在Excel中一样简单。没有必要返回到导入阶段来添加计算好的字段或过滤数据。
Tableau中的可视化发现功能很强大,Tableau为其易用的实现和图表显示的精细控制设立了标准。通过单击或拖动感兴趣的尺寸(通常是离散类别或特性)和度量(数值),并自己选择一个标记(显示类型,如条形、线条和点),可以构建Tableau可视化,或使用自动标记选择,或使用“显示给我看(show me)”的方法来选择可视化。
要进行更多控制的话,可以将维度和度量拖动到特定的标记特征或“搁架(shelf)”上。当你了解分析中发生的情况时,你可以与其他人共享仪表板和故事。这很容易通过将它们发布到Tableau Server或Tableau Online来完成,无论你是否使用Tableau Desktop,是否需要上传,还是你已经在做在线分析。
Tableau的定价变得相当有竞争力,至少与Qlik和Domo相比是这样的。个人版:每位用户每月35美元;专业版:每位用户每月70美元; Tableau Server:每位用户每月35美元; Tableau Online(完全托管):每位用户每月42美元。
不过,我必须指出,微软的Power BI以Tableau的四分之一的价格提供了大约相当于后者80%的功能。当你考虑劳动力成本和公司利益时,你必须根据自己的情况来决定这笔帐是否经得起推敲。