Skip to main content Skip to Footer

思想前沿


数据加速:建立面向现代数据供应链的架构

对于强有力的数据供应链而言,数据加速发挥着重要作用,它能帮助企业克服数据迁移、数据处理和数据交互这三大数据相关挑战。

概要


虽然数据技术正在飞速发展,但大多数技术却只是被企业零星地采用。因此,无论是关乎客户互动、经营绩效、计算机通知,还是外部业务环境中的事件,大量企业数据都未得到充分利用。不仅如此,企业的数据生态系统已变得日益复杂,各自为政的“数据孤岛”(data silos)比比皆是。这使得企业更难获取有用的数据,从而限制了企业从数据中创造价值。事实上,Gartner公司近期的一项调查显示,85%的《财富》500强企业都未充分发掘大数据(Big Data)所蕴藏的潜力并据此形成竞争优势,这样的情况将持续至2015年底。此外,埃森哲近期开展的一项研究也发现,虽然半数的受访企业很重视数据的准确性,但绝大多数管理者并不清楚数据分析项目会带来怎样的业务成果。

为了释放数据所蕴藏的潜力,企业应着手将数据视为一条供应链,使该链条以简单、有效的方式在整个企业中流动,并最终贯穿包括供应商和客户在内的整个企业合作伙伴生态系统。目前,采取该工作方式的时机已经成熟。一方面,新的外部数据源正不断涌现,为企业获取数据洞察力提供了全新机遇;另一方面,用以构建优质数据平台的工具和技术也已形成并得以应用。这些都为企业建立完整的端到端数据供应链奠定了坚实的基础。

现代数据供应链以数据的创造、引入,或与其他数据相结合为出发点。数据沿着供应链的不同环节流动,逐步获取价值,最终产生切实可行的宝贵业务洞察力,为新的产品、服务、流程创新、营销活动和全球化战略等提供支持。通过有效的配置和管理,数据供应链有助企业发掘内部数据,对更多数据来源进行充分利用,并加快数据的流动。企业一旦具备上述能力,就能通过先进的计算技术(如机器学习)汲取更多价值。

对于强有力的数据供应链而言,数据加速发挥着重要作用。简单地说,数据加速主要依托相关工具和技术快速获取海量数据(从数据源输入专门的数据系统),并能使其迅速存储和取用。具体而言,企业能够通过数据加快节奏获取有价值的数据,进而进行数据分析,获取洞察力并据此采取行动,有时甚至能在机遇窗口极为短暂的情况下迅速交付。由此可见,数据加速能帮助企业克服数据迁移、数据处理和数据交互这三大数据相关挑战。

基于该观点,埃森哲大数据业务部门与埃森哲技术实验室携手合作,对上述挑战进行了详细研究,并对应对这些挑战的架构组件进行了评估。接下来,我们将探讨这些架构组件的组合方式,为企业打造恰当的数据平台解决方案提供建议。

背景

数据加速能够帮助企业有效应对以下三大挑战:如何使数据从源头迅速迁移到有需求的企业部门;如何处理数据以尽快获取可行洞察力;以及如何快速响应用户或应用提交的查询请求——即所谓的数据交互。

数据动起来
过去,数据在企业中的迁移是缓慢且相对直接的过程:数据首先被收集至暂存区,随后再转换成适当的格式,并加载存入同数据源(如大型主机或企业 数据仓库)。然后,以点对点的形式将数据直接传输至数据集市,供用户和应用调取使用。然而,随着数据量和数据种类的急剧增加,这种传统的流程已难以为继。

数据处理
长期以来,企业一直通过数据处理来获取切实可行的洞察力。然而,有待处理的数据量和数据种类已显著增加。为适应该该情况,实现又快又准的处理结果,企业必须培养相应的数据处理能力,尤其要比以往更为迅速地开展以下三项工作:进行数据计算、创建并实施仿真模型、比较统计数据,由此获得新的洞察力。

数据交互
数据交互主要关乎数据基础架构的可用性。本质上讲,用户或应用会向基础架构提交查询要求,并期望在可接受的时间范围内获得响应。传统的解决方案已使人们能够轻松地提交要求、获得所需结果,获取切实可行的洞察力。但是,大数据的兴起催生出了许多全新的编程语言,阻碍了现有用户采用这些系统。此外,由于数据规模庞大,用户不得不等候数十分钟、甚至好几小时才能获得查询结果。

总之,数据加速能为实现更快的数据交互提供支持,即以普遍接受的方式将用户和应用与数据基础架构关联起来,并确保按要求快速提交查询结果。

分析

为了构建能够支持数据加速的数据供应链战略,企业必须做到以下几点:

  • 储存数据。从使用频率最高、时间关联度最强的数据着手。这些数据将首先进入数据平台,获得加速。

  • 识别效率低下的流程。寻找那些耗时颇多的手工数据修补流程(如:数据标记或数据清理),利用机器学习算法进行替代。

  • 找到数据孤岛。除此之外,还要明确企业目前尚未得以满足的相应数据需求

  • 简化数据存取。制定标准化的数据平台数据存取策略。解决方案能够具有混合特点,比如将传统的中间件和应用程序接口相结合起来,抑或采用平台即服务(PaaS)产品。

  • 对单个数据供应链进行优先排序。这有助企业制定详细的路线图,从而大规模实施数据供应链。

  • 兼顾外部数据源。在企业外部寻找数据源,以补充现有数据,帮助生成更加全面的洞察力

  • 为自身企业数据选择合适的数据加速技术堆叠,同时研究优化配置的方法。

建议

为了从企业数据中赢得竞争优势,企业必须通过数据获取业务洞察力。大数据的诞生,使相关技术门槛降至历史新低。但是,大数据同样也带来了各种挑战。为了应对这些挑战,企业应建立数据供应链,加快数据迁移、处理与交互,从而使决策者得以更加迅速地捕获数据洞察力并采取行动,最终实现数据分析投资回报。

然而,旨在促进数据加速的解决方案市场已变得非常复杂。因此,企业管理者应首先深化对数据移动、处理与交互固有挑战的认识,才能建立适当的数据加速基础架构。接下来,他们还应熟悉市场上现有的为数据加速提供支持的架构组件。

同时,仅有上述认识还远远不够:架构组件只有经过正确的组合,充分利用各自的互补优势,方能够实现最大价值。通过探索四种潜在的架构配置方式,企业管理者能够就哪些配置方式最能满足企业需求展开讨论。同样重要的是,在与供应商进行协商讨论时,他们还能对未来的解决方案提出更多富有说服力的观点。

以上这份报告对相关议题进行了整体性的介绍。企业管理者可以以此为起点,了解不断变化的大数据技术市场,并着手研究适合的架构解决方案,从而充分满足企业自身需求,通过构建数据分析能力实现丰厚的回报。