当两者一起使用时,它们可以提供许多机会,以提供复杂、个性化、数据驱动的客户体验。
翻译自 Data Warehouses and Customer Data Platforms: Better Together 。
想象一下,您是一家大型全球企业的首席技术官(CTO)。您的团队正在就未来一年加速业务发展的营销和分析技术投资进行讨论,以确定新的架构。但坦率地说:考虑到这些工作负载的重要性,您在事后几乎没有太多机会进行更改。组织可能将在未来的五到十年内使用这种新架构。
出现了两个派系,提出了看似截然不同的方法。第一个派系拥抱数据仓库/湖屋架构,将其视为所有数据的“真相之源”,并相信需要采用以数据仓库为中心的“现代数据堆栈”,而不需要客户数据平台(CDP)。
另一个派系认为最大的问题在于实时摄取大量流式客户数据的挑战,并且关注保持与营销和分析路线图上的高级用例同步的能力。这个团队相信需要一个能够扩展和适应实时数据的 CDP ,以适应业务需求的变化。
他们请您审查他们的提案并作出决策。企业的命运(以及许多人的职业生涯)就掌握在您的手中。您会做出什么决定?
在回答之前,请考虑到这并不像“数据仓库 vs. CDP”这么简单。让我们看看使用带有 CDP 的数据仓库可以获得的一些能力。
在规模不断扩大的企业中,要识别客户个体并在他们的整个旅程中为他们提供个性化选择变得更加困难。随着数据从一个地方转移到另一个地方,将这些数据点与身份关联起来成为一个复杂的数据工程问题。这就是身份解析发挥作用的地方:它将大量的数据(每秒数万亿个数据点)转化为对客户是谁、他们在旅程中的位置以及如何更好地为他们服务的共同理解。
这正是客户数据平台(CDP)擅长的领域。通过与各种应用程序、数据库和数据仓库一起工作, CDP 帮助企业收集、统一并最终激活身份解析的客户配置文件,将这些数据联系在一起。
如果没有 CDP ,转化身份解析将需要大量的时间和数据科学资源。SQL 并不是解决高级身份解析的正确工具,而且“出色的身份解析逻辑”对大多数企业来说并非差异化因素。但是,能够推动个性化互动并为客户构建令人愉悦的产品可能会决定您的业务成败,而这源于对各个接触点用户的深入了解。CDP 和数据仓库的结合使得身份解析变得简单,使数据工程师和分析师可以专注于其他问题。
如果数据只是闲置不动,那么它就毫无用处。然而,数据往往会被困在仓库中,没有被使用起来。这是因为历史上,数据的消费者无法直接利用数据仓库的强大功能,他们需要向工程团队求助,要求他们实施新的 SDK 、构建集成或实施新工具。这变成了一个不断追逐最新工具的无休止循环,IT和工程团队陷入了建设和维护集成的困境。
这就是为什么您需要提供工具来实现自助数据分析,并使分析和数据科学团队能够构建整个业务可以利用的模型。通过这样做,您将能够打破无休止的循环,建立一个良性循环。
具备反向 ETL(提取、转换、加载)功能的 CDP 使团队能够自动将数据从数据仓库移回到市场营销、销售和支持等下游工具中,以激活并创建超个性化的客户体验。CDP还为业务团队提供了“无代码”方式来激活数据,使用集中的受众和旅程构建工具。
通过 CDP 和数据仓库,您可以构建一个可信赖的数据基础设施,为任何潜在的 AI 战略奠定基础。 AI 中的“智能”是基于客户数据进行训练的。如果您的客户数据被隔离、不一致、过时或不完整,即使是最创新的 AI 应用程序也会产生较少的影响。
由 CDP 提供的可信赖的数据基础设施提供了对 AI 至关重要的统一、一致和实时数据。您可以利用这个基础设施为仓库中存储的数据进行高级模型训练。
企业可以通过从多个来源实时流式传输数据更新到数据仓库,从而创建客户的更完整视图。但是,整合这些数据流水线可能具有挑战性,这就是 CDP 集成发挥作用的地方。
我们来看一个例子。MongoDB 是一家现代化的 SaaS 公司,其复杂的销售周期涉及潜在客户组织中来自不同团队的许多利益相关者。因此, MongoDB 有许多多线程、多渠道的销售流程同时运行。为了全面了解一个潜在客户, MongoDB 需要将 181 个不同的数据集与其由 CDP 提供支持的“黄金档案”进行整合,以唯一标识每个客户联系人。其中一些是在营销网站上进行的实时聊天,一些是在应用程序层进行的交互。其中一些数据是缓慢移动的,存储在数据仓库的表中。其中一些数据以需要亚秒级延迟来解析的速度进入。能够将所有这些数据流合并在一起对于 MongoDB 团队来说是一个巨大的推动因素,这仅仅是因为 MongoDB 在使用 CDP 时与其数据仓库并用。
通过在单个平台中结合实时事件流、 ETL 和反向 ETL ,数据团队不再需要建立和维护数据流水线。并且使用 CDP 更容易添加新的数据源和目的地,缩短价值实现的时间。
如今,企业在使用客户数据方面需要比以往更加谨慎,但这不能妨碍提供有意义的个性化体验。事实上,客户对此有期望。
想象一下,你打电话给客户服务代表反映了你对他们产品的问题,而他们的回答是一个与你刚刚告诉他们的内容完全无关的通用营销信息。这会让人反感!事实上,66% 的消费者表示,如果品牌不能提供相关和个性化的体验,他们将不再使用该品牌。
能够提供这种个性化和相关性水平的体验需要数据,但你需要透明地告知如何使用这些数据。最先进的公司会对他们的数据收集和使用进行全面透明,并为最终用户提供先进的控制手段。
实际上,同意管理意味着向用户公开细粒度的偏好设置,以便他们可以选择加入或退出对数据的使用方式。换句话说,系统地告知用户你如何收集私人数据以及你如何使用它,让他们有能力同意或拒绝,然后始终按照这些偏好进行实施。
然而,在各种应用程序、内部团队和使用场景之间应用这些控制是一项具有挑战性的工程问题。而这正是拥有内置同意和隐私功能的 CDP 的统一平台可以提供益处的地方。这些控制可以涵盖仓库中的数据以及应用程序中的实时事件,确保无论客户在何处与您互动,都能始终遵循他们的偏好。
当然,法规合规在这里也非常重要。对于 GDPR ,你可能需要在欧盟设立一个地区数据中心,以便将欧洲客户的数据存储在那里。对于 HIPAA 合规性,你使用的任何供应商都需要签署一份管理受保护健康信息的业务关联协议。所有这些也需要进行管理,而 CDP 可以提供一个控制层,有助于确保到达数据仓库的所有内容都符合法规要求。
在当今以数据驱动的世界中,组织需要仔细考虑最适合支持其业务需求的架构。数据仓库和 CDP 并不是相互排斥的选择。事实上,CDP 增强了数据仓库,并提供了许多机会来激活仓库中的数据,并提供复杂、个性化、数据驱动的客户体验。而这正是客户所期望的。