《数据科学与大数据分析——数据的发现 分析 可视化与表示》一2.6 第5阶段:沟通结果

本节书摘来自异步社区《数据科学与大数据分析——数据的发现 分析 可视化与表示》一书中的第2章,第2.6节,作者【美】EMC Education Services(EMC教育服务团队),更多章节内容可以访问云栖社区“异步社区”公众号查看

2.6 第5阶段:沟通结果

在运行模型之后,团队需要将建模的成果和之前建立的成功与失败的衡量标准进行比较。在第5阶段中,如图2.7所示,团队需要考虑以何种最佳方式向团队成员和利益相关者阐述项目的发现和成果,包括警告、假设和结果的不足。因为项目演示常常面向整个组织机构,因此需要采用听众可以理解的方式来恰当地表达成果和定位发现。


《数据科学与大数据分析——数据的发现 分析 可视化与表示》一2.6 第5阶段:沟通结果

在第5阶段,团队需要确定项目是否成功达到既定目标。许多时候,人们不愿意承认失败,但在这个情况下失败不应该被视为真正的失败,而是数据不能充分地验证或否定一个给定的假设。这听起来有些违背常理。但是,团队在确定数据是否会证明或否定在第1阶段中提到的假设时必须足够严谨。有时团队只做了一些肤浅的分析,其不足以验证或否定一个假设。有时团队做了深入的分析却试图展示并不存在的结果。在分析数据时要在这两个极端之间找到平衡,在展示实际结果时要实事求是。

当进行评估时,要确定结果是否有统计上的显著意义和有效性。如果是的话,要明确交流时需要突出哪些提供了显著发现的结果。如果结果是无效的,要考虑如何对模型进行改进和迭代以生成有效结果。在这一步中,要评估结果并确定哪些数据出人意料,哪些与第1阶段提出的假设一致。将实际结果与早期制定的想法相比较,可以产生额外的想法和见解。如果团队没有花时间来制定最初的假设,则将错过这些额外的想法和见解。

此时,团队应该已经确定哪种或哪些模型可以最佳地解决分析挑战。此外,团队应该已经对项目的某些发现有所认知。在这个阶段,一种最佳实践是记录所有的发现,然后选择三个最重要的发现分享给利益相关者。此外,团队需要反映这些发现的含义和评估其业务价值。取决于模型产生的结果,团队可能需要花费时间量化结果带来的业务影响,以帮助准备项目演示和展示发现的价值。Doug Hubbard的著作[6]为如何评估企业无形资产和量化看似不可预测的事物价值提供了见解。

既然团队已经运行了模型,完成了周密的发现阶段,并对数据集有了充分了解,就应该反思项目,思考项目遇到的阻碍和可以改进的方面。要为后续工作或现有过程的改进提供建议,还要考虑每一位团队成员和利益相关者需要怎样履行其个人职责。例如,项目发起人必须为项目提供支持,利益相关者必须理解模型如何影响流程(例如,如果团队创建了一个模型用于预测客户流失,市场营销团队必须理解如何在规划措施时使用这个模型)。生产工程师需要实施已经完成的工作。此外,在这个阶段要强调工作的商业价值,并开始在生产环境中实施项目成果。

这一阶段完成时,团队将会记录从分析中得出的重要发现和主要见解。这个阶段交付的成果对于利益相关者和赞助商来说将是最看得见的,所以要小心清楚地阐述结果、方法论和发现的商业价值。第12章将详细讲解数据可视化的工具和引用文献。

上一篇:《Docker进阶与实战》——3.1节Docker image概念介绍


下一篇:从SQL Server到MySQL,近百亿数据量迁移实战