本节书摘来自异步社区《数据分析变革:大数据时代精准决策之道》一书中的第2章,第2.4节,作者【美】Bill Franks(比尔•弗兰克斯),更多章节内容可以访问云栖社区“异步社区”公众号查看
2.4 小结
从本章中我们获得的最重要的启发有以下几个。
- 不必管该如何定义大数据。我们要管的是哪些数据,无论大小,是分析需要的。定义不重要,结果才重要!
- 我们要保持业务问题导向。不要为了实现大数据技术而实现大数据。
- 尽管过度炒作和不切实际的短期预期确实存在,但大数据时代切切实实已然到来。就像因特网泡沫的存在并不能表明因特网不是巨大的商业机会一样,大数据泡沫的存在同样也不意味着大数据就没有巨大的商业机会。
- 数据让人兴奋的原因是它能提供新的信息。新信息几乎每一次都能打败新算法。
- 我们不能只使用大数据来完善既有的分析流程。我们还要发现如何利用大数据以全新视角解决老问题或者解决全新问题的方法。
- 可以预料,在接下来的几年,物联网的炒作肯定会暴涨,但我们一定要重新思考数据留存策略,这样才能应对低价值数据造成的新的数据洪水。
- 与传统数据相比,大数据的“差异性”会产生比“大数据量”更多的挑战。
- 大数据需要的不只是数据处理与数据存储的可扩展性。在用户数、并发度、负载管理以及安全性等方面同样需要可扩展性。
- 大数据一定会是整体数据与分析策略的一个组成部分。大数据肯定不能光靠本身就有效解决所有的问题。
- 关于 SQL 将亡的预测已经存在许多年了,现在非关系型平台正在争分夺秒地实现 SQL 接口。尽管这也代表了巨大的转变,但它同样也反映了现实的业务需求。
- 今天,大数据看上去很有颠覆性,大数据现在正在经历与其他数据源相同的成熟度曲线。大数据难以应对,关键在于数据源是同时倾覆而来。
- 全球各行各业中,多数企业都认为自己落后于大数据时代。事实上,只有少数企业走在前列,这同样也说明,只有少数企业落在队后。
[1] 基于2014年6月12日我为国际分析研究所写的题为“What’s the Definition of Big Data? Who Cares?”的博客。参见http://iianalytics.com/2012/06/whats-the-definition-big-data-who-cares/。
[2] 参见www.gartner.com/it-glossary/big-data/的“Gartner IT Glossary”。还请参考2013年5月27日Svetlana Sicular在《福布斯》上发表的“Gartner’s Big Data Definition Consists of Three Parts, Not to Be Confused with Three ‘V’s”,网址是www.forbes.com/sites/gartnergroup/2013/03/27/gartners-big-data-definition-consists-of-three-partsnot-to-be-confused-with-three-vs/。
[3] 参见2012年8月2日我在《IT Briefcase》上发表的“Defi ning Big Data: The Missing ‘V’”,网址是www.itbriefcase.net/defining-big-data-the-missing-v。
[4] 基于2012年12月12日我为国际分析研究所写的题为“Will the Big Data Bubble Burst in 2013?”的博客。参见http://iianalytics.com/2012/12/will-the-big-data-bubble-burst-in-2013/。
[5] 参见2013年1月22日Svetlana Sicular在《福布斯》上发表的“Big Data Is Falling into the Trough of Disillusionment”,网址是http://blogs.gartner.com/svetlana-sicular/bigdata-is-falling-into-the-trough-of-disillusionment/。
[6] 参见Bill Franks的《Taming the Big Data Tidal Wave》(Hoboken, NJ: John Wiley & Sons, 2012) 。
[7] 基于2013年1月11日我为国际分析研究所写的题为“Driving Analytic Value from New Data”的博客。参见http://iianalytics.com/2013/01/driving-analytic-value-from-new-data/。该主题也在我的《驾驭大数据》一书中有所讨论。
[8] 基于2013年1月14日我为国际分析研究所写的题为“Think Differently to Maximize Value from Big Data Analytics”的博客。参见http://iianalytics.com/2013/03/think-differently-to-maximize-value-from-bigdata-analytics/。
[9] Jeff Tanner的《Dynamic Customer Strategy: Big Profits from Big Data》(Hoboken, NJ: John Wiley & Sons, 2014)
[10] 参见2010年8月10日www.drugrecalls.com/celebrex.html的“Pfizer Study Finds that Celebrex May Increase the Risk of Heart Attack”。
[11] 基于2012年8月9日我为国际分析研究所写的题为“A Strategic Mistake with Big Data”的博客。参见http://iianalytics.com/2012/08/a-strategic-mistake-with-big-data/。该主题也在我的《驾驭大数据》一书中有所讨论。
[12] Lisa Arthur的《Big Data Marketing: Engage Your Customers More Effectively and Drive Value》(Hoboken, NJ: John Wiley & Sons, 2013)。
[13] 基于2013年7月11日我为国际分析研究所写的题为“Big Data Analytics Doesn’t Have to Be the Wild West”的博客。参见http://iianalytics.com/2013/07/big-data-analytics-doesnt-have-to-be-the-wild-west/。
[14] 基于2013年2月14日我为国际分析研究所写的题为“The Global Nature of Big Data and Analytics”的博客。参见http://iianalytics.com/2013/02/the-global-nature-of-big-data-and-analytics/。