后疫情时代,这家老牌数据分析公司想用“好奇心”和分析的力量改变世界

一场突如其来的疫情打破了人类社会运作的原有模式,也在方方面面改变了原有的规则。数据分析领域在这次疫情中也受到了同样的冲击。

大波实体经济因为“封城”原因转到线上,这一方面加速了传统行业的数据化进程,另一方面也带来了巨大的挑战。

从线下转到线上是许多受疫情冲击企业的自救模式,但是这些平时线下业务为主的企业,突然转到线上,难免会出现“水土不服”的现象。整体数据规模的扩大,让所有公司的数据量级都更大、更复杂,如何能够有效做好数据分析,并基于这些数据做好决策,更好的服务客户,是所有转型线上+线下模式的公司在后疫情时代面对的最大问题。

如何应对?

专注数据分析40多年、服务全球超过20,000家客户,老牌数据分析公司SAS给出的答案是:依靠正确的技术,用好奇心改变世界。

在2021年SAS Global Forum上,SAS首席执行官Jim Goodnight表示:“将数据转化为决策进一步满足了人们的好奇心,并揭示了新的可能性。与我们的客户和合作伙伴一起,我们敢问:'如果用另一种方式呢? 作为回报,我们的客户提高了效率和收益,同时使这个世界更安全,更强大和更有弹性,实现了SAS的承诺。”

SAS首席执行官Jim Goodnight
**
十年一剑,SAS Viya始于大规模数据分析**

事实上自诞生之日起,SAS一直致力于大规模数据的分析解决,也从不惧变化带来的问题。

在2021 SAS Global Forum上,Jim Goodnight首次披露了SAS备受好评的AI平台——SAS Viya的诞生背景及十多年来其随着时代变更的过程。

“2009年,我们在和一家新加坡银行合作的过程中了解到,他们进行一次业务上的风险计算需要18个小时完成,这对他们的决策产生了很大的影响。因此,我们开始思考如何减少计算处理和处理大数据所需的时间。并设计了一个保存在内存中的系统。”

没有使用大多数平台采用的Hadoop方案,SAS选择自主研发了最新的分布式计算方式,让数据分析可以分布在数十个或数百个内核中同时进行。Goodnight在演讲中表示:“我们希望消除SAS技术和底层硬件的限制。”

这就是SAS Viya的诞生过程,2009年推出的这一分布式计算引擎将新加坡银行的18小时风险分析计算压缩到了15分钟。十多年来,SAS Viya已经更新了四代,在第三代产品中,它“已成为市场上性能最快的产品”,最新版本4已于2020年11月发布。

“Viya从一开始就从设计上追求性能、速度和大规模数据。一旦进行了数据分析并创建了模型,就可以立即在生产环境中运行它。市面上其他竞争对手一般需要进行编程语言变更,但我们不需要。”

在最新的产品中,那项最初需要18个小时分析完成的风险技术任务现在只需要15分钟就可以完成。

应对全球数字化进程,SAS给出两大对策

回到最开始的问题,如何在后疫情时代解决企业大规模数据分析问题?

在SAS Global Forum前的新闻发布会上,SAS首席技术官Bryan Harris给出了两大解决策略。

分析无处不在:收购英国Boemska公司,结合云原生能力

Harris提出的第一个解决方案是:让分析无处不在。

为了实现随时、随地进行数据分析,SAS做出了一系列努力。今年年初,SAS宣布收购英国Boemska公司,加速人工智能在云计算方面的努力,进一步将SAS和开源模型移植到移动和企业应用程序中,这结合了下一代云原生功能,也将低代码和无代码技术融入产品中,开发和执行模型和决策,以执行特定任务,例如预期欺诈,与医疗事件有关的决策,识别制造缺陷等等;此外,还能同时确保Microsoft Azure等云上分析更加高效经济。

SAS Viya在2020年SAS Global Forum上就宣布了与微软的战略联盟。当时,微软首席执行官Satya Nadella在谈到与SAS的合作时说:“在后疫情的世界中,客户,员工等的期望正在发生变化,分析在这里将变得很重要。” Nadella称:“启用数据使(每位员工)能够使用预测和分析能力将对业务绩效产生直接影响。” “通过帮助实现这一目标,我们可以加快客户转型。”

2020年SAS Global Forum上,微软首席执行官Satya Nadella与SAS首席执行官Jim Goodnight对谈

今年,SAS进一步扩大了合作伙伴关系,Harris宣布将增加AWS和Google Cloud作为云选项。其还与Red Hat(IBM)合作,在混合云中运行SAS产品,其Kubernetes版本还将囊括阿里云、腾讯云、华为云等。

“客户可以灵活地在本地、上云,混合云实施技术方案。” Harris表示。

人人都可以使用分析的力量:低代码+无代码趋势

除了随时随地进行数据分析,SAS还致力于让数据分析成为人人都可以使用的工具。

为了实现这一目标,SAS将低代码和无代码融入了产品中。

其实早在2001年,大数据和数据分析起步之时,SAS就将低代码和无代码操作融入产品设计中,当时SAS已经从专有代码转向简易操作平台,这也是机器学习自动化的最早形式。

在2018年发布的SAS Viya版本中,已经完成了算法自动化上的设置,表现了对AI和机器学习自动化程序这一新聚焦点的全面拥抱——AI分析植入和自动化;更加透明的结果输出;更好地数据治理功能;用户体验地提升;更加开放,支持更多分析工具。

在本次峰会后的采访中,Harris告诉《大数据文摘》,SAS的客户正在整个企业中部署数十种、数百种甚至数千种模型。低代码、无代码环境通过增加分析生命周期的参与来提高组织的敏捷性。客户在新的数字化时代的竞争优势有多大,取决于公司能够以多快的速度识别机会、开发模型,并将这些模型合并到决策流中,然后将决策流集成到任何业务流程或任何应用程序中。

针对数据驱动决策的实时和有效,Harris还在采访中给出了一些SAS产品的使用建议:

制定数据驱动的决策,首先需要及时将实时数据或接近实时的数据纳入决策制定过程。在运行时,必须在特定情况下及时做出决策评估。SAS智能决策支持多种实时数据源,包括流数据,以确保可以以适当的粒度应用决策逻辑。当与 SAS 信息目录结合使用时,系统可以识别潜在的数据异常和分布不一致,以及不应被共享的潜在私人信息。

在模型构建过程中,SAS Visual Machine Learning 允许数据科学家在将模型部署到生产中之前识别潜在的偏差区域。无论是多数人群或少数群体,不管是公司还是代理机构,最终用户不仅能使用,还能够了解“为什么”使用某个模型。关于生产中的潜在偏差,SAS 模型管理器允许跨各种指标和维度进行偏差检测,查找与总体相比的数据和模型偏差。

部署决策或模型后,好的数据驱动还会持续根据最新数据验证性能。在SAS Model Manager和SAS Intelligent Decisions中,数据治理可自动应用于模型和业务规则,以跟踪更新数据,在必要时进行监测、验证和重新训练。新的最优模型和修改后的业务规则可以轻松部署到生产中。

结语
疫情加速了各类企业的数字化进程,根据SAS在 2021 Global Forum上公布的数据我们可以看到,在各行各业,数据分析和软件都在渗透。后疫情时代,SAS也已经做好了全面的准备应对数据化进程的加速。

在采访中Harris表示,短期内,我相信我们将看到传统行业对AI的使用会大大增加,以帮助公司跨结构化、非结构化、流式传输、图像音频、视频等各种数据集做出更好的决策。从长远来看,我认为我们将看到合成数据的巨大机会,以支持现实世界中客户环境的复杂模拟。从AI的角度来看,这将大大降低数据获取成本并进一步加速创新。

不止提升合作伙伴的工作效率,SAS还相信可以通过Viya这款产品用数据分析造福世界,Goodnight今年也在线演示了SAS Viya低代码、无代码分析的能力。他在演讲中公开演示了如何使用多种机器学习模型,预测由于新冠疫情患者人数增加而导致的床位紧张,在演示中,该计算机在30分钟内完成了在Microsoft Azure上的配置,通过并行处理完成了大规模数据分析,并通过简单的“拖-拽-点击”等无代码操作建立了一个机器学习流程。

上一篇:《R语言数据挖掘:实用项目解析》——第2章,第2.6节变量分段


下一篇:JUnit单元测试、反射、注解、动态代理