(此文章同时发表在本人微信公众号“dotNET每日精华文章”,欢迎右边二维码来关注。)
题记:Build2016开完很久了,现在才来回顾下,就说说那些和大数据相关的Session,也因为笔者最近在深入研究这方面的东西。
3月30日到4月1日的Build2016 微软开发者大会的内容引爆了整个.NET开发社区,大家的热情都被Xamarin免费开源、Bash on Windows等点燃了。不过在这些热点背后,我还是比较关注和自己最近研究的大数据领域相关的Session。下面我就整理一些我个人认为值得关注的:
1,Building Big Data Applications using Spark and Hadoop
Spark现在在大数据方面的应用已经在抢占Hadoop的风头了,国内的互联网公司也已经有很多这方面的案例和分享。或许你正为快速搭建Spark集群伤脑筋,不过我们知道微软很早就在Azure中提供了Hadoop的服务——HDInsight,这不为了让大家也能轻易的使用Spark,HDInsight服务也开始支持Spark了。这个Session就讲述了如何利用Azure的Spark服务来快速搭建自己的大数据应用。
回放地址在:https://channel9.msdn.com/Events/Build/2016/P420
2,Building Analytics for the Modern Business
随着大数据技术的发展,商业智能分析也进入了新阶段:数据实时的创建出来、这些数据由多种类型组成、数据量巨大、用户期望更高、希望硬件和存储成本更低、能够移动化访问。从而如何构建这样的数据解决方案就成为挑战。Azure通过提供数据仓库服务(Data Warehouse as a Service)来帮助大家开发快速和低成本的开发这样的解决方案。
Session回放地址在:https://channel9.msdn.com/Events/Build/2016/T682
3,U-SQL: 0-60 for Big Data with .NET
U-SQL是微软在Azure Data Lake(数据湖)中引入的一种基于SQL的新语言,它可以使用C#语言的语法来扩展大家熟悉的SQL语法,从而让大数据处理更加容易和有意思。这个Session会讲述U-SQL背后的概念,并通过一些例子来展示如何使用它查询非结构化、半结构化和结构化数据。
回放地址在:https://channel9.msdn.com/Events/Build/2016/T696-R2
4,Azure Data Lake and Azure Data Warehouse: Applying Modern Practices to Your App
这个Session是关于Azure新数据服务Azure Data Lake和Azure Data Warehouse的概览介绍。两个服务都可用来存储、处理和分析巨量数据。本Session会深入讲解每个服务,并带领大家了解集成大规模数据分析服务到应用的常见模式。
回放地址在:https://channel9.msdn.com/Events/Build/2016/B813
5,A Developers Guide to Azure SQL Data Warehouse
这个Session其实是一个关于Data Warehouse的入门介绍了。介绍了数据分布、表设计和查询优化的基础知识,从而为商业智能解决方案提供最佳的性能。
回放地址在:https://channel9.msdn.com/Events/Build/2016/P402
6,A Lap Around R Tools for Visual Studio
作为宇宙最强IDE,在微软收购R语言的开发商之后,自然也提供了R语言的开发工具。通过使用R Tools for Visual Studio,让你在喜爱的VS里面同样可以对数据进行分析,创建预测模型,快速、交互式的、酷炫的可视化数据,还可以利用统计学和机器学习领域的一些函数库。这个Session就对这一工具进行了一个完整的讲解。
回放地址在:https://channel9.msdn.com/Events/Build/2016/B884
7,Advanced Analytics with R and SQL
在微软收购R开发商之后,R语言就被融入到SQL Server当中,所以把R和SQL配合使用也就是自然而然的事情了。这个Session讲述了如何充分发挥这两个语言各自的优势,来实现高级数据分析的场景。
回放地址在:https://channel9.msdn.com/Events/Build/2016/B805
8,Data Integration in the Cloud and Building Data Analytics Pipelines
上面提到了这么多关于数据的服务(Azure Data Factory, Azure Data Lake Store and Azure Data Lake Analytics, SQL Data Warehouse),那么如何把这些东西乃至本地部署的Hadoop集群集成起来,形成一个数据分析的管道呢?这个Session就能为你解开答案。
回放地址:https://channel9.msdn.com/Events/Build/2016/P430
9,Intelligent Systems: Advanced Analytics in Action for Retail, Healthcare and Manufacturing
再高级的数据分析技术,最终都要回到实际应用场景中,那么这个Session会给你展示在零售业、医疗卫生和制造业方面的实际商业智能系统的案例分享。