SQL Server Integration Services – SSIS)

来源:https://blog.csdn.net/me_online/article/details/1526131

由于国内关于关于 SQL Server 2005 商务智能 (SQL Server Business Intelligence - BI)的中文资料相当匮乏,我想把我近两年来用于授课的英文资料,以及从事的一些典型的实际案例,编译成中文,用于与国内的同行交流。本文为使技术术语描述的更为精确,全部使用英文,以避免不论不累的中文翻译,同时也可以更好地帮助读者提高英文资料阅读能力甚至对外技术交流能力。本文全部原创,未经作者同意,谢绝转载。

 

开发SQL Server 2005 BI 应用,主要包括三个主要部分: SQL Server 集成服务 (SQL Server Integration Services – SSIS) , SQL Server 报表服务 (SQL Server Reporting Services) 和 SQL Server Analysis Services (SSAS).  本文将由通过大量实例由浅入深地介绍通过 SQL Server Business Intelligence Development Studio (BIDS) 构建 SSIS 应用程序的方法和技巧。

 

SSIS 的由来

 

很多人都熟悉SQL Server 的命令行程序 Bulk Copy Program (BCP),在SQL Server 7.0发布之前,这似乎是从SQL Server导入导出数据的主要方法。从SQL Server 7.0 开始,一个全新的内置系统工具 DTS被增加到了SQL Server 中,该工具通过建立 DTS 程序包(Package)的方法用来进行不同数据源之间的数据转换和导入导出数据。DTS 与BCP 程序行相比,具有几个明显的特点:DTS 可以将许多内置的任务 (Task) 与数据转换步骤(Steps)相连,在基于OLEDB下的不同的数据源之间进行各种复杂的数据转化;能够通过脚本(Script)自定义复杂的数据转换操作;以通过设置SQL Server Agent 自动化DTS 包的运行;在其他应用程序中通过调用DTS 对象,实现对DTS Package 的访问等。

Microsoft 在SQL Server 2005 中又对DTS 进行了重大的改进,使一个单纯的ETL工具,变成了具有企业级开发能力的ETL平台,而不仅仅是把名字从DTS 改为了SSIS。

 

SSIS 的主要特点

 

1)      SSIS 不仅仅用来简单的传输和转换数据,还可以用来对建立Business Intelligence 平台的数据进行集成、转移、扩展、过滤和修正。

2)      SSIS 不但具有很多内置的数据清理功能,而且还可以通过第三方控件来扩充功能,可以使用户通过Visual Studio.NET开发自定义的控件。

3)      SSIS可以将数据直接导入到SQL Server 分析服务(Analysis Services) 的 Cube中。

4)      SSIS可以与SQL Server 报表服务 (Reporting Services) 无缝集成,即 SSIS 包可以作为报表服务的数据源。

5)      以 SQL Server Business Intelligence Development Studio (BIDS) 作为开发平台。BIDS 是基于 Visual Studio 2005 界面的集成开发环境,当开发SSIS 包的时候,不需要邦定到任何具体的 SQL Server 服务器,就是说可以脱机工作。BIDS的IDE开发环境 如图1-1 所示:

 

 


 

                 

 

 

 


                               图1-1

 

  安装 SSIS

 

SSIS 随 MS SQL Server 2005 标准版、工作组版和开发版发行,在安装MS SQL Server 2005 的同时选择安装 SSIS的选项即可。软件和硬件需求可以在MSDN相应的文档中查询。(http://msdn2.microsoft.com/en-us/library/ms143731.aspx)

本文中的实例全部在英文 Windows 2003 Server 企业版 + SQL Server 2005 开发版 开发环境下调试。部分实例使用了SQL Server 2005 自带的 AdventureWorks 数据库和AdventureWorksDW数据库,实际项目的实例使用了Himalayan 数据库。

 

AdventureWorks 和 AdventureWorksDW 数据库是 SQL Server 2005自带的例子数据库,它们在 SQL Server 2005 中取代了大家在 SQL Server 2000 中熟悉的 Northwind 数据库,是练习学习 SSAS, SSIS 和 SSRS 的最好的工具。值得注意的是,这两个数据库不是SQL Server 2005的默认安装选项。如果想使用学习本文中的例子,在安装SQL Server 2005时必须使用定制安装,并且选择安装 例子数据库。当然,这两个重要的例子数据库,也可以增加到已经安装完成的SQL Server 2005中,读者可以到Microsoft的官方网站去下载这最新版本的例子数据库文件。(http://www.microsoft.com/downloads/details.aspx?FamilyID=E719ECF7-9F46-4312-AF89-6AD8702E4E6E&displaylang=en)

Himalayan 数据库是一个我实际从事的一个SSAS项目的数据库,大约有200多个表。主要用于建立北美公用事业单位(水电煤气)的CRM系统。本文中的大量实例用于建立CRM系统和第三方财务软件的数据交换, 感兴趣的朋友可以向我索取该数据库文件。

SSIS Package (包)

我们从DTS 开始,就把在DTS中开发的能完成特定功能的数据转换操作的各个步骤地集合叫做 Package,其实就是一个图形化的程序,它包含了原数据表、目标数据表、步骤、任务、流程、脚本等,我们把这些组成统称为 Package, 并可以把这个Package 存放到 SQL Server 中,或作为单独的文件保存。DTS Package 的默认扩展名为 .dts, SSIS 中的扩展名为 .dtsx
 
我们会在下节中通过 SQL Server 2005 的导入/导出向导建立一个简单的 SSIS Packge.
————————————————
版权声明:本文为CSDN博主「Me_online」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/me_online/article/details/1526131

SQL Server Integration Services – SSIS)

上一篇:Redhat中安装mariaDB


下一篇:Access 2016 未在本地计算机上注册“Microsoft.ACE.OLEDB.12.0”提供程序