在控制台使用OSS Select

OSS Select-让提取数据价值更简单、更快速

对象存储OSS(Object Storage Service)具有海量、可靠、安全、高性能、低成本的特点。OSS提供标准、低频、归档类型,覆盖多种数据从热到冷的存储需求,单个文件的大小从1字节到48.8TB,可以存储的文件个数无限制。OSS已成为互联网、企业级数据应用的基础设施。
通常,获取对象存储数据的通方式为:获取整个对象,或按指定的字节范围来获取数据。OSS Select推出后,可以直接使用简单的SQL语句,从OSS的文件中选取所需要的内容。

在控制台使用OSS Select

本文将介绍如何在控制台轻松体验OSS Select的功能。

准备数据

控制台

登录控制台,并创建bucket
在控制台使用OSS Select

请创建华南1的测试bucket(您可以选择你自己想要创建的bucket名字)
在控制台使用OSS Select

下载模拟数据到本地(该数据本次实验的模拟数据)

http://testdatasample.oss-cn-hangzhou.aliyuncs.com/people/people.zip

将下载的数据解压,并放到刚才创建的bucket里

在控制台使用OSS Select

执行SQL,选取内容

点击刚上传Object最右边的更多按钮,然后再点击选取内容按钮,打开选取内容对话框
在控制台使用OSS Select

点击显示文件预览按钮,我们可以预览这个文件
在控制台使用OSS Select
我们可以看到这个文件有3列,分别是姓名公司年龄

然后点击下一步按钮,我们可以输入SQL来执行, 比如我们想查找年龄大于50岁,并且名字以Lora开头的人(其中_1, _2, _3是列索引,代表第一列、第二列、第三列以此类推)

select * from ossobject where _1 like 'Lora*' and _3 > 50

得到如下结果:
在控制台使用OSS Select

比如我们想统计这个文件有多少行,最大年龄与最小年龄是多少,我们可以执行如下SQL

select count(*), max(cast(_3 as int)), min(cast(_3 as int)) from ossobject

得到如下结果:
在控制台使用OSS Select

其他

OSS Select更高级的用法,请参考OSS相关的SDK(Java/Python,其他语言的OSS Select支持在开发中)

参考文章

https://yq.aliyun.com/articles/593910?spm=5176.10695662.1996646101.searchclickresult.41a75825WS8Atv

上一篇:搭建个人Leanote云笔记本


下一篇:Day 5 搭建个人Leanote云笔记本