DataWorks百问百答47:如何配置操作Python UDF函数?

udf函数是什么?
maxcompute自带了一些函数比如:max/min/sum 等,但是由于自带的函数数量有限且实现的功能有较大的局限性,通常不能满足业务的需要,这时用户可以自己定义udf来方便扩展。udf 函数可以直接应用于select 语句,对查询结构做格式化处理之后,然后再输出内容。


注意点:
1.Python UDF必须通过annotate指定函数签名。
2.必须实现 evaluate 方法
操作步骤:
step1:
创建python类型ud资源:
案例如下:(实现两个bigint类型字段值相加)
DataWorks百问百答47:如何配置操作Python UDF函数?

from odps.udf import annotate
@annotate ( "bigint,bigint->bigint" )
class MyPlus ( object ):
def evaluate ( self , arg0 , arg1 ):
if None in ( arg0 , arg1 ):
return None
return arg0 + arg1

step2:
根据资源来配置创建函数:

<br/>DataWorks百问百答47:如何配置操作Python UDF函数?
注意点1:类名为资源文件名.class类名
注意点2:资源列表中填写 所有 用到的文件(例如udf中用到的其他文本类型文件等),用英文逗号分隔

step3:
调用函数实现业务需求:
DataWorks百问百答47:如何配置操作Python UDF函数?

注意点1:调用语句中使用的是函数名

DataWorks百问百答历史记录 请点击这里查看>>

更多DataWorks技术和产品信息,欢迎加入【DataWorks钉钉交流群】

上一篇:解决流动人口管理的世纪大难题,政务大数据如何助力


下一篇:mySQL 增量备份方案