第一次投递论文,就中了 KDD,是什么样的体验?
第一次投 KDD,不仅中了,还同时获得了最佳论文 runner-up和最佳学生论文 runner-up,又是什么样的体验?
这两个知乎体问题,邀请东北大学 SDS(Sustainability & Data Science)实验室的博士生 Thomas Vandal 来回答最合适不过了。他的处女作《DeepSD: Generating High Resolution Climate Change Projections through Single Image Super-Resolution》在 KDD 2017 上荣获最佳论文 runner-up及最佳学生论文 runner-up,Vandal 此外还获得了 Student Travel Award。
Vandal 在会后告诉雷锋网(公众号:雷锋网) AI 科技评论,之前他只参加过一些 workshop,因此一开始并没有想到这篇论文会获得最佳应用类论文的 runner-up,「我们本来觉得可能会有机会获得最佳学生论文奖,但这个结果的确出人意料。」
DeepSD 这篇论文围绕的是解决气候分析的统计降尺度问题,团队利用深度学习技术通过广义的叠加超分辨率 CNN (SRCNN) 框架增加多尺度输入通道,生成有效的统计降尺度模型。(底部附论文摘要)
在 Youtube 上,Vandal 已经放出了关于这篇论文的介绍视频,雷锋网 AI 科技评论搬运视频如下:
第一次投 KDD 就获得如此出色的成绩,让 Vandal 感到非常惊讶和高兴,他表示这对自己而言是一个莫大的鼓励。自然,第一次上台伴随的也有紧张。在论文展示现场,他在演讲时舌头有些打结,出现了不时的卡顿。或许大家也看到了他的局促不安,因此在问答环节的时候,只有一位观众非常「友善」地提了一个不痛不痒的问题;同一场次至少要让观众提三四个问题的主持人也没有「刁难」他,很快地邀请下一位讲者上台;在 Vandal 演讲完毕*的时候,他抱着电脑快步离开,甚至忘记了把身上别着的麦克风摘下来递给下一位讲者;而当他回到后排座位上的时候,脸上终于流露出自然而放松的神色。
在演讲过程中,Vandal 也提及了模型自身依然存在一些缺点,包括理解云、冰雹等气象对气候判断的影响,还没有在缺乏数据的地方检验模型的可预测性,在这样的状况下,要进行高分辨率的气候分析则显得更加困难。Vandal 也表示,希望利用机器学习将模型变得更高效,且能够适应更大范围的分析。
「我们采用深度学习方法解决气候问题的时候,实际上是在一个非常大的范围内产生作用。而其中面临的最大问题是面对气候的海量数据源,我们需要关注用户真正关心的数据是哪些,并将其进行模式化处理。可能对于商务人士或是*人士,他们需要的内容可能会有差异。」
Thomas Vandal 向雷锋网 AI 科技评论表示,深度学习的火热对计算机科学而言,是一个深入研究领域知识的良好契机,就像自然语言处理现在也运用了深度学习优化模型结果一样,反过来,它也能够促进我们对领域知识的理解。「深度学习也提供了一种让我们重新利用和审视数据的方法,值得所有研究者关注和思考。」
而根据 Vandal 的说法,这篇论文很快将投递到机器学习或计算机视觉的期刊上,在此之后会在大型计算机上进行试运行,最终将 120 个气候模型投入使用并将结果开放给公众。
作为一名正在研读交叉学科工程的博士生,Thomas Vandal 实际上算得上是「半路出家」。2012 年在马里兰州大学完成数学本科学习的他,毕业后在 Boston Technologies 担任市场风险分析师,管理数百万的外汇市场,随后在 Affectiva 担任数据科学家,开发了一款分析面部表情的工具。自 2015 年开始,Vandal 开始在东北大学攻读交叉工程学科,致力于用深度学习研究气候问题。
深度学习的应用有很多,但为何他会选择气候方向?Vandal 表示,气候领域是一个非常重要的方向,在未来的二十到五十年都可能会对全美国甚至全球产生普遍性的影响。「NASA 有很多卫星在监测各种有意思的气象数据,我也和很多其它 NASA 成员在合作。」
目前,Vandal 也在 NASA Ames 研究中心实习,这篇获奖论文也是与 NASA 研究员 Sangram Ganguly、Ramakrishna Nemani,还有剑桥大学的 Evan Kodra、University Corporation 的 Andrew Michaelis 以及 Vandal 的导师 Auroop R Ganguly 合作完成。他计划在未来继续对气候问题进行深度研究,争取将自己的论文成果落地为成熟技术并尽快带给公众。
附论文摘要:
气候变化的影响是由基础设施、生态系统和发电厂等大多数关键系统所监测到的。然而,目前地球系统模型(Earth System Models,ESM)的空间分辨率过低,因此并不适合本地化。统计降尺度(statistical downscaling)能够通过对历史气候的观测来学习低分辨率到高分辨率的映射,采用这种方法可以获得缩减规模投射。依赖统计模型的选择,小尺度投射在准确性和可靠性上提出了不同的要求。气候系统的时空特征推动了超分辨率图像处理技术对统计降尺度的适应性。我们提出了 DeepSD,一种用于气候统计降尺度的、广义的叠加超分辨率 CNN(SRCNN)框架。DeepSD 增加了具有多尺度输入通道的 SRCNN,能够最大化统计降尺度的可预测性。比起误差订正空间分解法(Bias Correction Spatial Disaggregation)以及三个自动统计降尺度方法,我们采用的方法将美国大陆范围内日降水量气候降尺度从 1 度(~100 km)降至 1/8 度(~12.5 km)。此外,我们讨论了使用 NASA 地球交换(NEX)平台的框架,用于超过 20 个具有多个排放情景的 ESM 模型的统计降尺度。
本文作者:奕欣
本文转自雷锋网禁止二次转载,原文链接