专访天数智芯倪岭:如何赋能企业更有效地进行AI应用开发

  近年来,在大数据、云计算等技术升级的共同推动下,人工智能技术及应用取得了蓬勃发展。如今,继“互联网+”之后,“AI+”已蔚然成风。

  人工智能技术的发展不会取代人类,但使用人工智能的企业一定会取代那些从未打算与人工智能结合的对手们。目前已经有一些公司凭借新技术迅速崛起,并对同行施加了降维打击。很多企业已经意识到寻求AI赋能的重要性,但面临的难题是,要让传统企业实现AI升级并不容易,从基础硬件的配置和部署,到数据采集和结构化,到模型搭建与训练,再到算法模型的部署,其复杂性不言而喻。

  由于复杂度过高,很多企业往往初步地了解了基础硬件的配置和软件部署后就对智能化望而却步。正如著名华人学者李飞飞曾说,AI技术让人兴奋,但使用起来仍有很高的门槛,以致于只有少数公司能发挥其作用,她认为发展AI的当务之急就是降低进入的门槛。

  如今在中国有这么一家公司,就是致力于帮助企业快速且低门槛地使用人工智能工具,解决开发环境部署和高成本投入等问题。

  “我们的目标是将企业AI开发和应用变的更快、更简单”,天数智芯研发副总倪岭表示。

  为了帮助企业更简单高效的使用大数据和人工智能技术为自身业务赋能,倪岭带领团队研发了SkyDiscovery智能数据基础软件平台;同时,为了响应企业对于私有云和软硬件一体化部署的需求,天数智芯也推出了相应的超融合一体机产品——SkyAXE, 为使用者提供高性能、高可用、低成本、低运维的数据计算服务。

  让计算变得更快:为加速数据分析和AI计算,各类高性能硬件层出不穷,包括天数也在紧锣密鼓的研发通用、标准、高性能计算芯片。倪岭认为,所谓“硬件越快,软件越难”,在大规模的分布式异构环境下,计算、网络、存储如何协同高效运转对软件提出了巨大挑战。天数通过自研的“Soft Silicon”核心计算加速技术,使用高级指令集优化,并行与分布式加速,动态编译,RDMA网络传输,分级存储等一系列基础软件优化手段充分挖掘硬件的能力,最小化计算任务各环节的性能瓶颈,从而帮助企业“少花钱,多办事”,更有效的进行数据科学和机器学习任务的开发和应用。

  让开发变得更简单:在实际的数据分析任务中,机器学习往往只是其全生命周期中很小的一部分,数据的清洗与准备,特征选取,模型的反复调试与评估,模型的部署和管理往往会占去开发者更多的时间和精力,计算资源的管理与分配,繁杂运行环境与依赖,项目开发的协同与隔离,都是阻碍数据科学家和机器学习工程师进行快速原型开发的拦路虎。

  倪岭认为,作为一个成熟好用的数据科学平台产品,在用户交互和平台功能上要尽可能的将用户从繁杂和重复性的劳动中解放出来,因此,基于容器编排系统的云API,数据及模型的可视化探索,可交互的在线编程环境,拖拽的傻瓜式开发,工作流的支持,包括自动特征工程,自动模型选择,自动超参数和架构搜索的AutoML,完备的模型管理与导出,以及资源和计算任务的管理与监控,数据、代码、模型、可视化分析的托管与共享等功能都在天数智芯团队的努力下一一呈现给SkyDiscovery的使用者们。

  “一个功能点就能体现天数在把计算变得更快,开发变得简单所做的努力”,倪岭举例道,使用多个节点的多块GPU对单机Tensorflow模型训练进行原生的分布式加速,需要修改大量代码和进行手动集群管理,是个既困难又繁琐的任务,即便是富有经验的程序员也望而却步。SkyDiscovery提供了单机版Tensorflow训练程序自动分布式化的功能,用户不需要修改一行代码便可以轻松在分布式环境下达到接近线性的加速比。

  倪岭表示,借鉴芯片硬件开发中软硬件协同设计的理念,在保证SkyDiscovery软件平台标准通用的前提下,SkyAXE大数据机器学习一体机从规划之初,团队就将硬件与软件架构的相融与适配进行了综合的考量。

  市场上常见的数据科学相关的一体机产品,因为使用场景的不同采用截然不同的设计,搭配的软件平台也泾渭分明。大数据一体机通常是堆叠commodity server节点,搭配如HBase, Spark等Hadoop生态系统的软件;而深度学习一体机都以单机多GPU卡的形式出现,配合诸如Tensorflow和Caffe等的深度学习框架。

  倪岭认为,以Hadoop为代表的大数据技术和传统HPC技术,本质上,都是分布式计算环境下的作业系统,解决的都是将大的数据处理任务进行分解和协调的问题,如果以高性能计算为出发点,利用HPC技术,将存储,计算和应用以超融合的方式进行整合,配合大数据生态中的动态水平扩展、高容错和高可用的特性,一个在云端融合大数据和高性能计算的统一软硬件平台不但是完全有可能的,并且是数据科学需求演进过程中融合与互利的必然结果。

  搭载了深度优化的SkyDiscovery软件平台的SkyAXE一体机正是在这样的认识中诞生的,既能满足企业对传统大数据存储和分析的需要,也能满足他们对机器学习、深度学习等进阶数据科学的需要。不仅充分利用资源,也解决了数据存储和分析流程在不同平台流转造成的开发效率低下的实际问题。

  超融合一体机SkyAXE

  倪岭表示,通过将计算与存储分离和PaaS云化,SkyAXE支持模块化定制,可以根据企业应用场景,对应用、计算、存储等模块进行灵活配置。SkyDiscovery平台支持大部分通用开发语言、主流分布式计算框架、深度学习框架和100+机器学习算法库,和多种类别的数据接入,拖拽式开发和大量行业模版,对各层级使用者,大幅简化了数据探索,原型开发和模型生产化的难度,帮助企业更快速可靠的进行大数据和人工智能应用的开发与落地。

  目前 SkyDiscovery和SkyAXE 已经广泛应用于高校、科研院所、制造型企业、医疗体系、金融机构等不同企事业单位。针对企业的业务现状和需求,天数协助评估、规划和进行定制实施,这样一套端到端、一站式、可定制的大数据、人工智能数据平台,正助力企业突破智能化转型过程中所遇到的瓶颈,并以创新技术为各行各业带来更高的商业价值。

  在应用领域方面,倪岭表示,在SkyDiscovery和SkyAXE平台产品和服务的基础上,天数针对几个重点垂直行业,包括高端装备与制造、大众健康、产业金融、人工智能教育等几大领域都实现了相应的AI应用,云服务和产品解决方案,分别被称为:SkyFront、SkyHealth、SkyFinance和 SkyEdu。

  在智能制造方面,倪岭介绍说,SkyFront是专门为助力制造型企业转型升级而打造的智能设备健康管理平台,包含了工业时序数据平台,及以AI技术为核心的故障预测与健康管理 (PHM) 系统。通过动态采集设备运行数据,与企业信息系统中故障、维护等信息进行整合,利用各种智能算法,建立设备的故障预测模型,能帮助企业用户更加有效预防设备故障的产生、准确预测设备使用寿命全面提高设备管理水平,从而大幅提升生产效率和经济效益。

  在智慧医疗方面,SkyHealth基于SkyDiscovery智能数据平台,打通医院各业务信息系统,对多种来源的数据,进行采集、清洗和结构化,帮助医疗科研机构建立符合国际标准的临床病例数据库,并借助深度学习技术,对病理学、影像学的各类医疗图像数据进行分类,分割等模型的开发,提供智能辅助诊断,提高医生、医院和第三方检测机构的工作效率,向患者提供更加优质的医疗服务,从而推动分级诊疗,优化医疗诊疗流程。

  比如响应国家大力推动的两癌筛查政策,天数最近推出了人工智能宫颈癌液基细胞辅助筛查(TCT)云平台产品和服务。在一体化精准医学病例数据管理和机器学习云平台的基础上,医疗团队首创了数字化细胞涂片的全视野智能检测技术,快速筛查和排除阴性病例,提高筛查效率,节省ICL人力成本80%以上。

  作为高性能数据处理以及深度学习、人工智能应用领域的技术先锋,天数智芯的产品和服务能显著增强企业和云计算中心数据处理和分析能力,助力企业与云计算中数据分析应用向智能化转变,实现精准预测、认知和智能决策等方面扩展,极大提升了数据价值。

  未来,天数智芯将一直致力于研发自主可控、国际一流的通用、标准、高性能计算软硬件基础平台,并以自身标准平台为基础,以生态联动的方式,有机整合高端芯片、基础软件和云服务三大基础业务,深耕以AI为代表的高性能计算市场。

  “过去两年多,我们充分发挥了软件平台的优势,在人工智能的数个垂直领域积累下多个应用场景。当然,让企业能够更快速、更有效地进行智能应用的开发的目标永无止境。”

  “未来,我们将进一步优化智能数据基础软件平台的技术能力,并借助天数智芯倾全力打造的云端高性能计算加速芯片,为更多行业应用赋能,天数智芯未来在企业云计算和人工智能解决方案市场上将更具竞争力。”谈及未来,倪岭透露出未来公司的研发决心。

  “工欲善其事,必先利其器。既然各行各业都想通过数据和智能化分析来为自己的业务赋能,未来我们将持续发挥软件平台+芯片硬件的融合优势,为赋能者赋能,让企业能够更快速、更有效地进行智能应用的开发”,倪岭表示。

上一篇:每日一书丨尼克新书《人工智能简史》全新升级 全方位解读AI历史和未来


下一篇:《我要进大厂系列 五》-谈谈你常用的测试框架有哪些?