数据大爆炸的时代,发展信创,保证数据的安全与流通便成为刻不容缓的议题。专注于数据智能互联解决方案的科技创新企业冲量在线,致力于促进数据生产要素在社会间的互联互通,构建可信、安全、隐私、公平、高效的“数据互链网”。
作为隐私计算结合信创的先行者,冲量在线已经发布了业界首批隐私计算信创一体机,涵盖ARM与X86架构,在全部采用国产化硬件的基础上,支持国密、同态、椭圆曲线、MPC、联邦学习等安全技术,能满足金融、政务运营商等行业各类的数据合作需求,严格保护数据中的个人和企业隐私信息,实现多方可信的数据协作。
展望未来,冲量在线创始人&CEO刘尧认为,信创是大趋势和风口,未来的市场空间万亿级别,冲量在线敏锐的抓住了现阶段布局机会,做了很长时间的储备。国内的信创产业,很多产品实际的应用场景不够多,这正是冲量在线想逐步解决的问题。
冲量在线今年将更多精力放在标准化产品研发上,目前,冲量在线已经和数十家企业达成战略合作和生态合作,通过上下游的打通,希望能真正解决生产级的业务问题,让隐私计算平台可以作为插件的方式,融入到用户的数据全生命周期治理的业务场景中去。
冲量在线如何以信创软硬件结合场景为突破口“占山为王”,信创未来的大趋势如何?从这篇与刘尧的访谈中,或许可以管中窥豹。
01 信创有万亿市场空间
算力智库:
您的职业经历涵盖不同互联网大厂以及软硬件领域,其中有哪些观察和经验促使您选择在信创领域创业,又有哪些认知和判断促使冲量在线选择隐私计算赛道并主打TEE?
刘 尧:
在我的职业经历中,业务软件类产品、硬件类产品、解决用户IT基础设施生产效率的云平台类产品、创新类产品如区块链和可信计算等都做过很多。
可以看到,我对通过软硬件结合的方式来实现产品的标准化与规模化比较擅长。参考此前在云原生、人工智能、区块链等,基础设施平台技术类赛道的实践经验,这类技术最终都走向了软硬件结合的路线,通过软硬件结合all in one的方式来提供一个更加完善的解决方案给到用户,在提升功能完备度,极致地优化性能,还是做产品标准化,都有帮助,隐私计算本身也会面临这样的范式转换阶段。2018年的GDPR法案颁发之后,数据不管是在公有云端还是在私有云端的流通开始逐步变成刚需,这是我们当时选择这个赛道创业的核心原因。信创是大趋势和风口,这个已经形成了业界共识,所以冲量的一体机产品目前已经完美地整合了国产化的芯片、操作系统等信创底座。冲量做软硬结合的产品有很强的技术和业务积累,为了响应GDPR法案的推出, BAT、谷歌、微软、IBM、英特尔等10家公司在Linux基金会的组织中成立了机密计算联盟,我作为百度的代表参与其中。当时就发现,基于软硬件结合的方案,在通用性和性能上,会有比较突出的表现,特别是对于人工智能算法的支持能力比较强大。2020年冲量在线公司成立的时候,恰逢国家推出了一系列的政策来扶持中国芯片和信创产业,那时候我们就发现了商机,使用国产化的芯片来解决数据流通问题将是一块相当大的市场空白,所以我们就用短短一年多的时间投入了几十个核心工程师来攻克这个难题,目前已经支持了国内所有主流的芯片和操作系统,包括海光、鲲鹏、飞腾、龙芯、申威、兆芯、统信、麒麟等,真正意义上做到了隐私计算的全栈自主可控。
算力智库:
TEE在多大程度上受制于我国芯片实力的短板,突破点有哪些?TEE的可信源于对芯片的信任,在信创国产化大趋势下,TEE如何从根本上取信于人?信创未来的大趋势又会是怎么样的?
刘 尧:
冲量在线不只做TEE相关产品,冲量的核心是打造完全自主可控、高性能的数据流通TEE、多方安全计算、联邦学习三条路线都有储备,三条路线旨在解决不同的问题,有不同适合的场景,技术厂商都应该布局。
首先,TEE和芯片产业的强绑定关系确实客观存在,但在2021年性能、供货等这些问题已经逐步得到解决,比如冲量在中国电信“数信链网”中的数据交易场景,已经使用国产化芯片的TEE能力,满足了数千万条数据联合建模性能要求,还有基于成都超算中心算力的隐私计算平台测试,能够支持8亿条数据2000万人的数据联合分析处理,这些都是基于国产芯片的TEE完成的实践。我们已经把国产芯片能力带进了生产环境,相信明年国产芯片在数据流通领域的应用将会是井喷式的状态。
中国电信、中科可控、冲量在线在河北数字经济博览会上合作发布“数信链网”产品
第二,是信任根问题,国产芯片厂商大部分具备很强的可信任能力,也拥有全面的合规与技术认证,能够很大程度上被信任,同时冲量在线通过与芯片厂商的通力研发与合作,将远程认证、一致性度量、可信计算3.0的主动免疫、国密加解密、防侧信道攻击等技术能力加入进来,更加补齐了芯片在使用过程中的安全可信能力。此外,我们在数据流通领域也会引入一些区块链的能力,来提供去中心化的信任、追溯和审计能力,这也是一种切实可行的技术手段,冲量在线也是首批通过信通院区块链增强的隐私计算标准测试的厂商,也是通过case最多的厂商。
02 技术融合解决业务场景应用问题
算力智库:
一般说隐私计算总是和密码学、人工智能算法密切相关。TEE尽管历史悠久且应用普遍,却“存在感”相对较小,您如何看待?对于大多数商业级隐私计算或数据流通场景来说,TEE是否是底层必须?哪些场景更需要TEE的支持?哪些场景又需要TEE跟其他技术栈进行融合应用?
刘 尧:
TEE其实更偏底层技术,可以给数据流通平台提供很好的硬件加速能力, 在大规模的数据流通量、高级别人工智能算法适配、远距离的数据组网、灵活动态调整的业务场景适配等场景上可以发挥比较好的价值。
声量比较小的原因是TEE本身确实开发难度相对较高,像我们底层的所有开发语言是基于Rust等高级语言开发的,同时需要对芯片本身有足够了解,所以这块的人力储备基本都来自头部科技公司,对于创业公司的人才密度要求也比较高。同时冲量在线也想极致地降低用户的使用门槛,所以我们也推出了一系列产品脚手架的功能,支持用户基于C++、Python以及更多的编程方式来对隐私计算平台进行编程,可以灵活地适配风控、营销、绿色金融、产业数字化、工业物联网等多样化的场景需求。
我们还是想坚定地干我们认为正确的事。类似隐私计算、区块链、人工智能等技术基础设施类的赛道,硬件加速是永恒的话题,我们也会持续地投入。比如2021年的英特尔AI 100计划就邀请了冲量在线参加,使用Intel SGX TEE来解决联邦学习的性能问题,同时降低联邦计算中间环节的安全隐患,这个项目也已经完成了生产级的投产。
所以我们认为,TEE技术与联邦学习、安全多方计算等技术融合才能更加完善的解决数据流通中的性能、安全等很多问题。
03 重点发力产品标准化研发
算力智库:
您如何看待隐私计算一体机的兴起?与算法类隐私计算解决方案相比,这类硬件设备主要适用于哪些场景和目标客户?有哪些优势和不足?
刘 尧:
一体机发展了好多年,例如数据库一体机、金融风控一体机、人工智能一体机、区块链一体机等等,是一个相对成熟的模式。一体机主要解决了两个重点问题,一是通过软硬件集成的模式极致地提升性能,二是整合多种类型的软件,形成一体化的能力,为用户提供一键式的场景使用体验。隐私计算一体机也是解决上述这两个问题。
隐私计算一体机对于算法性能的提升普遍可以达到数十倍,也能够通过云原生的底座技术完成多台一体机的分布式组网和联动,可以适用于数据规模超大、实时响应要求高的数据流通业务场景,比如图像识别、指纹识别、工业互联都是我们目前在尝试的创新场景,客户群体在金融、政务、运营商、工业等多个行业都可以落地。同时,我们还联合合作伙伴推出了很多针对业务场景的一体机,比如冲量在线于宇信科技和南大通用的合作,三方通过将数据中台、模型治理、数据库、和隐私计算进行无缝整合,针对金融客户数据治理场景提供了All in One的体验,可以一键式的支持金融信贷、营销的全生命周期数据治理和流通。
冲量在线联合中科可控、飞腾、中诚华隆推出的业界首批国产隐私计算一体机
算力智库:
您曾表示冲量在线的发展目标是做真正自主可控的产品化软硬件业务,而不仅仅是成为单纯做项目的团队。站在2022年的起点向前看,请您再为我们解读下这里的“产品化”和“软硬件业务”的内涵。冲量在线的产品,又是如何真正迈向客户生产环境的?
刘 尧:
最关键还是想做产品化,产品化有几个特征,一个是要足够标准。这就要尽可能遍历所有跟数据流通相关的应用场景,我们平台其实已经兼容了数十个机器学习算法,尽可能的让产品在某一些特定场景变得标准化,这是能批量复制最好的手段,也是我们要重点打造的一键式业务能力。
第二个是要有明确的优势,所以我们通过软硬件业务来极致的优化性能,来打造这款产品的性能优势。
第三个是通过与数据流通场景下的数据中台、数据库、人工智能平台、云平台、业务软件系统进行整合,将隐私计算作为插件融合到用户的数据治理全流程中去,真正地让隐私计算迈入生产环境,而不是引入一个新的业务孤岛。当然我们也会跟上下游形成开放且长期的合作,建立了包括宇信科技、科蓝软件、华为、紫光云、南大通用等数十家头部厂商的合作生态。
算力智库:
除了隐私计算技术本身,数据流通是否需要其它技术作为生态支撑?冲量在线在这些技术领域又是如何布局的?
刘 尧:
数据流通需要四类技术,第一是安全隐私类技术,这个通过隐私计算或者可信计算等就可以解决。第二是整合区块链的能力,这个恰好是我们公司之前积累比较多的能力,基于区块链实现的数据确权交易、定价追溯升级等也是数据交易流通里面必备的一些技术组件。第三是与人工智能平台做很多的配合来满足大规模数据分析挖掘和应用的需求,我们团队实践过百度的机器学习云平台,相对有很多的技术储备,在算法丰富度上也进行了数十种的储备。第四就是数据治理能力,隐私计算需要跟数据中台的整合,跟数据库的适配,兼容流式计算等能力,才能形成系统化的数据流通解决方案。
这四个点是我们认为数据交易流通里面必须要解决的问题,这恰好是冲量在线相对比较擅长的领域,所以我们会持续在这四方面上做大力投入。
算力智库:
在上述目标的指引下,目前冲量在线的主要业务模式是怎样的,2022年以及未来的理想业务模式又会往哪些方向发展?冲量在线对于行业的布局又有哪些?
刘 尧:
冲量在线将会重点关注拥有大量数据的头部行业,像金融、*、运营商、工业运等,冲量在线都已经具备了一些标杆案例。我们连续两年获得了中国信息通信研究院颁发的隐私计算行业十大标杆案例,与工行、百度、联通等行业巨头并列,也证明了我们在金融、政务等方向的案例深度。
现在市场是一片蓝海,大家都在刚起步阶段。基于大客户的场景做拓展,也还是我们重要的产品模式。
此外,冲量在线已经摸索出了产品标准化交付的模式,通过被集成的方式我们与数十家头部企业都建立了合作,帮助合作伙伴补齐了他们数据治理、数据共享、隐私计算硬件等业务短板,实现了很多项目中的双赢。