阿里云-飞天-盘古
概述
业务
- 盘古是阿里云自研的分布式存储平台,承接了整个阿里云的存储业务,拥有海量的用户。当前支持的业务方向主要有
- 超大规模的分布式文件系统(单集群数万台机器,数十亿文件),主要用于阿里云的大数据计算服务(ODPS)。
- 块存储,支持阿里云的云盘业务,包括全SSD云盘,混合存储云盘,SATA云盘,目前无论是收费用户数、营收、数据量、机器规模 在国内都无出其右。
- 对象存储,成功入围Gartner最新一期全球公共云存储服务魔力象限,也是首家入选的中国云服务商。
- 表格存储、SLS、归档服务、NAS、消息队列服务等大量的新业务均基于盘古存储平台。 目前所有这些业务均发展迅猛,无论是用户量,数据量,机器数,每年都是超过100%的增长,完全在风口上,而且随着云计算的深入发展,大量的企业上云,这个趋势还在不断增强。整个业务的国际化发展非常好,目前在美国、德国、日本、澳大利亚、新加坡、迪拜、印度、中国香港、中国* 等地均有部署和大量的国际客户。
团队
- 大家都坚持用事实,用数据说话,沟通协作便捷高效。业务在飞速发展,有足够的丰腴土地待开发,所以基本上每个人都能独立own一块,并且能长期专注的深耕下去,个人能取得长足的发展,但并不为每个人设置硬的界限,崇尚志愿者文化,遇到挑战性的问题,欢迎任何人挺身而出来承担,大家协调资源帮他拿到结果,新人很容易脱颖而出。
- 团队大牛多,有ACM世界冠军,中科院的研究员,7位博士。人员非常稳定,流失率低,超过一半的同事干了4年以上,对我们而言,这个不仅仅是一份工作,而是一个事业,我们信仰云计算。
- 特别声明一下团队是有妹子的,已有三位,我们欢迎更多。
- 当前我们正在进行下一代分布式存储平台的研发,计划做出革命性,大幅领先市场的产品,求贤若渴,热烈欢迎各路精英加盟。
工作环境
- 对于用户,数据安全就是生命。存储是个高危行业,我们从不讳言承受着巨大压力,期待你有足够的抗压能力。
- 不强制加班,但确有加班,我们更期待高效率的工作而不是加班,不搞996,工作时间弹性。
- 工作地点 北京、杭州、上海,入职上海的同学前期需要到杭州熟悉业务。
岗位描述
-
下一代分布式存储系统的架构设计与实现,研发大幅领先市场的存储。
-
高可靠、高可用 系统的设计开发与演进,黑天鹅事件的规避预防以及损失控制,降低爆炸半径。数据是用户的生命,绝对不能错,不能丢,而且要高可用(发生不可用故障后,百倍赔偿),众所周知硬件都会发生故障,我们碰到过网卡错,CPU错,内存错,网络错,磁盘/raid卡出错是家常便饭,更不用说内核错了,太常见了,在这里你会碰到太多的险恶性问题(事前难以预料,只有发生了才会意识到的问题),我们的工作就是要在这些不可靠的软硬件环境下为用户提供高可靠,高可用的存储服务。
-
对接新的硬件(NVME, NVDIMM,3DXPOINT, RDMA网络),提升资源利用率,降低硬件成本,为用户提供更便宜的存储。当前公司的存储产品每年都大幅降价,让利于客户,这要求我们在软件层面更高效的用好硬件资源,为产品开创更大的让利空间。
-
用户对IO性能的追求永无止境,我们一直致力于降低IO latency, 提升吞吐量,其中涉及到网络性能优化,单机存储的性能优化,例如我们正在研发的用户态文件系统。你做的每1us的优化,都会惠及海量的用户。
-
关注工程质量,严格的代码review, UT/ST测试,每位开发者都要对自己的代码负责,你就是最后的守夜人。
-
倾听用户的声音,去伪存真,将其转化为合理的需求,制定开发计划,并推动上线。
岗位要求
-
热爱代码,追求高品质代码,对工程质量有深刻认识。积极主动,遇到不好的代码,鼓励每个人动手修正,不管是否你写的。
-
坚毅,有足够的耐力。云计算是一场长征,有太多的困难要克服,有太多的坑要趟,没有足够的耐力很难坚持下来,如今团队内已经有多个马拉松爱好者。
-
用数据说话,用数理逻辑服人,整个团队都用这种方式沟通,你会发现沟通会非常简洁高效。
-
将物理极限作为系统的极限,不轻言不可能,我们偏好追求极致的人。
-
思维活跃,能根据现状提出新的想法,对于和团队大方向一致的想法我们会尽力协调资源帮你实现这个想法。
-
我们主要使用C/C++ 来工作。
-
性格开朗,具有较强的组织能力,能活跃团队氛围,丰富团队生活,组织高质量团建的,是加分项。
-
熟悉分布式系统,有高可用系统经验,熟悉linux kernel , IO 虚拟化, SSD硬件,或者有存储背景, 是加分项。
-
自信,以上条件不能完全具备也没有关系,我们欢迎自信的人。
联系人:吴均平 邮箱: junping.wu@alibaba-inc.com