以下是胡逢法的专访,推荐阅读(约5分钟)。
思考点燃理想,尝试成就结果
初中时,学校附近有个工厂,课余时间经常跑到那里去看工人干活,看到很多场景觉得比较好玩,比如工人在做产品质量检查,当时都是用肉眼去看的,我当时想,这类工作得一个个用人去看去记录,要是用机器自动去完成该多好,那时我对自动化及视觉设备这一块应该已经萌生了兴趣。读研的时候,我发现图像处理这些研究很有实际应用价值,例如机器替代人工去做很多繁琐且辛苦的事情可以缓解很多工人的压力等。所以我的学习和工作也一直在做这些方面研究,我逐渐地把自己的想法,通过结合各个模块的知识添加到系统里的方式来实现很多功能。
以前我是做算法类的,只要把某个功能点写好即可。智慧园区的一个项目需要我从技术和业务两个角度考虑问题,不同的视角不断碰撞,于是产生新的点子。在这个过程中有很多知识和技术可以更好地结合利用起来,做出的效果令人很有成就感,对个人的经验和能力来说都有很大提升。
负重前行,每一次转折都弥足珍贵
我的职业生涯有几次较大转折,从规模庞大的上市公司,到初创的技术团队,再到杭州际视科技有限公司的合伙人。尤其家人会不理解,觉得大公司很好,瞎折腾什么?
个人认为大公司拥有完善的机制、企业文化等,这些对于培养职业素养方面有很多好处,我现在仍然保持当时养成的一些好习惯并在工作中颇有收益。同时,在大公司也会存在一些限制,后来我有自己的想法想去实现,所以去了互联网创业公司体验。其实每次转变过程也是对自己内心的一种拷问,我不是想简单的跳槽,而是在朝我想要的方向去发展。这个过程也包括对自己优势劣势的考量、生活工作的复盘,以及对未来的重新规划。
挑战肯定是有的,比如在大公司工作时,更倾向于专注,大多数时候只需要负责好个人的小模块并不断专精就可以高枕无忧了。而到一个初创团队里,需要考虑的问题接踵而来,做事方式、沟通方式需要转变,思维都需要转变等,刚开始时会有些不适应,对个人来说也是一种挑战。由大多数时候只需做好某个领域的技术活,其他事情基本上不用管,转为不光专精某一方向,还需要不断扩充周边知识,不同方向的内容产生交集。从原有的点向面的碰撞,到需要掌握更多的系统性的工作,对个人来说这也是一笔宝贵的经历。
与时俱进,融会贯通
随着近几年深度学习的兴起,视频图像智能的准确率在很多应用领域已经超过了我们人眼的识别,如人脸识别、目标识别。但是从更高的维度去考虑,如视频的分析、视频的理解,个人认为目前图像以及相应的算法还处于人类的婴儿期,比如说:它可以区分出这是什么那是什么;但是当这些变成一个视频序列的时候,比如在一个固定的场景中,要让它判断这个人在干什么,理解发生了什么事情,还需要探索一段时间。未来会朝着场景理解这方面推出新的应用和创新,比如在智慧园区智慧工地里面,发现工人工作时的危险行为,能进行甄别和及时危险预警;在心理学上,结合图像或者脑电波以及心理学等方面的知识,对人的心理活动进行探索。也就是从目前图像检测、分类跨到对图像和视频系列的理解,进阶到更高的维度。
目前看来,图像视频这一块发展是挺迅速的。近年来,随着硬件的性能拓展和提升、深度学习的发展,不论性能还是准确率都提升非常快。早些年的时候,做一些最简单的物体分类,可能得花上几个月才能做成一个比较好的分类器(比如人脸识别),目前有一些现有的模型可以在几周甚至几小时就可以得出效果更好的分类器。所以知识在不断的更新时,我们也要不断地学习,更新技术和知识体系。可以参考最新的一些会议,国内外高效的论坛等。另外一个重要的点是,个人要善于横向发展,融会贯通,很多东西都是源于生活又高于生活,实际上很多问题结合生活中很浅显的例子就可以引用过来更便于理解,特别是我们视觉上的方式比较直观,可以用简单的模型引用到复杂的逻辑上,这样会理解得更快。