AI公开课:19.04.18俞益洲—深睿医疗CS《计算机视觉的应用与落地》课堂笔记以及个人感悟
导读
俞益洲,现为深睿医疗联合创始人、首席科学家(Chief Scientist)。香港大学计算机科学系教授,美国计算机协会杰出科学家,IEEE Fellow。在加州大学伯克利分校获计算机博士学位,导师为人工智能与计算机视觉领域的美国科学院与工程院两院院士Malik教授。
2006年成为美国伊利诺依大学香槟分校(UIUC)终身教授(UIUC的计算机系在美国排名第五)。多次与谷歌大脑、微软研究院等机构合作,并多次在微软亚洲研究院任客座研究员。2002年获美国国家科学基金杰出青年奖(CAREER Award),2007年获中国自然科学基金海外青年学者合作基金(原海外杰青)资助。近年来多次在人工智能,计算机视觉,医疗AI有关的会议和论坛做特邀报告,并应邀担任计算机视觉和可视媒体领域重要国际会议的程序委员会委员或主席。2018年11月,俞教授当选为2018 ACM杰出科学家,以及2019年度 IEEE Fellow。
目录
问答环节
小编正在使劲整理中……
雷鸣教授:在CV领域的投资有哪些?判断投资一家公司的条件?应用场景、经济上的收益。那么,如何评估团队?
吴世春VC:投了很多。关于如何判断,主要看能否落地解决问题,能否降低成本或者提高效率,解决的客户是谁,投的偏应用型的、垂直领域的公司。关于团队,要对行业足够理解(行业的痛点)为第一位,不一定要是大牛,但只要能够把好的东西学以致用,把这些东西进行产品化,不仅做的好还要卖的好。
雷鸣教授:探讨计算机视觉领域,目前非常热,今天是不是风头浪尖了,未来是否还有突破,哪些方向有真实进展?
鲁继文教授:CV领域的确取得了很大的发展,关于未来,不单单检测还要有决策问题。未来会走向3D的,结合很多好的传感器。目前计算机领域,做的很好的是感知,未来应该走向认知,虽然很难,但是希望还是有突破。
雷鸣教授:关于GAN,这个方向,也是很有意思的。关于CV领域的技术落地,看未来3~5年,还会有哪些好的机会,适合初创企业,会有快速的成长?
俞益洲教授:讲两个吧,一个是人机交互,CV结合NLP进行多模态融合和理解,进行无障碍的沟通,这个应用场景是很多的,比如服务行业,情感交流,教育行业,游戏行业(特别运动类)等。
吴世春VC:小的点来分析,我们投了好朋友科技,利用CV来降低一些成本,变废为宝。再比如垃圾分类等领域,也有很多公司也有在做。
鲁继文教授:未来的手机是否会被其他AI智能产品替代,对机器实现智能化,第二,需要结合一些特定场景结合,比如工业的一些缺陷检测。
雷鸣教授:其实,生成领域会有更大的有趣的东西,尤其是娱乐方面,比如卡通,现在静态图片已经可以以假乱真。内容生产会有很多的东西出来。
个评:创业,要理解行业痛点,降成本、提效率,比别人的好,才算牛!
备注:以上对话环节的文本编辑,为博主总结,与原文稍微有异,请以原文录音为准。时间紧迫,如有错误,欢迎网友留言指出、探讨。
现场PPT
小编正在使劲整理中……
演讲PPT
小编正在使劲整理中……
雷鸣教授PPT
计算机视觉技术、计算机视觉应用场景
静态视频流技术,如何利用计算机视觉与医学影像结合,当前是非常热的一个方向。
具体案例有,阿里的猪脸识别,大疆无人机的果树林病虫害的识别,高压寻检识别,观察沃尔玛停车数量来预测销售数量,全球小麦图像检测来预测期货,互联网如抖音等视频内容理解、广告插入等。
俞益洲教授PPT
计算机视觉的主要任务有哪些?
- 图像识别
- 运动分析
- 场景重建
- 图像恢复
基于深度学习的计算机视觉
卷积神经网络,今年的图灵奖得主 LeCun ,在1989年,发明了一种具有特殊连接关系的神经网络。当时图像尺寸很小,因为受限当时算力的原因。
Hinton(今年图灵奖的得主)的学生,在2012年,在ImageNet 比赛上,拿到了冠军。当时,一个GPU,训练一次,还是需要两个星期。后来,都是在此基础上,有所改进,推动了神经网络的发展。
端到端非线性变换,每层对图像的理解逐步加深,第五层可以识别单个部件,最后一层综合整个部件识别。
计算机视觉的应用
智能安防,比如智慧交通、车辆识别、车牌管理等。对人的视频监控。1VS1识别 或者 1VS多识别(该方向还可以做的更好)
安防市场规模:中国安防市场很大,几乎占全球市场的50%。
自动驾驶:语义分割,道路的指示信息。检测指示牌,它是一个综合的技术,比如传感器,还有控制系统等,其实CV领域在自动驾驶方向占比也不是太多。
麦肯锡市场调研:自动驾驶若能在中国落地生根,前景将十分广阔。自动驾驶,十年以后,有可能超过安防市场的规模。
增强现实:比如对伯克利的校园建筑,建造三维模型。***帝国,可以从多个角度观看这个子弹。
无人零售:会利用到很多CV领域的技术。这还是一个新兴的市场,据说,将来可以达到万亿级市场。
智慧医疗:医学影像的辅助诊断、治疗。机器人问诊等。
医学影响市场规模:增长趋势明显,爆发时机成熟。现在病人和三甲医院分配不太均衡,所以可以带来改善。
痛点:误诊常有,医疗资源分布也不均衡,有望提高质量和效率。
计算机视觉与医学影响分析
- 现代医学越来越多依赖医学影像信息进行诊断。
- 80%的临床问题需要影像检查得到准确的诊断结果。
- 医学影像格式标准利于人工智能深度学习技术。
- 人工智能+ 时代,医学影像也将走向智能化。
图像识别
- 图像分类:比如ImageNet有1000多类。
- 图像定位:利用包围框定位目标,常针对单个目标检测问题而言。
- 多目标检测:对所有物体进行目标检测。
- 语音分割问题:希望每个像素都能知道是哪个类别所覆盖,即密集的图像识别或者分类。
- 实例分割:每个轮廓的边界都要勾勒出来。
医学图像分类案例
皮肤癌分类:不同类别的皮肤癌,相距比较远,故可以达到很高的精度。
深睿医疗—基于AI的医学影像分析案例
- 基于CT的肺结节良恶性预测模型:AUC指标,达到80%多,已经超过了大部分*别的医师,而现在基本上,已经处于最高的准确度状态。
- 脑出血区域分割、体积测量:利用二类语义分割技术。
- 基于胸部DR的病灶检测:二维空间其实是很难发现的,但是利用AI模型可以对细微差别进行识别。目前能对20多种进行检测。
- 儿童骨龄辅助评估:主要对手指关对部位小骨头的发育状况,进行检测,然后评等级,进而评估。
- 乳腺钙化筛查:钙化检出的技术挑战,非常细小、非常稀疏、情况复杂,肉眼很难判断。
基于AI的医学影像分析特有的挑战
- 训练样本较少:迁移学习解决。
- 数据标注成本高:采用半监督学习解决。比如基于胸部DR的混合监督学习案例。
- 数据标签噪声大、一致性差:数据标签的自动修正,协同合作、修正。
相关文章