AI 3D感知论坛学术专家共话三维计算机视觉前沿科技

首页 >

近日,由中国自动化学会模式识别与机器智能专委会、中国人工智能学会模式识别专委会主办,国内3D传感领军企业奥比中光承办的“AI之眼,智见未来”3D传感&人工智能前沿科技论坛在深圳市南山区举行,来自国内多所知名大学的七位顶尖专家就基于深度学习的三维场景重建、动态场景三维重建、基于三维信息的行为理解、视觉SLAM、三维人脸和表情识别、三维人脸建模、三维场景智能感知与理解等三维计算机视觉领域的前沿科技进行阐述。深圳南山科创局南山区科创局(区科协)常务副主席张汉国、奥比中光联合创始人兼CTO肖振中出席论坛活动并致辞。


奥比中光联合创始人兼CTO肖振中出席论坛活动并致辞

深圳市南山区科创局(区科协)常务副主席张汉国在讲话中表示,推动新一代人工智能与产业的深度融合已上升为国家战略,此次论坛对于推进我国人工智能“产学研”的深度融合,推动AI 3D传感技术的创新与发展具有重要意义。

7位顶尖学术专家分享3D传感&人工智能最新科研成果



纪荣嵘:基于深度学习的场景信息重构

厦门大学“闽江学者”特聘教授、博士生导师纪荣嵘表示,在实际应用中,重构场景语义信息和几何信息非常重要,目前深度学习技术虽然在目标检测、视频跟踪等领域取得了重大突破,但在应用中依然存在图像遮挡等问题。对此,纪荣嵘教授介绍了其课题组在视觉里程计、图像语义分割和图像深度估计的研究进展,并举例介绍了这些技术在移动端的应用。

刘烨斌:实时便携动态场景三维重建

清华大学自动化系副教授、博士生导师刘烨斌认为,真实世界视觉信息的采集、数字化记录与重建是当前视觉媒体技术发展的核心关键,随着IPhone X等智能手机新增加实时深度探测模块,动态场景的三维重建变得更加便捷。目前,动态场景的三维重建主要面临精准性、便捷性和实时性三方面的挑战。对此,刘烨斌教授围绕便捷性和实时性,回顾了动态场景三维重建的发展历程,介绍了最新的关于便捷采集及实时生成的成果,主要是基于深度相机实时动态人体三维重建。此外,刘烨斌教授还围绕视觉信息采集的计算摄像技术,介绍了在视角维度的光场摄像、光谱维度的高光谱视频成像、空间维度的十亿像素视频生成、时间维度的TOF瞬态成像方面的最新进展。

章国锋:视觉SLAM技术及应用

浙江大学CAD&CG国家重点实验室教授、博士生导师章国锋重点介绍了基于视觉的同时定位与地图构建(Visual SLAM)技术,在满足实际应用需求中需要解决的关键性问题,包括:一是如何实现在移动设备上实时稳定跟踪,处理快速运动和强旋转问题;二是如何重建三维几何表面进行在线调整和误差累积消除;三是如何实现高效的全局优化等。

卢策吾:基于三维信息的行为理解

上海交通大学研究员、博士生导师卢策吾介绍了在行为理解和三维视觉的最新进展。行为理解研究主要涵盖Deep RNN、Alphapose and beyond COCO、Interactiveness;三维视觉则包括PointSIFT、Pointwise Rotation-Invariant Network、DBNet。

黄迪:基于三维人脸数据的身份识别与表情分类

北京航空航天大学计算机学院长聘副教授、博士生导师黄迪首先介绍了三维人脸分析技术的发展。他表示,得益以奥比中光为代表的三维数据采集设备制造商的发展,相比过去,以较低成本快速编辑获取高精度的三维数据成为现实,这促进了三维人脸分析技术的进一步发展和应用。由于三维人脸能够直接反映人脸形状信息且能与纹理信息良好互补,目前已成为各机构研究热点。对此,黄迪教授介绍了在三维人脸分析在数据库构建、处理方法、实验评价等方面的研究进展,并对其中涉及的人脸标志点定位,人脸曲面配准、曲面几何表示、和二维三维信息融合等研究内容、以及三维人脸识别和三维人脸表情分类的应用做了详细介绍。

赵启军:三维人脸建模:由图到形的人脸识别

针对目前大热的人脸识别,四川大学计算机学院副教授、博士赵启军在演讲中表示,人脸能够反映我们的很多信息,比如身份、种族、性别、年龄、情绪、注意力和健康状况等等。但是,相比二维人脸图像,获取三维人脸数据仍然要更加昂贵和不便,导致其实际应用依然存在诸多限制。对此,赵启军教授介绍了在由二维人脸图像重建三维人脸形状方面的工作,他表示,他们提出的方法能够利用二维图像生成三维人脸模型,且能够大幅提升人脸识别准确率。赵启军教授认为,随着三维人脸获取和建模技术的快速发展,三维人脸将在越来越多的应用中发挥更加重要的作用。特别是奥比中光的3D传感技术目前已经应用到诸多场景中,对于3D感知领域发展有非常大的促进作用。

郭裕兰:三维场景智能感知与理解

国防科技大学电子科学学院讲师郭裕兰表示,得益于以奥比中光为代表的3D传感企业的快速发展,三维视觉在近年来得到了广泛关注,相比2D图像,三维点云包含了更加丰富的几何、形状和结构信息,从而为场景理解提供了更多可能。对此,郭裕兰详细介绍了其研究组在双目深度估计、三维目标识别以及三维场景标注等方向的研究进展。他认为,未来,3D智能感知与理解在自动驾驶、机器人、VR/AR以及遥感等领域都有大量的应用。

以自身为“桥梁”,打造AI 3D传感“产学研”

论坛现场,来自各高校的研究人员和人工智能企业的研发人员齐聚一堂,与七位学术专家共同探讨三维计算机视觉领域的前沿技术。如今,我国正在稳步推进人工智能产业化进程,在此期间,“产学研”无疑是推动AI理论成果向产业研发应用转化的关键一环。肖振中在论坛致辞中表示,奥比中光十分重视与高校、科研机构的“产学研”合作,承办此次论坛不仅是自身进步的需要,也是推动学科和行业发展的社会责任。

此次论坛的举办为研发人员搭建了AI 3D传感技术交流平台,凸显了奥比中光在AI 3D传感领域的科研地位和学术影响力,今后,奥比中光将进一步加强与产学研各界的合作,并以自身为“桥梁”拉近AI 3D传感产业与学术界的关联,以全自主知识产权技术助力产业升级,以产业需求推动学术进步,助推AI 3D传感科研成果更好地向产品、市场转化。

编辑 刘桂瑶

(作者:读特记者 闻坤 文/图)

评论一下
评论 0人参与,0条评论
还没有评论,快来抢沙发吧!
最热评论
最新评论
已有0人参与,点击查看更多精彩评论