随着中国人工智能的飞速发展,中国企业及学术界人士在世界顶级学术会议上扮演着越来越举足轻重的角色。6月18日,全球计算机视觉及模式识别领域顶级学术会议CVPR 2018(Conference on Computer Vision and Pattern Recognition)在美国盐湖城召开,国内人工智能技术领跑者百度作为重要支持者亮相本届大会,联合举办了大会唯一一场自动驾驶研讨会(Workshop on Autonomous Driving-WAD)。此外,基于大规模自动驾驶数据集ApolloScape展开的Video Segmentation Challenge(视频场景解析挑战赛)也成为本届CVPR的最受关注的挑战赛之一,集结了全球100多家高校及机构团队参加。
此次自动驾驶研讨会上行业大咖云集、干货满满。特斯拉人工智能部门主管Andrej Karpathy、KITTI数据集创始人Andreas Geiger、Lyft工程副总裁Luc Vincent、Waymo技术主管Congcong Li和Chen Wu、Uber自动驾驶部门(ATG)主管Raquel Urtasun、加州大学伯克利分校教授,BDD研究中心副主任Kurt Keutzer 等重量级专家同台交锋,就自动驾驶未来发展进行了前沿分享和深入探讨,搭建了自动驾驶产学研界沟通的桥梁。此外,ApolloScape还在6月18日晚上举办一场精致的晚宴,邀请计算机视觉界极具创新想法和实践精神的研究人员、开发者和合作伙伴出席,进行进一步的分享交流。
ApolloScape活动现场,杨睿刚,Lyft工程副总裁Luc Vincent,Gerard Medioni, 南加州大学教授/Amazon Director of Research, Ramin Zabih, 康纳尔大学教授/Computer Vision Foundation主席
自动驾驶研讨会联合主席, 百度机器人与自动驾驶实验室负责人杨睿刚教授介绍到,在自动驾驶开发测试中,海量、高质的真实数据是必不可缺的“原料”。但是,少有团队有能力开发并维持一个适用的自动驾驶平台,长期的,系统的收集和标注新数据,因此行业亟需一个数据量充沛、标注详实的自动驾驶专用数据平台。今年3月,百度大规模自动驾驶数据集ApolloScape应需开放,致力于为全世界自动驾驶技术研究者提供更为实用的数据资源及评估标准。据介绍,ApolloScape目前行业内环境最复杂、标注最精准、数据量最大的三维自动驾驶公开数据集。
ApolloScape 活动现场
感知能力是自动驾驶亟待攻克的方向之一,而语义理解则能帮助更加准确地解析目标场景对象。但是,图像的语义标注需要耗费大量的财力和人力,因此业内目前能够用于语义分割的标注图像数据极其有限。因此,被标注的图像数据量和场景组合成为衡量一个数据集复杂性和实用性的重要依据。目前,ApolloScape已经开放了14.7万帧的像素级语义标注图像,包括感知分类和路网数据等数十万帧逐像素语义分割标注的高分辨率图像数据,以及与其对应的逐像素语义标注, 并将进一步涵盖更复杂的环境、天气和交通状况,添加更多的传感器来扩充数据的多样性。并且,ApolloScape的标注精细度上超过同类型的KITTI,Cityscapes数据量,也超过UC Berkley最新发布的BDD100K。因为对于任何数据集,标注数据量和场景组成,共同决定了数据复杂度和实际的可用性。
KITTI | Cityscapes | Mapillary | BDD100K | ApolloScape | ||||
原始的数据量 | 14,999 | 25,000 | 25,000 | 120,000,000 | 143,906 | |||
标注的数据量 (矩形框级别) | 14,999 | 无 | 无 | 100,000 | 无 | |||
标注的数据量 (像素级别) | 400* | 5,000精确 20,000粗略 | 25,000 | 10,000 | 143,906 | |||
场景复杂度 (每张图平均) | 矩形框级别 | 像素级别 | 像素级别 | 矩形框级别 | 像素级别 | |||
人: 0.8 车: 4.1 | 人: 7.0 车: 11.8 | 未知 | 人: ~1.3 车: ~11.0 | 难度 | 易 | 中 | 难 | |
人 | 1.1 | 6.2 | 16.9 | |||||
车 | 12.7 | 24.0 | 38.1 | |||||
多样性 | 好/中等天气条件 白天 | 50个城市 好/中等天气条件 白天 | 6大洲 多样的天气条件 白天和夜晚 非常多样 | 美国的4个区域 多样的天气条件 白天和夜晚 非常多样 | 中国2个城市的4个区域 多样的天气条件 白天 独特的Tricycle类别 | |||
三维信息 | 有(三维矩形框级别) | 无 | 无 | 无 | 有(三维点级别) | |||
视频标注 | 有(矩形框级别) | 无 | 无 | 无 | 有(像素级别) | |||
车道线信息 | 无 | 无 | 有(仅二维) 2类 | 有(仅二维) 8类 | 有(二维和三维) 28类 | |||
地理定位 | 厘米级精度 | 未知 | 城市级别精度 | 米级精度 | 厘米级精度 |
除了研讨会,每届大会的挑战赛也备受关注,可谓是全球计算机视觉研发人员踊跃参与的极客“世界杯”。在CVPR自动驾驶研讨会上,百度和BDD合作发起了4项任务挑战赛,其中,基于ApolloScape数据集,在国外知名机器学习竞赛平台Kaggle上线Video Segmentation Challenge(视频场景解析挑战赛),成为本届CVPR的最受关注的挑战赛之一。据悉,本届CVPR仅挑选了4个挑战赛与Kaggle进行合作,ApolloScape的Video Segmentation Challenge便是其中之一,吸引了145只国内外队伍参赛。据悉,挑战赛获奖队伍会在美国时间22日的自动驾驶研讨会现场进行成果分享。
据悉,ApolloSpace接下来将为数据集拓展更多类型、更多属性的数据:通过添加红外图像,帮助自动驾驶算法更容易进行夜间检测;提取更稠密的轨迹信息,用于对驾驶行为进行建模;以及通过众包模式采集立体视觉的驾驶特殊事件图像。此外,ApolloScape未来还将增加美国的相关数据。
随着合作伙伴以及开发者络绎不绝地加入,作为世界上唯一的像素级的、连续视频三维数据集,ApolloSpace将成规模地获取更多数据并从中汲取经验,涵盖更为丰富、复杂的全球化场景,支持自动驾驶技术的落地应用及产业发展。同时,Apollo也正联手越来越多的合作伙伴和开发者,持续创新,将自动驾驶、智能网联技术渗透、落地至各个场景之中,掀起汽车产业的智能化革命。
来源:第一电动网
本文地址:https://www.d1ev.com/news/qiye/70606
文中图片源自互联网,如有侵权请联系admin#d1ev.com(#替换成@)删除。