Google发布超过500万张图片的地标识别资料集,A

伟德国际1946网页版首页 1

Google这段日子公布了用来训练地方统一规范识别模型的新版资料集Landmarks-v2,比从前率先版的资料集更加大,含有超过20万个不等地方统一规范,500万张以上的图像,资料量是首先版的2倍,除外,谷歌(Google卡塔尔国还颁发两项新的Kaggle挑战,分别是Landmark Recognition 2019和Landmark Retrieval 2019,为了加快实体识其他研商,还将物体识别技艺Detect-to-Retrieve开源发表。

机械之心发布

新智元报纸发表

伟德国际1946网页版首页 2

源点:百度飞桨

来源:venturebeat

GoogleLandmarks是天下最大之处统一规范识别资料集。在成立Landmarks-v2资料集的长河中,此中黄金时代项挑衅就是要为地方统一标准生成标签,由于标志者不可能为数百万张地方统一标准影象标识,Google透过全球外省的水墨艺术家一起努力,来解决这项难点,各种壁画师都熟习他们所在地之处统一标准,让这么些水墨画家为图片标志标签。

这段时间,百度视觉团队依据飞桨(PaddlePaddle卡塔 尔(英语:State of Qatar)深度学习平台,自己作主研究开发之处统一标准检索/识别设计方案,在 Google Landmark Retrieval 20191] 和 Google Landmark Recognition 20192] 多个职分中都斩获第二名,并受邀在微管理机视觉领域的世界级学术会议 CVPENVISION 2019 上开展技能分享。

编辑:元子

而Google新公布的两项Kaggle挑衅,要邀约机器学习的爱好者和研究员参预,Landmark Recognition 2019的靶子是要识别出输入图片的地方统一标准,Landmark Retrieval 2019挑衅则是要寻找全体包罗该地方统一规范的图样,这两项挑衅总共祭出5万澳元的奖金,获胜的行伍将会受邀至CVPTiguan2019研究切磋会公布使用办法。

Google 二〇一七年更新了眼下最大的人工和自然地方统一标准识别数据集,公布了 Google-Landmarks-v2,数据聚集满含超越 400 万张图纸,描述了 20 万处项目地方统一标准。操练多少还未有通过精美女工标记,种类数目严重不均衡,同八个地方统一规范的图像遭到拍片角度、遮挡、天气以致光线等影响非常大,同有的时候常候蕴涵多量非地方统一标准数据,符合实况,特别富有挑战性。基于此数据集,今年合计吸引全世界超过300 支军队参预了 Google 主办的地标检索识别比赛。

谷歌(Google卡塔 尔(阿拉伯语:قطر‎最大之处统一标准数据集更新,开源的Google-Landmarks-v2满含500万张图纸和200400个地方统一标准。同不经常候设立两项总奖金5万澳元的交锋,鼓劲更加多人来为该品种遮风避雨。

别的,谷歌(Google卡塔 尔(阿拉伯语:قطر‎也开源发表物体识其余新技艺Detect-to-Retrieve,Google利用物体侦测模型的边界框(bounding boxes卡塔 尔(英语:State of Qatar),给与含有指标项目物体的印象区域额外的权重,该办法大幅度地晋级了模型的准确率,谷歌(Google卡塔尔国公布的模子是由此原来的Google-Landmarks资料集聚,含有86,000张图纸的子资料集来练习。

伟德国际1946网页版首页 3

尼亚加拉大瀑布和金桔树大瀑布无论在地理地方依旧在照片里的突显形态都以莫衷一是的。谷歌AI部门希望AI不仅可以够区分出两者,同有时候还相应将各自对应的坐标志别出来,无论照片中的大瀑布是右边照、正面照还是航拍照。

图 1 一些地方统一规范示例图像以致 top5 的寻觅结果

二〇一八年,谷歌发表了Google-Landmarks,那是随时世界上最大之处统一标准数据集,并开设了两场较量:Landmark Recognition 2018和Landmark Retrieval 2018,有500多名机器学习探究人口列席。

地方统一标准检索职分关心给定一张图像,须要找到给定数据库中负有同生龙活虎的地方统一标准图像。评估数据超越10 万张待查询图像,以至接近 80 万的追寻数据库 。

不到一年的时候,Google就开源了它的升高版:Google-Landmarks-v2。这是多少个新的、具有更加大地方统一规范识别语料的库,包罗的肖像数量是初代的两倍、地方统一标准数据量是初代的七倍。从今现在,谷歌(Google卡塔尔国朝着更头昏眼花之处统一标准检查测验计算机视觉模型的对象迈出了第后生可畏的一步。下图为谷歌(Google卡塔 尔(英语:State of Qatar)-Landmarks-v第22中学地方统一标准地方的热图

地方统一标准识别职务关心给定一张图像,标注该图疑似不是地方统一标准,倘诺是地方统一标准,需求证明其在 20 万种地方统一标准的花色。

伟德国际1946网页版首页 4

评估数据与地方统一规范检索职务的待查询图像相像,据竞技完推算,此中有地方统一规范的图像不到 2004 张。当前,百度视觉团队的受奖方案已经付诸到 arxiv 上,何况在 Github 上开源代码。上边将为大家详细解读。

随后,Google又在机器学习社区Kaggle上,推出了两项新的挑衅:Landmark Recognition 2019和Landmark Retrieval 2019 ,并揭发了Detect-to-Retrieve的源代码和模型,那是三个区域图像检索框架。

舆论地址:

Landmark Recognition 2019的参Gaby赛者供给统筹地方统一规范检查评定AI模型,Landmark Retrieval 2019的参Gaby赛者要求利用叁个AI系统,寻找钦赐地方统一典型关联的图像。两项赛事都不外乎总额为50000法郎的新大器晚成款表彰,获胜团队还将获邀插手CVPLacrosse2019的研究探究会。

开源项目地址:

伟德国际1946网页版首页 5

地方统一标准检索实施方案

谷歌 AI软件技术员Bingyi Cao和托比亚斯Weyand说:“实例识别和图像检索形式都急需更加大的数据集,包罗图像数据和各样标识,以便练习出越来越好、越来越强有力的系统。大家期望以此数据集能够协助拉动实例识别和图像检索方面包车型大巴新星手艺。”

在地方统一标准检索竞赛中,大家运用ImageNet预演习的模子参数作早先化,然后在 GLD v2(Google Land马克 Dataset V2卡塔 尔(阿拉伯语:قطر‎上进展操练。互连网布局上,大家接纳了 ResNet 152 4 ResNet200 4 SE_ResNeXt152 5] 和 Inception V46] 作为主导网络。在那之中 ResNet 类别都以依据故事集 3],使用了 ResNet_VD 的修改版本,那 4 个模型在 ImageNet 上的 1000 分类义务上 top1 的正确率分别为 80.54%,80.93%,81.百分之四十 和 80.77%。那一个模型及演习方法都早已在飞桨的 Github 图像分类项目中开源 7]。

伟德国际1946网页版首页 6

伟德国际1946网页版首页 7

依照Bingyi和Weyand的说法,谷歌-Landmarks-v2包蕴了逾越500万张来自世界各州油戏剧家搜聚的20多万个例外市标的图像,然后将照片里的图像举行标明,比方新天鹅堡、金门大桥、干净的水寺、哈利法塔、狮身人面像、马丘比丘和其余着名景点,最后Google的斟酌人口用来自Wikimedia的免费能源,比如图像、音频及任何项指标媒体文件,来补偿历史和不为人知的图像。

图 2 地方统一标准检索职责设计方案流程图

那正是说Detect-to-Retrieve框架又是用来干什么的吧?Bingyi和Weyand表示,已发布的、由原本地方统一标准数据集中的80000个子集进行练习的模型,利用来自物体格检查测模型的边界框,来为包蕴感指标项目标图像区域提供“额外的权重”,进而可以显着的增高准确性。

在教练检索特征进程中,为了使特征紧凑,通过风姿浪漫层全连接将骨干网的出口(不带有 softmax 分类全连接层以现今后的网络卡塔 尔(阿拉伯语:قطر‎映射到 512 维,同一时候使用 arcmargin loss8] 替换古板的 softmax loss,调节演习图像分辨率为 448*448,进一层晋级模型特征的表明工夫。别的,竞技进程中还依据 Npairs Loss9]伟德国际1946网页版首页,,以至将 index 集合的 80 万张图像聚类后加盟演习,学习更三种区别维度的特色,进步整类别统的泛化技艺。全体操练检索特征的代码也生机勃勃度在飞桨的 Github 度量学习项目中开源 10]。

伟德国际1946网页版首页 8

在化解方案中,除了底工特征外,检索计策还使用了 Query Expansion11] 和 Database Augmentation 战术。不一致于古板的 QE 和 DBA,在选拔平均队列中,进一层加入了 Local feature 重排和归类重排。Local feature 能够拉回一些角度,尺度转变大的 Case,如图 3 所示。

现阶段以此数据集独有演习集开放下载。测量检验集等会随着挑战赛的进展而稳步开放。

伟德国际1946网页版首页 9

数据集:

图 3 局地特征效果示例

其它,比赛中,还依据全量数据演习了归类模型,通过分类 rerank 来一发晋级查找目的。分类可以拉回一些跨域的图样,比方一张 test 图片能够拉回相应地方统一标准的老照片等。在分拣重排的时候,使用了多分拣投票的计策,投投票选举择了 test 和 index 图片的类型,进而每一张 test 图片供给 index 库时候,把相近类别的图片前置。利用分类和 Local feature 实行重排后,能更为进步 QE 和 DBA 的效果。具体的效用如表 1 所示。

挑战赛:

地方统一标准检索任务评估指标接收 mAP@100,详细定义参谋 Google Landmark Retrieval 20191] 官方表明

伟德国际1946网页版首页 10

{"type":2,"value":"

表 1 不一模型和政策的搜寻效果

本文由韦德娱乐1946发布于韦德娱乐1946,转载请注明出处:Google发布超过500万张图片的地标识别资料集,A

您可能还会对下面的文章感兴趣: