38c63.com快速飞艇罗意强视觉设计麻省理工学院的

2019-04-27 12:17| 发布者: | 查看: |



相关推荐:



  多年来,科学家一直在努力教电脑如何看待人类,最近的研究似乎表明计算机在识别视觉对象方面取得了进展

  然而,麻省理工学院的一项新研究提醒说,这种明显的成功可能会产生误导,因为所使用的测试无意中堆积在一起,有利于计算机

  计算机视觉对于从“智能”汽车到盲人视觉修复的应用非常重要。最近的计算模型显示出了令人印象深刻的进步,在对自然摄影图像集进行分类方面拥有60%的成功率。其中包括广泛使用的Caltech101数据库,旨在测试计算机视觉算法,以防止在现实世界中看到的各种图像

  然而,麻省理工学院麦戈文脑研究所的神经科学家詹姆斯迪卡罗,哈佛大学罗兰研究所的研究生尼古拉斯平托和大卫考克斯认为,这些图像集存在设计缺陷,使得计算机能够在失败的情况下取得成功 - 真实变化的图像。例如,摄影师倾向于将对象置于框架中心并且偏好某些视图和上下文。相比之下,视觉系统在更广泛的条件下遇到物体

  “我们识别视觉对象的难易程度掩盖了这项壮举的计算难度,”该研究的高级作者,1月25日PLoS计算生物学在线版的解释说。“核心挑战是图像变化。任何给定的物体都可以根据其位置,距离,方向,光线和背景将无数的图像投射到视网膜上。”

  该团队通过使用一个简单的“玩具”计算机模型揭示了当前计算机对象识别测试中的缺陷,该计算机模型受到大脑视觉通路中最早步骤的启发。具有类似于大脑初级视觉皮层中的属性的人工神经元分析图像中的每个点并捕获关于线边界的位置和方向的低级信息。该模型缺乏在视觉处理的后期阶段中发生的更复杂的分析,以提取关于视觉场景的更高级特征的信息,例如对象之间的形状,表面或空间

  研究人员将这种模型视为一个稻草人,期望它作为建立基线的一种方式失败。然而,当他们在Caltech101图像上进行测试时,该模型的表现非常出色,其性能与五种最先进的物体识别系统相似或更好

  怎么会这样?“我们怀疑当前计算机视觉测试中所谓的自然图像并没有真正涉及可变性的核心问题,38c63.com快速飞艇罗意强而且我们对使物体难以识别或容易识别的直觉是不正确的,”Pinto解释道

  为了测试这个想法,作者设计了一个更仔细控制的测试。仅使用两个类别 - 飞机和汽车 - 他们引入了位置,大小和方向的变化,更好地反映了现实世界中的变化范围

  “只有两种类型的物体可以区分,这种测试对于玩具计算机模型应该更容易,但事实证明它更难,”考克斯说。该团队的结论是:“我们的模型在Caltech101图像集上表现不错,不是因为它是一个很好的模型,而是因为自然图像无法充分捕捉现实世界的变化。”

  因此,研究人员主张改进计算机视觉社区使用的当前标准和图像,以比较模型和衡量进展。他们说,在计算机能够接近人类大脑的表现之前,科学家们必须更好地理解为什么物体识别的任务如此困难以及大脑的能力如此令人印象深刻

  免责声明:本网站图片,文字之类版权申明,因为网站可以由注册用户自行上传图片或文字,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除

  Tayzu Robotics与Verizon Wireless合作进行大规模数据收集

  对于Verge读者来说翻新的Google Pixel 3s和Pixel 3 XL比以往任何时候都便宜

<
>
快速飞艇网成立于2014年,我们是一家专注用户体验设计开发与互联网品牌建设的设计公司,创立至今为2000多位客户提供了创新与专业的设计方案。设计服务范围包括:交互原型设计、产品视觉设计、网站设计与开发建设、移动及软件产品界面设计、图标设计、品牌及平面设计等。

联系我们

江苏省南京市玄武区玄武湖

13588889999(服务时间:9:00-18:00)

admin@adminbuy.cn

在线咨询 官方微信官方微信

部门热线

前   台:13588889999
业务部:13588889999
客服部:13588889999
技术部:13566667777
人事部:13566667777

网站建设 微信开发 售后服务 咨询电话13588889999 返回顶部
返回顶部