首页 科技内容详情
​我国突破智能视觉计算技术,为智能安防等提供了强有力的保障

​我国突破智能视觉计算技术,为智能安防等提供了强有力的保障

分类:科技

网址:

SEO查询: 爱站网 站长工具

点击直达

智能视觉计算是实现智能视频监控的核心技术,是保障国家、人民生命财产和“一带一路”国际战略实施所必需的战略技术。面向复杂环境下的智能视觉计算是国际公认难题,由于欧美等国技术封锁,我国一直尚难取得技术突破。


计算机视觉的应用领域几乎涵盖了我们所知的所有行业,如自动驾驶、金融风控、安防、新零售、智能手机、智能机器人.....据IDC预测,中国人工智能市场将在2024年形成千亿市场规模,而计算机视觉占比将超过一半,未来广阔前景引人遐想。


1、天津大学突破了复杂环境下的智能视觉计算关键技术


日前,天津大学刘安安教授主持完成的“复杂环境智能视觉计算关键技术及应用”项目突破了技术封锁,并获得天津市人民政府颁发的2021年度天津市科技进步特等奖。

该项目突破了复杂环境下的智能视觉计算关键技术,形成了从理论方法、技术、产品到标准的成套创新技术。据刘安安教授介绍,该研究的创新点主要有三点:


1)针对低照度下采集图像对比度低、噪声强导致的视觉感知难题,建立了结构一致性的图像增强模型,提出了多噪声联合修复方法,开发了智能视频采集设备,实现了低照度视觉清晰感知;


2)针对跨视角下视觉外观多样导致的目标识别和跟踪难题,构建了跨视角共嵌空间模型,建立了跨视角相似性度量机制,提出了时空约束的多目标关联方法,开发了跨视角视觉分析软件,实现了独立于外源信息的宽视域多目标跟踪;


3)针对多场景下视觉事件模式复杂导致的语义理解难题,构建了多语义关联引导的语义模型,发明了多尺度融合的姿态识别方法,提出了时空注意力引导的视觉描述生成方法,开发了多场景视觉语义分析软件。


该项目成果经专家组鉴定认为“该项目整体技术达到国际先进水平,其中多场景视觉语义理解技术达到国际领先水平”。


项目产品获国际安博会金鼎奖,已在北京、新疆等全国二十余个省以及厄瓜多尔等十余个国际工程广泛应用,服务于反恐维稳、治安防控、司法监管等领域,为保护国家、人民生命和财产安全,建设“平安中国”及推动“一带一路”国际战略工程实施提供了强有力的技术保障,为我国智能安防技术进步贡献了“天大的力量”。


2、计算机视觉


那么究竟何谓计算机视觉呢?计算机视觉是使用计算机及相关设备对生物视觉的一种模拟。它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息,就像人类和许多其他类生物每天所做的那样。


计算机视觉是一门关于如何运用照相机和计算机来获取我们所需的、被拍摄对象的数据与信息的学问。形象地说,就是给计算机安装上眼睛(照相机)和大脑(算法),让计算机能够感知环境。我们中国人的成语"眼见为实"和西方人常说的"One picture is worth ten thousand words"表达了视觉对人类的重要性。不难想象,具有视觉的机器应用前景能有多么地宽广。


计算机视觉既是工程领域,也是科学领域中的一个富有挑战性的重要研究领域。它是一门综合性的学科,已经吸引了来自各个学科的研究者参加到对它的研究之中。其中包括计算机科学和工程、信号处理、物理学、应用数学、统计学、神经生理学和认知科学等。

3、计算机视觉的应用


您每天使用的许多应用程序都采用计算机视觉技术。Google使用它来帮助您在图片库中搜索对象和场景(例如“狗”或“日落”)。


其他公司使用计算机视觉来帮助增强图像。一个实例是AdobeLightroomCC,它使用机器学习算法来增强缩放图像的细节。传统缩放使用插值技术为放大区域着色,但是Lightroom使用计算机视觉来检测图像中的对象并在放大时锐化其功能。


由于计算机视觉的进步,面部识别是一个取得显着进展的领域。苹果使用面部识别算法来解锁iPhone。Facebook使用面部识别来检测您在线发布的图片中的用户(尽管并非每个人都是粉丝)。在国内,许多超市现在都提供面部识别支付技术,从而使客户无需再掏手机和钱包。


面部识别技术的进步也引起了隐私和权利倡导者的担忧,尤其是在不同国家的政府机构正在使用它进行监视时。


内容审核是计算机视觉的另一个重要应用。Facebook、百度灯等公司必须每天审查数十亿条帖子,并删除包含暴力,极端主义或色情内容的图像和视频。大多数社交媒体网络使用深度学习算法来分析帖子并标记包含被禁止内容的帖子。


进入更专业的领域,计算机视觉正迅速成为医学中必不可少的工具。深度学习算法在分析医学图像方面显示出惊人的准确性。医院和大学正在使用计算机视觉通过检查X射线和MRI扫描来预测各种类型的癌症。


自动驾驶汽车还严重依赖计算机视觉来了解周围环境。深度学习算法可分析来自安装在车辆上的摄像头的视频,并检测人,汽车,道路和其他物体,以帮助汽车导航其环境。

4、计算机视觉的局限性


当前的计算机视觉系统在经过足够的示例训练后,在对图像分类和定位照片中的对象方面做得不错。但从本质上讲,支持计算机视觉应用程序的深度学习算法正在匹配像素模式。他们对图像中发生的事情一无所知。


理解视觉数据中人与物体之间的关系需要常识和背景知识。这就是为什么社交媒体网络使用的计算机视觉算法可以检测裸露的内容,但是却常常难以分辨安全的裸露内容(母乳喂养或文艺复兴时期的艺术)与色情内容之类的违禁内容之间的区别。同样,这些算法很难说出极端主义宣传与关于极端主义团体的纪录片之间的区别。


当人们面对前所未有的情况时,他们可以利用他们对世界的广泛了解来填补空白。与人类不同,计算机视觉算法需要对必须检测的对象类型进行彻底的指导。一旦他们的环境中包含偏离训练样例的事物,他们便开始以不合理的方式采取行动,例如未能检测到停在奇特位置的紧急车辆。


目前,解决这些问题的唯一解决方案是在越来越多的实例上训练AI算法,希望更多数据能够涵盖AI面临的每种情况。但是,正如经验表明的那样,在没有情境意识的情况下,总会出现极端情况,即使AI算法感到困惑的罕见情况。


许多专家认为,只有创造能够以与人类相同的方式解决问题的人工智能,人工智能才能实现真正的计算机视觉。正如计算机科学家和AI研究人员梅拉妮·米切尔(MelanieMitchell)在她的《人工智能:思考人类的指南》一书中所说:“似乎视觉智能与其他智能(尤其是常识,抽象和语言)并不容易分开……此外,它可能是人类视觉智能所需要的知识……无法从网上下载的数百万张图片中学到,而必须在现实世界中以某种方式进行体验。”


主要来源:天津大学招生办,青瑞教育,弘讯观察


注:文章内的所有配图皆为网络转载图片,侵权即删!

 当前暂无评论,快来抢沙发吧~

发布评论