新闻-资讯-生活第一门户 
首页 军事 综合 汽车 健康养生 科技 教育 文化 娱乐 时事 社会 国际 体育 旅游 财经
新闻信息
您的当前位置: 后挂新闻网 > 科技 > 潘云鹤:“视觉知识”推动AI 2.0突破

潘云鹤:“视觉知识”推动AI 2.0突破

2019-11-07 09:29:17 访问:3406

记者韩阳梅

人类对世界认知中大约80%的信息来自视觉。人们希望人工智能能够像人类一样敏锐地观察、识别和预测未来的世界。在中国工程院院士潘云河看来,实现可视化知识表达、推理、学习和应用的技术将是人工智能(ai)2.0突破的重要方向之一。

近日,潘云河首次系统地提出了“视觉知识”的概念,并在接受《中国科学日报》采访时做了详细解释。

中国科学报:你提出视觉知识概念的背景是什么?

潘云河:视觉处理技术对人工智能发展有重要影响。

首先,近年来,图像识别水平的快速提高推动了人工智能热潮的形成。图像识别技术的突破不仅提高了计算机识别人脸、字符、指纹、生物特征和医学图像的准确性,而且进一步推动了智能制造等领域的发展。中国科学院科技发展战略按照技术分类统计了2018年中美人工智能企业的数量。可以看出,一半以上的企业提供并应用图像识别技术。

其次,传统的知识表达方式有明显的缺陷。早期的图像识别和计算机视觉是基于图像处理技术。深度神经网络的使用采用数据驱动的方法学习特征表达式,有效提高了图像分类和识别的准确性。

然而,作为人工智能知识表达的一种方式,深层神经网络难以解释,也无法推理,并且由于训练网络参数的大量识别数据不可避免地会引入数据偏差。因此,我们需要研究一种新的知识表达方式——视觉知识。

这启发我们,数字视觉是推动人工智能发展的一个重要领域。更好的知识表达是促进数字视觉发展的关键技术。克服深层神经网络的缺陷是“视觉知识”研究的关键方向。

中国科学新闻:什么是视觉知识?它的特点是什么?

潘云河:视觉知识是一种新的知识表达形式,可以表达世界的时空结构和变化特征。计算机图形学通过长期发展,为视觉知识的表达和操作提供了技术基础。然而,视觉知识的表达和推理需要在此基础上进行改革和重构。

视觉知识不同于目前人工智能中使用的知识表达方法。视觉概念有典型的类别结构、层次结构和动作结构。视觉概念可以形成视觉命题,包括场景结构和动态结构。视觉命题可以构成视觉叙事。计算机图形结果的重建可以实现视觉知识的表达、推理和操作,计算机视觉结果的重建可以实现视觉知识的学习。

实现可视化知识的表达、推理、学习和使用的理论和技术将是ai 2.0取得突破的重要方向之一。

视觉知识被归类为常识,因为很难用语言符号来表达。然而,过去人工智能研究的主要弱点之一是缺乏对视觉知识的研究。因此,可视化知识的研究和应用将是ai 2.0的一个重要发展方向。

《中国科学报》:如何构建视觉知识体系?

潘云河:视觉知识系统建设和利用首先要解决的问题是视觉知识学习,这也是知识学习的无人区。为了建立一个系统的知识体系,自上而下的设计往往更为必要。在这个过程中,计算机视觉研究成果如三维形状重建为系统的视觉知识学习提供了发展土壤。

然而,视觉知识学习需要进一步深化从视觉形状重构到视觉知识重构的目标,并且还需要对现有的计算机视觉技术进行进一步的研究,例如,重构三维形状的层次结构并定位它们在概念范畴中的位置。

除了视觉概念,我们还应该研究视觉命题和视觉叙事的表达和学习。

中国科学新闻:视觉知识有哪些应用?

潘云河:从视觉识别技术在当前人工智能热潮中的广泛渗透,我们可以推断出视觉知识的应用极其广泛。这里我将举例说明视觉知识的各种应用。

基于知识的识别方法,如用于图像识别。例如,“猫”,根据“猫”视觉概念的典型和类别,采用综合推理方法自动生成猫类别内外的各种大图像数据,并根据类别内外自动识别为正面和负面的例子。然后,用上述示例大数据训练多层神经网络。最后,利用训练好的多层神经网络对图像进行识别。

事实上,视觉知识具有独特的优势,可以提供综合生成能力、时空比较能力和图像显示能力,这些都是文字知识所缺乏的重要能力。它们可以为人工智能在创造、预测和人机集成方面的新发展提供基本动力。

《中国科学报》:关于视觉知识,我们未来还需要关注什么?

潘云河:建立一个可视化的知识词典非常重要,它是一个巨大而实用的知识平台和数据平台。它应该由全球人工智能、计算机图形学和计算机视觉科技工作者共同建设。为了顺利高效地完成可视化知识词典的构建,群体智能组织模式是必不可少的。

快乐十分

© Copyright 2018-2019 kansaikawakami.com后挂新闻网 Inc. All Rights Reserved.