计算机视觉（Computer Vision）简介及其子任务、模型、数据集

计算机视觉

Computer Vision

计算机视觉是一个跨学科的科学领域，涉及到计算机如何从数字图像或视频中获得高水平的理解。从工程的角度来看，它试图理解人类视觉系统能够完成的任务并使之自动化。计算机视觉任务包括获取、处理、分析和理解数字图像的方法，以及从现实世界中提取高维数据以产生数字或符号信息，例如以决策的形式。

这里的理解意味着将视觉图像（视网膜的输入）转化为对世界的描述，使思维过程有意义并能引起适当行动。这种图像理解可以被看作是利用借助几何学、物理学、统计学和学习理论构建的模型将符号信息从图像数据中分离出来。计算机视觉这门科学学科关注的是从图像中提取信息的人工系统背后的理论。图像数据可以有多种形式，如视频序列、来自多个摄像头的视图、来自三维扫描仪或医疗扫描设备的多维数据。计算机视觉的技术学科寻求将其理论和模型应用于计算机视觉系统的构建。

——来自维基百科