陈根:计算机视觉——模拟人类视觉系统 2024-06-15 00:37:04 文/陈根 作为智能世界的双眼,计算机视觉是人工智能技术里的一大分支。计算机视觉通过模拟人类视觉系统,赋予计算机“看”和“认知”的能力,是计算机认识世界的基础。确切地说,计算机视觉技术就是利用了摄像机以及电脑替代人眼使得计算机拥有人类的双眼所具有的分割、分类、识别、跟踪、判别决策等功能,是创建了能够在 2D的平面图像或者 3D的三维立体图像的数据中,以获取所需要的“信息”的一个完整的人工智能系统。计算机视觉利用成像系统代替视觉器官作为输入手段,利用视觉控制系统代替大脑皮层和大脑的剩余部分完成对视觉图像的处理和解释,让计算机自动完成对外部世界的视觉信息的探测,做出相应判断并采取行动,实现更复杂的指挥决策和自主行动。 作为人工智能最前沿的领域之一,视觉类技术是人工智能企业的布局重点,具有最大的技术分布。计算机视觉40多年的发展中,人们提出了大量的理论和方法。总体来看,可分为三个主要历程。即马尔计算视觉、多视几何与分层三维重建和基于学习的视觉。1982 年,马尔(David Marr)在其《Vision》一书中提出的视觉计算理论和方法,标志着计算机视觉成为了一门独立的学科。马尔计算视觉理论包含二个主要观点:首先,马尔认为人类视觉的主要功能是复原三维场景的可见几何表面,即三维重建问题;其次,马尔认为这种从二维图像到三维几何结构的复原过程是可以通过计算完成的,并提出了一套完整的计算理论和方法。因此,马尔视觉计算理论在一些文献中也被称为三维重建理论。马尔计算视觉认为,从二维图像复原物体的三维结构,涉及三个不同的层次。首先是计算理论层次,也就是说,需要使用何种类型的约束来完成这一过程。马尔认为合理的约束是场景固有的性质在成像过程中对图像形成的约束。其次是表达和算法层次,也就是说如何来具体计算。最后是实现层次,马尔对表达和算法层次进行了详细讨论。马尔认为,从二维图像恢复三维物体,经历了三个主要步骤,即图像初始略图(sketch)物体到2.5维描述,再到物体3维描述。其中,初始略图是指高斯拉普拉斯滤波图像中的过零点(zero-crossing)、短线段、端点等基元特征。物体2.5维描述是指在观测者坐标系下对物体形状的一些粗略描述,如物体的法向量等。物体3维描述是指在物体自身坐标系下对物体的描述,如球体以球心为坐标原点的表述。马尔计算视觉理论在计算机视觉领域的影响是深远的,他所提出的层次化三维重建框架,至今是计算机视觉中的主流方法。80 年代开始,计算机视觉掀起了全球性的研究热潮,方法理论迭代更新,主要得益于二方面的因素:一方面,瞄准的应用领域从精度和鲁棒性要求太高的“工业应用”转到要求不太高,特别是仅仅需要“视觉效果”的应用领域,如远程视频会议(teleconference)、考古、虚拟现实、视频监控等。另一方面,人们发现,多视几何理论下的分层三维重建能有效提高三维重建的鲁棒性和精度。在这一阶段,OCR和智能摄像头等问世,并进一步引发了计算机视觉相关技术更为广泛的传播与应用。80年代中期,计算机视觉已经获得了迅速发展,主动视觉理论框架、基于感知特征群的物体识别理论框架等新概念、新方法、新理论不断涌现。90年代,计算机视觉开始在工业环境中得到广泛的应用,同时基于多视几何的视觉理论也得到迅速发展。90 年代初,视觉公司成立,并开发出第一代图像处理产品。而后,计算机视觉相关技术就被不断地投入到生产制造过程中,使得计算机视觉领域迅速扩张,上百家企业开始大量销售计算机视觉系统,完整的计算机视觉产业逐渐形成。在这一阶段,传感器及控制结构等的迅速发展,进一步加速了计算机视觉行业的进步,并使得行业的生产成本逐步降低。进入21世纪,计算机视觉与计算机图形学的相互影响日益加深,基于图像的绘制成为研究热点。高效求解复杂全局优化问题的算法得到发展。更高速的 3D 视觉扫描系统和热影象系统等逐步问世,计算机视觉的软硬件产品蔓延至生产制造的各个阶段,应用领域也不断扩大。当下,计算机视觉作为人工智能的底层产业及电子、汽车等行业的上游行业,仍处于高速发展的阶段,具有良好的发展前景。 赞 (0) 相关推荐 人脑与卷积神经网络的诡异对应,识别三维图形反应模式非常相似 新智元发布时间:10-2714:00万象大会年度获奖创作者,新智元官方帐号新智元导读]一直以来,神经网络可以让我们了解我们的大脑,就像我们利用我们对大脑的了解来开发新的神经网络一样.近日,有研究团队发 ... 你想知道的这都有!一文带你快速了解计算机视觉 导语:计算机视觉(Computer Vision, CV)作为人工智能(AI)的核心技术之一,在过去的三十年里发展迅猛,应用范围遍及工业.农业.军事.国防等多个领域.本报告将一步到位,从基础概念到技术 ... 陈根:压电聚合物系统,实现高效给药 文/陈根 慢性病的给药需要随着时间的推移优化药物剂量,以达到最佳的治疗效果.然而,传统的给药往往很难控制释放速度.更糟糕的是,还可能出现重复给药.体内非特异性生物分布.以及细胞毒性高等问题. 目前,大 ... 陈根:探索人类寿命极限,进一步追求生命永续 文/陈根 追求生命永续是人类长期以来的愿景. 现代医学开创了全新的局面,改变了人与其自身,与疾病.苦难和死亡的联系,在过去的三百年里,在欧洲中部,即便是不同社会阶层的成员,平均预期寿命都大幅提高,在2 ... 陈根:从人类到墨鱼,都可“延迟满足” 文/陈根 人们常言,遇事要看长远,不满足当下,要坚持长期价值,因为长期价值能让我们未来获得更好的收益,而不是短期收益.这也就是所谓的"延迟满足".即放弃眼前立即可获得的奖赏,目的是 ... 陈根:可穿戴机器人系统,让中风患者康复更快 文/陈根 可穿戴技术,即一种将多媒体.无线通信.传感等技术相融合,嵌入到人们日常穿戴中的新型人机交互方式.因为可穿戴设备体积小.功耗低.使用简便.可移动操作等特点,其也被称为继手机后的下一个风口,ID ... 陈根:CasMINI基因编辑系统,更精准、更有效 文|陈根 CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)是原核生物基因组内的一段重复序列,是生命进化历史上,细菌和病 ... 陈根:机器专家,模拟人类专家 文/陈根 自从1965 年世界上第一个专家系统 DENDRAL问世以来,专家系统的技术和应用,就在短短的30 年间获得了长足的进步和发展.尤其是在80年代中期以后,随着知识工程技术的日渐丰富和成熟,各 ... 陈根:解密“臭美”之迷,人类为何“臭美”? 陈根 知名科技作家为你解读科技与生活的方方面面.05-07 09:58 文/陈根 自我面孔对人类来说有着重要的意义,它代表着一个人的身份以及自我感知.事实上,人类"看脸"这个基本需 ... 陈根:能源的逻辑背后,是人类文明的演进 文/陈根 煤炭和石油的发现与利用使人类告别了农耕文明,进入了工业文明.200多年化石能源的使用,在给人类社会带来巨大进步的同时,也给人类社会造成了日益严峻的环境问题和气候问题.不可再生能源紧缺的全球危 ... 陈根:数字的人类,永生的未来 文/陈根 自古以来,有关于生死的命题都是人世间最难解的悲情,以至于长生不老甚至实现永生成为人们超现实的渴望和追求. 千百年来,人类对于永生的追求从未停止.前有秦始皇大兴土木,迷信长生不老之术,甚至耗费 ...