如何将多目标检测用于建筑平面图? | MixLab智能建筑

在建筑平面图的分析中,一些复杂的平面图总是会让人感到头晕脑胀,不同的标注方式以及不同的图形符号更难以让普通人去解读。

5种不同图形符号的浴缸以及真实场景中具有的遮挡,标注等信息

有时,图形符号又会极其简单,对于人类来说对此的解读会显得十分容易,但对机器来说又会变得毫无特征进而无法分析。

信息量较少的图形:入口门,壁橱门,冰箱和洗碗机

在本文中,作者通过利用前沿的深度学习技术,并改编基于YOLOv2架构的对象监测框架来解决上述所有问题。

-- workflow

输入图像->图像分块->YOLOv2处理->阈值处理->图像整合

是不是看起来很简单,但事实并非如此

- 数据集

首先是数据集的准备,带注释的图纸数据集很难获得,网上很少有公开的,对于建筑平面图而言尤其如此,这是因为知识产权经常会限制其使用和发布。

想尽一切办法解决数据集的问题后,面临的是数据拆分与数据清洗。因为图像识别是无法直接检测pdf类型的图纸的,所以首先需要将pdf转换成DPI图像,并针对建筑的符号类型进行标注,例如浴室、水槽、窗户、以及电器。

浴室水槽,进门,单折叠门,双折叠门,浴缸,淋浴等

- 预处理

在处理建筑平面图图像时,我们会面临几个问题。

首先,平均一张平面图的尺寸为5400×3600像素,而单个物体符号非常小(可能只有70x 80像素)。若对模型直接投喂一整张图片的话,很多符号可能都会在CNN的输出特征图中消失。

此外,平面图图像具有不同的长宽比,若按照CNN架构的要求将其调整为固定大小,将会极大地改变了符号形态,从而降低了分类性能。

那么,我们可以通过图像切片与平铺进行处理数据集,可解决上述问题。并且还可以有效的扩充数据集。

通过图像平铺策略进行数据增强。会发现符号出现在图块内的各个位置,同时其中还包括其他各种符号。

- 训练网络

对比YOLOv3和YOLOv2,虽然YOLOv3能够更好的预测和特征提取,但相对来说会使模型变的缓慢。而YOLOv2相比YOLO有着更好的召回与精度,在这样的监测中可以保证精度的同时,不会让模型运行变得太慢。

最后,对于重叠检测,我们比较所有对边界框。如果它们的重叠大于阈值(较小边框的大小的百分比),则保留具有最高分类分数的边框。如果分数接近,则选择较大的边界框,并删除较小的边界框。

重叠检测,选取10%阈值的结果

在实际数据集中检测到的各种级别的遮挡和重叠:

实际的建筑平面图检测结果

让小白也能看得懂的建筑图


本文所涉及的技术资料

欢迎加入星球获取~ 

(0)

相关推荐

  • 揭晓高速公路场景下计算机视觉与交通的秘密

    高速公路场景基于计算机视觉的车辆检测和流量统计 1.文章信息 <Vision-based vehicle detection and counting system using deep lea ...

  • 深度学习

    人工智能技术与咨询 4天前 本文来自<系统工程与电子技术>,作者周龙等 摘 要:针对传统雷达图像目标检测方法在海杂波及多种干扰物组成的复杂背景下目标分类识别率低.虚警率高的问题,提出将当前 ...

  • 【目标检测算法解读】yolo系列算法一

    前言 大家好,这是目标检测算法解读系列的第一篇文章,在这个系列中小糖豆会对经典的目标检测算法进行解读,在每个算法原理讲解完后,会有相应的源代码解析.小糖豆认为学习一个算法,既要弄清楚它的原理,又要真正 ...

  • 解决物体检测中的小目标问题

    重磅干货,第一时间送达 为了提高模型在小物体上的性能,我们建议使用以下技术: 提高图像捕获分辨率 提高模型的输入分辨率 平铺图像 通过扩充生成更多数据 自动学习模型锚 过滤掉多余的类 为什么小目标问题 ...

  • 什么是目标检测中的平均精度均值(mAP)?

    重磅干货,第一时间送达 计算机视觉界已经集中在度量 mAP 上,来比较目标检测系统的性能.在这篇文章中,我们将深入了解平均精度均值 (mAP) 是如何计算的,以及为什么 mAP 已成为目标检测的首选指 ...

  • 多摄像头实时目标跟踪和计数

    作者:LeonLok 编译:ronghuaiyang 导读 本文来自github,很实用的一个应用. git仓库地址:https://github.com/LeonLok/Multi-Camera-L ...

  • YOLOV4训练自己的数据集—从环境配置到完成检测任务(Windows)

    文章采用的是官方开源代码: https://github.com/AlexeyAB/darknet YOLOV4的详细阐述可以阅读原汁原味的论文: https://arxiv.org/abs/2004 ...

  • 收藏 | 目标检测的模型集成与实验

    仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:作者:Vikas S Shetty  |  编译:ronghuaiyang  | AI公园 AI博士笔记系列推荐 周志华<机器学习> ...

  • 竞赛冠军方案:2020珠港澳人工智能算法大赛双料冠军解读

    团队介绍 团队来自深圳市威富视界有限公司.中国科学院半导体研究所,队长为宁欣副研究员,成员分别为石园.刘江宽.支金林.王镇.荣倩倩,排名不分先后. 珠港澳人工智能算法赛题介绍 以检测和识别为核心的各项 ...

  • 图像分割技术概述

    青榴实验室 1周前 1.什么是图像分割 图像分割是图像分析的第一步,是计算机视觉的基础,是图像理解的重要组成部分,同时也是图像处理中最困难的问题之一.所谓图像分割是指根据灰度.彩色.空间纹理.几何形状 ...

  • 利用合成图像对热图像进行鲁棒行人检测

    重磅干货,第一时间送达 小黑导读 论文是学术研究的精华和未来发展的明灯.小黑决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...