医药安全标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210850871.7 (22)申请日 2022.07.19 (71)申请人 上海西虹桥 导航技术有限公司 地址 201799 上海市青浦区高泾路59 9号1 幢101室 申请人 上海交通大 学 (72)发明人 尚小雪 潘常春 郁文贤 裴凌  (74)专利代理 机构 安徽顺超知识产权代理事务 所(特殊普通 合伙) 34120 专利代理师 贺湘君 (51)Int.Cl. G06T 3/40(2006.01) G06T 3/00(2006.01) G06V 20/17(2022.01) G06V 10/25(2022.01)G06V 10/26(2022.01) G06V 10/46(2022.01) G06V 10/82(2022.01) G06T 5/50(2006.01) G06T 7/70(2017.01) G06T 7/80(2017.01) G06T 17/00(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G01C 11/02(2006.01) G01C 11/04(2006.01) (54)发明名称 一种基于无人机倾斜摄影3D模型的目标快 速识别与标定方法 (57)摘要 本发明涉及信息技术技术领域, 且公开了一 种基于无人机倾斜摄影3D模型的目标快速识别 与标定方法, 包括以下步骤: 步骤一: 2D图片预处 理; 步骤二: 2D图片拼接; 步骤三: 人工智能识别; 步骤四: 2D/3D坐标转换; 步骤五: 3D可视化标识, 直接用拍摄的图片进行图像识别存在重复识别、 识别速度慢的问题, 本过程对图片携带的光点中 心的高精度坐标进行处理, 得到图片轨迹, 利用 轨迹中相邻最近的4张图片作为图片拼接的数据 源, 为图像拼接做拼接数据准备, 直接利用三维 坐标信息选取图片拼接顺序和拼接位置, 避免出 现图像拼接过程中进行逐一特 征点获取匹配 。 权利要求书1页 说明书5页 附图3页 CN 115330594 A 2022.11.11 CN 115330594 A 1.一种基于无人机倾斜摄影3D模型的目标快速识别与标定方法, 其特征在于: 包括以 下步骤: 步骤一: 2D图片预处 理; 步骤二: 2D图片拼接; 步骤三: 人工智能识别; 步骤四: 2D/ 3D坐标转换; 步骤五: 3D可视化标识。 2.根据权利要求1所述的一种基于无人机倾斜摄影3D模型的目标快速识别与标定方 法, 其特征在于: 利用无人机拍摄的2D图片携带的三 维坐标信息, 结合重叠度对2D图片进 行 快速拼接处理, 降低图片计算数据量, 然后利用人工智能识别方法对感兴趣的图片内容进 行智能识别, 将2D图片识别 结果的坐标信息通过坐标转换系统映射计算得到3D坐标值, 在 3D模型上标识出识别对象。 3.根据权利要求1所述的一种基于无人机倾斜摄影3D模型的目标快速识别与标定方 法, 其特征在于: 所述步骤一2D图片预 处理的具体操作流程为: 无人机在摄影测量拍摄定焦 图片时, 提前设置飞行区域、 规划飞行路线, 设定飞行重叠度, 重叠度一般在70%以上才能 在三维建模时得到比较好的结果, 同时在采集数据时会利用北斗/ GPS的RTK或者PPK高精度 定位系统, 可得到拍摄图片时的高精度三维坐标, 一般坐标系为WGS84。 直接用拍摄的图片 进行图像识别存在重复识别、 识别速度慢的问题, 本过程对图片携带 的光点中心的高精度 坐标进行处理, 得到图片轨迹, 利用轨迹中相邻最近的4张图片作为图片拼接的数据源, 为 图像拼接做拼接数据准备, 直接利用三维坐标信息选取图片拼接顺序和 拼接位置, 避免出 现图像拼接过程中进行 逐一特征点获取匹配, 然后才能选取最相近的图片进行拼接 。 4.根据权利要求1所述的一种基于无人机倾斜摄影3D模型的目标快速识别与标定方 法, 其特征在于: 所述步骤二2D图片拼接的具体操作流程为: 根据高精度三 维坐标计算得到 的4张拼接图片, 将2D图片进行拼接合成处理, 处理过程如下: 输入合并图像 ‑重叠区域计 算‑特征点提取‑2D图像配准‑投影变换‑拼接计算 ‑图像融合 ‑生成图像。 5.根据权利要求1所述的一种基于无人机倾斜摄影3D模型的目标快速识别与标定方 法, 其特征在于: 所述步骤三人工智能识别的具体操作流程为: 采用深度学习算法实现拼接 后2D图片的智能识别, 识别内容主要包括: 树、 农田、 电线杠、 池塘、 汽车、 房屋/地基、 人、 绿 化带、 人行道等; 深度学习的数据集采用现有的公开数据集如: ADE20K、 Urban  Drone Dataset(UDD)、 Stanford Drone Dataset等进行 预训练和粗调, 再用无 人机拍摄的图片进行增强后细调; 图像处理采集全景分割算法, 采用Transformer和多层感知机MLP解码的方式实现的开 源的SegFormer分割算法。 6.根据权利要求1所述的一种基于无人机倾斜摄影3D模型的目标快速识别与标定方 法, 其特征在于: 所述步骤四2D/3D坐标转换的具体操作流程为: 将人工智能图像识别的像 素坐标, 与物理世界的三 维坐标建立快速转换模 型, 转换过程如下: 像素坐标 ‑图像坐标 ‑相 机坐标‑WGS84坐标。权 利 要 求 书 1/1 页 2 CN 115330594 A 2一种基于无人机倾斜摄影3D 模型的目标快速识别与标定方 法 技术领域 [0001]本发明涉及信息技术领域, 具体为一种基于无人机倾斜摄影3D模型的目标快速识 别与标定方法。 背景技术 [0002]随着无人机、 人工智能技术的日渐成熟, 利用无人机拍 摄的照片图像研究获取的 视觉信息内容也日益丰富。 传统方式上, 通过无人机拍摄的大量二 维照片, 利用空三摄影测 量建模方法, 可以生成附带有高精度三维坐标信息的地理信息三维模型, 实现对三维模型 进行点、 线、 面、 体的测量。 利用无人机摄影技术可以生 成大范围空间3D特定场景图。 一类重 要的应用是需要能够对场景图中的目标进行识别, 并标定其 位置和几何信息 。 [0003]利用深度学习技术对无人机拍摄的2D图片进行车、 房、 树、 人等物体的智能识别。 , 该技术虽然已经比较成熟, 但是由于单帧2D图片仅仅是场景图的局部信息, 并且其中的目 标位置和几何信息无法直接标定, 可视化效果差, 无法满足行业需求。 [0004]而直接在3D模型数据中进行场景图目标识别与标定也存在 较大的困难, 通常3D模 型是以3D点云数据来描述的, 虽然3D点云模型能否覆盖全局的场景图, 但由于三维模型在 建模过程中存在 模型重构, 导致原有图像信息存在不同程度的丢失, 影响识别效果, 加上 处 理的数据量大, 需要消耗大量的算力, 时效上 无法满足行业应用需求。 [0005]因此, 需要建立一种混合机制的处理, 能够利用在2D图片上的精确识别能力, 融合 3D模型上的坐标和几何尺寸信息, 进而实现在3D全局场景图上的目标快速识别与标定方 法。 发明内容 [0006](一)解决的技 术问题 [0007]针对现有技术的不足, 本发明提供了一种基于无人机倾斜摄影3D模型的目标快速 识别与标定方法, 解决了在大量大幅重叠度下的2D图片的快速目标识别、 合并、 拼接与统 计; 快速进行2D/3D坐标变换, 对2D图片中的识别的目标, 能够快速标定其位置和几何信息, 并在3D模型中进行 可视化展示的问题。 [0008](二)技术方案 [0009]为实现上述目的, 本发明提供如下技术方案: 1.一种基于无人机倾斜摄影3D模型 的目标快速识别与标定方法, 包括以下步骤: [0010]步骤一: 2D图片预处 理; [0011]步骤二: 2D图片拼接; [0012]步骤三: 人工智能识别; [0013]步骤四: 2D/ 3D坐标转换; [0014]步骤五: 3D可视化标识。 [0015]优选的, 利用无人机拍摄的2D图片携带的三维坐标信息, 结合重叠度对  2D图片进说 明 书 1/5 页 3 CN 115330594 A 3

PDF文档 专利 一种基于无人机倾斜摄影3D模型的目标快速识别与标定方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于无人机倾斜摄影3D模型的目标快速识别与标定方法 第 1 页 专利 一种基于无人机倾斜摄影3D模型的目标快速识别与标定方法 第 2 页 专利 一种基于无人机倾斜摄影3D模型的目标快速识别与标定方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:44:37上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。