MVTec 将于 2025 年 5 月 27 日发布 HALCON 的新版本。
HALCON 25.05 版本不仅包含众多优化与更新,还引入了结合深度学习算法与传统方法的全新技术。
自主训练 Deep 3D Matching 模型
Deep 3D Matching 是一种全新的基于深度学习的技术,用于快速、稳健地进行三维目标检测与位姿估计,仅需使用 2D 图像即可完成。该技术几乎无需参数配置,性能出色,尤其适用于如 Bin Picking 和机器人操作等高要求应用场景,即便在复杂条件下也能表现优异。
借助 HALCON 25.05,用户现可自主训练自己的 Deep 3D Matching 模型,无需依赖 MVTec 的支持服务。全新开发的渲染器可通过目标物体的 CAD 模型生成训练数据,从而实现完全基于合成数据的模型训练。这一功能极具灵活性,可根据物体特性(如反光或透明)模拟不同场景。
更强大 Deep OCR 功能
HALCON 25.05 引入了一个Deep OCR 的对齐步骤,在识别前对粗略剪裁的文本区域进行优化。该步骤显著提高了识别准确率,即使文本区域并未精确定位,也能获得可靠的 OCR 结果。
通过这一新特性,用户可以在跳过检测模型的同时,依然获得高质量的文本识别结果,从而大幅缩短处理时间。该对齐步骤本身计算效率很高,几乎不会增加额外的处理负担。
此功能不仅提升了文本识别流程的灵活性,也让整体运行速度更快,因为不再需要精确设定 ROI(感兴趣区域)。
核心功能改进
在 HALCON 25.05 中,二维码识别器新增了二维码矫正功能,即使二维码位于弯曲或变形的表面上,也能实现稳定识别。
这一改进拓展了在物流、包装、食品加工和瓶身贴标等行业的应用可能性——这些行业中,二维码常常印刷在非平坦材料上。矫正过程能够显著提高可读性,无需要求完美平整的表面。
该功能为可选项,用户可按需启用。虽然其处理时间略长于标准二维码读取,但因识别更加稳健,对于高要求应用来说具有重要价值。
此外,HALCON 25.05 还新增了中断 Generic Shape Matching (通用形状匹配)训练过程的功能,赋予用户更高的灵活性与控制力。现在,训练过程可以手动停止,或通过设置超时时间(例如:1 秒后自动停止)来限制训练时长,从而确保操作效率,避免无谓等待。此前,训练一旦启动就必须运行至结束,可能会导致延迟,特别是在资源受限的嵌入式应用中。通过这项改进,用户可将训练过程无缝集成进工作流程中,避免长时间处理,提升系统响应能力。
HALCON 25.05 推出了一组全新的图像采集算子,旨在实现与先进相机技术的无缝集成。
尽管 MVTec 始终专注于高效的相机连接,但诸如 GigE Vision 和 USB3 Vision 等现代标准的兴起,也带来了新的机遇与挑战。
这一新接口在简化相机操作的同时,仍提供对高级配置的完整控制。新算子拥有更清晰、更直观的界面,针对典型应用场景进行了优化,同时仍完全支持 GenICam GenTL 架构。
此外,如果所使用的 GenICam GenTL 设备支持多数据流,该接口也可以提供相应支持。用户可以预期,新算子的性能与之前版本相当甚至更优,从而确保在过渡到最新相机技术时依然体验顺畅、稳定可靠。
转载自MVTec官方微信公众号
|