首页 » 一年后,Fast R-CNN被引入,将区域选择和特征

一年后,Fast R-CNN被引入,将区域选择和特征

合到一个机器学习模型中。在这种情况下,当 Fast R-CNN 获得一张图像和一组 Rols 时,它会返回在图像中检测到的对象的类别和边界框列表。

这里的关键创新是添加了RoI 池化层。RoI 池化层获取 CNN 特征图和图像中的感兴趣区域,并将它们与每个区域的相应特征进行匹配。这使得能够快速提取所有感兴趣区域的特征。在 Fast R-CNN 之前,R-CNN 分别处理每个区域,非常耗时。

3. Faster R-CNN

由于Fast R-CNN仍然需要提取图像中的区域并输入到模型中,因此无法实现实时的目标检测。因此,为了解决这个问题,2016年 海外数据 提出了Faster R-CNN 。

与前代产品不同的是,Faster R-CNN 以图像作为输入。然后对其进行处理并返回对象类别列表及其对应的边界框。通过将区域检测添加到主神经网络架构中,我们现在可以使用 Faster R-CNN 实现近乎实时的对象检测。

4.基于区域的全卷积网络(R-FCN)

R-FCN是一种全卷积图像分类器,可全尺寸检测区域,共享整个图像上的几乎所有计算。与利用每个区域子网络数百次的 Fast/Faster R-CNN 相比,它效率高且准确率高。相比之下,R-FCN 仅使用最新的残差网络来检测图像中的物体。

5. 方向梯度直方图(HOG)

HOG计算图像局部部分中 健身将持续成为业务流程外包领域的全球领导者 梯度方向出现的次数。这种方法有助于预测帧中包含某个对象的概率。

6. YOLO

YOLO 的意思是“你只能看一次” ,类似于俚语 (You Only Live Once)。虽然 R-CNN 模型系列在物体检测方面通常更准确,但 YOLO 在实时实现物体检测方面速度要快得多。

在这种情况下,单个神经网

7.单次检测器(SSD)

SSD只需一次拍摄即可检测图像中的多个物体。这使得 SSD 比基于两次拍摄 R-CNN 的方法快得多。

8.空间金字塔池化(SPP-Net)

卷积神经架构SSP-Net使用空间金字塔池化来消除网络的固定大小限制。这意味着 CNN 不再需要固定大小的输入图像。它允许可变大小的输入图像进入 CNN 进行分类。

然而,无论你使用哪种算法或模型,你都需要 澳大利亚电话号码 大量的数据集进行训练。如果你想让你的智能机器成功地在一个充满物体和人的世界中导航,你必须对它们进行更多的训练,以帮助它们更好地模仿人类。

物体检测和分割还有很长的路要走。不过好消息是,我们离实现完全自动化已经不远了。

滚动至顶部