图像分割技术是将图像划分为多个具有独特属性的区域,并从中提取感兴趣目标的过程。它是图像处理向图像分析过渡的关键步骤。目前,图像分割方法主要包括基于阈值的分割、基于区域的分割、基于边缘的分割以及基于特定理论的分割等。从数学角度来看,图像分割是将数字图像划分为互不相交的区域的过程,同时也是一个标记过程,即将同一区域的像素赋予相同的编号。
为了解决传统的GrabCut和GraphCut算法需要用户提供精确的前景和背景种子,且种子覆盖不全时分割准确度受影响的问题,微软研究室提出了更为高效的GrabCut分割算法。GrabCut算法只需用户提供一个包含前景的矩形区域,矩形外的区域被视为背景。具体步骤如下:
将矩形外的像素标记为背景,矩形内的像素标记为前景,并使用这些标记来训练背景和前景的高斯混合模型(GMM);使用训练好的GMM计算每个像素属于背景或前景的概率,从而计算能量函数中的Data项,Smoothness项的计算方法与GraphCut类似;通过优化能量函数获得图像的一个分割结果;使用步骤3中的分割结果重新训练前景和背景的GMM;重复步骤2、3、4,直到分割结果收敛(不再有显著变化)。
从上述步骤可以看出,GrabCut是一个通过循环执行来实现EM(期望最大化)算法的过程。由于用户提供的矩形内可能包含部分背景像素,因此初始种子可能不完全准确。然而,GMM模型不需要所有训练数据都正确,即使部分分类错误,也可以通过EM步骤达到正确的最终结果。GrabCut正是利用了GMM的这一特性。不过需要注意的是,GMM存在陷入局部最优解的问题,GrabCut也同样面临这一挑战。
算法论文的地址为:https://www.php.cn/link/ec6019ea251a4e03b08d4135153be64e
API代码语言为JavaScript,代码运行次数为0。以下是API的代码示例:
public static void grabCut(Mat img, Mat mask, Rect rect, Mat bgdModel, Mat fgdModel, int iterCount, int mode)
参数说明如下:
参数一:
img
,输入的待分割图像,必须是8位三通道图像。参数二:
mask
,输入/输出8位单通道掩码图像。像素值及其含义如下:GC_BGD(0)表示明显的背景像素,GC_FGD(1)表示明显的前景像素,GC_PR_BGD(2)表示可能的背景像素,GC_PR_FGD(3)表示可能的前景像素。参数三:
rect
,包含细分对象的ROI区域。ROI外的区域被标记为“明显的背景”。当第七个参数
mode
为GC_INIT_WITH_RECT时,该参数才会被使用。参数四:
bgdModel
,前景模型临时对象。处理同一图像时,请勿对其进行修改。参数五:
fgdModel
,背景模型临时对象。处理同一图像时,请勿对其进行修改。参数六:
iterCount
,迭代次数。可以通过使用
mode == GC_INIT_WITH_MASK
或
mode == GC_EVAL
进行进一步调用来完善结果。参数七:
mode
,分割模式标志位。标志位值及其含义如下:GC_INIT_WITH_RECT(0)表示使用提供的矩形初始化状态和掩码,之后根据算法进行迭代更新;GC_INIT_WITH_MASK(1)表示使用提供的掩码初始化状态,可以组合使用GC_INIT_WITH_RECT和GC_INIT_WITH_MASK,然后使用GC_BGD自动初始化ROI之外的所有像素;GC_EVAL(2)表示算法应该恢复;GC_EVAL_FREEZE_MODEL(3)表示算法仅在固定模型下运行GrabCut算法(单次迭代)。
以下是JavaScript代码示例:
/** * 图像分割 Grabcut * author: yidong * 2020/11/21 */class GrabcutActivity extends AppCompatActivity { private val mBinding: ActivityGrabcutBinding by lazy { ActivityGrabcutBinding.inflate(layoutInflater) } private lateinit var mRgb: Matoverride fun onCreate(savedInstanceState: Bundle?) { super.onCreate(savedInstanceState) setContentView(mBinding.root) val bgr = Utils.loadResource(this, R.drawable.lena) mRgb = Mat() Imgproc.cvtColor(bgr, mRgb, Imgproc.COLOR_BGR2RGB) mBinding.ivLena.showMat(mRgb) GlobalScope.launch(Dispatchers.IO) { doGrabCut() }}private fun doGrabCut() { val rectMat = Mat() mRgb.copyTo(rectMat) val rect = Rect(80, 30, 340, 390) Imgproc.rectangle(rectMat, rect, Scalar.all(255.0), 2) GlobalScope.launch(Dispatchers.Main) { mBinding.ivLena.showMat(rectMat) } val bgdModel = Mat.zeros(1, 65, CvType.CV_64FC1) val fgdModel = Mat.zeros(1, 65, CvType.CV_64FC1) val mask = Mat.zeros(mRgb.size(), CvType.CV_8UC1) Imgproc.grabCut(mRgb, mask, rect, bgdModel, fgdModel, 5, Imgproc.GC_INIT_WITH_RECT) val result = Mat() for (i in 0 until mask.rows()) { for (j in 0 until mask.cols()) { val value = mask.get(i, j)[0].toInt() if (value == 1 || value == 3) { mask.put(i, j, 255.0) } else { mask.put(i, j, 0.0) } } } Core.bitwise_and(mRgb, mRgb, result, mask) GlobalScope.launch(Dispatchers.Main) { mBinding.ivResult.showMat(result) }}override fun onDestroy() { mRgb.release() super.onDestroy()}
}
效果图如下:


源码地址:https://www.php.cn/link/cf3df6fa1165f1ceaa6c246e9d7d0492
以上就是Android OpenCV(四十三):图像分割(Grabcut)的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/135921.html
微信扫一扫
支付宝扫一扫