首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >[Python图像处理] 十九.图像分割之基于K-Means聚类的区域分割

[Python图像处理] 十九.图像分割之基于K-Means聚类的区域分割

作者头像
Eastmount
发布于 2023-09-01 06:10:02
发布于 2023-09-01 06:10:02
1.9K019
代码可运行
举报
运行总次数:19
代码可运行

忙碌的七月,忙碌的2023,感谢关注,加油!

该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门、OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子、图像增强技术、图像分割等,后期结合深度学习研究图像识别、图像分类应用。希望文章对您有所帮助,如果有不足之处,还请海涵~

前面的文章讲解了图像锐化和边缘提取技术,该篇文章将开始围绕图像分割进行讲解。百度百科将其定义为:

图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。它是由图像处理到图像分析的关键步骤。现有的图像分割方法主要分以下几类:基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等。从数学角度来看,图像分割是将数字图像划分成互不相交的区域的过程。图像分割的过程也是一个标记过程,即把属于同一区域的像索赋予相同的编号。

本篇文章主要讲解基于理论的图像分割方法,通过K-Means聚类算法实现图像分割或颜色分层处理。基础性文章,希望对你有所帮助。

学Python近十年,认识了很多大佬和朋友,感恩。深知自己很菜,得拼命努力前行,编程也没有什么捷径,干就对了。希望未来能更透彻学习和撰写文章,同时非常感谢参考文献中的大佬们的文章和分享,共勉。 - https://blog.csdn.net/eastmount


一.K-Means聚类原理

第一部分知识主要参考自己的新书《Python网络数据爬取及分析从入门到精通(分析篇)》和之前的博客 [Python数据挖掘课程] 二.Kmeans聚类数据分析。

K-Means聚类是最常用的聚类算法,最初起源于信号处理,其目标是将数据点划分为K个类簇,找到每个簇的中心并使其度量最小化。该算法的最大优点是简单、便于理解,运算速度较快,缺点是只能应用于连续型数据,并且要在聚类前指定聚集的类簇数。

下面是K-Means聚类算法的分析流程,步骤如下:

  • 第一步,确定K值,即将数据集聚集成K个类簇或小组。
  • 第二步,从数据集中随机选择K个数据点作为质心(Centroid)或数据中心
  • 第三步,分别计算每个点到每个质心之间的距离,并将每个点划分到离最近质心的小组,跟定了那个质心。
  • 第四步,当每个质心都聚集了一些点后,重新定义算法选出新的质心。
  • 第五步,比较新的质心和老的质心,如果新质心和老质心之间的距离小于某一个阈值,则表示重新计算的质心位置变化不大,收敛稳定,则认为聚类已经达到了期望的结果,算法终止。
  • 第六步,如果新的质心和老的质心变化很大,即距离大于阈值,则继续迭代执行第三步到第五步,直到算法终止。

下图是对身高和体重进行聚类的算法,将数据集的人群聚集成三类。


二.K-Means聚类分割灰度图像

在图像处理中,通过K-Means聚类算法可以实现图像分割、图像聚类、图像识别等操作,本小节主要用来进行图像颜色分割。假设存在一张100×100像素的灰度图像,它由10000个RGB灰度级组成,我们通过K-Means可以将这些像素点聚类成K个簇,然后使用每个簇内的质心点来替换簇内所有的像素点,这样就能实现在不改变分辨率的情况下量化压缩图像颜色,实现图像颜色层级分割。

在OpenCV中,Kmeans()函数原型如下所示:

retval, bestLabels, centers = kmeans(data, K, bestLabels, criteria, attempts, flags[, centers])

  • data表示聚类数据,最好是np.flloat32类型的N维点集
  • K表示聚类类簇数
  • bestLabels表示输出的整数数组,用于存储每个样本的聚类标签索引
  • criteria表示算法终止条件,即最大迭代次数或所需精度。在某些迭代中,一旦每个簇中心的移动小于criteria.epsilon,算法就会停止
  • attempts表示重复试验kmeans算法的次数,算法返回产生最佳紧凑性的标签
  • flags表示初始中心的选择,两种方法是cv2.KMEANS_PP_CENTERS ;和cv2.KMEANS_RANDOM_CENTERS
  • centers表示集群中心的输出矩阵,每个集群中心为一行数据

下面使用该方法对灰度图像颜色进行分割处理,需要注意,在进行K-Means聚类操作之前,需要将RGB像素点转换为一维的数组,再将各形式的颜色聚集在一起,形成最终的颜色分割。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# coding: utf-8
import cv2
import numpy as np
import matplotlib.pyplot as plt

#读取原始图像灰度颜色
img = cv2.imread('scenery.png', 0) 
print img.shape

#获取图像高度、宽度
rows, cols = img.shape[:]

#图像二维像素转换为一维
data = img.reshape((rows * cols, 1))
data = np.float32(data)

#定义中心 (type,max_iter,epsilon)
criteria = (cv2.TERM_CRITERIA_EPS +
            cv2.TERM_CRITERIA_MAX_ITER, 10, 1.0)

#设置标签
flags = cv2.KMEANS_RANDOM_CENTERS

#K-Means聚类 聚集成4类
compactness, labels, centers = cv2.kmeans(data, 4, None, criteria, 10, flags)

#生成最终图像
dst = labels.reshape((img.shape[0], img.shape[1]))

#用来正常显示中文标签
plt.rcParams['font.sans-serif']=['SimHei']

#显示图像
titles = [u'原始图像', u'聚类图像']  
images = [img, dst]  
for i in xrange(2):  
   plt.subplot(1,2,i+1), plt.imshow(images[i], 'gray'), 
   plt.title(titles[i])  
   plt.xticks([]),plt.yticks([])  
plt.show()

输出结果如图所示,左边为灰度图像,右边为K-Means聚类后的图像,它将灰度级聚集成四个层级,相似的颜色或区域聚集在一起。


三.K-Means聚类对比分割彩色图像

下面代码是对彩色图像进行颜色分割处理,它将彩色图像聚集成2类、4类和64类。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# coding: utf-8
import cv2
import numpy as np
import matplotlib.pyplot as plt

#读取原始图像
img = cv2.imread('scenery.png') 
print img.shape

#图像二维像素转换为一维
data = img.reshape((-1,3))
data = np.float32(data)

#定义中心 (type,max_iter,epsilon)
criteria = (cv2.TERM_CRITERIA_EPS +
            cv2.TERM_CRITERIA_MAX_ITER, 10, 1.0)

#设置标签
flags = cv2.KMEANS_RANDOM_CENTERS

#K-Means聚类 聚集成2类
compactness, labels2, centers2 = cv2.kmeans(data, 2, None, criteria, 10, flags)

#K-Means聚类 聚集成4类
compactness, labels4, centers4 = cv2.kmeans(data, 4, None, criteria, 10, flags)

#K-Means聚类 聚集成8类
compactness, labels8, centers8 = cv2.kmeans(data, 8, None, criteria, 10, flags)

#K-Means聚类 聚集成16类
compactness, labels16, centers16 = cv2.kmeans(data, 16, None, criteria, 10, flags)

#K-Means聚类 聚集成64类
compactness, labels64, centers64 = cv2.kmeans(data, 64, None, criteria, 10, flags)

#图像转换回uint8二维类型
centers2 = np.uint8(centers2)
res = centers2[labels2.flatten()]
dst2 = res.reshape((img.shape))

centers4 = np.uint8(centers4)
res = centers4[labels4.flatten()]
dst4 = res.reshape((img.shape))

centers8 = np.uint8(centers8)
res = centers8[labels8.flatten()]
dst8 = res.reshape((img.shape))

centers16 = np.uint8(centers16)
res = centers16[labels16.flatten()]
dst16 = res.reshape((img.shape))

centers64 = np.uint8(centers64)
res = centers64[labels64.flatten()]
dst64 = res.reshape((img.shape))

#图像转换为RGB显示
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
dst2 = cv2.cvtColor(dst2, cv2.COLOR_BGR2RGB)
dst4 = cv2.cvtColor(dst4, cv2.COLOR_BGR2RGB)
dst8 = cv2.cvtColor(dst8, cv2.COLOR_BGR2RGB)
dst16 = cv2.cvtColor(dst16, cv2.COLOR_BGR2RGB)
dst64 = cv2.cvtColor(dst64, cv2.COLOR_BGR2RGB)

#用来正常显示中文标签
plt.rcParams['font.sans-serif']=['SimHei']

#显示图像
titles = [u'原始图像', u'聚类图像 K=2', u'聚类图像 K=4',
          u'聚类图像 K=8', u'聚类图像 K=16',  u'聚类图像 K=64']  
images = [img, dst2, dst4, dst8, dst16, dst64]  
for i in xrange(6):  
   plt.subplot(2,3,i+1), plt.imshow(images[i], 'gray'), 
   plt.title(titles[i])  
   plt.xticks([]),plt.yticks([])  
plt.show()

输出结果如下图所示,当K=2颜色聚集成两种,当K=64颜色聚集成64种。


希望这篇基础性文章对您有所帮助,如果有错误 或不足之处,请海涵!一起加油,2019年四月考博加油,写于贵阳钟书阁。

(By:Eastmount 2023-07-24 夜于地球)


参考文献:

  • [1]基于苗族服饰的图像锐化和边缘提取技术研究[J]. 现代计算机,2018(10).
  • [2]《数字图像处理》(第3版),冈萨雷斯著,阮秋琦译,电子工业出版社,2013年.
  • [3]《数字图像处理学》(第3版),阮秋琦,电子工业出版社,2008年,北京.
  • [4]《OpenCV3编程入门》,毛星云,冷雪飞,电子工业出版社,2015.
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-07-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 娜璋AI安全之家 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
matlab实现K均值聚类算法
K均值聚类(K-Means Clustering)是一种基于距离的无监督学习算法,通过迭代优化将数据集划分为K个簇,使得簇内数据点相似度最大化,簇间相似度最小化。其目标是最小化簇内平方误差和(Within-Cluster Sum of Squares, WCSS)。
用户11823301
2025/09/05
2140
使用K-Means聚类进行图像分割(OpenCV代码演示)
在计算机视觉中,图像分割是将图像划分为多个片段的过程。分割图像的目标是将图像的表示改变为更有意义且更易于分析的东西。它通常用于定位对象和创建边界。
Color Space
2024/04/12
9350
使用K-Means聚类进行图像分割(OpenCV代码演示)
[Python从零到壹] 十三.机器学习之聚类算法四万字总结(K-Means、BIRCH、树状聚类、MeanShift)
在过去,科学家会根据物种的形状习性规律等特征将其划分为不同类型的门类,比如将人种划分为黄种人、白种人和黑种人,这就是简单的人工聚类方法。聚类是将数据集中某些方面相似的数据成员划分在一起,给定简单的规则,对数据集进行分堆,是一种无监督学习。聚类集合中,处于相同聚类中的数据彼此是相似的,处于不同聚类中的元素彼此是不同的。本章主要介绍聚类概念和常用聚类算法,然后详细讲述Scikit-Learn机器学习包中聚类算法的用法,并通过K-Means聚类、Birch层次聚类及PAC降维三个实例加深读者印象。
Eastmount
2021/12/02
2.4K0
[Python从零到壹] 十三.机器学习之聚类算法四万字总结(K-Means、BIRCH、树状聚类、MeanShift)
【OpenCV】Chapter9.边缘检测与图像分割
边缘检测的原理和matlab实现在我之前这两篇博文中提到过,这里不再赘述。 【计算机视觉】基础图像知识点整理【计算机视觉】数字图像处理基础知识题 此次来看OpenCV的实现方式。
zstar
2022/09/28
1.7K0
【OpenCV】Chapter9.边缘检测与图像分割
基于聚类的图像分割-Python
当我们在做一个图像分类任务时,首先我们会想从图像中捕获感兴趣的区域,然后再将其输入到模型中。让我们尝试一种称为基于聚类的图像分割技术,它会帮助我们在一定程度上提高模型性能,让我们看看它是什么以及一些进行聚类分割的示例代码。
小白学视觉
2022/02/12
1.4K0
基于聚类的图像分割-Python
基于聚类的图像分割(Python)
作者 | 小白 来源 | 小白学视觉 了解图像分割 当我们在做一个图像分类任务时,首先我们会想从图像中捕获感兴趣的区域,然后再将其输入到模型中。让我们尝试一种称为基于聚类的图像分割技术,它会帮助我们在一定程度上提高模型性能,让我们看看它是什么以及一些进行聚类分割的示例代码。 什么是图像分割? 想象一下我们要过马路,过马路之前我们会做什么? 首先,我们会看道路两旁,以确定接近的车辆等环境对象,然后我们会对接近的车辆的速度做出一些快速的估计,并决定何时以及如何过马路。所有这些都发生在很短的时间内,非常
AI科技大本营
2023/04/14
1.8K0
基于聚类的图像分割(Python)
机器学习算法实践——K-Means算法与图像分割
一、理论准备 1.1、图像分割 图像分割是图像处理中的一种方法,图像分割是指将一幅图像分解成若干互不相交区域的集合,其实质可以看成是一种像素的聚类过程。通常使用到的图像分割的方法可以分为: 基于边缘的技术 基于区域的技术 基于聚类算法的图像分割属于基于区域的技术。 1.2、K-Means算法 K-Means算法是基于距离相似性的聚类算法,通过比较样本之间的相似性,将形式的样本划分到同一个类别中,K-Means算法的基本过程为: 初始化常数 ,随机初始化k个聚类中心 重复计算以下过程,直到聚类中心不再改变
felixzhao
2018/03/14
2.3K0
机器学习算法实践——K-Means算法与图像分割
【白话机器学习】算法理论+实战之K-Means聚类算法
如果想从事数据挖掘或者机器学习的工作,掌握常用的机器学习算法是非常有必要的,常见的机器学习算法:
石晓文
2020/03/24
1.7K0
【白话机器学习】算法理论+实战之K-Means聚类算法
K-means算法及OpenCV实现
K-means算法MacQueen在1967年提出的,是最简单与最常见数据分类方法之一并且最为一种常见数据分析技术在机器学习、数据挖掘、模式识别、图像分析等领域都用应用。从机器学习的角度看,K-means属于一种无监督的机器学习方法。无监督学习(Unsupervised Learning)简单的说就是在不给定正确答案(标签)的情况下,在数据中找到一些相似的特征用以分析(分类)数据的方法。而在K-means算法解决图像的问题中,就是在对图像的像素点进行分类,达到图像分割的目的。
chaibubble
2022/05/07
8180
K-means算法及OpenCV实现
万字长文告诉新手如何学习Python图像处理(上篇完结 四十四) | 「Python」有奖征文
期结合深度学习研究图像识别、图像分类应用。希望文章对您有所帮助,如果有不足之处,还请海涵~
全栈程序员站长
2022/11/04
2.4K0
万字长文告诉新手如何学习Python图像处理(上篇完结 四十四) | 「Python」有奖征文
特征类型和图像分割
我们最想检测的就是角点,因为角点是可重复性最高的特征,也就是说因为角点是可重复性最高的特征,给出关于同一景象的两张或以上图像 我们就能很轻易地识别出这类特征。 举一个简单的例子:
小飞侠xp
2018/08/29
1.2K0
K-means算法在图像分割中的应用实例
参数说明: type - 终止条件的类型:TermCriteria::COUNT,TermCriteria::EPS或 TermCriteria::COUNT + TermCriteria::EPS maxCount - 要计算的最大迭代次数或元素 epsilon - 迭代算法停止的所需精度或参数更改 criteria - 终止标准(已弃用的CvTermCriteria格式)。
用户9831583
2022/06/16
6970
K-means算法在图像分割中的应用实例
OpenCV K-means 实现主色提取
最近大量使用到 K-means 算法,一直使用的是 Sklearn 库来实现,没想到 OpenCV 库里面也有这个算法,故找了个例子实现一下。
机器视觉CV
2019/07/15
3.2K0
OpenCV K-means 实现主色提取
通过k-means进行图像量化压缩--python实现
图像读取完我们获取到的其实是一个width*height的三维矩阵(width,height是图片的分辨率)
Awesome_Tang
2018/09/11
1.6K0
通过k-means进行图像量化压缩--python实现
[Python图像处理] 二十.图像量化处理和采样处理及局部马赛克特效
前面一篇文章我讲解了基于K-Means聚类的图像分割或量化处理,但突然发现市场上讲解图像量化和采样代码的文章很缺乏,因此结合2015年自己的一篇 文章 及相关知识,分享一篇Python图像量化及处理的博文供同学们学习。基础性文章,希望对你有所帮助。
Eastmount
2023/09/01
1.3K0
[Python图像处理] 二十.图像量化处理和采样处理及局部马赛克特效
机器学习系列:(六)K-Means聚类
K-Means聚类 前面几章我们介绍了监督学习,包括从带标签的数据中学习的回归和分类算法。本章,我们讨论无监督学习算法,聚类(clustering)。聚类是用于找出不带标签数据的相似性的算法。我们将介绍K-Means聚类思想,解决一个图像压缩问题,然后对算法的效果进行评估。最后,我们把聚类和分类算法组合起来,解决一个半监督学习问题。 在第一章,机器学习基础中,我们介绍过非监督学习的目的是从不带标签的训练数据中挖掘隐含的关系。聚类,或称为聚类分析(cluster analysis)是一种分组观察的方法,将更具
小莹莹
2018/04/23
1.8K0
机器学习系列:(六)K-Means聚类
K-means 在 Python 中的实现
K-means算法简介 K-means是机器学习中一个比较常用的算法,属于无监督学习算法,其常被用于数据的聚类,只需为它指定簇的数量即可自动将数据聚合到多类中,相同簇中的数据相似度较高,不同簇中数据相似度较低。 K-menas的优缺点: 优点: 原理简单 速度快 对大数据集有比较好的伸缩性 缺点: 需要指定聚类 数量K 对异常值敏感 对初始值敏感 K-means的聚类过程 其聚类过程类似于梯度下降算法,建立代价函数并通过迭代使得代价函数值越来越小 适当选择c个类的初始中心; 在第k次迭代中,对任意一个样本,
小莹莹
2018/04/23
1.9K0
K-means 在 Python 中的实现
OpenCV中K-means源码解析
参数说明: mat - 2D或N维矩阵,注:当前方法不支持具有4个以上通道的矩阵。 distType - 分布类型(RNG :: UNIFORM或RNG :: NORMAL)     a - 第一分布参数;在均匀分布的情况下,这是一个包含范围的下边界;在正态分布的情况下,这是一个平均值。     b - 第二分布参数;在均匀分布的情况下,这是一个非包含上边界,在正态分布的情况下,这是一个标准偏差(标准偏差矩阵或整个标准偏差矩阵的对角线)。 saturateRange - 预饱和标志;仅用于均匀分配;如果为true,则该方法将首先将a和b转换为可接受的值范围(根据mat数据类型),然后将生成在[saturate(a),saturate(b))范围内的均匀分布的随机数,如果saturateRange = false ,该方法将在原始范围[a,b)中生成均匀分布的随机数,然后将其saturate,这意味着,例如,RNG().fill(mat_8u,RNG :: UNIFORM,-DBL_MAX,DBL_MAX)将由于范围(0,255)显着小于[-DBL_MAX,DBL_MAX),因此可能会产生大多数填充有0和255的数组。
用户9831583
2022/06/16
5360
OpenCV中K-means源码解析
K-means算法
聚类(Clustering)是一种无监督学习(unsupervised learning),简单地说就是把相似的对象归到同一簇中。簇内的对象越相似,聚类的效果越好。
润森
2019/08/29
1.1K0
K-means算法
基于K-Means聚类算法的主颜色提取
本期我们将一起实现基于K-Means聚类算法的主色提取。在深入研究代码之前,让我们先了解一下K-Means算法的背景知识。
小白学视觉
2020/10/27
2.6K0
基于K-Means聚类算法的主颜色提取
推荐阅读
相关推荐
matlab实现K均值聚类算法
更多 >
领券
一站式MCP教程库,解锁AI应用新玩法
涵盖代码开发、场景应用、自动测试全流程,助你从零构建专属AI助手
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档