数据预处理之图像去空白
admin
2024-05-23 22:04:18
0

数据预处理之图像去空白

  • 图像去空白
    • 介绍
    • 方法
    • 边缘检测
    • 阈值处理
    • 形态学图像剪切

图像去空白

介绍

图像去空白是指在图像处理中去除图像中的空白区域的过程。空白区域通常是指图像中的白色或其他颜色,其不包含有用的信息。去空白的目的是为了节省存储空间、提高图像处理速度、改善图像质量等。

去空白的方法有很多,其中一些常见的方法包括边缘检测、阈值处理、图像剪切和形态学处理。每种方法都有其特定的优势和局限性,因此通常需要结合使用多种方法,以便获得最佳效果。

举个例子,假设有一张图片,其中有一个大的白色区域,我们可以使用阈值处理的方法将其转换为黑白图像,然后使用形态学处理的方法去除其中的白色像素,最终得到一张只包含有用信息的图像。

方法

下面是几种常见的图像去空白方法:

  1. 边缘检测:通过检测图像中的边缘来去除空白区域。例如,使用 Canny 边缘检测算法或膨胀腐蚀算法。
  2. 阈值处理:通过设置图像中像素值的阈值来去除空白区域。例如,使用二值化算法。
  3. 图像剪切:通过计算图像中非空白像素的边界,并仅保留其中的图像。
  4. 形态学处理:通过使用形态学操作,例如腐蚀和膨胀,来去除空白区域。

这些方法的选择取决于图像的质量、内容和需求。通常,多种方法需要结合使用,以便获得最佳效果。

边缘检测

边缘检测是一种常见的图像去空白方法。该方法通过检测图像中的边缘,从而确定图像的有效区域。

步骤如下:

  1. 对图像进行预处理,将其转换为灰度图像。
  2. 使用滤波器对图像进行模糊处理,以减少图像中的噪声。
  3. 使用边缘检测算法,如Canny算法、Sobel算法等,在图像上检测边缘。
  4. 对检测到的边缘进行处理,以确定有效区域。
  5. 将有效区域从图像中剪切出来,得到一张去空白后的图像。

注意:边缘检测方法不一定适用于所有图像,因此需要对不同的图像进行试验,以确定最佳的边缘检测算法和参数。

import cv2
import numpy as np# 读取图像
img = cv2.imread("input.jpg")# 转换为灰度图像
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# 使用Canny边缘检测算法
edges = cv2.Canny(gray, 50, 150)# 寻找轮廓
contours, hierarchy = cv2.findContours(edges, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)# 确定有效区域
x, y, w, h = cv2.boundingRect(contours[0])# 将有效区域从图像中剪切出来
cropped = img[y:y + h, x:x + w]# 保存去空白后的图像
cv2.imwrite("output.jpg", cropped)

阈值处理

import cv2
import numpy as np# 读取图像
img = cv2.imread("input.jpg")# 转换为灰度图像
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# 阈值处理
_, thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)# 寻找轮廓
contours, hierarchy = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)# 确定有效区域
x, y, w, h = cv2.boundingRect(contours[0])# 将有效区域从图像中剪切出来
cropped = img[y:y + h, x:x + w]# 保存去空白后的图像
cv2.imwrite("output.jpg", cropped)

形态学图像剪切

目前来说最有用

import numpy as np
import cv2img = cv2.imread('data/3.jpg')
img = img[:-5,:-5] 
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
gray = 255*(gray < 128).astype(np.uint8)
gray = cv2.morphologyEx(gray, cv2.MORPH_OPEN, np.ones((2, 2), dtype=np.uint8))
coords = cv2.findNonZero(gray)
x, y, w, h = cv2.boundingRect(coords)
rect = img[y:y+h, x:x+w] 
cv2.imwrite("Output.jpg", rect)

相关内容

热门资讯

盘前:科技股热潮降温 纳指期货... 来源:环球市场播报 周五,美国股指期货下跌。科技股走弱、美国国债收益率上升拖累大盘。科技板块近期大...
600096,拟投建1000万... 今日(5月15日),三大股指均收跌,全市场成交额为3.37万亿元,较上一个交易日缩量179亿元。收盘...
原创 应... 当地时间5月14日美股盘后,半导体设备达成应用材料(Applied Materials)公布了202...
歌手温岚被紧急送入ICU,主办... 歌手温岚原定于5月16日在上海举办巡回演唱会。15日,有消息称温岚因身体不适被紧急送医,随后,演唱会...
闪迪、美光越涨越便宜?股价暴涨... 存储芯片需求的爆炸式增长正在颠覆传统估值逻辑——股价越涨,闪迪和美光反而越便宜。 闪迪今年以来股价累...
监管部门“5·15”密集发声,... 监管新规密集发布,投资者保护防线再加固。 5月15日,证监会在北京举办2025年“5·15全国投资者...
纳指、标普500指数续创新高!... 美股三大指数集体收涨,纳指涨0.88%,标普500指数涨0.77%,道指涨0.75%。其中,纳指、标...
欧洲主要股指收盘集体下跌 英国富时100指数跌1.71%,法国CAC40指数跌1.72%,德国DAX30指数跌2.11%,富时...
巴宝莉去年扭亏盈利近两亿元,进... 英国奢侈品牌Burberry巴宝莉公布截至3月28日的2026财年业绩,释放明显复苏信号。集团营收同...
腾澎投资拟减持巨人网络不超3%... 巨人网络公告显示,公司控股股东一致行动人、第二大股东上海腾澎投资合伙企业(有限合伙)(下称“腾澎投资...
医疗健康领域投融资日报(5月1... 据亿欧数据统计,昨日(2026年5月14日)共披露23起投融资事件,涉及15家国内企业,8家国外企业...
债市ETF“工具箱”,解锁固收... 当前,市场波动有所加大,不确定性因素较多,单一资产投资模式难以有效应对市场起伏,引入固收类资产、优化...
招商蛇口股东会通过博时蛇口产园... 观点网讯:5月15日,招商蛇口2026年第一次临时股东会在公司总部会议室召开,会议由董事长朱文凯主持...
《学习时报》刊文:全球海洋可再... 海洋可再生能源一般指蕴藏于海水水面、水体及海床之中,可转化为电能的清洁能源类型,主要包括海上风能、潮...
数据看盘游资、量化抢筹多只机器... 沪深股通今日合计成交4353.39亿,其中澜起科技和中际旭创分居沪股通和深股通个股成交额首位。板块主...
土耳其BIST-100指数下跌... 土耳其BIST-100指数下跌1.8%,主要银行指数下跌2.4%。 来源:金融界AI电报
15分钟动态电价时代:园区光伏... 一、电价改革的“加速度”:从分时计费到现货波动 过去,工商业用户的电价表一年可能只调整几次,峰、平、...
湘潭上元产业港:多套成交 12... 湘潭上元产业港再迎成交热潮,近期3套优质厂房成功签约,多位企业家携手落子,以实力见证长株潭热土的产业...
4月新增人民币贷款跌入负区间,... 本报(chinatimes.net.cn)记者刘佳 北京报道 作为观察货币政策传导效率的核心窗口,4...
2.2/7.2馆展位图首发!5... 【2.2馆展位图】 【7.2馆展位图】 Bakery china 2.2馆部分 企业推介 22B...