目标检测数据集格式转换( xml - txt ),以及图像标签的对应裁剪_XC_
前言
在目标检测数据集的制作上,我们保存的标签格式基本是xml格式的,但是在yolov5等网络模型中,我们使用的是txt的标签格式,需要进行相互转换。
还有一些其他的用处,需要修改相关的xml的标签数据,这里写了一个脚本,用来修改我们的标签数据。
xml to txt
直接修改输入和输出的路径,以及修改一下自己的保存格式即可,还设置了一个归一化的可选的操作,直接看代码即可。
写的粗糙了点,需要改的你们自己改就行。
import os
from lxml import etree
#设置输入的xml文件夹,输出的txt的文件夹的位置
path = r"D:labels_ori_xml"
write_path = r"D:labels_ori_txt"
#切换工作目录
os.chdir(path)
#获取xml文件夹下的所有文件名
filenames = os.listdir(path)
for filename in filenames:
#打开写入文件
new_name = filename.split('.')[0] + '.txt'
if not os.path.exists(write_path):
os.mkdir(write_path)
f = open(write_path + '\' + new_name, 'w')
with open(filename,'rb') as fp:
#开始解析xml文件
xml = etree.HTML(fp.read())
width = int(xml.xpath('//size/width/text()')[0])
height = int(xml.xpath('//size/height/text()')[0])
# 获取对象标签
obj = xml.xpath('//object')
print(len(obj))
for each in obj:
name = each.xpath("./name/text()")[0]
if name == 'car':
classes = 0
xmin = int(each.xpath('./bndbox/xmin/text()')[0])
xmax = int(each.xpath('./bndbox/xmax/text()')[0])
ymin = int(each.xpath('./bndbox/ymin/text()')[0])
ymax = int(each.xpath('./bndbox/ymax/text()')[0])
# 归一化(可选)
dw = 1 / width
dh = 1 / height
x_center = (xmin + xmax) / 2
y_center = (ymax + ymin) / 2
w = (xmax - xmin)
h = (ymax - ymin)
x, y, w, h = x_center * dw, y_center * dh, w * dw, h * dh
# 写入
f.write(str(classes) + ' ' + str(x) + ' ' + str(y) + ' ' + str(w) + ' ' + str(h) + ' ' + '
')
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
修改图像和对应的xml数据
我们在制作完成数据集之后,可能只需要裁剪出一部分的图像和标签数据作为训练数据,这里,写了一个图像和标签数据裁剪的代码,输出想要的对应的区域。
比如说我只想裁剪出所有数据集中的这个位置的图像,并修改对应的标签文件。
直接看代码了。
标签的裁剪
import os
import xml.etree.ElementTree as ET
import glob
#设置输入的xml文件夹,输出的txt的文件夹的位置
in_path = r"D:DATADL_TorchDATASskysatlabels_ori"
write_path = r"D:DATADL_TorchDATASskysatlabels_ori_512"
if not os.path.exists(write_path):
os.mkdir(write_path)
# 切换工作空间并获取文件
os.chdir(in_path)
annotations = os.listdir('.')
annotations = glob.glob(str(annotations)+'*.xml')
# 迭代每个xml文件
for i, file in enumerate(annotations):
# 设置保存文件
save_name = file.split('.')[0] + '.xml'
save_file = os.path.join(write_path, save_name)
#开始解析xml文件
with open(file,'rb') as fp:
xml = ET.parse(fp)
root = xml.getroot()
#更改宽、高(这里手动设置为自己需要裁剪的尺寸)
size = root.find('size')
size.find('width').text = str(512)
size.find('height').text = str(512)
# print(size.find('width').text,size.find('height').text)
# 获取对象标签
for obj in root.findall('object'):
xmlbox = obj.find('bndbox')
xmin = int(xmlbox.find('xmin').text)
xmax = int(xmlbox.find('xmax').text)
ymin = int(xmlbox.find('ymin').text)
ymax = int(xmlbox.find('ymax').text)
#过滤筛选不在范围内的标签,根据自己的需要修改范围
if (xmax > 512 or ymax > 512):
root.remove(obj)
xml.write(save_file, xml_declaration=True)
print('{} is finished!!!'.format(save_file))
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
图像的裁剪
import os
import glob
in_path = 'D:images_ori'
out_path = r'D:images_ori_512'
# 切换工作空间并获取文件
os.chdir(in_path)
annotations = os.listdir('.')
annotations = glob.glob(str(annotations)+'*.jpg')
#创建输出文件夹
if not os.path.exists(out_path):
os.mkdir(out_path)
# 迭代每张图片
for i, file in enumerate(annotations):
# 设置保存文件并打开
save_name = file.split('.')[0] + '.jpg'
save_file = os.path.join(out_path, save_name)
img = Image.open(file)
cropped = img.crop((0, 0, 512, 512)) #设置裁剪范围(x_min, y_min, x_max, y_max)
cropped.save(save_file)
print('{} save successed!!!'.format(save_file))
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
还行,凑合着用。需要改的自己改一点。
推荐阅读