深度学习训练数据python代码——数据增⼴(⼆)
python图像数据增强库
乍放的近义词
Augmentor使⽤⽐较简单,只有⼀些简单的操作。 imgaug实现的功能更多,可以对keypoint, bounding box同步处理,⽐如你现在由⼀些标记好的数据,只有同时对原始图⽚和标记信息同步处理,才能有更多的标记数据进⾏训练。我在gmentation和detection任务经常使⽤imgaug这个库。
Augmentor
[直接点开,⾕歌翻译,⽂档很全]
千门开锁万灯明
Augmentor 是管道化的图像增强库,每⼀个增强操作都是逐步叠加在图像上。此外对于输⼊的图像,可以选择按照⼀定的概率进⾏增强,⽐如只随机对⼀半图像进⾏旋转。
可以实现的操作有, rotate, crop, perspective skew(视⾓倾斜), elastic distortions(弹性变换【OCR⾮刚体中可以利⽤随机扭曲】), sheering(坐标轴倾斜), mirroring(镜像)、随机改变图像亮度Augmentor.Operations.RandomBrightness、随机改变对⽐度/饱和度、随机擦除某⼀矩形框⾥的像素Augmentor.Operations.RandomErasing、随机裁剪
npwp
/
*注意倾斜后,旋转后都有多余的边界,从倾斜图像中裁剪原始图像的相同纵横⽐的最⼤可能区域,然后调整⼤⼩以匹配原始图像尺⼨*/安装
sudo -H pip install Augmentor
中国古典四大名著
升级:
手机显示无法访问移动网络怎么办pip install Augmentor --upgrade
⽤法
第1步:创建新的管道
运营分类必须⾸先初始化⼀个对象,该对象指向存储原始图像数据集的⽬录
>>> import Augmentor
>>> p = Augmentor.Pipeline("/path/to/images")
Initialid with 100 images found in lected directory.
上海工商网官网第2步:向管道添加操作
>>> p.rotate(probability=0.7, max_left_rotation=10, max_right_rotation=10)
添加进⼀步的操作,在这种情况下是⼀个操作
>>> p.zoom(probability=0.3, min_factor=1.1, max_factor=1.6)
第3步:从流⽔线执⾏和采样
并指定所需的图像数量,在本例中为10,000:
>>> p.sample(10000)
语文书二年级下册默认情况下,新⽣成的增强图像将保存到名为output的⽬录中,相对于包含初始图像数据集的⽬录。
可以使⽤Augumentor.Pipeline()创建⼀个实例,调⽤各种⽅法向pipeline添加⽅法, status()可以显⽰当前pipeline的状态,在status中每个操作都有⼀个对应的index, remove_operation(index)移除⼀个操作, 最后调⽤sample(nums)得到nums个augument后的图像。
import Augmentor
p = Augmentor.Pipeline("/path/to/images/")
p.status()