"笨方法"学习CNN图像识别(二)—— tfrecord格式高效读取数据

— 全文阅读5分钟 —

在本文中,你将学习到以下内容:


  • 将图片数据制作成tfrecord格式
  • 将tfrecord格式数据还原成图片

前言

tfrecord是TensorFlow官方推荐的标准格式,能够将图片数据和标签一起存储成二进制文件,在TensorFlow中实现快速地复制、移动、读取和存储操作。训练网络的时候,通过建立队列系统,可以预先将tfrecord格式的数据加载进队列,队列会自动实现数据随机或有序地进出栈,并且队列系统和模型训练是独立进行的,这就加速了我们模型的读取和训练。

准备图片数据

按照图片预处理教程,我们获得了两组resize成224*224大小的商标图片集,把标签分别命名成1和2两类,如下图:

《
两类图片数据集
《
label:1
《
label:2

我们现在就将这两个类别的图片集制作成tfrecord格式。

制作tfrecord格式

导入必要的库:

定义一些路径和参数:

bestnum控制每个tfrecord的大小,这里使用1000,首先定义tf.python_io.TFRecordWriter,方便后面写入存储数据。
制作tfrecord格式时,实际上是将图片和标签一起存储在tf.train.Example中,它包含了一个字典,键是一个字符串,值的类型可以是BytesListFloatListInt64List

在这里我们保存的label是classes中的编号索引,即0和1,你也可以改成文件名作为label,但是一定是int类型。图片读取以后转化成了二进制格式。最后通过writer写入数据到tfrecord中。
最终我们在当前目录下生成一个tfrecord文件:

《
tfrecord文件

读取tfrecord文件

读取tfrecord文件是存储的逆操作,我们定义一个读取tfrecord的函数,方便后面调用。

这段代码主要是通过tf.TFRecordReader读取里面的数据,并且还原数据类型,最后我们对图片矩阵进行归一化。到这里我们就完成了tfrecord输出,可以对接后面的训练网络了。
如果我们想直接还原成原来的图片,就需要先注释掉读取tfrecord函数中的归一化一行,并添加部分代码,完整代码如下:

在后面建立了一个队列tf.train.batch,通过Session调用顺序队列系统,输出每张图片。Session部分在训练网络的时候还会讲到。我们学习tfrecord过程,能加深对数据结构和类型的理解。到这里我们对tfrecord格式的输入输出有了一定了解,我们训练网络的准备工作已完成,接下来就是我们CNN模型的搭建工作了。

点赞