18. 深度学习——图像的读取（笔记）

1. 图像基本知识像素值就是特征值单通道：每一个像素一个值，叫灰度值在[0~255]之间，三通道，每个像素点3个值。4-D张量是 [样本数，height, width, channels]缩放图片⼤小：减少像素的量；统⼀图⽚的⼤小，去进⾏算法识别。2. 图像基本操作API3.案例狗图片读取1、构造图片文件队列2、构造图片阅读器3、读取图片数据4、处理图片数据代码：import tensorflow

枫城雪

1165人浏览 · 2020-08-03 09:00:11

枫城雪 · 2020-08-03 09:00:11 发布

1. 图像基本知识

像素值就是特征值
在这里插入图片描述

单通道：每一个像素一个值，叫灰度值在[0~255]之间，三通道，每个像素点3个值。

在这里插入图片描述

4-D张量是 [样本数，height, width, channels]
在这里插入图片描述
缩放图片⼤小：减少像素的量；统⼀图⽚的⼤小，去进⾏算法识别。

2. 图像基本操作API

在这里插入图片描述

3.案例

狗图片读取

1、构造图片文件队列
2、构造图片阅读器
3、读取图片数据
4、处理图片数据

代码：

import tensorflow as tf
import os

main_path = "F:/文本文件数据/狗图片/"
# 导入数据的准备
file_name = os.listdir(main_path)
# print(file_name) # 以列表的形式列出文件的名字

# 完整路径
file_list = [main_path+x for x in file_name] 
# print(file_list)

# 1.构建文件的队列
file_queue = tf.train.string_input_producer(file_list)

# 2.构造阅读器读取队列数据(默认读取一张图片)
reader = tf.WholeFileReader()
key, value = reader.read(file_queue)
print(value)

# 3.对每一个图片进行解码
image = tf.image.decode_jpeg(value)
print(image)

# 4.统一图片大小
image_resize = tf.image.resize_images(image,[200,200])
print(image_resize)

# 5.批处理
image_batch = tf.train.batch([image_resize], batch_size=20, num_threads=1, capacity=20)
print(image_batch)

结果：
在这里插入图片描述

ValueError: All shapes must be fully defined: [TensorShape([Dimension(200), Dimension(200), Dimension(None)])]

做完批处理后，打印批处理后的结果，报错，意思是没有确定形状没有固定，可以看到3-D的张量长宽固定了是200x200但是通道数没有固定。但是又有一个问题，为啥之前形状都是问号没有固定并没有报错。原因是因为RGB有三个值，比如一张图片是很多像素点组成，有很多R值，G值，B值，当一张图片放入队列中相当于放了3张数字表进去（R,G,B），现在批处理，一下子放了好多图片进去，每张图片，有3张表，但是计算机并不知道你传的是彩色图还是灰度图，也就不知道一张图片有几张表，所以产生报错。

在批处理之前固定形状，也就是将图片的通道数写出来。

更正的代码：


import tensorflow as tf
import os

main_path = "F:/文本文件数据/狗图片/"
# 导入数据的准备
file_name = os.listdir(main_path)
# print(file_name) # 以列表的形式列出文件的名字

# 完整路径
file_list = [main_path+x for x in file_name] 
# print(file_list)

# 1.构建文件的队列
file_queue = tf.train.string_input_producer(file_list)

# 2.构造阅读器读取队列数据(默认读取一张图片)
reader = tf.WholeFileReader()
key, value = reader.read(file_queue)
print(value)

# 3.对每一个图片进行解码
image = tf.image.decode_jpeg(value)
print(image)

# 4.统一图片大小
image_resize = tf.image.resize_images(image,[200,200])
print(image_resize)

# 注意： 一定要把样本的形状固定【200,200,3】,在批处理的时候要求所有的数据形状必须定义
image_resize.set_shape([200,200,3])
# 5.批处理
image_batch = tf.train.batch([image_resize], batch_size=20, num_threads=1, capacity=20)
print(image_batch)

# 开启会话
with tf.Session() as sess:
    # 定义一个线程协调器
    coord = tf.train.Coordinator()
    
    #开启读文件的线程(这里比之前开启线程方便很多，有专门的的API)
    threads = tf.train.start_queue_runners(sess, coord=coord)
    
    print(sess.run([image_batch]))
    
    # 回收线程
    
    coord.request_stop()
    
    coord.join(threads)

结果：
在这里插入图片描述

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

嵌入式作业（七）：基于Ardunio的STM32串口通信

嵌入式作业（七）0作业要求1Ardunio 完成STM32的串口通信（1）安装Ardunio IDE（2）stm32串口通信2关于 stduino IDE0作业要求安装 Ardunio IDE 和相关软件支持库，在Ardunio 完成STM32板子的串口通信程序：（1）持续向串口输出“Hello world！”；（2）当接收到“stop!”时，停止输出。网上有一个国人版的MCU集成开发平台， st

CSDN学习社区

JDBC详解

JDBC文章目录JDBC什么是JDBC?JDBC驱动程序:Java使用JDBC访问数据库的步骤:设置classpath:Oracle连接字符串的书写格式:简单的例子:常用数据库的驱动程序及JDBC URL:Oracle数据库:SQL Server数据库MySQL数据库Access数据库PreparedStatement接口:JNDI-数据源（Data Source）与连接池（Connection

CSDN学习社区

“模式识别与机器学习”学习笔记no2.再谈感知机

接**上篇：上篇主要进行了PLA，Pocket算法的理论过程分析和在给定数据集上利用pocket算法对数据集进行分类学习，得到错分数量最少的分类面。上篇中pocket算法的过程已经进行了编程和测试，框架已经建立了起来，这一篇主要上篇中没有提到或涉及不深的几个问题。1.数据集的构造。上篇是直接使用了题目给的向量，这次来根据正态分布来产生数据集。np.random.normal函数可以根据均值和方差生