Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场

tf.io

作者头像
狼啸风云
修改于 2022-09-04 13:15:40
修改于 2022-09-04 13:15:40
3K00
代码可运行
举报
运行总次数:0
代码可运行

一、构成

1、模块

2、类

  • FixedLenFeature:用于解析固定长度输入特性的配置。
  • FixedLenSequenceFeature:将变长输入特征解析为张量的配置。
  • PaddingFIFOQueue:一个FIFOQueue支持通过填充来批量处理可变大小的张量。
  • PriorityQueue:按优先级顺序对元素进行排队的队列实现。
  • QueueBase:队列实现的基类。
  • RandomShuffleQueue:按随机顺序对元素进行排队的队列实现。
  • SparseFeature:用于解析示例中的稀疏输入特性的配置。
  • TFRecordCompressionType:记录的压缩类型。
  • TFRecordOptions:用于操作TFRecord文件的选项。
  • TFRecordWriter:将记录写入TFRecords文件的类。
  • VarLenFeature:用于解析可变长度输入特性的配置。

3、函数

  • decode_and_crop_jpeg():将jpeg编码的图像解码并裁剪成uint8张量。
  • decode_base64():解码web安全的base64编码字符串。
  • decode_bmp():将bmp编码的图像的第一帧解码为uint8张量。
  • decode_compressed():减压字符串。
  • decode_csv():将CSV记录转换为张量。每一列映射到一个张量。
  • decode_gif():将gif编码图像的帧解码为uint8张量。
  • decode_image():用于decode_bmp、decode_gif、decode_jpeg和decode_png的函数。
  • decode_jpeg():将jpeg编码的图像解码为uint8张量。
  • decode_json_example():将json编码的示例记录转换为二进制协议缓冲区字符串。
  • decode_png():将png编码的图像解码为uint8或uint16张量。
  • decode_proto():op从序列化协议缓冲区消息中提取字段到张量中。
  • decode_raw():将原始字节字符串转换成张量。(弃用参数)
  • deserialize_many_sparse():从序列化的迷你批处理反序列化并连接sparsetenators。
  • encode_base64():将字符串编码为web安全的base64格式。
  • encode_jpeg():jpeg编码图像。
  • encode_proto():op序列化输入张量中提供的protobuf消息。
  • extract_jpeg_shape():提取jpeg编码的图像的形状信息。
  • is_jpeg():检查“内容”是否编码JPEG图像的便利函数。
  • match_filenames_once():保存匹配模式的文件列表,因此只计算一次。
  • matching_files():返回匹配一个或多个glob模式的文件集。
  • parse_example():将示例原型解析为张量的dict。
  • parse_sequence_example():解析一批SequenceExample原型。
  • parse_single_example():解析一个示例原型。
  • parse_single_sequence_example():解析一个SequenceExample原型。
  • parse_张量():转换序列化的张量流。把张量变成张量。
  • read_file():读取和输出输入文件名的全部内容。
  • serialize_many_():将N-minibatch sparse张量序列化为[N, 3]张量。
  • serialize_():将稀疏张量序列化为一个3向量(1-D张量)对象。
  • serialize_张量():将张量转换为序列化的张量。
  • tf_record_iterator():从TFRecords文件中读取记录的迭代器。(弃用)
  • write_file():以输入文件名将内容写入文件。创建文件和递归
  • write_graph():将图形原型写入文件。

二、重要函数和类

1、tf.io.parse_single_example

解析单个Example协议。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
tf.io.parse_single_example(
    serialized,
    features,
    name=None,
    example_names=None
)

与parse_example类似,除了:对于稠密张量,返回的张量与parse_example的输出相同,除了没有批处理维数,输出形状与dense_shape中给出的形状相同。对于稀疏量,删除索引矩阵的第一个(batch)列(索引矩阵是列向量),值向量不变,删除形状向量的第一个(batch_size)条目(现在是单个元素向量)。可以通过使用parse_example批量处理示例原型而不是直接使用这个函数来看到性能优势。

参数:

  • serialized:一个标量字符串张量,一个序列化的例子。有关详细信息,请参见_parse_single_example_raw文档。
  • features:dict将特性键映射到FixedLenFeature或VarLenFeature值。
  • name:此操作的名称(可选)。
  • example_names:(可选)标量字符串张量,关联的名称。

返回值:

  • 一个dict映射特征键到张量和稀疏张量值。

可能产生的异常:

  • ValueError: if any feature is invalid.

2、tf.io.FixedLenFeature

用于解析固定长度输入特性的配置。若要将稀疏输入视为密集输入,请提供default_value;否则,对于任何缺少此特性的示例,解析函数都将失败。

域:

  • shape:输入数据的形状
  • dtype:输入的数据类型
  • default_value:如果示例缺少此特性,则使用的值。它必须兼容dtype和指定的形状

3、tf.io.VarLenFeature

用于解析可变长度输入特性的配置。

域:

  • dtype:输入的数据类型
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019年08月27日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
tf.io.parse_single_example()
类似parse_example,除了:对于稠密张量,返回的张量与parse_example的输出相同,除了没有批处理维数,输出形状与dense_shape中给出的形状相同。对于稀疏量,删除索引矩阵的第一个(batch)列(索引矩阵是列向量),值向量不变,删除形状向量的第一个(batch_size)条目(现在是单个元素向量)。可以通过使用parse_example批量处理示例原型而不是直接使用这个函数来看到性能优势。
狼啸风云
2019/08/29
2.4K0
tf.parse_single_example
对于稠密张量,返回的张量与parse_example的输出相同,除了没有批处理维数,输出形状与dense_shape中给出的形状相同。
狼啸风云
2019/06/13
1.8K0
【他山之石】Tensorflow之TFRecord的原理和使用心得
“他山之石,可以攻玉”,站在巨人的肩膀才能看得更高,走得更远。在科研的道路上,更需借助东风才能更快前行。为此,我们特别搜集整理了一些实用的代码链接,数据集,软件,编程技巧等,开辟“他山之石”专栏,助你乘风破浪,一路奋勇向前,敬请关注。
马上科普尚尚
2021/03/17
2.5K0
【他山之石】Tensorflow之TFRecord的原理和使用心得
基于tensorflow的图像处理(一)TFRecord输入数据格式
tensorflow提供了一种统一的格式来存储数据,这个格式就是TFRecord,TFRecord文件中的数据都是通过tf.train.Example Protocol Buffer的格式.proto来存储的。以下代码给出了tf.train.Example的定义。
狼啸风云
2019/07/03
2.1K0
TFRecord读写简介
为了高效地读取数据,比较有帮助的一种做法是对数据进行序列化并将其存储在一组可线性读取的文件(每个文件 100-200MB)中。这尤其适用于通过网络进行流式传输的数据。这种做法对缓冲任何数据预处理也十分有用。TFRecord 格式是一种用于存储二进制记录序列的简单格式。图片1. 写入TFRecord图片特征数据feature_data = { 'name': 'xiaoming', 'age': 20, 'height': 172.8, 'scores': [[120,130,140]
haoxiang
2022/08/11
5770
TFRecord读写简介
《机器学习实战:基于Scikit-Learn、Keras和TensorFlow》第13章 使用TensorFlow加载和预处理数据
Data API还可以从现成的文件(比如CSV文件)、固定大小的二进制文件、使用TensorFlow的TFRecord格式的文件(支持大小可变的记录)读取数据。TFRecord是一个灵活高效的二进制格式,基于Protocol Buffers(一个开源二进制格式)。Data API还支持从SQL数据库读取数据。另外,许多开源插件也可以用来从各种数据源读取数据,包括谷歌的BigQuery。
SeanCheney
2019/12/16
3.7K0
《机器学习实战:基于Scikit-Learn、Keras和TensorFlow》第13章 使用TensorFlow加载和预处理数据
小白学PyTorch | 17 TFrec文件的创建与读取
正常情况下我们用于训练的文件夹内部往往会存着成千上万的图片或文本等文件,这些文件通常被散列存放。这种存储方式有一些缺点:
机器学习炼丹术
2020/10/15
1.5K0
小白学PyTorch | 17 TFrec文件的创建与读取
【技术分享】TFRecord 实践
对于数据量较小而言,可能一般选择直接将数据加载进内存,然后再分batch输入网络进行训练。但是,如果数据量较大,这样的方法就不适用了,因为太耗内存,所以这时最好使用 tensorflow 提供的队列 queue,也就是第二种方法从文件读取数据。对于一些特定的读取,比如csv文件格式,官网有相关的描述。而 TFRecords 是tensorflow 的内定标准形式,更加高效的读取方法。 Tensorflow 读取数据的三种方式:
腾讯云TI平台
2019/07/03
2.3K1
【技术分享】TFRecord 实践
tf API 研读4:Inputs and Readers
tensorflow中数据的读入相关类或函数: 占位符(Placeholders) tf提供一种占位符操作,在执行时需要为其提供数据data。 操作 描述 tf.placeholder(dtype, shape=None, name=None) 为一个tensor插入一个占位符 eg:x = tf.placeholder(tf.float32, shape=(1024, 1024)) tf.placeholder_with_default(input, shape, name=None)
MachineLP
2018/01/09
1.6K0
tf API 研读4:Inputs and Readers
利用TFRecords存储于读取带标签的图片
TFRecords其实是一种二进制文件,虽然它不如其他格式好理解,但是它能更好的利用内存,更方便复制和移动,并且不需要单独的标签文件
演化计算与人工智能
2020/08/14
1.4K0
利用TFRecords存储于读取带标签的图片
TensorFlow 2.0 - TFRecord存储数据集、@tf.function图执行模式、tf.TensorArray、tf.config分配GPU
注意:@tf.function修饰的函数内,尽量只用 tf 的内置函数,变量只用 tensor、numpy 数组
Michael阿明
2021/02/19
9490
TensorFlow 2.0 - TFRecord存储数据集、@tf.function图执行模式、tf.TensorArray、tf.config分配GPU
小白学PyTorch | 16 TF2读取图片的方法
想要把一个图片,转换成RGB3通道的一个张量,我们怎么做呢?大家第一反应应该是PIL这个库吧
机器学习炼丹术
2020/10/15
7930
小白学PyTorch | 16 TF2读取图片的方法
tensorflow读取数据-tfrecord格式
概述关于tensorflow读取数据,官网给出了三种方法: 1、供给数据:在tensorflow程序运行的每一步,让python代码来供给数据 2、从文件读取数据:建立输入管线从文件中读取数据 3、预加载数据:如果数据量不太大,可以在程序中定义常量或者变量来保存所有的数据。 这里主要介绍一种比较通用、高效的数据读取方法,就是tensorflow官方推荐的标准格式:tfrecord。 tfrecord数据文件 tfrecord数据文件是一种将图像数据和标签统一存储的二进制文件,能更好的利用内存,在tenso
用户1332428
2018/03/08
2.8K0
Tensorflow使用TFRecords和tf.Example
参考 tf.python_io.TFRecordWriter() - 云+社区 - 腾讯云
狼啸风云
2022/09/28
1K0
Tensorflow使用TFRecords和tf.Example
tf.compat
沿着坐标轴给出的维数减少input_张量。除非keepdims为真,否则对于轴上的每一项,张量的秩都会减少1。如果keepdims为真,则使用长度1保留缩减后的维度。如果轴为空,则所有维数都被缩减,并返回一个只有一个元素的张量。
狼啸风云
2019/09/06
5.9K0
Tensorflow数据读取之tfrecord
这次只记录我在实验中遇到的情况和略懂的几点,多余的我没有怎么看【笑哭】,一个是因为懒,一个是因为官网介绍页太少了8,有点心塞~~ 开门见山,关于Tensorflow读取数据,官网给出了三种方法,分别是: 1.供给数据(Feeding): 在TensorFlow程序训练或者测试的每一个epoch,在tf.Session().run()函数中,以字典的形式通过feed_dict参数进行赋值。 2.从文件读取数据: 在TensorFlow图的起始, 让一个输入管线从文件中读取数据。 3.预加载数据: 在TensorFlow图中定义常量或变量来保存所有数据(仅适用于数据量比较小的情况)。
全栈程序员站长
2022/11/17
9820
TFRecord简介,原理分析,代码实现?[通俗易懂]
在利用深度学习算法搭建完成网络之后,我们要对网络进行训练,要训练网络就要有训练数据,通常我们会直接对硬盘上存放数据进行操作,来fetch到网络中。这样直接从硬盘上读取 数据太慢了,为了加快数据读取,今天我们介绍一种比较好的数据格式 tfrecord,那么什么是tfrecord呢?
全栈程序员站长
2022/08/02
7610
TFRecord简介,原理分析,代码实现?[通俗易懂]
Tensorflow - tfrecords 文件的创建
这里主要提供了 Tensorflow 创建 tfrecords 文件的辅助函数,以用于图像分类、检测和关键点定位.
AIHGF
2019/03/11
1.8K0
YJango:TensorFlow中层API Datasets+TFRecord的数据导入
2. 对接性:TensorFlow中也加入了高级API (Estimator、Experiment,Dataset)帮助建立网络,和Keras等库不一样的是:这些API并不注重网络结构的搭建,而是将不同类型的操作分开,帮助周边操作。可以在保证网络结构控制权的基础上,节省工作量。若使用Dataset API导入数据,后续还可选择与Estimator对接。
YJango
2018/04/10
4K2
YJango:TensorFlow中层API Datasets+TFRecord的数据导入
深度学习_1_Tensorflow_2_数据_文件读取
子线程读取数据 向队列放数据(如每次100个),主线程学习,不用全部数据读取后,开始学习
Dean0731
2020/05/08
9430
相关推荐
tf.io.parse_single_example()
更多 >
LV.1
这个人很懒,什么都没有留下~
加入讨论
的问答专区 >
    领券
    一站式MCP教程库,解锁AI应用新玩法
    涵盖代码开发、场景应用、自动测试全流程,助你从零构建专属AI助手
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档