首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >tf.data.Dataset:拆分字符串并将其转换为整数数组

tf.data.Dataset:拆分字符串并将其转换为整数数组
EN

Stack Overflow用户
提问于 2018-10-23 10:23:01
回答 1查看 1K关注 0票数 1

我正在使用tf.data.Dataset API,并以x numpy数组和y numpy数组作为标签开始。我的x只是由字符串组成:

array([["good movie"], ["terrible film"]]

所以我分成了一个训练和测试,并创建了一个tf.data.Dataset

代码语言:javascript
运行
AI代码解释
复制
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.1, random_state=42)

dataset = tf.data.Dataset.from_tensor_slices(({"reviews": x_train}, y_train))

但现在,我想这么做:

代码语言:javascript
运行
AI代码解释
复制
dataset["reviews"] = tf.string_split(dataset["sequence"])

但是这个语法是不正确的。我见过map,但我不想对tf.data.Dataset中的所有列都这样做。

此外,将字符串转换为整数数组的最佳方法是什么(每个单词都得到一个唯一的整数)。所以:

["good movie"]可能会变成[2, 4]

谢谢!

EN

回答 1

Stack Overflow用户

发布于 2018-11-11 09:12:29

您可以在Tensorflow存储库这里中找到关于这里的一个很好的示例。

在存储库中,除了它的并行数据集外,它还包含两个字典文件,名为src_vocab_filetrg_vocab_file,它们包含了我们语料库中的所有词汇表。

First,它通过utils.py将这两个文件转换为src_vocab_tabletrg_vocab_table

代码语言:javascript
运行
AI代码解释
复制
from tensorflow.python.ops import lookup_ops

src_vocab_table = lookup_ops.index_table_from_file(
      src_vocab_file, default_value=UNK_ID)

第二个,它使用iterator_utils.py拆分、缩短数据集中的字符串单词并将其转换为ID。

代码语言:javascript
运行
AI代码解释
复制
src_dataset = src_dataset.map(lambda src: tf.string_split([src]).values)
src_dataset = src_dataset.map(lambda src: src[:src_max_len])
src_dataset = src_dataset.map(lambda src: tf.cast(src_vocab_table.lookup(src), tf.int32))
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52955535

复制
相关文章
字符串转整数
/* 功能:字符串转整数 日期:2013-06-19 */ #include <stdio.h> #include <stdlib.h> #include <string.h> void StringToInteger(char *str,int *number); int main(void) { char ch[1000]={0}; int num[1000]; printf("请输入一个数字字符串"); gets(ch); StringToInteger(ch,num); prin
WindCoder
2018/09/20
1.5K0
Go 字符串转整数
image.png image.png
用户5760343
2019/07/17
1.4K0
Go 字符串转整数
int转换为char数组_C语言将整数转化为字符串
如int i=1;在程序中直接将强制将i转换成char类型char a=(char)i,会发现a并不是’1’而是’\0001′,原因是在将i转换成char时,默认的会把i的值当成ASCII值,这样a的值就是’\0001’了
全栈程序员站长
2022/11/03
3.4K0
整数拆分
给定一个正整数 n,将其拆分为至少两个正整数的和,并使这些整数的乘积最大化。 返回你可以获得的最大乘积。
宇宙之一粟
2020/10/26
1.5K0
leetcode 回文数_字符串转换为整数
原题链接 请你来实现一个 myAtoi(string s) 函数,使其能将字符串转换成一个 32 位有符号整数(类似 C/C++ 中的 atoi 函数)。
全栈程序员站长
2022/09/22
5190
字符串转换整数python_将Python字符串转换为Int:如何在Python中将字符串转换为整数
Unlike many other programming languages out there, Python does not implicitly typecast integers (or floats) to strings when you concatenate them to strings.
用户7886150
2021/01/14
4.1K0
shell字符串转换为数组
1)数组的定义 在shell中,数组的使用比较简单,基本的定义方法有如下4种: 方法1:
陈不成i
2021/06/22
2.4K0
字符串转换整数python_将Python字符串转换为Int:如何在Python中将字符串转换为整数
Unlike many other programming languages out there, Python does not implicitly typecast integers (or floats) to strings when you concatenate them to strings.
用户7886150
2021/01/14
3.9K0
mysql整型转字符串_java中如何将字符串转换为字符数组
select * from A order by cast(name as unsigned);
全栈程序员站长
2022/09/27
24.2K0
8. 字符串转整数 (atoi)
在找到第一个非空字符之前,需要移除掉字符串中的空格字符。如果第一个非空字符是正号或负号,选取该符号,并将其与后面尽可能多的连续的数字组合起来,这部分字符即为整数的值。如果第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成整数。
张伦聪zhangluncong
2022/10/26
7010
Swift 字符串转整数 (atoi) - LeetCode
1、在找到第一个非空字符之前,需要移除掉字符串中的空格字符。如果第一个非空字符是正号或负号,选取该符号,并将其与后面尽可能多的连续的数字组合起来,这部分字符即为整数的值。如果第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成整数。
韦弦zhy
2018/09/11
1.7K0
Swift 字符串转整数 (atoi) - LeetCode
json字符串数组转json数组
当需要把一串字符串转成一个json 数组 ,并遍历其中的内容时。 首先要导入 net.sf.json.JSONArray和net.sf.json.JSONObject 两个jar 包
全栈程序员站长
2022/06/24
5.7K0
枚举值转换(字符串转换为枚举和整数转换为枚举)
上面的方法是区分大小写的,也就是说,如果strA的值为“AA”,则转换失败;如果不需要区分大小写,需要使用下面的方法:
拓荒者IT
2019/09/26
4K0
Js数组转字符串
//join() 方法用于把数组中的所有元素放入一个字符串。 //元素是通过指定的分隔符进行分隔的。 <script type="text/javascript"> var arr = new Array(3) arr[0] = "George" arr[1] = "John" arr[2] = "Thomas" if(arr instanceof Array ){//用来判断是否是数组 console.log(arr.join()) //George,John,Thomas console.log
明知山
2020/09/03
10K0
343. 整数拆分
给定一个正整数 n,将其拆分为至少两个正整数的和,并使这些整数的乘积最大化。 返回你可以获得的最大乘积。 示例 1: 输入: 2 输出: 1 解释: 2 = 1 + 1, 1 × 1 = 1。 示例 2: 输入: 10 输出: 36 解释: 10 = 3 + 3 + 4, 3 × 3 × 4 = 36。 思路: 根据贪心算法,就尽量将原数拆成更多的 3 如果整数 n 的形式是 3k+1,例如 7。按照上面规则,会拆分成“3 + 3 + 1”。 1 是没作用的。此时
CaesarChang张旭
2021/06/17
4680
字符串数组转换为list集合
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/151785.html原文链接:https://javaforall.cn
全栈程序员站长
2022/06/24
2.3K0
js json字符串转json数组_string转json数组
查了很久,也实践了很多,都没有成功。网上说得最多的就是用 net.sf.json.JSONArray和net.sf.json.JSONObject 两个jar 包里面的
全栈程序员站长
2022/11/08
13.5K0
[Leetcode][python]String to Integer (atoi)/字符串转整数 (atoi)
将情况都考虑进去 1. 空字符串:返回 2. 从前往后遍历,发现空格,i++ 3. 若有符号,存储sign(flag) 4. 字符串转整数,result = result * 10 + ord(str[i]) - ord('0'),如果溢出直接返回MAX或MIN
蛮三刀酱
2019/03/26
9630
LeetCode8. 字符串转整数 (atoi)
 多考虑一些细节即可 class Solution { public int myAtoi(String str) { long ans = 0,MAX_INT = (long)Integer.MAX_VALUE + 1; boolean flag = false; int st = 0; while(st < str.length() && str.charAt(st) == ' ') { st++;
mathor
2018/07/24
6540
LeetCode8. 字符串转整数 (atoi)
Leetcode打卡 | No.008 字符串转整数
欢迎和小詹一起定期刷leetcode,每周一和周五更新一题,每一题都吃透,欢迎一题多解,寻找最优解!这个记录帖哪怕只有一个读者,小詹也会坚持刷下去的!
小小詹同学
2018/07/24
5320
Leetcode打卡  |  No.008 字符串转整数

相似问题

调整数组大小并将其转置

10

拆分函数并将其转换为整数值

22

C:拆分整数并将其转换为ASCII

40

遍历字符串数组并将其转换为整数

60

拆分字符串并将其解析为整数

21
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档