使用python itertools.groupby解析文本数据块

、、

我正在尝试用itertools.groupby解析Python2.7中的一个文本块，数据结构如下： BEGIN IONSRTINSECONDS=14.605我使用的代码如下： import itertoolsdef isa_group_separator(line):rege

浏览 24提问于2019-09-04得票数 1

回答已采纳

1回答

解析可迭代性而不对每个块进行listifying

、、、、

假设我想要实现一个可迭代Python的分裂，而不对每个块进行语言化，类似于itertools.groupby，它的块是懒惰的。但我想在一个比平等的钥匙更复杂的条件下去做。所以更像一个解析器。(但more_itertools.split_at对每个块进行了listifies处理。) 在解析器组合器语言中，这可能称为sepBy1(odd, many(even))。使用itertools.groupby可能会有一些聪明的jitsu，可能会应

浏览 5提问于2022-05-03得票数 0

回答已采纳

1回答

使用python和groupby处理stdin数据块

、、

其目标是让python脚本逐行处理排序的stdin，收集具有相同键的“数据块”，然后在键发生变化时将该块作为JSON (或任何其他单个对象)输出。在这个阶段，我只希望能够通过正确使用groupby和itertools来隔离关键和数据块。在下面的示例中，有两个块，每个块有三行。设置是data.csv在哪里 1,a,test 1,ho

浏览 0提问于2013-06-28得票数 0

回答已采纳

3回答

困扰Python迭代工具群中的奇怪行为/错误？

、、、、

我使用itertools.groupby来解析一个短的标签分隔的文本文件。文本文件有几个列，我所要做的就是对特定列中具有特定值x的所有条目进行分组。下面的代码用于名为name2的列，查找变量x中的值。我尝试使用csv.DictReader和itertools.groupby来完成这个任务。在表中，有8行与此条件匹配，因此应该返回8个条目。我在下面对相同的数据手动进行匹配，并得到正确的结果： import itertools, operator, csv

浏览 6提问于2012-10-24得票数 1

回答已采纳

3回答

解析文本文件中的数据

、、

我有一个文本文件，内容如下：ID: 01Data3: -0.1091356549E+001然后是一个空行，并重复更多相似的块，所有这些块都具有相同的数据字段。我正在将一段C++代码移植到Python上，其中的某个部分逐行获取文件，检测<em

浏览 0提问于2013-06-14得票数 9

回答已采纳

1回答

我需要改进一个解析多个fasta文件的函数，用一个尝试注释处理来检查是否压缩。

、、

嗨，伙计们，我正在处理一个巨大的gz压缩fasta文件，我有一个很好的fasta解析器，但是我想让它变得更一般，在我可以检查压缩的方式，解析一个gz或一个非压缩的文件。filename.endswith('.gz'): fasta_iter = (it[1] for it in itertools.groupbyis_header)) with open

浏览 1提问于2020-01-27得票数 0

回答已采纳

1回答

NLP项目的数据库

、、、、

有人能建议哪个数据库更好地存储文本信息，如词性序列，依存关系，用python编写的NLP项目中使用的句子。现在，这些信息被存储在文件中，每次都需要对它们进行解析，以便提取所提到的块，这些块将用作下一处理阶段的输入。考虑的选项- MongoDB、Cassandra和MySQL。NoSQL数据库在这种类型的应用程序中是否更好。谢谢。

浏览 0提问于2013-06-01得票数 0

回答已采纳

3回答

Python -从具有可变属性和行长度的文件中读取数据

我正在尝试找到在Python中解析文件并创建命名元组列表的最佳方法，每个元组表示一个数据实体及其属性。数据看起来像这样：STY: Acquired Abnormality STN: A1.2.2.2 input = file.read().split("\n\n&q

浏览 0提问于2013-04-24得票数 3

回答已采纳

2回答

确定两个列表中元素的分组程度

、

我想要做的是确定两个字符串的公共元素分组的程度。可能已经有一个数学函数或scipy/numpy/etc函数可以做到这一点。我只是不知道它叫什么。我已经用谷歌搜索过了。例如：['a','a','a','b','b','b']['b','b','b','a','a','a']['a','a

浏览 2提问于2019-03-24得票数 2

1回答

试图在Python中使用docutils.parsers.rst.tableparser

、、

我想使用Python包中的解析器来获取一个纯文本表并轻松地解析它。表解析器可以读取的表的格式对于我的项目非常方便。问题在于，即使文档中说，解析(块)函数的输入是“文本行列表；没有空格填充”，但每当我试图解析某项内容时，它都会失败。所以像这样的一小块代码： parser = tbp.GridTablePar

浏览 2提问于2014-12-03得票数 1

回答已采纳

1回答

使用python从文本中提取变量并写入csv

、、

我需要帮助来解析一个看起来像这样的文本文件： WKU 3487472 03487471 J 16, 1969 A41d 25104 19700106 for end_of_record, lines in <em

浏览 0提问于2013-02-28得票数 0

回答已采纳

1回答

将IP列表转换为CIDR块

我想将类似于so的IPv4地址列表转换为一个汇总的CIDR列表，并将最接近的匹配IP地址组合在一起以创建CIDR块。根据下面的链接，我的理解是，我希望使用itertools.groupby()将它们转换为范围列表，然后将它们转换为基于范围的CIDR。 69.162.124.236, 63.143.42.242,] 我的当前函数运行在Python3.9.

浏览 8提问于2022-02-22得票数 2

1回答

如何对文件使用itertools.groupby

我计划使用itertools.groupby创建一个包含块数据的列表，但我很难找出将行分割为列表块的关键部分。 blocks = [] for key, val in itertools.groupby(f, lambda x:):

浏览 0提问于2017-05-08得票数 0

1回答

使用python将有组织的文本文件转换为csv？

、、、

我需要将文本文件转换为csv并按列组织它。然而，我在文本文件中的数据是以行为单位的，有715页长。以下是文本文件外观的示例：基本上，每一行都用“-”分隔。但是，行之间的数据位于多行中。有没有办法绕过这种奇怪的数据布局，最终得到一个csv，其中包含姓名、年龄、职业、薪水等列。我将使用python。我在想，有没有可能用每个新行前面的-符号来拆分它？

浏览 1提问于2020-10-17得票数 0

1回答

如何对StanfordNLP服务器进行100 K左右的字符限制？

我正试图用StanfordNLP解析书长的文本块。http请求工作得很好，但是文本长度有一个不可配置的100 in限制，即MAX_CHAR_LENGTH in StanfordCoreNLPServer.java。现在，在将文本发送到服务器之前，我正在对其进行切分，但是即使我尝试在句子和段落之间进行分割，也会在这些块之间丢失一些有用的共同引用信息。想必，我可以解析具有较大重叠的块，并将它们链接到一起，但这似乎(1)不雅，(2)类似于相当多的维护。是否

浏览 6提问于2017-10-11得票数 3

回答已采纳

1回答

Python中的垂直直方图

我试图用单词的长度和这些长度的频率作为变量，将文本放到垂直直方图中。我可以很容易地做到水平，但我完全迷路了，当涉及到垂直。(是的，一般是Python和编程方面的新手)import itertools word_count = len(word) word_l

浏览 6提问于2011-03-24得票数 0

回答已采纳

1回答

有办法将Ride .Robot txt文件转换为Python代码吗？

、

我知道RIDE运行.robot文件并将txt转换为Python robot.api调用。我想看看骑行中的东西是如何在robot.api中被调用的Library DateTime A_Test_Case与以下相同：testcase.keywords.create(&

浏览 7提问于2020-04-09得票数 0

回答已采纳

1回答

应用程序/逻辑丛-1的节点表达式体解析器

、、、、

我使用节点表示来处理的POST请求，并使用application/logplex-1格式的正文数据(显然是)。特别是，我使用作为中间件来解析POST主体。指定app.use(bodyParser.text({ type: 'application/logplex-1' }))来强制body-parser将主体解析为文本是可以的，但是文本只是一个空间分隔的大信息块因此，我需要进一步解析<

浏览 5提问于2015-08-20得票数 0

回答已采纳

2回答

连续几天将工作时间分组

、、

问题描述"""Mon-Thu 9:30AM-9:00PM Sun & Hol 11:00AM-6:00PM"""我的方法基于解析工作日的行，按照第一个空格拆分，然后使用itertools.groupby()对每一行的第二项进行排序，

浏览 0提问于2017-09-08得票数 5

回答已采纳

2回答

如何在txt文件末尾解析json格式化文本

、

我有一个txt文件，它包含一些纯文本和一个json样式的文本块。我想解析txt并将json块解压缩到python对象。: { }, "asdf", "sdf"} 在每个txt中只有一个合法的json块。

浏览 2提问于2018-09-28得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

解析可迭代性而不对每个块进行listifying

使用python和groupby处理stdin数据块

困扰Python迭代工具群中的奇怪行为/错误？

解析文本文件中的数据

我需要改进一个解析多个fasta文件的函数，用一个尝试注释处理来检查是否压缩。

NLP项目的数据库

Python -从具有可变属性和行长度的文件中读取数据

确定两个列表中元素的分组程度

试图在Python中使用docutils.parsers.rst.tableparser

使用python从文本中提取变量并写入csv

将IP列表转换为CIDR块

如何对文件使用itertools.groupby

使用python将有组织的文本文件转换为csv？

如何对StanfordNLP服务器进行100 K左右的字符限制？

Python中的垂直直方图

有办法将Ride .Robot txt文件转换为Python代码吗？

应用程序/逻辑丛-1的节点表达式体解析器

连续几天将工作时间分组

如何在txt文件末尾解析json格式化文本

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐