我正在尝试制作一个标记器,我有一个文件,我正在尝试用gzip读取它。但它会给出以下错误: Traceback (most recent call last):
File "extract_sends.py", line 14, in <module>
main()
File "extract_sends.py", line 12, in main
file_content = f.read()
File "/Library/Frameworks/Python.framework/Versions/3.7/lib/
如何从stdin逐行读取gzipped内容?
我在当前目录中有一个包含UTF-8内容的压缩文件a.gz。
场景1:
使用gzip.open(filename)是可行的。我可以打印开的线条。
with gzip.open('a.gz', 'rt') as f:
for line in f:
print(line)
# python3 my_script.py
场景2:
我想阅读stdin中的gzipped内容。因此,我将gzipped文件作为下面脚本的输入。
with gzip.open(sys.stdin, mode='rt&
当我试图用Python中的.gz模块逐行读取gzip文件时,我会遇到以下问题:
File "/home/user/path/to/example.py", line 40, in run
for line in handle:
File "/home/user/.conda/envs/py38/lib/python3.10/gzip.py", line 399, in readline
return self._buffer.readline(size)
AttributeError: 'GzipFile' object
plaintext = input("Please enter the text you want to compress")
filename = input("Please enter the desired filename")
with gzip.open(filename + ".gz", "wb") as outfile:
outfile.write(plaintext)
上面的python代码给了我以下错误:
Traceback (most recent call last):
File "C:
我正在阅读大量的gzip文件。当我尝试下面的代码时,由于某些文件已损坏,进程无法完成。Python可以打开那些损坏的文件,但是由于这些文件中某些行的错误,进程会被中断。
for file in files:
try:
fin=gzip.open(file,'rb')
except:
continue
for line in fin:
try:
temp=line.decode().split("
我在s3中有文件作为gzip块,因此我必须连续读取数据,不能随意读取数据。我总是要从第一个文件开始。
例如,假设我在s3、f1.gz、f2.gz、f3.gz中有3个gzip文件。如果我在本地下载所有,我可以做cat * | gzip -d。如果我做了cat f2.gz | gzip -d,gzip: stdin: not in gzip format就会失败。
如何使用python从s3中传输这些数据?我看到了智能打开,它有能力解压缩gz文件
from smart_open import smart_open, open
with open(path, compression='.g
我需要我的Python脚本来操作一个gzip压缩的文件,它可能仍然会被写入。因为它们还没有被适当地关闭,这样的操作有时会在结束时导致CRC错误。
我如何才能抑制这些错误,并简单地处理所有事情直到不完整的结尾?
我的代码是:
if usegzip:
opener = gzip.open;
else:
opener = open;
...
for line in opener(input_filename,'r'):
.... process line ....
当遇到仍然打开的文件时,我得到的异常是:
for line in opener(inp
我正在尝试用python脚本获得的结果填充数据库。我在POST请求中发送gzipped数据。
PHP脚本在中间充当web服务,需要提取gzip数据并获取“sql-query”并进行进一步的处理。
这就是我在Python方面想要做的:
Sending a POST request using urllib:
# Data to be sent in POST request, it can be a SQL UPDATE/INSERT or SELECT
dictheaders = {'sql': "UPDATE 'logs' SET 'some
如何用Python读取可能或不被gzip压缩的文件?
我现在的代码
with gzip.open("file.xml") as f:
xml.sax.parse(f, reader)
使用.xml.gz文件,但不处理.xml文件:
...
File "/usr/lib/python3.5/gzip.py", line 409, in _read_gzip_header
raise OSError('Not a gzipped file (%r)' % magic)
是否有一个内置的或重要的替代始终根据文件内容和/或文件扩展名返
我试图使用python的gzip库来简化一些创建csv输出文件的python脚本。我尝试过许多不同的方法来创建gzip文件,但是无论我尝试过哪种方法,我都遇到了相同的问题。
我的python脚本成功运行,但是当我试图解压缩Finder中的gzip文件(使用MacOS 10.15.6)时,提示我出现以下错误:
Unable to expand "file.csv.gz" into "Documents". (Error 79 - Inappropriate file type or format.)
经过一些调试,我将错误的原因缩小到包含行中断(\n)字符的文件内
目标是创建python2.7和>=python3.6兼容的代码。
此代码目前在python2.7上工作。它创建一个GzipFile对象,然后将列表写入gzip文件。它最后将gzip文件上传到一个s3桶中。
示例数据:[1,2,3,4,5,6,"a",3,"iamastring"]
def get_gzip_writer(path):
with s3_reader.open(path) as s3_file:
with gzip.GzipFile(fileobj=s3_file, mode="w") as gzip_file:
我正在尝试使用Hadoop Streaming来运行两个命令,比如gunzip | map_to_old_format.py,但是它在gzip中显示"|.gz not found“或者类似的东西(仅当通过Hadoop.如果我在命令行上运行,它工作得很好)。
因为我不知道如何在Python语言中动态压缩,所以我想创建一个shell脚本来为我组合这个命令(例如gunzip_and_map_to_old.sh)。我尝试了一下,但是gzip不喜欢(gzip抱怨" gzip : stdin: not in gzip format"):
#!/bin/bash
while read
环境: Windows,Python3.4.1,64位版本.
我试着用泡菜和gzip保存数据,就像这样:
with gzip.open(filename, 'rb') as f:
pickle.dump(data,f)
可以在不使用gzip的情况下成功地转储数据,但是对于gzip,异常引发如下:
File "C:\Python34\lib\gzip.py", line 344, in write
self.fileobj.write( self.compress.compress(data) )
OverflowError: Size does no
我试图为序列到序列模型运行教程,但运行以下命令
bazel run -c opt <...>/models/rnn/translate/translate.py --data_dir [your_data_directory]
以下列错误结尾
for line in gz_file:
File "/usr/lib/python2.7/gzip.py", line 462, in readline
c = self.read(readsize)
File "/usr/lib/python2.7/gzip.py", line 26
运行时出现以下错误: Python manage.py createsuperuser
Traceback (most recent call last):
File "/Users/project/env/lib/python3.7/site-packages/django/contrib/auth/password_validation.py", line 174, in __init__
with gzip.open(password_list_path, 'rt', encoding='utf-8') as f:
F