我从推特上提取了数据。目前,数据在多个文件中,我无法将其合并到一个文件中。
注意:所有文件都是JSON格式的。
我编写了这段代码,正如我在关于使用Python合并JSON的一些教程中看到的那样
from glob import glob
import json
import pandas as pd
with open('Desktop/json/finalmerge.json', 'w') as f:
for fname in glob('Desktop/json/*.json'): # Reads all json from the current directory
with open(fname) as j:
f.write(str(j.read()))
f.write('\n')
我成功地合并了所有文件,现在文件是finalmerge.json。
现在,我按照几个线程中的建议使用了这一点:
df_lines = pd.read_json('finalmerge.json', lines=True)
df_lines
1000000*23 columns
那么,我应该如何使每个特性在单独的列中呢?
我不知道为什么JSON文件有什么问题,我检查了合并的文件,发现它作为JSON文件无效?我该怎么做才能把它变成一个数据框架?
我问这个问题的原因是,我有非常基本的蟒蛇知识,我发现类似问题的所有答案都比我所能理解的要复杂得多。请帮助这个新的python用户将多个JSON文件转换为一个JSON文件。
发布于 2020-10-19 16:58:25
我认为问题在于您的文件不是真正的json (或者更好地说,它们是以强森的形式构造的)。你有两种程序方式:
试着跟进这个问题,让我知道它是否解决了你的问题:将JSONL文件作为JSON对象加载
您还可以尝试以这种方式编辑代码:
with open('finalmerge.json', 'w') as f:
for fname in glob('Desktop/json/*.json'):
with open(fname) as j:
f.write(str(j.read()))
f.write('\n')
每一行都是不同的json元素。
https://stackoverflow.com/questions/64431731
复制相似问题