我的数据库中有一个collection想对其中的每一条记录添加一个键值,并进行更新
伪码:
cur = db["paperA"].find(no_cursor_timeout =True).batch_size(10000000)
for doc in cur:
sidTmp = {"Sid": doc.get('Sid')}
docTmp = self.citation_doc.find_one(sidTmp)
res = search_by_sid(docTmp["Citaions"], sidTmp)
由于集合包含上亿条数据,所以更新过程中会非常慢。
更新过程中,也会遇到bsonbj size is invalid问题
相似问题