Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >python,如何引用data_frame行并行执行

python,如何引用data_frame行并行执行
EN

Stack Overflow用户
提问于 2019-07-04 07:32:42
回答 1查看 49关注 0票数 0

我编写了一个简单的for循环,它可以迭代数据帧的每一行。将数据帧的每一行与第二数据帧的所有条目(该函数的第二输入)进行比较。

现在,这个函数经过一些比较和搜索,返回具有以下结构的数据格式的回行。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
new_df=pd.DataFrame(columns=['1','2','3','4','5','6','dist','unique','occurence','timediff','id'], dtype='float')

for循环现在如下所示:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
for i in range(0,small_pd.shape[0]):
    new_df=new_df.append(SequencesExtractTime(small_pd.loc[i],large_pd.loc[i]) )

我正试图找到一种并行运行此代码的方法,因为在单个核心上执行需要数年时间。

我找到了那个包裹

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from joblib import Parallel, delayed
import multiprocessing

num_cores = multiprocessing.cpu_count()
print(Parallel(n_jobs=num_cores)(SequencesExtractTime(small_pd,large_pd)(i) for i in range(0,small_pd.shape[0])))

现在的问题是如何正确地使用这两个数据帧,以便可以从并行循环中使用。我认为问题在于,我不知道如何编写输入参数,因为我在for循环中使用了它们。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
small_pd.loc[i]

以并行函数的形式表示。

你能帮我解决这个问题吗?谢谢亚历克斯

EN

回答 1

Stack Overflow用户

发布于 2019-07-05 03:10:36

您的DataFrames是否包含>100万行?如果是这样的话,即使并行执行粗糙的循环也会对内存造成损失。

如果您真的需要比较从第一个df到第二个df的每个列条目。试着考虑一下列表解析。

这样,您就可以利用.intersection().difference(),无论哪种方法适合您过滤这里的文件的需要。

或者试试熊猫的groupby()

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56891029

复制
相关文章
一行 Python 代码实现并行
Python 在程序并行化方面多少有些声名狼藉。撇开技术上的问题,例如线程的实现和 GIL,我觉得错误的教学指导才是主要问题。常见的经典 Python 多线程、多进程教程多显得偏"重"。而且往往隔靴搔痒,没有深入探讨日常工作中最有用的内容。
昱良
2019/05/30
9220
一行 Python 代码实现并行
译者:caspar 译文:https://segmentfault.com/a/1190000000414339 原文:https://medium.com/building-things-on-the-internet/40e9b2b36148 Python 在程序并行化方面多少有些声名狼藉。撇开技术上的问题,例如线程的实现和 GIL,我觉得错误的教学指导才是主要问题。常见的经典 Python 多线程、多进程教程多显得偏"重"。而且往往隔靴搔痒,没有深入探讨日常工作中最有用的内容。 传统的例子 简单搜
企鹅号小编
2018/01/19
1K0
一行 Python 代码实现并行
并发与并行的区别_并发执行和并行执行
学习多线程的时候会遇到一个名词:并发。这是属于操作系统中的词汇,需要了解并发和并行的区别,从网上搜集了几种说法帮助理解。 一: 并发是指一个处理器同时处理多个任务。 并行是指多个处理器或者是多核的处理器同时处理多个不同的任务。 并发是逻辑上的同时发生(simultaneous),而并行是物理上的同时发生。 来个比喻:并发是一个人同时吃三个馒头,而并行是三个人同时吃三个馒头。 二: 并行(parallel):指在同一时刻,有多条指令在多个处理器上同时执行。就好像两个人各拿一把铁锨在挖坑,一小时后,每人一个大坑。所以无论从微观还是从宏观来看,二者都是一起执行的。
全栈程序员站长
2022/11/04
1.4K0
并发与并行的区别_并发执行和并行执行
一行 Python 代码实现并行,骚技能!
当我用Python写第一行代码的那一天,我着迷于简单性,流行性及其著名的单行代码。
用户7466307
2021/04/22
1.4K0
并行执行任务
在app列表首页,展示多个item,并有分页;而每个item里后台都会调用一个http请求,判断当前item的状态
LiosWong
2018/10/29
7100
并行执行(二)、multiprocessing
multiprocessing包是Python中的多进程管理包。它与 threading.Thread类似,可以利用multiprocessing.Process对象来创建一个进程。该进程可以允许放在Python程序内部编写的函数中。该Process对象与Thread对象的用法相同,拥有is_alive()、join([timeout])、run()、start()、terminate()等方法。属性有:authkey、daemon(要通过start()设置)、exitcode(进程在运行时为None、如果为–N,表示被信号N结束)、name、pid。此外multiprocessing包中也有Lock/Event/Semaphore/Condition类,用来同步进程,其用法也与threading包中的同名类一样。multiprocessing的很大一部份与threading使用同一套API,只不过换到了多进程的情境。这个模块表示像线程一样管理进程,这个是multiprocessing的核心,它与threading很相似,对多核CPU的利用率会比threading好的多。
狼啸风云
2022/07/27
5240
并行执行(二)、multiprocessing
实现并行运算的一行Python 代码
Python 在程序并行化方面多少有些声名狼藉。撇开技术上的问题,例如线程的实现和 GIL,我觉得错误的教学指导才是主要问题。常见的经典 Python 多线程、多进程教程多显得偏"重"。而且往往隔靴搔痒,没有深入探讨日常工作中最有用的内容。
1480
2019/05/21
8300
一行 Python 代码实现并行,骚技能,Get!
Python 在程序并行化方面多少有些声名狼藉。撇开技术上的问题,例如线程的实现和 GIL,我觉得错误的教学指导才是主要问题。常见的经典 Python 多线程、多进程教程多显得偏"重"。而且往往隔靴搔痒,没有深入探讨日常工作中最有用的内容。
一墨编程学习
2019/05/05
8710
一行 Python 代码实现并行,骚技能,Get!
并行执行任务思考
这篇文章由之前的并行执行任务发展而来,如何生成task,在之前的文章中,生成task方式如下:
LiosWong
2018/10/29
4820
聊聊在Python如何实现并行
何为并行和并发Python有哪些相关的模块该如何选择合适的模块CPU-bound和I/O-bound问题threading、asyncio和multiprocessing优劣抉择结论
哒呵呵
2019/03/01
8170
[python]map方法与并行执行
由上可见, 调用map, 相当于顺序调用了add(1,4), add(2,5), add(3,6)方法; 一行代码实现了方法的迭代调用, 简单快捷。 那如果再优化一下,实现并行调用add方法, 应该怎么做呢?在python里也好实现, 利用multiprocessing模块就可以。
py3study
2020/01/13
1.3K0
Python并行编程之道—加速海量任务同时执行
这次我要和大家分享一种加速海量任务执行的方法,那就是Python并行编程。如果你经常处理大量的任务,并且希望能够同时执行它们以提高效率,那么并行编程将会给你带来巨大的帮助!
华科云商小徐
2023/10/12
6470
3行代码实现 Python 并行处理,速度提高6倍!
原标题:Here’s how you can get a 2–6x speed-up on your data pre-processing with Python
数说君
2018/10/23
2.2K0
3行代码实现 Python 并行处理,速度提高6倍!
python 中如何引用头文件
如果是web 下,比如说django ,那么你新建一个app,把你需要导入的说用东东,都写到这个app中,然后在setting中的app也配上基本就ok了
py3study
2020/01/09
3.4K0
Oracle优化08-并行执行
在讨论Oracle的性能问题时,通常要假设一个前提,那就是这个系统是OLTP还是OLAP(或者说数据仓库系统)。 只有在这个前提下,讨论一些性能问题才有意义,因为这两类系统太不一样了,甚至很多技术是相悖的。
小小工匠
2021/08/16
3780
「PostgreSQL技巧」Citus实时执行程序如何并行化查询
Citus有多个不同的执行程序,每个执行程序的行为都不同,以支持各种用例。对于许多概念而言,分布式SQL似乎必须是一个复杂的概念,但是其原理并不是火箭科学。在这里,我们将看几个有关Citus如何采用标准SQL并将其转换为以分布式形式运行以便可以并行化的示例。结果是您可以看到单节点数据库的查询性能提高了100倍或更多。
架构师研究会
2020/07/20
8720
「PostgreSQL技巧」Citus实时执行程序如何并行化查询
使用shell并行执行多个脚本
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/53906996
用户1148526
2019/05/25
3.4K0
从4行代码看引用
http://mpvideo.qpic.cn/0bf2jeabmaaa5mamohecafqfasodczeqafqa.f10002.mp4?dis_k=d8f7c67a37d41e17ebd38a4
程序员小王
2021/04/28
5490
从4行代码看引用
点击加载更多

相似问题

如何并行执行python subTests?

17

如何并行执行函数: Python

20

Python连续并行执行

03

如何编写并行执行的函数(python)?

13

如何在python中并行执行for循环?

71
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文