腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

社区首页 >问答首页 >python，如何引用data_frame行并行执行

问python，如何引用data_frame行并行执行
EN

Stack Overflow用户

提问于 2019-07-04 07:32:42

回答 1查看 49关注 0票数 0

我编写了一个简单的for循环，它可以迭代数据帧的每一行。将数据帧的每一行与第二数据帧的所有条目(该函数的第二输入)进行比较。

现在，这个函数经过一些比较和搜索，返回具有以下结构的新数据格式的回行。

new_df=pd.DataFrame(columns=['1','2','3','4','5','6','dist','unique','occurence','timediff','id'], dtype='float')

for循环现在如下所示：

for i in range(0,small_pd.shape[0]):
    new_df=new_df.append(SequencesExtractTime(small_pd.loc[i],large_pd.loc[i]) )

我正试图找到一种并行运行此代码的方法，因为在单个核心上执行需要数年时间。

我找到了那个包裹

from joblib import Parallel, delayed
import multiprocessing

num_cores = multiprocessing.cpu_count()
print(Parallel(n_jobs=num_cores)(SequencesExtractTime(small_pd,large_pd)(i) for i in range(0,small_pd.shape[0])))

现在的问题是如何正确地使用这两个数据帧，以便可以从并行循环中使用。我认为问题在于，我不知道如何编写输入参数，因为我在for循环中使用了它们。

small_pd.loc[i]

以并行函数的形式表示。

你能帮我解决这个问题吗？谢谢亚历克斯

python

dataframe

parallel-processing

1元体验云点播

覆盖建站/短视频等热门场景，提供媒资管理、短视频 SDK、小程序插件和播放器云+端一体化能力，助您抓住视频风口

回答 1

Stack Overflow用户

发布于 2019-07-05 03:10:36

您的DataFrames是否包含>100万行？如果是这样的话，即使并行执行粗糙的循环也会对内存造成损失。

如果您真的需要比较从第一个df到第二个df的每个列条目。试着考虑一下列表解析。

这样，您就可以利用.intersection()或.difference()，无论哪种方法适合您过滤这里的文件的需要。

或者试试熊猫的groupby()

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/56891029

复制

一行 Python 代码实现并行

编程算法 python

Python 在程序并行化方面多少有些声名狼藉。撇开技术上的问题，例如线程的实现和 GIL，我觉得错误的教学指导才是主要问题。常见的经典 Python 多线程、多进程教程多显得偏"重"。而且往往隔靴搔痒，没有深入探讨日常工作中最有用的内容。

昱良

2019/05/30

9220

一行 Python 代码实现并行

数据库 android java

译者：caspar 译文：https://segmentfault.com/a/1190000000414339 原文：https://medium.com/building-things-on-the-internet/40e9b2b36148 Python 在程序并行化方面多少有些声名狼藉。撇开技术上的问题，例如线程的实现和 GIL，我觉得错误的教学指导才是主要问题。常见的经典 Python 多线程、多进程教程多显得偏"重"。而且往往隔靴搔痒，没有深入探讨日常工作中最有用的内容。传统的例子简单搜

企鹅号小编

2018/01/19

1K0

并发与并行的区别_并发执行和并行执行

https 网络安全

学习多线程的时候会遇到一个名词：并发。这是属于操作系统中的词汇，需要了解并发和并行的区别，从网上搜集了几种说法帮助理解。一：并发是指一个处理器同时处理多个任务。并行是指多个处理器或者是多核的处理器同时处理多个不同的任务。并发是逻辑上的同时发生（simultaneous），而并行是物理上的同时发生。来个比喻：并发是一个人同时吃三个馒头，而并行是三个人同时吃三个馒头。二：并行(parallel)：指在同一时刻，有多条指令在多个处理器上同时执行。就好像两个人各拿一把铁锨在挖坑，一小时后，每人一个大坑。所以无论从微观还是从宏观来看，二者都是一起执行的。

全栈程序员站长

2022/11/04

1.4K0

一行 Python 代码实现并行，骚技能！

python 编程算法 serverless

当我用Python写第一行代码的那一天，我着迷于简单性，流行性及其著名的单行代码。

用户7466307

2021/04/22

1.4K0

并行执行任务

其他

在app列表首页,展示多个item,并有分页;而每个item里后台都会调用一个http请求,判断当前item的状态

LiosWong

2018/10/29

7100

并行执行(二)、multiprocessing

processing

multiprocessing包是Python中的多进程管理包。它与 threading.Thread类似，可以利用multiprocessing.Process对象来创建一个进程。该进程可以允许放在Python程序内部编写的函数中。该Process对象与Thread对象的用法相同，拥有is_alive()、join([timeout])、run()、start()、terminate()等方法。属性有：authkey、daemon（要通过start()设置）、exitcode(进程在运行时为None、如果为–N，表示被信号N结束）、name、pid。此外multiprocessing包中也有Lock/Event/Semaphore/Condition类，用来同步进程，其用法也与threading包中的同名类一样。multiprocessing的很大一部份与threading使用同一套API，只不过换到了多进程的情境。这个模块表示像线程一样管理进程，这个是multiprocessing的核心，它与threading很相似，对多核CPU的利用率会比threading好的多。

狼啸风云

2022/07/27

5240

实现并行运算的一行Python 代码

编程算法 python

1480

2019/05/21

8300

一行 Python 代码实现并行，骚技能，Get!

编程算法 python

一墨编程学习

2019/05/05

8710

并行执行任务思考

其他

这篇文章由之前的并行执行任务发展而来,如何生成task,在之前的文章中,生成task方式如下:

LiosWong

2018/10/29

4820

聊聊在Python如何实现并行

https 网络安全 python

哒呵呵

2019/03/01

8170

[python]map方法与并行执行

add io map multiprocessing pool

由上可见, 调用map, 相当于顺序调用了add(1,4), add(2,5)， add(3,6)方法; 一行代码实现了方法的迭代调用, 简单快捷。那如果再优化一下，实现并行调用add方法，应该怎么做呢？在python里也好实现, 利用multiprocessing模块就可以。

py3study

2020/01/13

1.3K0

Python并行编程之道—加速海量任务同时执行

python 爬虫

这次我要和大家分享一种加速海量任务执行的方法，那就是Python并行编程。如果你经常处理大量的任务，并且希望能够同时执行它们以提高效率，那么并行编程将会给你带来巨大的帮助！

华科云商小徐

2023/10/12

6470

3行代码实现 Python 并行处理，速度提高6倍！

其他

原标题：Here’s how you can get a 2–6x speed-up on your data pre-processing with Python

数说君

2018/10/23

2.2K0

python 中如何引用头文件

python jquery

如果是web 下，比如说django ，那么你新建一个app，把你需要导入的说用东东，都写到这个app中，然后在setting中的app也配上基本就ok了

py3study

2020/01/09

3.4K0

Oracle优化08-并行执行

oracle 数据库 sql

在讨论Oracle的性能问题时，通常要假设一个前提，那就是这个系统是OLTP还是OLAP（或者说数据仓库系统）。只有在这个前提下，讨论一些性能问题才有意义，因为这两类系统太不一样了，甚至很多技术是相悖的。

小小工匠

2021/08/16

3780

「PostgreSQL技巧」Citus实时执行程序如何并行化查询

sql 分布式对象存储微信

Citus有多个不同的执行程序，每个执行程序的行为都不同，以支持各种用例。对于许多概念而言，分布式SQL似乎必须是一个复杂的概念，但是其原理并不是火箭科学。在这里，我们将看几个有关Citus如何采用标准SQL并将其转换为以分布式形式运行以便可以并行化的示例。结果是您可以看到单节点数据库的查询性能提高了100倍或更多。

架构师研究会

2020/07/20

8720

使用shell并行执行多个脚本

云数据库 SQL Server sql 数据库

用户1148526

2019/05/25

3.4K0

从4行代码看引用

汇编语言 https http 网络安全编程算法

http://mpvideo.qpic.cn/0bf2jeabmaaa5mamohecafqfasodczeqafqa.f10002.mp4?dis_k=d8f7c67a37d41e17ebd38a4

程序员小王

2021/04/28

5490

点击加载更多

相似问题

如何并行执行python subTests？

如何并行执行函数: Python

Python连续并行执行

如何编写并行执行的函数(python)？

如何在python中并行执行for循环？

活动推荐

提供高质量视频生成与处理服务，效果专业

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问python，如何引用data_frame行并行执行
EN

1元体验云点播

回答 1

Stack Overflow用户

如何并行执行python subTests？

如何并行执行函数: Python

Python连续并行执行

如何编写并行执行的函数(python)？

如何在python中并行执行for循环？

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问python，如何引用data_frame行并行执行EN

1元体验云点播

回答 1

Stack Overflow用户

如何并行执行python subTests？

如何并行执行函数: Python

Python连续并行执行

如何编写并行执行的函数(python)？

如何在python中并行执行for循环？

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问python，如何引用data_frame行并行执行
EN