Loading [MathJax]/jax/input/TeX/config.js

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >在NumPy中按非标准化对数概率从集合中采样

问在NumPy中按非标准化对数概率从集合中采样
EN

Stack Overflow用户

提问于 2021-01-24 05:38:05

回答 1查看 181关注 0票数 2

我有一个一维np.ndarray，里面充满了定义分类分布的非标准化对数概率。我想从这个分布中抽取一个整数索引。由于许多概率都很小，对对数概率进行归一化和指数化会带来很大的数值误差，因此我不能使用np.random.choice。实际上，我正在寻找一个与TensorFlow的tf.random.categorical等效的NumPy，它处理非标准化的对数概率。

如果NumPy中没有直接实现此目的的函数，那么实现这种采样的有效方式是什么？

性能强劲，每月20元起的MySQL

功能完善，便宜稳定，没有业务可以自动停机，强效降本的MySQL

EN

回答 1

Stack Overflow用户

发布于 2021-01-24 06:16:28

通常，存在具有自定义分布的many ways to choose an integer，但它们中的大多数采用与给定概率成比例的权重。如果权重是对数概率，则需要一种略有不同的方法。也许最简单的算法是拒绝采样，下面将对其进行描述并用Python实现。在下面的算法中，最大对数概率是max，并且有k个整数可供选择。

对数权重在[0 ]中取一个均匀的随机整数，将-

对应的对数权重生成一个指数(1)随机数，称其为ex.
If i - max，ex小于对数权重，返回i。否则，请转至步骤1.

拒绝采样的时间复杂度平均而言是恒定的，特别是当max设置为等于真正的最大权重时。另一方面，每个样本的预期迭代次数在很大程度上取决于分布的形状。另请参阅“公平芯片/偏置硬币加载芯片”算法中的Keith Schwarz's discussion。

现在，此算法的Python代码如下所示。

import random
import math

def categ(c):
 # Do a weighted choice of an item with the
 # given log-probabilities.
 cm=max(c) # Find max log probability
 while True:
      # Choose an item at random
      x=random.randint(0,len(c)-1)
      # Choose it with probability proportional
      # to exp(c[x])
      y=cm-random.expovariate(1)
      # Alternatively: y=math.log(random.random())+cm
      if y<c[x]:
          return x

上面的代码一次生成一个变量，并且只使用Python的基本模块，而不是NumPy。Another answer展示了如何在NumPy中通过随机变量块一次实现拒绝采样(尽管在不同的随机采样任务中演示)。

票数 1

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/65867476

复制

相关文章

7-15 球队“食物链” （30 分)【 DFS + 剪枝】

某国的足球联赛中有N支参赛球队，编号从1至N。联赛采用主客场双循环赛制，参赛球队两两之间在双方主场各赛一场。

Lokinli

2023/03/09

3350

足球数据 | 被对手进球后的十分钟内最有可能扳回比分

大数据文摘作品转载具体要求见文末作者|Alex Bleakley 选文 | Aileen 翻译 | 徐宇文校对 | 王昱森摘要：在凌晨结束的世预赛亚洲区12强赛第4场比赛中，中国队客场0比2不敌乌兹别克斯坦，4战之后仅积1分。赛后，国足主帅高洪波在发布会上宣布辞职。有人说，当一支足球队刚进球了以后，他们会突然变得比之前更容易被对方进球，这种说法是可靠的吗？这一现象又与主客场、球队实力等因素有无关系？来自英国的作者Alex Bleakley通过数据分析，针对这一现象进行了研究：他分析了201

大数据文摘

2018/05/22

1.4K0

《世界杯彩票竞猜系统》设计报告

足球彩票节是由爱彩网在2014年巴西世界杯前夕发起的彩民网上盛筵，从2014年6月3日开幕，至世界杯结束闭幕，此节日长达41天。节日期间爱彩网不间断推出众多促销活动惠及球迷和彩民，同时为世界杯助力造势。因此，建立一套基于计算机环境的技术先进、高效稳定、安全可靠的世界杯彩票竞猜测评系统是完全有必要的。

小爷毛毛_卓寿杰

2019/02/13

1K0

《世界杯彩票竞猜系统》设计报告

Python算法——树的平衡检测

python 二叉树 tree 算法原理

树的平衡检测是指判断一棵树是否为平衡二叉树，即每个节点的左右子树高度差不超过1。在本文中，我们将深入讨论如何实现树的平衡检测算法，提供Python代码实现，并详细说明算法的原理和步骤。

Echo_Wish

2023/11/30

1580

常用进程调度算法_进程调度算法例题

所谓进程调度方式，是指当某个进程正在处理机上执行时，若有某个更为重要或紧迫的进程需要处理，即有优先权更高的进程进入就绪队列，此时应如何分配处理机。通常有以下两种进程调度方式：

全栈程序员站长

2022/11/10

1.4K0

常用进程调度算法_进程调度算法例题

进程调度算法设计_三种调度算法

process schedule time 队列进程

进程管理是操作系统中的重要功能，用来创建进程、撤消进程、实现进程状态转换，它提供了在可运行的进程之间复用CPU的方法。在进程管理中，进程调度是核心，因为在采用多道程序设计的系统中，往往有若干个进程同时处于就绪状态，当就绪进程个数大于处理器数目时，就必须依照某种策略决定哪些进程优先占用处理器。本实验模拟在单处理器情况下的进程调度，目的是加深对进程调度工作的理解，掌握不同调度算法的优缺点。

全栈程序员站长

2022/11/09

1.2K0

进程调度算法设计_三种调度算法

编程算法 http 存储 tcp/ip

Linux 内核包含4个IO调度器，分别是 Noop IO scheduler、Anticipatory IO scheduler、Deadline IO scheduler 与 CFQ IO scheduler。

233333

2022/05/10

1.2K0

磁盘调度算法

磁盘服务进程算法性能

平均寻道长度是磁盘调度算法的性能指标之一，用于评估磁头在访问磁盘上的数据时的平均移动距离。

一个风轻云淡

2023/10/15

8040

进程的调度常用算法

队列服务进程算法系统

系统将按照作业到达的先后次序来进行作业调度，或者说它是优先考虑在系统中等待时间最长的作业，而不管该作业所需执行时间的长短，从后备作业队列中优先选择几个最先进入该队列的作业，将他们调入内存，为他们分配资源和创建进程。然后把它放入就绪队列。当在进程调度中采用FCFS算法时，每次调度是从就绪的进程队列中选择一个最先进入该队列的进程，为之分配处理机，使之投入运行。该进程一直运行到完成或发生某事件而组赛后，进程调度程序才将处理机分配给其他进程。在进程调度中采用先来先服务算法的时候，每次调度就从就绪队列中选一个最先进入该队列的进程，为之分配处理机，即谁第一排队谁就先被执行。

一个风轻云淡

2023/10/15

3130

通过sql语句分析足彩(第三篇）(r3笔记第91天)

sql 数据分析存储

在之前写过两片关于sql语句分析足彩的。都从不同的角度提供了一些思路，之前是基于500场比赛的数据分析，为了数据分析的更加有说服性，我抽取了7000多场比赛的数据来作为分析的基础。自己是在世界杯的时

jeanron100

2018/03/15

6810

进程调度算法；先来先服务调度算法、短作业优先调度算法、时间片轮转调度算法「建议收藏」

编程算法 https 网络安全

2. 掌握进程调度算法，如先来先服务调度算法（first come first served,FCFS）、短作业优先调度算法（shotjob first,SJF）、时间片轮转调度算法。

全栈程序员站长

2022/11/11

2.5K0

进程调度算法；先来先服务调度算法、短作业优先调度算法、时间片轮转调度算法「建议收藏」

进程调度算法

队列服务器进程算法系统

在多道程序系统中，进程的数量往往多于处理机的个数，因此进程争用处理机的情况在所难免。处理机调度是对处理机进行分配，即从就绪队列中按照一定的算法（公平、高效）选择一个进程并将处理机分配给它运行，以实现进程并发执行。

薄荷冰

2024/11/14

2070

进程调度算法

编程算法文件存储

1. 先来先服务调度算法。先来先服务（FCFS）调度算法是一种最简单的调度算法，该算法既可用于作业调度，也可用于进程调度。FCFS算法比较有利于长作业（进程），而不利于短作业（进程）。由此可知，本算法适合于CPU繁忙型作业，而不利于I/O繁忙型的作业（进程）。

黄规速

2022/04/14

1.1K0

调度算法的评价指标

文章目录知识总览 1. CPU利用率 2. 系统吞吐量 3. 周转时间 4. 等待时间 5. 响应时间知识回顾与重要考点知识总览 1. CPU利用率 2. 系统吞吐量 3. 周转时间 4. 等待

兮动人

2021/06/11

6130

常用的进程调度算法

进程调度是由操作系统的进程调度程序按照某种策略和算法从就绪态进程中为当前空闲的CPU选择要运⾏的新进程，常用的进程调度算法有以下几种：

越陌度阡

2020/11/26

2.5K0

进程调度算法

编程算法文件存储

**高响应比优先算法规则**：在每次调度时先计算各个作业/进程的*相应比*，选择*相应比最高的*作业/进程为其服务

用户3906509

2020/06/12

2K0

作业调度算法

　　在多道程序环境中，主存中有着多个进程，其数目往往多于处理机数量。这就要求系统能按照某种算法动态地把处理机分配给就绪队列中的一个进程，使之执行，分配处理机的任务是由处理机调度程序完成的。处理机调度　　在多道程序系统中，一个作业被提交后必须经过处理机调度后，方能获得处理机执行。对于批量型作业而言，通常需要经历作业调度（也称为高级调度）和进程调度（也称为低级调度）两个过程才能获得处理机；而对于终端型作业而言，通常只需要经过进程调度就可以获得处理机。除了上述两种调度，操作系统中往往也设置了中级调度，用来提

Mister24

2018/05/14

4K0

LVS调度算法

内核中的连接调度算法 IPVS在内核中的负载均衡调度是以连接为粒度的。在HTTP协议（非持久中），每个对象从WEB服务器上获取都需要建立一个TCP连接，同一用户的不同请求会被调度到不同服务器上，所以这种细粒度的调度在一定程度上可以避免单个用户访问的突发性引起服务器间的负载不平衡。在内核中的连接调度算法上，IPVS已实现了以下八种调度算法：轮叫调度（Round-Robin Scheduling）加权轮叫调度（Weighted Round-Robin Scheduling）最小连接调度（Least-Co

用户1173509

2018/03/28

1.4K0

[操作系统]磁盘调度算法

一次磁盘读写操作所需要的时间寻找时间(寻道时间):磁头臂前后移动寻找磁道所需的时间 (系统软件可算法优化) 延迟时间:磁头旋转定位到目标扇区所需要的时间 (固定) 传输时间:读写数据到扇区所需的时间 (固定)

唯一Chat

2021/01/05

1.3K0

用python基于2015-2016年的NBA常规赛及季后赛的统计数据分析

python 数据分析机器学习

一、实验介绍 1.1 内容简介不知道你是否朋友圈被刷屏过nba的某场比赛进度或者结果？或者你就是一个nba狂热粉，比赛中的每个进球，抢断或是逆转压哨球都能让你热血沸腾。除去观赏精彩的比赛过程，我们也

机器学习AI算法工程

2018/03/14

2.8K1

用python基于2015-2016年的NBA常规赛及季后赛的统计数据分析

相似问题

瓷砖对匹配算法

20

匹配-三益智游戏算法

50

多层同步

10

多层平台

10

多层弹丸轨迹

10

活动推荐

提供大模型在企业的应用构建、高效便捷

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例