使用Python从DataFrame中随机选择子样本可以通过以下步骤实现:
import pandas as pd
import random
df = pd.DataFrame({'A': [1, 2, 3, 4, 5],
'B': ['a', 'b', 'c', 'd', 'e'],
'C': [True, False, True, False, True]})
sample_size = 2 # 设置子样本的大小
subsample = df.sample(n=sample_size, replace=False) # 从DataFrame中随机选择子样本
在这个例子中,我们选择了2个子样本,replace参数设置为False表示不允许重复选择。
print(subsample)
这将打印出随机选择的子样本。
对于这个问题,腾讯云没有特定的产品或链接与之相关。以上代码适用于任何云计算平台或本地环境。
领取专属 10元无门槛券
手把手带您无忧上云