首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

从另一个dataframe列的唯一值创建新的dataframe

从另一个DataFrame列的唯一值创建新的DataFrame,可以通过以下步骤实现:

  1. 首先,使用pandas库导入所需的模块和函数:
代码语言:txt
复制
import pandas as pd
  1. 创建一个原始的DataFrame对象,假设为df:
代码语言:txt
复制
df = pd.DataFrame({'A': [1, 2, 3, 4, 5],
                   'B': ['a', 'b', 'c', 'd', 'e'],
                   'C': ['x', 'y', 'z', 'x', 'y']})

这将创建一个包含三列(A、B、C)的DataFrame对象。

  1. 使用unique()函数获取指定列的唯一值列表:
代码语言:txt
复制
unique_values = df['C'].unique()

这将返回列'C'中的唯一值列表。

  1. 创建一个新的DataFrame对象,其中包含原始DataFrame中列'C'的唯一值:
代码语言:txt
复制
new_df = pd.DataFrame({'Unique Values': unique_values})

这将创建一个新的DataFrame对象new_df,其中包含一个名为'Unique Values'的列,其中包含列'C'的唯一值。

完整的代码示例:

代码语言:txt
复制
import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3, 4, 5],
                   'B': ['a', 'b', 'c', 'd', 'e'],
                   'C': ['x', 'y', 'z', 'x', 'y']})

unique_values = df['C'].unique()
new_df = pd.DataFrame({'Unique Values': unique_values})

print(new_df)

输出结果:

代码语言:txt
复制
  Unique Values
0             x
1             y
2             z

这样,你就可以通过从另一个DataFrame列的唯一值创建新的DataFrame了。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

python dataframe筛选列表的值转为list【常用】

筛选列表中,当b列中为’1’时,所有c的值,然后转为list 2 .筛选列表中,当a列中为'one',b列为'1'时,所有c的值,然后转为list 3 .将a列整列的值,转为list(两种) 4....筛选列表,当a=‘one’时,取整行所有值,然后转为list 具体看下面代码: import pandas as pd from pandas import DataFrame df = DataFrame...’1’时,所有c的值,然后转为list b_c = df.c[df['b'] == '1'].tolist() print(b_c) # out: ['一', '一', '四'] # 筛选列表中,...当a列中为'one',b列为'1'时,所有c的值,然后转为list a_b_c = df.c[(df['a'] == 'one') & (df['b'] == '1')].tolist() print(...a_b_c) # out: ['一', '一'] # 将a列整列的值,转为list(两种) a_list_1 = df.a.tolist() a_list_2 = df['a'].tolist()

5.1K10
  • 【数据处理包Pandas】DataFrame的创建

    一、DataFrame简介   DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。...index:行索引,用于指定行的标签,默认为整数索引。 columns:列索引,用于指定列的标签,默认为整数索引。 dtype:数据类型,用于指定DataFrame中的数据类型,默认为None。...NumPy 库和 Pandas 库: import numpy as np import pandas as pd 二、基于一维数据创建 DataFrame对象看成一维对象的有序序列,序列中的对象元素又分成按列排列和按行排列两种情况...(一)按列排列 按列排列,需要基于字典构建:字典的键对应列名,字典的值可以是一列表、一维Numpy数组、Series 对象,或者字典都行。...':97}}) 小结:只要外层是字典,则外层字典的键一定是作为DataFrame对象的列标签。

    8700

    Pandas创建DataFrame对象的几种常用方法

    DataFrame是pandas常用的数据类型之一,表示带标签的可变二维表格。本文介绍如何创建DataFrame对象,后面会陆续介绍DataFrame对象的用法。...生成后面创建DataFrame对象时用到的日期时间索引: ? 创建DataFrame对象,索引为2013年每个月的最后一天,列名分别是A、B、C、D,数据为12行4列随机数。 ?...创建DataFrame对象,索引与列名与上面的代码相同,数据为12行4列1到100之间的随机数。 ?...根据字典来创建DataFrame对象,字典的“键”作为DataFrame对象的列名,其中B列数据是使用pandas的date_range()函数生成的日期时间,C列数据来自于使用pandas的Series...除此之外,还可以使用pandas的read_excel()和read_csv()函数从Excel文件和CSV文件中读取数据并创建DateFrame对象,后面会单独进行介绍。

    3.6K80

    总结 | DataFrame、Series、array、tensor的创建及相互转化

    最近在入门图像识别,自然也会用到深度学习框架,也接触到了一个新的数据结构——tensor(张量)。...除此之外,也有一些很常用的数据结构,比如DataFrame、Series、array等,这篇文章主要对这几种数据结构的创建及相互转换做一个小总结。...创建方法 DataFrame 这里就不在单独贴出每种数据结构的示例图,只是简单描述一下各个数据结构的特点。DataFrame类似于一个二维矩阵,但它的行列都有对应的索引。...[在这里插入图片描述] 原理与通过字典创建一致,但需要注意行、列索引需要自己指定。...Series Series 可以当成 DataFrame 中一个元素,一列索引对应一列值。

    1.1K30

    总结 | DataFrame、Series、array、tensor的创建及相互转化

    作者:奶糖猫 来源:喵说Python 最近在入门图像识别,自然也会用到深度学习框架,也接触到了一个新的数据结构——tensor(张量)。...除此之外,也有一些很常用的数据结构,比如DataFrame、Series、array等,这篇文章主要对这几种数据结构的创建及相互转换做一个小总结。...创建方法 DataFrame 这里就不在单独贴出每种数据结构的示例图,只是简单描述一下各个数据结构的特点。DataFrame类似于一个二维矩阵,但它的行列都有对应的索引。...DataFrame创建方法很多,这里给出比较常用的三种方法: 1、通过字典创建 ? 2、通过元组创建 ? 原理与通过字典创建一致,但需要注意行、列索引需要自己指定。 3、randn随机生成 ?...np.random.randn(m,n)是生成一个 规格的矩阵,行列索引需要自己指定。 Series Series 可以当成 DataFrame 中一个元素,一列索引对应一列值。

    2.6K20

    数据分析EPHS(2)-SparkSQL中的DataFrame创建

    本篇是该系列的第二篇,我们来讲一讲SparkSQL中DataFrame创建的相关知识。 说到DataFrame,你一定会联想到Python Pandas中的DataFrame,你别说,还真有点相似。...这个在后面的文章中咱们在慢慢体会,本文咱们先来学习一下如何创建一个DataFrame对象。...通体来说有三种方法,分别是使用toDF方法,使用createDataFrame方法和通过读文件的直接创建DataFrame。...3、通过文件直接创建DataFrame对象 我们介绍几种常见的通过文件创建DataFrame。包括通过JSON、CSV文件、MySQl和Hive表。...4、总结 今天咱们总结了一下创建Spark的DataFrame的几种方式,在实际的工作中,大概最为常用的就是从Hive中读取数据,其次就可能是把RDD通过toDF的方法转换为DataFrame。

    1.6K20

    Pandas数据处理4、DataFrame记录重复值出现的次数(是总数不是每个值的数量)

    Pandas数据处理4、DataFrame记录重复值出现的次数(是总数不是每个值的数量) ---- 目录 Pandas数据处理4、DataFrame记录重复值出现的次数(是总数不是每个值的数量) 前言...环境 基础函数的使用 DataFrame记录每个值出现的次数 重复值的数量 重复值 打印重复的值 总结 ---- 前言         这个女娃娃是否有一种初恋的感觉呢,但是她很明显不是一个真正意义存在的图片...,可以在很多AI大佬的文章中发现都有这个Pandas文章,每个人的写法都不同,但是都是适合自己理解的方案,我是用于教学的,故而我相信我的文章更适合新晋的程序员们学习,期望能节约大家的事件从而更好的将精力放到真正去实现某种功能上去...语法 DataFrame.duplicated(subset=None,keep='first') 参数 subset:判断是否是重复数据时考虑的列 keep:保留第一次出现的重复数据还是保留最后一次出现的...:", count) 我们看了共计有5个李诗诗,因为第一个没有计数,从第二个开始计数故而输出结果是:4 重复值 import pandas as pd import numpy as np df =

    2.4K30

    从DataFrame自动化特征抽取的尝试

    类型 所谓类型指的是Spark DataFrame 的数据是强类型的,常见类型有String,Int, Double, Float, Array, VectorUDF等,他们其实可以给我们提供一定的信息...不需要分词的字段,一般其实就是分类字段。 Int 我们可以求一个distinct值,如果很少,很可能是一个分类字段,比如性别,年龄等。Double,Float等则可能是连续的,比如可能是金额等。...如果发现有几十万个种类,可能就是售价之类的,那么就自然当做连续值即可,当时我们可以做一些缺失值处理。...系统自动识别这种规则,然后自动进行处理,你唯一需要做的就是告知哪些字段要做什么处理。...目前EasyFeature的处理方式为: 把所有字段分成 整数类型,浮点类型,字符类型 对浮点类型做缺失值处理 对整数做分类和连续值的区分,分类的会被做one-hot化处理 对字符类型区分为分词和不分词

    42430

    pandas DataFrame的创建方法

    pandas DataFrame的增删查改总结系列文章: pandas DaFrame的创建方法 pandas DataFrame的查询方法 pandas DataFrame行或列的删除方法 pandas...2. csv文件构建DataFrame(csv to DataFrame) 我们实验的时候数据一般比较大,而csv文件是文本格式的数据,占用更少的存储,所以一般数据来源是csv文件,从csv文件中如何构建...3.1 添加列 此时我们又有一门新的课physics,我们需要为每个人添加这门课的分数,按照Index的顺序,我们可以使用insert方法,如下: new_columns = [92,94,89,77,87,91...[6]= new_line 但是十分注意的是,这样实际是改的操作,如果loc[index]中的index已经存在,则新的值会覆盖之前的值。...当然也可以把这些新的数据构建为一个新的DataFrame,然后两个DataFrame拼起来。

    2.6K20

    Python 数据处理 合并二维数组和 DataFrame 中特定列的值

    pandas.core.frame.DataFrame; 生成一个随机数数组; 将这个随机数数组与 DataFrame 中的数据列合并成一个新的 NumPy 数组。...values_array = df[["label"]].values 这行代码从 DataFrame df 中提取 “label” 列,并将其转换为 NumPy 数组。....print(random_array) print(values_array) 上面两行代码分别打印出前面生成的随机数数组和从 DataFrame 提取出来的值组成的数组。...结果是一个新的 NumPy 数组 arr,它将原始 DataFrame 中 “label” 列的值作为最后一列附加到了随机数数组之后。...运行结果如下: 总结来说,这段代码通过合并随机数数组和 DataFrame 中特定列的值,展示了如何在 Python 中使用 numpy 和 pandas 进行基本的数据处理和数组操作。

    31500

    Pandas 查找,丢弃列值唯一的列

    前言 数据清洗很重要,本文演示如何使用 Python Pandas 来查找和丢弃 DataFrame 中列值唯一的列,简言之,就是某列的数值除空值外,全都是一样的,比如:全0,全1,或者全部都是一样的字符串如...:已支付,已支付,已支付… 这些列大多形同虚设,所以当数据集列很多而导致人眼难以查找时,这个方法尤为好用。...上代码前先上个坑吧,数据列中的空值 NaN 也会被 Pandas 认为是一种 “ 值 ”,如下图: 所以只要把列的缺失值先丢弃,再统计该列的唯一值的个数即可。...代码实现 数据读入 检测列值唯一的所有列并丢弃 最后总结一下,Pandas 在数据清洗方面有非常多实用的操作,很多时候我们想不到只是因为没有接触过类似的案例或者不知道怎么转换语言描述,比如 “...列值唯一 ” --> “ 除了空值以外的唯一值的个数等于1 ” ,许多坑笔者都已经踩过了,欢迎查看我的其余文章,提建议,共同进步。

    5.8K21
    领券