Pandas 是一个强大的 Python 数据分析库,提供了高性能、易于使用的数据结构和数据分析工具。DataFrame 是 Pandas 中的一种数据结构,类似于表格,包含行和列,每列可以是不同的数据类型(如整数、字符串、浮点数等)。
Pandas DataFrame 的类型主要根据其数据来源和处理需求来分类:
read_sql
函数从 SQL 数据库读取数据。假设我们有一个包含多个产品的 DataFrame,并且我们希望从中选择独特的产品。
import pandas as pd
# 创建示例 DataFrame
data = {
'Product': ['A', 'B', 'A', 'C', 'D', 'B'],
'Price': [10, 20, 15, 30, 25, 22]
}
df = pd.DataFrame(data)
# 选择独特的产品
unique_products = df['Product'].unique()
print(unique_products)
unique()
方法从 Product
列中选择独特的产品。通过上述方法,我们可以轻松地从 DataFrame 中选择独特的产品。Pandas 的强大功能和灵活性使其成为数据分析中的首选工具。
领取专属 10元无门槛券
手把手带您无忧上云