首页
学习
活动
专区
圈层
工具
发布
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Pandas Query 方法深度总结

    '] == 'S'] 如果使用 query() 方法,那么看起来更整洁: df.query('Embarked == "S"') 与 SQL 比较,则 query() 方法中的表达式类似于 SQL...= 'S' df.query('Embarked == @embarked') 或者也可以使用 f 字符串,如下所示: df.query(f'Embarked == "{embarked}"')...如果使用方括号索引,这种语法很快变得非常笨拙: df[(df['Embarked'] == 'S') | (df['Embarked'] == 'C')] 我们注意到,在这里我们需要在查询的条件下引用...(‘C’)出发的乘客,可以在 Pandas 中使用否定运算符 (~): df[~((df['Embarked'] == 'S') | (df['Embarked'] == 'C'))] 使用 query...,当应用于列名时,我们可以使用 isnull() 方法查找缺失值: df.query('Embarked.isnull()') 现在将显示 Embarked 列中缺少值的行: 其实可以直接在列名上调用各种

    1.8K30

    Python人工智能:Python决策树分类算法实现示例——基于泰坦尼克号生存者数据集

    此时,具有字符串的特征属性包括性别属性Sex与登船港口属性Embarked,我们可以通过下面命令查看这两个属性包括的类别: print("性别具有的类别:", train_data['Sex'].unique...()) print("登船的港口类别:", train_data['Embarked'].unique()) 由此,可以看出性别属性Sex具有两类,登船的港口属性Embarked具有三类。...的处理代码: # 首先将登船港口类别转换为列表格式 labels = train_data['Embarked'].unique().tolist() # 然后获取每个登船港口类型的index值,并将其存储到...train_data中 train_data["Embarked"] = train_data["Embarked"].apply( lambda x: labels.index(x) ) 此时...由上图可以看出Sex与Embarked属性均已经处理妥当。

    1.9K10

    【精华总结】全文4000字、20个案例详解Pandas当中的数据统计分析与排序

    '].value_counts() output S 644 C 168 Q 77 Name: Embarked, dtype: int64 下面我们简单来介绍一下value_counts...同时我们也可以对索引,按照字母表的顺序来进行排序,代码如下 df['Embarked'].value_counts(ascending=True).sort_index(ascending=True)...Q 0.086614 Name: Embarked, dtype: float64 要是我们希望对能够在后面加上一个百分比的符号,则需要在Pandas中加以设置,对数据的展示加以设置,代码如下...pd.set_option('display.float_format', '{:.2%}'.format) df['Embarked'].value_counts(normalize = True)...output S 72.44% C 18.90% Q 8.66% Name: Embarked, dtype: float64 当然除此之外,我们还可以这么来做,代码如下 df['Embarked

    73110
    领券