腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

社区首页 >问答首页 >我想在某些行中执行条件筛选，以提取值。

问我想在某些行中执行条件筛选，以提取值。
EN

Stack Overflow用户

提问于 2022-03-10 07:25:33

回答 1查看 22关注 0票数 0

我有一个包含第一列的DataFrame：

Brand           Price
Samsung         75.5,99.2
Lenovo          50.3
Lg              60.5,88.4

如果单元格包含2个值，我希望提取最大值。我试一试下面的条件：

for x in df['Price']:
 if 0 <= len(x) <= 5:
  df['Price'] = df['Price'].str[0:5]
 else:
  df['Price'] = df['Price'].str[6:12]

但是它不适用于包含单个值的单元格，它返回一个空白单元格。

dataframe

feature-extraction

python

pandas

CDN&音视频通信出海专场

提供游戏出海、社交娱乐等方案，助力企业抢占出海市场

回答 1

Stack Overflow用户

发布于 2022-03-10 10:35:11

我们可以在逗号上str.split列，然后使用apply查找每行的最大值(每个字符串都需要转换为浮点数，以便max按预期的方式运行)：

df['Price'] = df['Price'].str.split(',').apply(lambda c: max(map(float, c)))

或者，展开为一个DataFrame，并将整个DataFrame转换为与astype一起浮动，并获取每一行的max (axis=1)：

df['Price'] = df['Price'].str.split(',', expand=True).astype(float).max(axis=1)

假设逗号分隔的值是排序的(最后一个值总是最大的)，我们也可以使用str accessor获得最后一个值(索引-1)：

df['Price'] = df['Price'].str.split(',').str[-1]

所有选项都生成输出df (用于提供示例)：

     Brand  Price
0  Samsung   99.2
1   Lenovo   50.3
2       Lg   88.4

设置：

import pandas as pd

df = pd.DataFrame({
    'Brand': ['Samsung', 'Lenovo', 'Lg'],
    'Price': ['75.5,99.2', '50.3', '60.5,88.4']
})

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/71426668

复制

【数据科学】数据科学家与数据科学

数据分析

仅仅在几年前，数据科学家还不是一个正式确定的职业，然而一眨眼的工夫，这个职业就已经被誉为“今后十年IT行业最重要的人才”了。一、数据科学家的起源 "数据科学"（DataScience）起初叫"datalogy "。最初在1966年由Peter Naur提出，用来代替"计算机科学"（丹麦人，2005年图灵奖得主，丹麦的计算机学会的正式名称就叫Danish Society of Datalogy，他是这个学会的第一任主席。Algol 60是许多后来的程序设计语言，包括今天那些必不可少的软件工程工具的原型。

陆勤_数据人网

2018/02/26

1.1K0

理解生成模型与判别模型

其他

我们都知道，对于有监督的机器学习中的分类问题，求解问题的算法可以分为生成模型与判别模型两种类型。但是，究竟什么是生成模型，什么是判别模型？不少书籍和技术文章对这对概念的解释是含糊的。在今天这篇文章中，我们将准确、清晰的解释这一组概念。

SIGAI学习与实践平台

2018/10/18

9840

理解生成模型与判别模型

其他

SIGAI学习与实践平台

2018/10/10

1K0

【数据科学】什么是数据科学家与数据科学

数据分析数据库数据处理数据可视化 sql

仅仅在几年前，数据科学家还不是一个正式确定的职业，然而一眨眼的工夫，这个职业就已经被誉为“今后十年IT行业最重要的人才”了。一、数据科学家的起源 “数据科学”（DataScience）起初叫”datalogy “。最初在1966年由Peter Naur提出，用来代替”计算机科学”（丹麦人，2005年图灵奖得主，丹麦的计算机学会的正式名称就叫Danish Society of Datalogy，他是这个学会的第一任主席。Algol 60是许多后来的程序设计语言，包括今天那些必不可少的软件工程工具的原型。图灵

陆勤_数据人网

2018/02/27

1.6K0

【推荐】数据科学家与数据科学。

大数据

仅仅在几年前，数据科学家还不是一个正式确定的职业，然而一眨眼的工夫，这个职业就已经被誉为“今后十年IT行业最重要的人才”了。一、数据科学家的起源 "数据科学"（DataScience）起初叫"datalogy"。最初在1966年由Peter Naur提出，用来代替"计算机科学"（丹麦人，2005年图灵奖得主，丹麦的计算机学会的正式名称就叫Danish Societyof Datalogy，他是这个学会的第一任主席。Algol 60是许多后来的程序设计语言，包括今天那些必不可少的软件工程工具的原型。图灵

小莹莹

2018/04/20

7310

【数据科学】数据科学的整合与细分

其他

自从大数据这个词出来以后，数据已经成为一个非常明确的科学领域。在这当中很少有人详细地探讨数据科学的结构和它面临的问题，包括我们行业面临的问题。数据科学有三个非常重要的层次：数据的获取、数据的描述和数

陆勤_数据人网

2018/02/27

9210

文档智能理解：通用文档预训练模型与数据集

https NLP 服务网络安全

预训练模型把迁移学习很好地用起来了，让我们感到眼前一亮。这和小孩子读书一样，一开始语文、数学、化学都学，读书、网上游戏等，在脑子里积攒了很多。当他学习计算机时，实际上把他以前学到的所有知识都带进去了。如果他以前没上过中学，没上过小学，突然学计算机就不懂这里有什么道理。这和我们预训练模型一样，预训练模型就意味着把人类的语言知识，先学了一个东西，然后再代入到某个具体任务，就顺手了，就是这么一个简单的道理。

机器学习AI算法工程

2020/12/15

1.8K0

数据不动模型动-联邦学习的通俗理解与概述

联邦学习机器学习监督学习迁移学习神经网络

联邦学习是一种机器学习设定，其中许多客户端（例如：移动设备或整个组织）在中央服务器（例如：服务提供商）的协调下共同训练模型，同时保持训练数据的去中心化及分散性。联邦学习的长期目标则是：在不暴露数据的情况下分析和学习多个数据拥有者（客户端或者独立的设备）的数据。

CV君

2022/03/30

1.6K0

python与数据科学应用

python

数据科学简介与应用数据科学主要以统计学、机器学习、数据可视化以及（某一）领域知识为理论基础，其主要研究内容包括数据科学基础理论、数据预处理、数据计算和数据管理(来自百度百科)。 01资料科学所要具备的能力 1、资料科学所要具备的能力统计(Statistic)单变量分析、多变量分析、变异数分析数据处理(Data Munging)抓取数据、清理数据、转换数据数据可视化(Data Visualization)图表、商业智能系统 2、数据科学主要分为以下几个步骤按职能来拆分可分为数据科学家和数据工程师，

用户1332428

2018/03/08

9800

数据科学31 |机器学习-模型评价

编程算法腾讯云测试服务机器学习神经网络深度学习

在二元预测中，通常会估计样本出现其中一种结局（如阳性）的概率，需要找到一个常数，即阈值（threshold）或门槛值（cutoff value），若概率值大于阈值，则预测为阳性。通过变动这一阈值，可以改变预测的特异性和灵敏度。

王诗翔呀

2020/07/09

1.2K0

机器学习与数据科学

机器学习

计算技术通常用来分析数据，而理解数据则依赖于机器学习。多年来，对于大多数开发者来说，机器学习却是非常遥远、一直是难以企及的。这可能是现在收益最高，也是最受欢迎的一项技术之一。毫无疑问——作为开发人

陆勤_数据人网

2018/02/26

8300

【数据科学】数据科学家教你用数据模型来恋爱。

hidden model

男生和女生分别是来自不同星球的科学事实已经众所周知的了.男生们总是认为,女生们都是迷一样的生物,他们的情感状态浮动似乎是以秒单位在变化的,难以理解,更勿论预测了! 而女生们觉得男生都是没有感觉动物,完全不能理解什么叫感受-尽管已经告诉他们N次了!这种男女之间的根本差别,导致了他们之间的感情关系是受一种超级无敌复杂的系统所支配的. 不过,我们可以用一个叫隐式马尔可夫(Hidden Markov Model)的数学模型来分析这个系统. 决定性系统首先我们来看看一种最简单的预测系统 - 决定性系统. 在这个系统

陆勤_数据人网

2018/02/26

6720

现实世界中的数据科学：基于领域知识和监督学习模型的黄金价格理解与预测

编程算法线性回归

大约公元前3600年，黄金首先在古埃及被采掘冶炼。经历30个世纪之后，在土耳其西部的一个古王国铸造出世界上第一枚金币，此后黄金便作为王国内的一种实物货币进行流通。

deephub

2020/05/12

6530

【数据科学】50+数据科学与机器学习速查表

其他

关于Python、R和Numpy、Scipy以及Pandas的速查表有了这些和R语言、python、Django、MySQL、SQL、Hadoop、Apache Spark以及机器学习算法相关的速查表，会让你对数据科学和数据挖掘的概念及相关命令得心应手，并加快开发速度。在数据科学界，有着成千上万的软件包和成百上千的函数！一个激情澎拜的数据爱好者没有必要掌握所有的。这里会包含大多数重要的软件包和函数，能够让你在紧凑的几页中集思广益并吸收知识。精通数据科学需要掌握统计学、数学、编程知识，特别是R语言、

陆勤_数据人网

2018/02/26

8060

数据科学24 | 回归模型-基本概念与最小二乘法

线性回归编程算法

回归分析在统计学中非常重要，目的在于了解两个或多个变量间是否相关、相关方向与强度，并建立数学模型以便观察特定变量来预测研究者感兴趣的变量。回归分析可以帮助人们了解在只有一个自变量变化时因变量的变化量。

王诗翔呀

2020/07/03

4K0

如何区分理解数据科学家与机器学习工程师

机器学习

数据科学家Vs机器学习工程师原文: What are machine learning engineers来源: https://tech.co/12-ways-advantage-big-data-2017-05 品觉导读：真正让“数据科学”发挥出了强大威力的，是在人们意识到，数据不仅止于精算统计、商业智能和数据仓库的时候。将数据人和其他部门（软件开发、营销、管理、人力资源）隔离开来的筒仓被打破后，数据科学才真正彰显出了自己的独特之处。这门学科的中心思想，便是数据适用于万事万物。在任何应用中

小莹莹

2018/04/24

5790

【数据科学】数据科学与工程：大数据时代的新兴交叉学科

大数据

摘要：大数据时代的IT发展的基本特点是：应用驱动创新，开源加速创新，硬件助力创新。基于对这些特点的认识，从社会创新发展、人才需求变化、技术发展趋势等方面论述了数据科学与工程这一新兴交叉学科的发展必然性，进一步阐述了数据科学与工程学科的特点、学科内涵与知识体系，最后从科学研究、系统开发和人才培养的角度探讨了数据科学与工程学科的建设思路。 1、引言当前，“大数据”这一术语已经远远超越了当初的互联网或信息技术（IT）的技术范畴，变成了一个时代的标志。大数据时代的到来有其必然性，当计算和通信取得长足进步的时候，

陆勤_数据人网

2018/02/26

2.3K0

详谈数据科学与大数据技术专业

大数据

从IT时代进入DT时代，高校在大数据方向上设置了哪些专业，具体学什么，就业怎么样，作为新兴专业，考生如何报考具体内容：专业名称：数据科学与大数据技术; 人才培养目标：以大数据为核心研究对象，利用大数据的方法解决具体行业应用问题。学制：四年;学位：工学或理学学位。目前已有35所高校申报了大数据专业：第一批(3所)：北京大学、对外经济贸易大学、中南大学; 第二批(32所)：中国人民大学、复旦大学、北京邮电大学、华东师范大学、电子科技大学、北京信息科技大学、中北大学、长春理工大学、上海工程技术大学

小莹莹

2018/04/24

2.4K0

基于RBAC权限模型的理解与设计

面向对象编程数据安全

在今天，数据安全越来越重要，这是底线也是红线，马虎不得。而要保障系统数据的安全，权限就是非常重要的一环。怎么能既保障安全可控，又能尽量地不影响用户使用，是我们必须要权衡的。如果权限体系过于复杂严格，那系统使用体验可能就比较差，而如果过于宽松，数据安全就难以保障。

明月AI

2022/11/07

7090

【数据科学】从学界到业界：关于数据科学的误解与事实

机器学习编程算法

在从学界(粒子物理学博士后研究员)进入业界(数据科学领域)时，Emily Thompson也曾有过犹疑。而现在，在担任 Insight 项目总监10个月之后，她对数据科学家有了自己独特的看法。近日，她在一篇文章中就当前人们对数据科学的误解谈了自己的看法，主要涉及数据科学家的职责、应用领域、工作环境、职业发展、技能集合等方面。误解一：“‘数据科学家’只是‘业务分析师’的一种花哨叫法，他们本质上是相同的” 在数据科学领域，业务分析师仍然占了很大一部分，而数据科学家也构建数据产品，创建软件平台，实现可视化

陆勤_数据人网

2018/02/27

8510

相似问题

Azure数据工厂- REST分页规则

Azure数据工厂中的REST分页

Azure数据工厂分页规则- QueryParameters.page

Azure数据工厂:来自标头的分页规则

Azure数据工厂Rest的自定义分页

活动推荐

SaaS建站+私有服务器，拖拉式完成多端建站，5分钟搭建企业官网

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问我想在某些行中执行条件筛选，以提取值。
EN

CDN&音视频通信出海专场

回答 1

Stack Overflow用户

Azure数据工厂- REST分页规则

Azure数据工厂中的REST分页

Azure数据工厂分页规则- QueryParameters.page

Azure数据工厂:来自标头的分页规则

Azure数据工厂Rest的自定义分页

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问我想在某些行中执行条件筛选，以提取值。EN

CDN&音视频通信出海专场

回答 1

Stack Overflow用户

Azure数据工厂- REST分页规则

Azure数据工厂中的REST分页

Azure数据工厂分页规则- QueryParameters.page

Azure数据工厂:来自标头的分页规则

Azure数据工厂Rest的自定义分页

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问我想在某些行中执行条件筛选，以提取值。
EN