腾讯云

文章/答案/技术大牛

发布

社区首页 >问答首页 >如何对“多组”数据帧重新建立索引？

问如何对“多组”数据帧重新建立索引？
EN

Stack Overflow用户

提问于 2019-05-08 13:32:29

回答 1查看 22关注 0票数 1

我有一个包含4列的数据帧，前3列是数值变量，表示最后一列变量的特征，最后一列是字符串。

我想通过groupby函数将最后一个字符串列与前3列合并在一起。然后它就可以工作了(我的意思是，共享前三列记录的相同特性的字符串已经成功合并)

之前数据帧的长度为1200，合并后的数据帧的长度为1100。我发现后面的df是多索引的。它只包含2列。(分层索引)因此，我通过生成的升序数字列表尝试了reindex方法。遗憾的是，我失败了。

df1.columns
*[Out]Index(['time', 'column','author', 'text'], dtype='object')
series = df1.groupby(['time', 'column','author'])
['body_text'].sum()#merge the last column by the first 3 columns
dfx = series.to_frame()# get the new df
dfx.columns
*[Out]Index(['author', 'text'], dtype='object')
len(dfx)
*[Out]1100
indexs = list(range(1100))
dfx.reindex(index = indexs)
*[Out]Exception: cannot handle a non-unique multi-index!

pandas

dataframe

python

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-05-08 13:34:20

此处Reindex不是必需的，最好使用DataFrame.reset_index或将参数as_index=False添加到DataFrame.groupby

 dfx = df1.groupby(['time', 'column','author'])['body_text'].sum().reset_index()

或者：

 dfx = df1.groupby(['time', 'column','author'], as_index=False)['body_text'].sum()

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/56042038

复制

python中的dataframe 剔除部分数据后，索引消失，重新建立索引

python

今天在处理一个数据的过程中出现问题，python中的dataframe 剔除部分数据后，索引消失，遍历就出错，

学到老

2019/01/25

2.9K0

如何使用Lily HBase Indexer对HBase中的数据在Solr中建立索引

hbase lucene/solr github 存储

温馨提示：要看高清无码套图，请使用手机打开并单击图片放大查看。 Fayson的github：https://github.com/fayson/cdhproject 提示：代码块部分可以左右滑动查看噢 1.文档编写目的 ---- 上一篇文章Fayson介绍了《如何使用HBase存储文本文件》，我们将文本文件存储到HBase中，文件名作为HBase表的Rowkey，每个文件转为二进制字节流存储到HBase表的一个column中。我们可以通过Rowkey来查询这些数据，但是我们却没办法实现这些文本文件的全文索引

Fayson

2018/07/12

5.1K0

bismark对参考基因组建立索引

数据分析 https 网络安全

分析DNA甲基化的手段有很多，除了甲基化芯片外，还有WGBS和RRBS等实验与高通量测序相结合的手段，不管是哪种策略，都需要对DNA进行亚硫酸氢盐处理。

生信修炼手册

2020/05/10

1.5K0

如何在CDH中使用Solr对HDFS中的JSON数据建立全文索引

lucene/solr json github java

温馨提示：要看高清无码套图，请使用手机打开并单击图片放大查看。 Fayson的github：https://github.com/fayson/cdhproject 提示：代码块部分可以左右滑动查看噢 1.文档编写目的 ---- Solr是一个高性能，采用Java开发，基于Lucene的全文搜索服务器。同时对其进行了扩展，提供了比Lucene更为丰富的查询语言，同时实现了可配置、可扩展并对查询性能进行了优化，并且提供了一个完善的功能管理界面，是一款非常优秀的全文搜索引擎。SolrCloud是Sol

Fayson

2018/07/12

6.1K0

php 去除数组重复项并且重新建立索引转

jquery php

$data = array(0=>'jquery',1=>'php',2=>'ajax',3=>'jquery',4=>'linux',5=>'php'); $data = array_values(array_unique($data)); print_r($data);

双面人

2019/04/10

1.3K0

Mysql合理建立索引,索引优化

云数据库 SQL Server sql 数据库

在我们日常使用数据库的时候，肯定避免不了对数据库的优化。那么对数据库的优化又少了不索引的知识。

宣言言言

2019/12/15

4.9K0

性能优化-如何选择合适的列建立索引

存储

1、在where从句，group by从句，order by从句，on从句中的列添加索引 2、索引字段越小越好（因为数据库数据存储单位是以“页”为单位的，数据存储的越多，IO也会越大） 3、离散度大的列放到联合索引的前面

cwl_java

2020/02/13

2.2K0

sqlserver 视图创建索引_数据库视图可以建立索引吗

数据库 sql 存储 java

视图(View)是从一个或多个表或其它视图导出的，用来导出视图的表称为基表，导出的视图又称为虚表。在数据库中，只存储视图的定义，不存放视图对应的数据，这些数据仍然存放在原来的基表中。使用视图前，必须先创建视图，创建视图要遵守以下原则：（1）只有在当前数据库中才能创建视图，视图命名必须遵循标识符规则。（2）不能将规则、默认值或触发器与视图相关联。（3）不能在视图上建立任何索引。

全栈程序员站长

2022/09/23

2.9K0

如何建立数据驱动文化

数据分析

是什么驱使企业建立成功的数据驱动文化？未必是数据本身。这是次要的。技术本身排在第三位。数据驱动决策才是第一位的。在向实施数据运维的数据驱动企业转变时，最重要也是最困难的是向数据心态的文化转变。这种转

陆勤_数据人网

2018/02/28

1.6K0

mysql建立联合索引_mysql之联合索引

数据库云数据库 SQL Server sql

create index `sindex` on `test` (`aaa`,`bbb`,`ccc`);

全栈程序员站长

2022/09/06

5.1K0

分区表建立索引

数据库 sql

全局索引 ============ CREATE INDEX month_ix ON sales(sales_month) 本地索引 ============ CREATE INDEX loc_dept_ix ON dept(deptno) LOCAL; 全局分区索引 ============ CREATE INDEX month_ix ON sales(sales_month) GLOBAL PARTITION BY RANGE(sales_month) (PARTITION pm1

cloudskyme

2018/03/20

2K0

mysql 建前缀索引_MySQL_前缀索引_建立[通俗易懂]

https java 网络安全

from sakila.city_demo group by city order by cnt desc limit 10;

全栈程序员站长

2022/08/25

3.1K0

数组如何汇总？文本处理-汇总多组数据如何使用？

腾讯轻联

腾讯轻联可以零代码连接多个应用，在实际使用中，比如我们获取城市的未来的7天天气预告数据、查询符合某个条件的表格数据等情况，我们可能在应用A中获取到的结果可能会是多条结果。

阿那个沫

2023/04/07

9150

干货，如何建立数据标签体系

大数据数据处理电商

数据社

2021/01/22

9.7K0

如何对iOS App进行打补丁和重新签名

ios

有没有想过在非越狱设备上运行修改后的iOS二进制文件？比如，你可以使用该技术插装app，以进行动态分析。又或者你需要进行GPS欺骗，从而可以在锁区玩Pokemon，但又担心越狱检测。福利来了，你可以按照以下过程对修改后的应用程序进行重新签名，然后便可在自己的设备上运行该应用程序。注意，该技术仅适用于非FairPlay加密二进制文件（从应用商店获取的app均为FairPlay加密）。苹果的配置和代码签名系统本身就让人有点晕头转向，所以，对app进行重新签名着实不易。只有在配置文件和代码签名头完全正确的前提

FB客服

2018/02/23

2.3K0

如何使用Flume准实时建立Solr的全文索引

lucene/solr github json

温馨提示：要看高清无码套图，请使用手机打开并单击图片放大查看。 Fayson的github：https://github.com/fayson/cdhproject 提示：代码块部分可以左右滑动查看噢 1.文档编写目的 ---- Fayson在上篇文章《如何在CDH中使用Solr对HDFS中的JSON数据建立全文索引》简单介绍了Solr，然后利用Cloudera提供的Morphline工具通过创建MapReduce可以实现对HDFS中的半/非结构化数据的批量建立全文索引。本文主要介绍如何使用Mor

Fayson

2018/07/12

1.6K0

如何建立数据质量中心（DQC）？

sql 大数据 sdk spark ide

日常工作中，数据开发工程师开发上线完一个任务后并不是就可以高枕无忧了，时常会因为上游链路数据异常或者自身处理逻辑的 BUG 导致产出的数据结果不可信。而这个问题的发现可能会经历一个较长的周期（尤其是离线场景），往往是业务方通过上层数据报表发现数据异常后 push 数据方去定位问题（对于一个较冷的报表，这个周期可能会更长）。

数据社

2021/07/12

5.9K0

MySQL索引的建立方式

数据库云数据库 SQL Server sql

MySQL索引的建立对于MySQL的高效运行是很重要的，索引可以大大提高MySQL的检索速度。

用户4988376

2021/08/12

2.4K0

Mysql常用的建立索引规则

索引

以上是一些普遍的建立索引时的判定依据。一言以蔽之，索引的建立必须慎重，对每个索引的必要性都应该经过仔细分析，要有建立的依据。因为太多的索引与不充分、不正确的索引对性能都毫无益处：在表上建立的每个索引都会增加存储开销，索引对于插入、删除、更新操作也会增加处理上的开销。

码客说

2019/10/22

3K0

用sql创建索引_sqlserver索引的建立与使用

云推荐引擎 sql java https 网络安全

1.创建普通索引 SQL CREATE INDEX 语法在表上创建一个简单的索引。允许使用重复的值：

全栈程序员站长

2022/10/02

1.9K0

相似问题

如何重新建立索引以合并两个数据帧？

如何对多维数组重新建立索引？

如何对mysql表重新建立索引

重新索引数据帧

重新索引多索引数据帧

219

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问如何对“多组”数据帧重新建立索引？
EN

回答 1

Stack Overflow用户

如何重新建立索引以合并两个数据帧？

如何对多维数组重新建立索引？

如何对mysql表重新建立索引

重新索引数据帧

重新索引多索引数据帧

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何对“多组”数据帧重新建立索引？EN

回答 1

Stack Overflow用户

如何重新建立索引以合并两个数据帧？

如何对多维数组重新建立索引？

如何对mysql表重新建立索引

重新索引数据帧

重新索引多索引数据帧

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何对“多组”数据帧重新建立索引？
EN