首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

迭代XLSX工作簿并将卷中的唯一值从数据帧保存到单个工作表

的步骤如下:

  1. 导入所需的库和模块,如pandas和openpyxl。
  2. 使用pandas的read_excel函数读取XLSX工作簿,并将其存储在一个数据帧中。
  3. 使用pandas的drop_duplicates函数从数据帧中删除重复的行,以获取唯一值。
  4. 创建一个新的XLSX工作簿,并使用openpyxl库创建一个工作表对象。
  5. 使用pandas的to_excel函数将唯一值保存到新创建的工作表中。
  6. 使用openpyxl库的save函数保存工作簿。

下面是一个示例代码:

代码语言:txt
复制
import pandas as pd
from openpyxl import Workbook

# 读取XLSX工作簿
df = pd.read_excel('example.xlsx')

# 获取唯一值
unique_values = df.drop_duplicates()

# 创建新的工作簿和工作表
workbook = Workbook()
sheet = workbook.active

# 将唯一值保存到工作表中
for index, row in unique_values.iterrows():
    sheet.append(row.tolist())

# 保存工作簿
workbook.save('unique_values.xlsx')

在这个例子中,我们使用了pandas库来处理数据帧和唯一值的操作,使用了openpyxl库来创建和保存XLSX工作簿。这个方法适用于需要从数据帧中提取唯一值并保存到单个工作表的场景。

腾讯云相关产品和产品介绍链接地址:

  • 腾讯云对象存储(COS):https://cloud.tencent.com/product/cos
  • 腾讯云云数据库 MySQL 版:https://cloud.tencent.com/product/cdb_mysql
  • 腾讯云云服务器(CVM):https://cloud.tencent.com/product/cvm
  • 腾讯云云原生容器服务(TKE):https://cloud.tencent.com/product/tke
  • 腾讯云云安全中心:https://cloud.tencent.com/product/ssc
  • 腾讯云音视频处理(MPS):https://cloud.tencent.com/product/mps
  • 腾讯云人工智能:https://cloud.tencent.com/product/ai
  • 腾讯云物联网平台(IoT Hub):https://cloud.tencent.com/product/iothub
  • 腾讯云移动开发平台(MTP):https://cloud.tencent.com/product/mtp
  • 腾讯云分布式文件存储(CFS):https://cloud.tencent.com/product/cfs
  • 腾讯云区块链服务(BCS):https://cloud.tencent.com/product/bcs
  • 腾讯云腾讯会议:https://cloud.tencent.com/product/tc-meeting
  • 腾讯云元宇宙:https://cloud.tencent.com/product/tencent-metaverse

请注意,以上链接仅供参考,具体产品选择应根据实际需求和情况进行评估。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

openpyxl:PythonExcel操作库

) # 追加一行数据 ws.append(['李四', "1102", 18]) # 追加一行数据 wb.save(r'测试1.xlsx') # 保存到指定路径,保存文件必须不能处于打开状态,因为文件打开后文件只读...(r'测试1.xlsx') # 获取已存在工作簿 ws = wb.active # 获取工作 for row in ws.values: # 输出所有数据 print(row) 工作簿对象...wb.copy_worksheet(sheet):在当前工作簿复制指定工作并返回复制后工作对象 wb.remove(sheet):删除指定工作 ws.save(path):保存到指定路径path...(r'测试1.xlsx') # 获取已存在工作簿 ws = wb.active # 获取工作 for row in ws.values: # for循环迭代 print...(row) print(list(ws.values)) # 转换为数据列表 ws.rows:获取所有数据以行格式组成迭代对象 ws.columns:获取所有数据以列格式组成迭代对象

63351
  • 用 Python 帮运营妹纸快速搞定 Excel 文档

    Worksheet(工作) 或者 Sheet()–工作簿单个内容,电子表格可以包含多个工作。 Column(列) – 用英文字母标记垂直数列,以“ A”开头。...您将了解以下内容: Python 读写 Excel 第三方库 工作簿获取工作 读取单元格数据 遍历行和列 写入 Excel 电子表格 添加和删除工作 添加和删除行和列 大多数公司和大学都使用...工作簿获取工作 第一步是找到一个与 OpenPyXL 一起使用 Excel 文件,本文项目的 Github 存储库为您提供了一个 books.xlsx 文件。...接下来,让我们看一下如何在工作簿添加和删除工作! 添加和删除工作 许多人喜欢在工作簿多个工作处理数据。...在本文中,您掌握了以下内容: Python 处理 Excel 第三方软件包 工作簿获取工作 读取单元格数据 遍历行和列 写入 Excel 电子表格 添加和删除工作 添加、删除行和列 OpenPyXL

    4.5K20

    Python 自动化指南(繁琐工作自动化)第二版:十三、使用 EXCEL 电子表格

    Excel 文档 首先,让我们回顾一些基本定义:一个 Excel 电子表格文档被称为工作簿单个工作簿保存在一个xlsx文件。每个工作簿可以包含多个表格(也称为工作)。...图 13-1:工作簿工作标签在 Excel 左下角。 示例文件 1 应该类似于 13-1 。(如果您没有网站上下载example.xlsx,您应该自己将这些数据输入到表格。)...工作簿获取工作 通过访问sheetnames属性,可以获得工作簿中所有工作名称列表。...然后,它打开census pdata . xlsx文件 ➋,获取带有人口普查数据工作,并开始迭代其行 ➍。...在工作簿添加或删除工作后,记得调用save()方法保存更改。 将数值写入单元格 将写入单元格非常类似于将写入字典键。

    18.3K53

    Python下Excel批量处理工具:入门到实践

    然后,通过workbook.active获取活动工作。最后,使用iter_rows方法遍历工作每一行和每一列,并打印出单元格。...('output.xlsx')在这个示例,首先创建一个新Excel工作簿。...以下是一个简单示例,演示如何批量读取指定目录下所有Excel文件,并将每个文件第一行数据提取出来保存到一个新Excel文件:import os from openpyxl import load_workbook...目标是提取这些文件姓名和年龄列,并将它们合并到一个新Excel文件。...遍历工作每一行(第二行开始,假设第一行是标题行),提取指定列数据并将这些数据追加到输出工作。将合并后数据存到Excel文件,并打印一条消息表示数据合并完成。

    14510

    Python下Excel批量处理工具:入门到实践

    然后,通过workbook.active获取活动工作。最后,使用iter_rows方法遍历工作每一行和每一列,并打印出单元格。...('output.xlsx')在这个示例,首先创建一个新Excel工作簿。...以下是一个简单示例,演示如何批量读取指定目录下所有Excel文件,并将每个文件第一行数据提取出来保存到一个新Excel文件:import os from openpyxl import load_workbook...目标是提取这些文件姓名和年龄列,并将它们合并到一个新Excel文件。...遍历工作每一行(第二行开始,假设第一行是标题行),提取指定列数据并将这些数据追加到输出工作。将合并后数据存到Excel文件,并打印一条消息表示数据合并完成。

    29910

    Python操作Excel一些基本程序代码

    打开Excel并添加工作簿 下面的脚本代码简单地调用Excel,添加工作簿并将工作簿保存在默认文件夹。...') excel.Visible = True 添加工作 下面的脚本代码创建一个新工作簿,添加新工作,将其命名为MyNewSheet,并保存到默认文件夹。...可以使用Range()获取单个单元格或单元格区域地址,其中括号参数可以是双引号单个单元格名称(例如,“A2”)、由冒号分隔并由双引号包围两个单元格名称区域(例如“A3:B4”)或由两个cells...') excel.Application.Quit() 从一个工作复制数据到另一个工作 下面的脚本使用FillAcrossSheets()方法将数据从一个工作复制到工作簿所有其他工作。...') excel.Application.Quit() 格式化工作表单元格 下面的脚本创建两列数据,然后设置工作中使用字体类型和字体大小格式。

    1.2K30

    用deepseek爬取网页内多个表格数据

    在deepseek输入提示词: 写一个Python脚本,提取网页表格数据,具体步骤如下: 在F盘新建一个excel工作簿,名称为public-apis.xlsx 打开网页:https://github.com...标签,变量{hnumber}8到58,提取h3标签内容,设为变量{excelname},作为public-apis.xlsx工作簿工作名称; 定位其中Xpath=//*[@id="repo-content-pjax-container...标签,变量{tablenumber}3到53,定位每个tr标签,然后提取每个tr标签中所有td标签内容写入public-apis.xlsx工作簿{excelname}工作一行,提取每个...tr标签第1个td标签a标签文本内容和href属性,写入public-apis.xlsx工作簿{excelname}工作同一行; 注意:每一步都要输出信息到屏幕上 在某些情况下,a_elements...我们需要在调用 strip 方法之前检查 a_elements[0].text 是否为 None 程序运行成功 多个表格数据存到工作

    8910

    Python作业之Excel操作。上

    另外可以看看操作excel有什么库: xlrd库:excel读取数据,支持xls、xlsx xlwt库:对excel进行修改操作,不支持对xlsx格式修改 xlutils库:在xlw和xlrd,...openpyxl:主要针对xlsx格式excel进行读取和编辑。 在程序编写之前又要知道Excel三大原子结构: WorkBook:工作簿对象 Sheet:表单对象 Cell:表格对象 ?...库挺大,安装 from openpyxl import load_workbook # 打开excel文件 wb = load_workbook('xxxx.xlsx') # 选择第1个工作sheet...ws = wb.active # 修改A1单元格 ws['A1'] = '苟日新,日日新' # 保存文件 wb.save('iamhappy.xlsx') 常见操作是这样 active时激活这个意思...) 读取时这样 Excel工作簿,是英文worksheet,习惯性缩写为wb; Excel工作是sheet,就是worksheet这个词,习惯性缩写为ws;日常生活中一般很少用工作簿或者工作

    93240

    Excel实战技巧67:在组合框添加不重复(使用ADO技巧)

    很多情况下,我们需要使用工作数据来填充组合框,但往往这些数据中含有许多重复。如何去除重复并得到唯一,这是一个永恒的话题,大家也会用到各式各样方法得到结果。...本文讲解一种技巧,使用Recordset(记录集)来获取唯一并将其填充到组合框。 示例数据如下图1所示。在工作中有一个组合框,需要包含列A省份列表,但是列A中有很多重复省份数据。 ?...可以在任何事件或过程调用它们,例如工作簿打开事件、查询刷新事件或者按下按钮后。 运行或调用过程后,在工作单击组合框右侧下拉按钮,结果如下图3所示。 ?...2.Data Source:告诉VBA在哪里找到包含所需数据数据库或工作簿。使用Data Source参数,要传递完整数据库或工作簿路径。...例如:Data Source=C:\MyDirectory\MyWorkbook.xlsx。 3.Extended Properties:当连接到Excel工作簿时使用。告诉VBA数据源来自数据库。

    5.6K10

    ExcelVBA-ADO-SQL-001连接数据

    12.0 Xml后缀XML、MACRO可以省略 Xlsx文件 Provider=Microsoft.ACE.OLEDB.12.0;DataSource=c:\myFolder\myExcel2007file.xlsx...另一个改进措施是IMEX=1与注册 TypeGuessRows配合使用,TypeGuessRows决定了ISAM 驱动程序从前几条数据采样确定数据类型,默认为“8 ”。...选择数据区域: "SELECT [列名一],[列名二] FROM [一 HDR=NO,也就是工作没有标题,用F1,F2...引用相应数据列。...数据区域也可以用Excel定义名称表示,假如有个工作簿作用范围数据区名称datarange,查询语句为: "SELECT * FROM [datarange]" 如果数据区名称作用范围是工作,需要加上工作名...:"SELECT *FROM [sheet1$datarange]" 有密工作簿: 如果Excel工作簿受密码保护,即使通过提供正确密码与连接字符串,也无法打开它来进行数据访问。

    2K60

    openpyxl简单入门

    as op写文件1、创建一个工作簿,同时创建一个工作sheet: wb = op.Workbook()2、创建新sheet两种方式:ws = wb.create_sheet()在指定位置创建工作...= wb.create_sheet('工作2',0)5、修改sheet,改变工作标签颜色,默认为无颜色ws.sheet_properties.tabColor = "F22F27"6、激活工作簿...,获取index=0工作ws = wb.active7、在单元格写入数据:ws'A1' = 42 在A1单元格写入ws.cell(row=1, column=2, value=42) 在B1...单元格写入ws.cell(1,3).value= 42 在C1单元格写入8、新增一行数据:传入数组ws.append(1, 2, 3, 4)9、保存工作簿wb.save('openpyxl.xlsx...print(ws.max_column) # 获取工作最大列 print(ws.calculate_dimension()) # 获取工作全部数据单元格区域 #获取所有sheet

    1K00

    Python与Excel协同应用初学者指南

    通过这种方式,可以将包含数据工作添加到现有工作簿,该工作簿可能有许多工作:可以使用ExcelWriter将多个不同数据框架保存到一个包含多个工作工作簿。...可以通过运行type(wb)检查wb类型。 图10 上面的代码块返回在Python中加载工作簿工作名称。接下来,还可以使用此信息检索工作簿单个工作。...就像可以使用方括号[]工作簿工作特定单元格检索一样,在这些方括号,可以传递想要从中检索的确切单元格。...,即标题(cols)和行(txt); 4.接下来,有一个for循环,它将迭代数据并将所有填充到文件:对于0到4每个元素,都要逐行填充值;指定一个row元素,该元素在每次循环增量时都会转到下一行;...简单地说,可以在get_book_dict()函数帮助下提取单个字典所有工作簿

    17.4K20

    Spider与OpenPyXL结合1.OpenPyXL基础操作操作数据存到文件2.爬虫与OpenPyXL结合(爬取前程无忧网站招聘数据,存储Excel表格)使用同样分析方法爬取智联招聘岗位信

    除非你修改了这个,否则你使用该函数一直是在对第一张工作进行操作。...(0) # 插入在工作簿第一个位置 在创建工作时候系统自动命名。...print(sheet.title) 操作数据 使用一个单元格 我们开始修改工作单元格内容 单元格可以直接根据他们索引直接获得 >>> c = ws['A4'] 通过上述语句,将返回在...第一步,分析网页结构,找到我们需要数据块标签 ? 我们找到筛选我们想要数据 ?...fileName = '51job.xlsx' #调用得到正在运行工作 excel = Excel.active #工作名字 excel.title = '51job' #定义爬虫方法

    97810

    使用Python将多个Excel文件合并到一个主电子表格

    工作流程 要解决此问题,我们需要遵循以下工作流程: 1.识别我们需要合并文件。 2.文件获取数据。 3.将数据步骤2移动到主数据集(我们称之为“数据框架”)。...我们遍历指定目录所有文件,但只处理名称以“.xlsx”结尾Excel文件,这是由下面的代码完成: if file.endswith('.xlsx'): read_excel()将excel数据读入...数据存储在计算机内存,而不打开Excel。 图2 上述代码执行以下操作: 1.循环遍历当前工作目录所有文件,通过检查以“.xlsx”结尾文件名来确定文件是否为Excel文件。...2.如果是,则读取文件内容(数据),并将其追加/添加到名为df数据框架变量。 3.将主数据框架保存到Excel电子表格。...我们有2个文件,每个文件包含若干个工作。我们不知道每个文件中有多少个工作,但知道所有工作格式都是相同。目标是将所有工作聚合到一个电子表格(和一个文件)

    5.5K20

    Python3 读取和写入excel xlsx文件 使用openpyxl

    openpyxl定义多种数据格式 最重要三种: NULL空:对应于pythonNone,表示这个cell里面没有数据。...对应于pythonfloat。 string: 字符串型,对应于pythonunicode。 Excel文件三个对象 workbook: 工作簿,一个excel文件包含多个sheet。...cell: 单元格,存储数据对象 1创建一个workbook(工作簿) wb = Workbook()  # 一个工作簿(workbook)在创建时候同时至少也新建了一张工作(worksheet)。...= wb.get_sheet_by_name('frequency') 不知道名字用index     sheet_names = wb.get_sheet_names()  #方法得到工作簿所有工作...data_dic = {}# 把数据存到字典for rx in range(1, ws.max_row + 1):    temp_list = []    pid = rx    w1 = ws.cell

    3.1K40
    领券