首页
学习
活动
专区
圈层
工具
发布

Python~Pandas 小白避坑之常用笔记

(5)) # 控制台打印前5条数据 三、重复值、缺失值、异常值处理、按行、按列剔除 1.重复值统计、剔除: import pandas as pd sheet1 = pd.read_csv(filepath_or_buffer...=['user_id']).sum() # 统计user_id列 重复值的数量 print("user_id重复列数:", duplicated_num) sheet1.drop_duplicates...# 填充空值, value=填充的值 # sheet1['年度'] = sheet1['日期'].dt.year # 根据日期字段 新增年份列 # sheet1['季度'] = sheet1['日期...) sheet1['年度'] = sheet1['日期'].dt.year # 根据日期字段 新增年份列 sheet1['季度'] = sheet1['日期'].dt.quarter # 根据日期字段...'SalesData', skiprows=0, usecols=None) sheet1['年度'] = sheet1['日期'].dt.year # 根据日期字段 新增年份列 sheet1['季度

4.2K30

数据拆分、合并思路(Java)

业务: 为项目满意度数据实现导入和查询功能. 需求: 数据库中数据为季度数据,一个项目会有0-4条数据,一年不定数量的季度满意度数据如何导入?如何按年查询?...导入: 导入的模板数据包含项目信息,年份,不定数量的季度数据,我需要将该年份的数据导入进数据库,所以这里foreach遍历easyExcel读取到的数据,每个对象先把四个季度的满意度信息提取出来,以季度...,满意度>格式放进map中....然后遍历这个map,根据项目信息和当前的key(季度)查询数据库判断该数据是否存在,存在就更新,不存在就新增....我的思路是根据项目和年份分组,再通过mysql的GROUP_CONCAT()函数合并数据 SELECT a.project_id,a.project_name,a.

77360
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    泰迪杯A题通讯产品销售和盈利能力分析一等奖作品

    如使用“TipDM-BI 数据分析和可视化平台”实现,使用方式详见附录。...任务 1 数据分析与预测 根据附件“非洲通讯产品销售数据”中的数据,分别实现以下任务: 任务 1.1 统计各个年度/季度中,地区、国家、服务分类的销售额和利润数 据,并计算各国、各服务分类销售额和利润的同比增长率...附件提交 3.1 将任务 1、2 所编写的源程序文件,分别用“task1”、“task2”命名,保存在“program”文件夹中;如使用 TipDM-BI 数据分析和可视化平台实现,将使用平台创建的自助仪表盘截图保存到...无重复值 1.1.2 统计各年度各国销售额数据&计算同比增长率 因为统计的是各年度的销售额数据,所有需要对“日期”列进行拆分,取出年份: # 先对日期列进行处理 year = salesData.loc.../各经理的成交率.csv") man_rate 输出为: 1.4.1对数据进行预处理及编码, 给出明确的预测模型 对列”日期“进行处理,计算出该日期属于第几季度 # 获取年份列 year = salesData.loc

    3.4K10

    动态计算店铺数量

    近日,阿迪达斯发布了2020年财报,其中一张报表是店铺数量,如下图所示: 该报表显示了阿迪达斯每个季度的店铺数量,以及到2020年底的店铺数量(注意年底数量=Q4数量),另外,还显示了每个季度的开店数量...如何在Excel/Power BI中仅凭一个完整店铺资料制作类似以上报表(如下透视表所示)?下文以Excel界面进行讲述,Power BI软件操作相同。...准备一个日期表,仅有日期列即可,日期完整覆盖店铺资料表的所有开业日期、关闭日期年份(本例为2017-2021年)。...) 月 = MONTH('日期表'[日期]) 季度 ="Q"&FORMAT('日期表'[日期],"Q") 添加度量值,计算期末现存店铺数量、期间开店数量、期间关店数量、净开关店数量: 期末店铺数量:...在本例中,日期表和店铺明细无需建立关系,使用时间智能函数时等操作时,日期表需要与数据中的日期建立关系。但本例日期表只是用来筛选。

    2.1K30

    【愚公系列】《Python网络爬虫从入门到精通》036-DataFrame日期数据处理

    ◾ 移动生态:HarmonyOS/iOS/Android/小程序 ◾ 前沿领域:物联网/网络安全/大数据/AI/元宇宙 ◾ 游戏开发:Unity3D引擎深度解析 前言在数据分析和处理的过程中,...在Python的Pandas库中,DataFrame提供了强大的工具和方法,使得日期数据的处理变得高效而便捷。...本篇文章将深入探讨如何在DataFrame中处理日期数据,包括日期的解析、格式化、时间戳的转换、日期范围的生成以及缺失数据的处理等关键技巧。....to_period(freq) 转换为周期对象(如季度周期) 3....-按季度统计并显示数据-----------')print(df1.resample('Q').sum().to_period('Q'))print('---------按月统计并显示数据-------

    40010

    Python进行数据分析Pandas指南

    print("\n数据的基本统计信息:")print(data.describe())​# 统计数据中不同类别的数量print("\n不同类别的数量:")print(data['category'].value_counts...# 将日期列转换为日期时间类型sales_data_cleaned['Order Date'] = pd.to_datetime(sales_data_cleaned['Order Date'])# 提取年份和月份信息...sales_data_cleaned['Order Date'].dt.yearsales_data_cleaned['Month'] = sales_data_cleaned['Order Date'].dt.month# 按年份和月份分组计算每月总销售额...# 提取季节信息sales_data_cleaned['Quarter'] = sales_data_cleaned['Order Date'].dt.quarter# 按季度分组并计算总销售额quarterly_sales...随后,我们展示了如何在Jupyter Notebook中结合Pandas进行交互式分析,以及如何利用Matplotlib和Seaborn等库进行数据可视化。

    2.4K380

    RFM会员价值度模型

    从订单时间中找到各个会员距离截止时间节点最近的订单时间作为最近购买时间;以会员ID为维度统计每个用户的订单数量作为购买频率;将用户多个订单的订单金额求和得到总订单金额。...  数据介绍  案例数据是某企业从2015年到2018年共4年的用户订单抽样数据,数据来源于销售系统 数据在Excel中包含5个sheet,前4个sheet以年份为单位存储为单个sheet中,最后一张会员等级表为用户的等级表...1]来过滤出包含订单金额>1的记录数,然后替换原来sheet_datas中的dataframe 最后一行代码的目的是在每个年份的数据中新增一列max_year_date,通过each_data['提交日期...、rfm分组和用户数量。...int32形式  输出3D图像中 X轴为RFM分组、Y轴为年份、Z轴为用户数量 该3D图可旋转、缩放,以便查看不同细节  左侧滑块,用来显示或不显示特定数量的分组结果  分别针3类群体,按照公司实际运营需求和当前目标

    1.6K10

    excel常用操作大全

    例如,在excel中输入单位的人员信息后,如果需要在原出生年份的数字前再加两位数字,即在每个人的出生年份前再加两位数字19,如果逐个修改太麻烦,那么我们可以使用以下方法来节省时间和精力: 1)假设年份在...2.如何在文件下拉窗口底部设置最近运行的文件名数量? 打开“工具”,选择“选项”,然后选择“常规”,并在“最近使用的文件列表”下的文件编号输入框中更改文件编号。...如果菜单中未显示最近使用的文件名,请取消“最近使用的文件列表”前的复选框。 3.在EXCEL中输入“1-1”和“1-2”等格式后,将成为日期格式,如1月1日和1月2日。我该怎么办?...11.如何在不同的单位格?快速输入相同数量的内容 选择单元格格区域,输入一个值,然后按Ctrl+ Ener在选定的单元格格区域中一次输入相同的值。...如果您需要在表格中输入一些特殊的数据系列,如物料序列号和日期系列,请不要逐个输入。为什么不让Excel自动填写它们呢?

    28.6K10

    如何用Tableau对数据建模?

    销售数据表记录了咖啡订单,包括字段:订单编号、订日期、门店、产品ID、顾客、数量。 产品表中记录了咖啡的种类与价格,包括字段:咖啡ID、咖啡种类、杯型、产品名称、价格。 1.什么是数据关系?...Year函数取值日期,就可以得到订单的年份。...如图所示,在度量空白处点击,选择创建计算字段 按下图,在小方框里写新建度量值名称:产品数量。...继续输入“产品ID”字段,表示统计有多少种产品(产品数量),这样我们就创建了一个新的度量值“产品数量” 创建成功后,它会显示在工作表左栏度量中,如果想要删除/隐藏/重命名/复制/编辑等,可以点击相应选项...例如,销售数据表中的“订单日期”是以天为单位,在做图时会自动汇总成一年 用“订单日期”为横轴,“数量”为纵轴生成的条形图,这个图可以很清楚的看到不同时间维度下咖啡的订单销量是多少,如年维度 同样的,

    2.6K30

    如何用Tableau对数据建模?

    销售数据表记录了咖啡订单,包括字段:订单编号、订日期、门店、产品ID、顾客、数量。 产品表中记录了咖啡的种类与价格,包括字段:咖啡ID、咖啡种类、杯型、产品名称、价格。 1.什么是数据关系?...([订单日期])表示用Year函数取值日期,就可以得到订单的年份。...如图所示,在度量空白处点击,选择创建计算字段 image.png 按下图,在小方框里写新建度量值名称:产品数量。...image.png 继续输入“产品ID”字段,表示统计有多少种产品(产品数量),这样我们就创建了一个新的度量值“产品数量” image.png 创建成功后,它会显示在工作表左栏度量中,如果想要删除...例如,销售数据表中的“订单日期”是以天为单位,在做图时会自动汇总成一年 用“订单日期”为横轴,“数量”为纵轴生成的条形图,这个图可以很清楚的看到不同时间维度下咖啡的订单销量是多少,如年维度 image.png

    2.3K00

    新手也能上手的 Python 数据分析与可视化教程:从 Excel 到图表一步步教你做代码操作可视化图表

    前置知识: Excel:会进行常见的筛选、排序、简单函数(如 SUM、AVERAGE)的操作; 毕业中学及以上学历,能够阅读文档并动手按步骤操作; 编程经验:不要求。...(file_path, sheet_name="Sheet1") 运行后,Pandas 会自动根据 Excel 中的列名与数据类型创建 DataFrame,存储在 df 变量中。...:如上,将字符串日期转换为 datetime 类型,方便后续按年月、季度等分析。...# 删除临时列 df.drop(columns="CalcSales", inplace=True) 9.3.3 增加辅助列 # 提取年份和月份数字 df["Year"] = df["Month"].dt.year...示例:只保留 2024 年数据(假设 Excel 中还有其他年份数据) df_2024 = df[df["Year"] == 2024].copy() 9.4 分组统计与对比 9.4.1 计算各地区 2024

    3.5K20

    行转列不再复杂:SQL高手都在用的技巧揭秘

    在数据世界中,数据的“形状”往往决定分析的效率。例如: 原始数据:季度销售额按行排列,难以直接生成年度对比报表。 目标:将季度(Q1-Q4)转换为列,直观展示全年趋势。...(Q1-Q4)转换为列,输出: year Q1 Q2 Q3 Q4 2023 5000 7000 6000 8000 核心逻辑: 分组聚合:按年份分组,计算每个季度的销售额。...SUM():聚合非目标季度的值为 0,确保结果仅包含目标列的值。 GROUP BY:按年份分组,生成每行的年度汇总。 优势: 兼容性:所有 SQL 数据库支持。...三、实战案例:复杂场景下的行转列 案例 1:多维度聚合(年+季度+产品) 需求:按年份和产品类型,统计各季度销售额。...列数控制:减少转列的数量(如仅转 Q1-Q4,而非所有月份)。 2.

    2.1K10

    精选100个Pandas函数

    后向填充;使用缺失值后一个填充缺失值 between() 区间判断 c count() # 计数(不包含缺失值) cov() 计算协方差 corr() # 计算相关系数 cumsum() 累计和...cumprod() 累计积 compress 条件判断 concat() # 数据合并 d dtypes() 查看数据字段类型 describe() # 描述统计信息 duplicated...() 判断是否有重复元素 drop_duplicates() #删除重复值 dropna() # 删除缺失值 diff() 一阶差分 dt.date() 提取日期 dt.time()...提取时间 dt.year() 提取年份 dt.month() 提取年份 dt.day() 提取天/日 dt.hour() 提取小时 dt.minute() 提取分 dt.second...使用前一个值填充缺失值 factorize() 因子化转换 g groupby() # 分组 get_dummies() # 哑变量 h hist() 绘制直方图 hasnans() 判断元素中是否存在缺失值

    86230

    一篇文章搞懂数据仓库:维度表(设计原则、设计方法)

    维度是维度建模的基础和灵魂。在维度建模中,将度量称为“事实” , 将环境描述为“维度”。 维度表包含了事实表中指定属性的相关详细信息,最常用的维度表有日期维度、城市维度等。...……string4year_weeks一年中的第几周一年中的第几周 1 2 3……bigint5mon_dt本周周一日期本周周一日期bigint6sun_dt本周周日日期本周周日日期bigint7month...\2\3\4string11quarter_short季度 数字型季度 数字型 1-4bigint12quarter_cn季度中文名季度中文名 第一季度……string13year年份年份,yyyy格式...在间里巴巴维度建模中, 一般是编码和文字同时存在,比如商品维度中的商品 ID 和商品标题、 类目 ID 和 类目名称等。...比如商品价格,可以用于查询约 束条件或统计价格区间 的商品数量,此时是作为维度属性使用的;也可 以用于统计某类目 下商品的平均价格,此时是作为事实使用的。

    4.1K20

    大数据分析工具Power BI(六):DAX表达式简单运用

    ','第四季度点播订单表') 图片 五、创建日期表 在Power BI中我们经常使用时间函数来对包含日期列的数据表进行时间转换操作做进一步的分析,这里我们通过Power BI创建一张日期表来演示日期函数的操作使用...在Power BI中创建日期表常见的有两种函数:CALENDAR和ADDCOLUMNS。下面分别介绍。...需求:创建一张时间表,包含年份、月份、日期、季度、星期、年份季度、年月、年周、全日期列字段,具体操作如下,新建表,输入DAX公式如下: 日期表2 = ADDCOLUMNS( CALENDAR(DATE..."季度",QUARTER([Date]), "星期",FORMAT([Date],"AAA"), "星期2","周"&WEEKDAY([Date],2), "年份季度",...]), "季度",QUARTER([Date]), "星期",FORMAT([Date],"AAA"), "年份季度",FORMAT([Date],"第Q季度"), "年月

    6.5K101

    YashanDB TO_CHAR函数

    日期时间型数据的格式支持以下字符的组合:年年份:'YYYY'、'YYY'、'YY'、'Y'、'RRRR'、'RR'由ISO标准定义下的年份: 'IYYY'、'IYY'、'IY'、'I'一年中的一天(1-...366):'DDD'一年中的一周(1-53):'WW'由ISO标准定义下一年中的一周(1-53):'IW'世纪:'CC'月月份数字:'MM'月份全称:'MONTH'月份缩写:'MON'季度季度(1-4)...标准定义下一年中的一周(1-53):'IW'一天的总秒数:'SSSSS'Note:有符号年份'SYYYY'格式符暂未实现,目前和无符号年份'YYYY'格式符完全等价。...366):'DDD'一年中的一周(1-53):'WW'由ISO标准定义下一年中的一周(1-53):'IW'世纪:'CC'月月份数字:'MM'月份全称:'MONTH'月份缩写:'MON'季度季度(1-4)...标准定义下一年中的一周(1-53):'IW'一天的总秒数:'SSSSS'Note:有符号年份'SYYYY'格式符暂未实现,目前和无符号年份'YYYY'格式符完全等价。

    30410

    mysql中关于时间统计的sql语句总结

    在之前写VR360时有一个统计页面(https://vr.beifengtz.com/p/statistics.html),在此页面的数据统计时用到了很多mysql中日期函数和时间统计sql语句,当时也是参考了一些资料才写出来的...在平时开发中,涉及到统计数据、报表甚至大数据计算时一定会使用这些日期函数,其他关系数据库也是类似的,我是以mysql为例,比较简单还免费嘛。...注意,对于给定的日期参数是一年的第一周或最后一周的,返回的年份值可能与日期参数给出的年份不一致: mysql> SELECT YEARWEEK(’1987-01-01’); -> 198653...在 MySQL 3.23 中,如果表达式的右边是一个日期值或一个日期时间型字段,你可以使用 + 和 - 代替 DATE_ADD() 和 DATE_SUB()(示例如下)。...date_fo rmat(` date`,'%V')='{某周}' select count(*) from `table` where date_format(`date`,'%c')='{某月}' 统计每天的访问数量

    4.4K10

    使用ECharts实现数据可视化:横纵坐标配置与数据处理详解

    本文将以两个实际案例(年份-数量统计和评分-数量统计)为例,详细讲解如何在ECharts中配置横纵坐标、处理数据排序及优化图表样式,并提供完整的代码实现。 一、核心需求与实现思路 1....需求分析 年份-数量统计:横坐标为年份(升序),纵坐标为电影数量。 评分-数量统计:横坐标为电影数量,纵坐标为评分(升序)。 2....技术难点 数据排序(年份或评分升序) 坐标轴类型切换(category vs value) 图表样式优化(提示框、标签旋转、布局边距) 二、年份-数量统计的实现 1....坐标轴类型 category:用于离散的分类数据(如年份、评分) value:用于连续的数值数据(如数量) 2....年份-数量统计组件 dianyingxinxiChat1() { this.

    39110

    ChatBI 不止 Text2SQL,加上多维分析才算全链 AI+ 商业智能

    【注】传统拖拽分析的方式仍然支持点击生成分组报表我们首先来生成一个分组报表(按省份和年份汇总订单金额)。在输入框中输入:表头 客户省 签单年点击执行,立即就得到了一张分组报表。...上面报表的指标部分不太符合我们预期,需要进一步调整,输入:删除订单编码 签单日期 发货日期 收货日期 客户城市名称将多余的列删除。...输入:不显示明细修改表头名称,分别执行两条命令:客户省改为省份签单年改为年份这样我们就得到了一张基于省份和年份分组汇总订单金额的汇总表。...过滤订单金额超过 3000 的命令:过滤 订单金额大于3000多个条件还可以组合使用, 比如:过滤 订单金额大于1000 且 发货日期晚于2023年12月31日排序对数据排序,输入:排序 省份升序,年份降序可以针对多列进行排序...还可以进行行列互换,输入:左表头年份,上表头省份统计图通过命令还可以生成各种类型的统计图及配色方案,输入如下命令:柱形图 分类 省份 系列 订单金额就得到了下面按省份统计订单金额的柱形图。

    19410
    领券