首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

最近面试太难了。

最近有位同学面试了几家,分享了一些觉得有些难度的SQL面试题:比如会让你用SQL实现行转列和列转行操作、用SQL计算留存、用SQL计算中位数、还有如何统计用户最大连续登录天数?...当然这种题变形也很多,连续打卡天数、连续学习天数,连续点击天数等等都是同一个类型,今天我们将会给大家分享SQL和Pandas的多种做法。让大家一次搞懂,下次面试不难!...作者简介 小小明,数据、Python爱好者,CSDN博客专家。个人博客地址:https://blog.csdn.net/as604049322 计算每一个用户的最大连续登录天数,由左变换到右边。...SQL 8.0窗口函数 实现思路: 对用户ID和登录日期去重 对每个用户ID按照日期顺序进行编号 将登录日期减去编号对应的天数,使连续的日期转换为同一天 将连续日期转换为同一个日期之后就可以按照这个字段分组...我们看看Pandas中rank函数的几种method的差异: import pandas as pd t1 = pd.DataFrame(data={'num': [2, 4, 4, 8, 8]})

1.1K32

esproc vs python 4

通过关联字段x 和 y 将P 的记录按照A 对齐。对着排列P计算y的值,计算结果和A中的x的值相等则表示两者对齐。这里是当前产品的出入库记录与B5中的时间序列对齐。...python ? 耗时esproc0.015python0.089 6.计算每个人的起止值班时间 题目介绍:表duty记录着值班情况,一个人通常会持续值班几个工作日再换其他人,数据如下: ?...我们的目的是根据duty表计算出每个值班的起止时间。...直到不相同了,取start~i-1位置的date的值,第0个赋值给begin,倒数第一个赋值给end,将name_rec,begin,end三个值放入初始化的duty_list中,然后将start赋值为...另外python中的merge函数不支持差集计算(或许其他函数支持),造成在第四例中特别麻烦。python pandas的dataframe结构是按列进行存储的,按行循环时就显得特别麻烦。

1.9K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Pandas中高效的选择和替换操作总结

    在本文中,我们将使用time()函数来测量计算时间,我们通过在执行前和执行后获取时间,然后计算其差值获得代码的执行时间。...{} sec".format(end_time - start_time)) 让我们看一个提高代码运行时间并降低计算时间复杂度的示例:我们将计算每个数字的平方,从0到100万。...} sec".format(for_loop_end_time - for_loop_start_time)) 可以看到它们之间有很大的差异,我们可以用百分比来计算它们之间的差异: list_comp_time...使用.iloc[]和.loc[]选择行和列 这里我们将介绍如何使用.iloc[] & .loc[] pandas函数从数据中高效地定位和选择行。...如果数据很大,需要大量的清理,它将有效的减少数据清理的计算时间,并使pandas代码更快。 最后,我们还可以使用字典替换DataFrame中的单个值和多个值。

    1.2K30

    动手学DL——深度学习预备知识随笔【深度学习】【PyTorch】

    \\ 2 & 2\\ \end{pmatrix} \begin{pmatrix} 0 &1 \end{pmatrix} ->\begin{pmatrix} 0 & 1 \\ 0 & 1\\ 0 & 1\...\ \end{pmatrix} \begin{pmatrix} 0 & 0 \\ 1 & 1\\ 2 & 2\\ \end{pmatrix} + \begin{pmatrix} 0 & 1 \\ 0 &...1\\ 0 & 1\\ \end{pmatrix} =\begin{pmatrix} 0 & 1 \\ 1 & 2\\ 2 & 3\\ \end{pmatrix} 向量|张量相加得到了意外的结果,...求导和反向传播:计算图可以帮助自动计算函数的导数,特别是在深度学习中的反向传播算法中。通过在计算图中计算每个节点的梯度,可以从输出端反向传播梯度到输入端,以便优化模型的参数。... ~~~python x.grad.zero_() y =x * x #由于 y 是通过对 x 进行元素级乘法实现的(y = x * x),因此 y 对于每个元素 x[i] 的梯度是 2

    38720

    Python做单细胞测序数据分析必备技能

    在前面单细胞转录组数据分析的文章中,有使用python实现的。今天我们了解一下在单细胞转录组分析过程中,必须要掌握的python数据框、包和函数等内容。...01、YEAR-END SUMMARY 数据结构 Pandas DataFrame Pandas是Python中最常用的数据处理库,DataFrame是其核心数据结构,类似于Excel表格,便于数据的存储和操作...差异表达分析 差异表达分析用于识别不同细胞群体之间显著差异表达的基因,这对于理解细胞功能和状态至关重要。 sc.tl.rank_genes_groups(): 识别差异表达基因。..., x='score_S', y='score_G2M') # 计算每个簇的细胞比例 proportions = adata.obs['leiden'].value_counts(normalize=True...通过学习和实践,逐步熟悉Pandas、NumPy、Scanpy、Omicverse等关键工具,以及细胞注释、去批次效应、差异表达分析、细胞组成分析等关键函数,您将能够胜任从数据预处理到高级分析的各个环节

    18610

    再见了!linux、awk。。

    虽然数据科学和机器学习工具和库(例如 Python 中的 Numpy、Pandas 和 Scikit-Learn等等)为数据处理和建模提供了更高级的功能,但 Shell 编程仍然是数据科学家和机器学习工程师工具箱中的一个重要组成部分...# 理解 Awk 程序结构 (BEGIN, body, END) Awk 程序结构由三个部分组成:BEGIN 块、body 块和 END 块。 1....模块如何编写: awk 'BEGIN { print "开始执行 Awk 程序" sum = 0 } { sum += $2 } END { print "执行结束"...END 块 该块在 Awk 程序执行完毕后被执行一次,用于做一些最终的计算、打印总结或清理操作等。...案例 假设我们有一个包含学生信息的文件,每一行包括学生的姓名、分数和班级,用逗号分隔。 我们想要读取文件并打印出每个学生的姓名和分数。

    22510

    精品教学案例 | 基于TensorFlow实现LSTM对股票收盘价走势的预测

    每次有新的内容需要输入时,输入控制会对其做出判断;遗忘控制会判断其影响结果具体表现为需要让主干忘记哪些内容;最后输出控制会基于当前主干分析和新的分析,判断如何输出分析结果。...LSTM的第一步决定丢弃什么信息,这由遗忘控制部件所决定,该部件被称为遗忘层。它会读取上一个节点的情况和当前节点的输入来判断主干部分该如何保留信息。...Pandas是基于NumPy的库,提供了高效地操作大型数据集所需的工具,弥补了Python在数据分析和建模方面的空白,使用户不必因为需求而切换到更特定领域的语言,如R。...# 设置模型训练预测需要的量 batch_size = 60 time_step = 20 train_begin = 0 train_end = 500 test_begin = 500 n = 10000...而其它使用到的库有:多用于科学计算的NumPy库、常见于数据分析任务的Pandas库、负责绘图展示的Matplotlib库。

    4.5K10

    几种自动生成verilog代码的方法

    这种方法的好处是只需要把精力花了编写模板身上,而其它部分都是由现成的库来实现,这样就只需要写很少量的python代码了。缺点是这种模板语言与Verilog语言本身有比较大的差异,需要稍微学习一下。...end 可见,这串代码的注释中用PYTHON_BEGIN和PYTHON_END括起了一段python代码。...重新生成时会先删除PY_VLG_BEGIN和PY_VLG_END之间的verilog代码。 always@(posedge clk, negedge rst_n) if(!...第五种:第四种基础上把常用规则提炼,做成开源工具 每个人单独搞一套就会变得不可持续。可以以开源项目的方式,爱好者共同开发和维护,不断迭代,形成行业规范。...并与现有的Verilog开发流程差异较大,DSL自成一套设计和验证的方法。 你更中意哪一种呢?

    20210

    使用Pandas_UDF快速改造Pandas代码

    常常与select和withColumn等函数一起使用。其中调用的Python函数需要使用pandas.Series作为输入并返回一个具有相同长度的pandas.Series。...对每个分组应用一个函数。函数的输入和输出都是pandas.DataFrame。输入数据包含每个组的所有行和列。 将结果合并到一个新的DataFrame中。...要使用groupBy().apply(),需要定义以下内容: 定义每个分组的Python计算函数,这里可以使用pandas包或者Python自带方法。...需要注意的是,StructType对象中的Dataframe特征顺序需要与分组中的Python计算函数返回特征顺序保持一致。...下面的例子展示了如何使用这种类型的UDF来计算groupBy和窗口操作的平均值: from pyspark.sql.functions import pandas_udf, PandasUDFType

    7.1K20

    leetcode无重复字符的最长字串 python实现

    这个解法是不能被接受的,提到它全是因为前面对“子串”的解释及其数量计算,来练习Python对字符串的操作。 (2)滑动窗口 “滑动窗口”这个概念在计算机算法中非常常见。...每日分享一些学习的方法和需要注意的小细节 点击:python技术分享交流 下面我们看看,“滑动窗口”如何进行字符串处理。...结合题目中的例子“abcabcbb”这个字符串,我们来看看如何找它的无重复最长子串。 首先,我们定义窗口的两端:begin和end,分别表示要找的子串的开头和结尾。...开始的时候,begin和end都指向0的位置即‘a’,然后end不断后移(窗口变宽),当遇到第二个‘a’时(遇见重复字符)就得到一个子串,其长度就是end和begin位置的差。 ?...不重复最长字串算法演示 如何判断是否遇到了重复字符‘a’呢?需要一个字典作为辅助数据结构,把end从头开始遇到的每个字符及其索引位置都放到字典里面,end每次移动到新字符就查一下字典即可。

    1.7K10

    嵌入式AI快速入门课程-K510篇 (第四篇 AI概念及理论知识)

    、损失函数、梯度等概念,同时学习如何在python程序中实现矩阵进行加减乘除操作。...下面我们设计python程序实现感知机模型,程序框图如下所示: python程序代码: 1.导入依赖库,如numpy、pandas、matplotlib等; 2.使用pandas库读取鸢尾花数据集 ;...反向传播的步骤如下: ​ 1.初始化权重ω和偏置值b等初始化参数 ​ 2.正向传播,计算每个神经元的输出 ​ 3.通过损失函数计算误差值 ​ 4.通过梯度下降法和链式法则求解每个神经元的梯度 ​ 5.更新网络参数...GPU通常包括多个处理器,每个处理器有一个共享内存,外加多个处理器和对应的寄存器,支持大规模并行处理,每个内核都专注于高效计算。...下面我们来展示GPU是如何工作的,为什么GPU可以加速图形和神经网络任务? ​ 在学习GPU如何工作前,我们需要知道并行计算是什么?

    51410

    打造Fashion-MNIST CNN,PyTorch风格

    PyTorch于2017年在Facebook上推出的很晚,但由于其动态的计算图和`` pythonic ''风格而很快赢得了从业者和研究人员的广泛喜爱。 ?...将尝试说明如何使用PyTorch从头开始为Fashion-MNIST数据集构建卷积神经网络分类器。如果没有强大的本地环境,则可以在Google Colab和Tensor Board上使用此处的代码。...return t 一旦定义了层,就可以使用层本身来计算每个层的前向结果,再加上激活函数(ReLu)和最大池操作,可以轻松地编写上述网络的前向函数。...计算并记录每个时期和运行的持续时间。 计算每个时期和跑步的训练损失和准确性。...begin_epoch:记录纪元开始时间,以便纪元结束时可以计算纪元持续时间。重置epoch_loss并epoch_num_correct。 end_epoch:大多数情况下都会发生此功能。

    1.4K20

    Pandas实用手册(PART III)

    ,今天继续为大家带来三大类实用操作: 基本数据处理与转换 简单汇总&分析数据 与pandas相得益彰的实用工具 基本数据处理与转换 在了解如何选取想要的数据以后,你可以通过这节的介绍来熟悉pandas...merge函数强大之处在于能跟SQL一样为我们抽象化如何合并两个DataFrames的运算。...函数相同的结果: 当然,你也可以直接使用pivot_table函数来汇总各组数据: 依照背景不同,每个人会有偏好的pandas 使用方式。...在说明每个工具的功能时,我都会使用你已经十分实习的Titanic数据集作为范例DataFrame: tqdm:了解你的程序进度 tqdm是一个十分强大的python进度条工具,且有整合pandas,此工具可以帮助我们了解...我懂的技巧不多,而现在轮到你教我了! - END -

    1.8K20

    Excel和Python整合使用,很神奇!

    这里,先看看Excel和Python之间的相似和差异。...如果能够做到这一点,那么使用Python控制Excel就不会有问题。 计算 看下面的例子来计算正方形的面积。在Excel中,我们使用单元格和公式,在Python中,我们使用变量和公式。...图3:Excel 图4:Python 每个Python变量就像一个包含一些数据的“单元”,可以通过在Python中键入变量名来引用这些“单元格”。 多重计算 我们经常需要同时计算许多项。...当前系数=先前系数*1.02,并且计算在pandas数据框架内执行。 图6:在Python pandas中的复利计算 我想说的是,无论是哪种计算,Excel和Python之间的底层逻辑都是相同的。...这里,我们已经比较了Excel和Python,接下来我们将深入细节,学习如何使用Python控制Excel! 注:本文学习整理自pythoninoffice.com。

    2.1K30

    Python数据科学(七)- 资料清理(Ⅱ)1.资料转换2.处理时间格式资料3.重塑资料4.学习正则表达式5.实例处理

    1.资料转换 1.套用向量化计算(例子依然使用我们采集的房天下的数据) 计算新价格 df['总价'] * 1000 使用 Numpy计算新的价格 np.sqrt() 代表开根号 import numpy...['建筑面积'] 2.定义函数进行套用 map:将函数套用到Series 上的每个元素 eg....#正则表达式在python中的使用 正则表达式,在python中,主要用到了一个re模块 compile():编译正则表达式 pattern = re.compile(“^\d{2,}$”) pattern...= r‘^\d{2,}$’ pattern.match(str,begin,end):从指定的字符串str第一个字符查询匹配的字符 pattern.search(str, begin, end):...5.实例处理 我们通过对新浪微博新闻数据的采集和处理作为案例 import requests import pandas import re from bs4 import BeautifulSoup

    1.1K30

    Machine Learning-特征工程之卡方分箱(Python)

    初次接触变量分箱是在做评分卡模型的时候,SAS软件里有一段宏可以直接进行连续变量的最优分箱,但如果搬到Python的话,又如何实现同样或者说类似的操作呢,今天就在这里简单介绍一个办法——卡方分箱算法。...卡方分布的定义如下: 若k个独立的随机变量Z1, Z2,..., Zk 满足标准正态分布 N(0,1) , 则这k个随机变量的平方和: ? 为服从自由度为k的卡方分布,记作: ?...卡方值用于衡量实际值与理论值的差异程度,这也是卡方检验的核心思想。 卡方值包含了以下两个信息: 1.实际值与理论值偏差的绝对大小。 2.差异程度与理论值的相对大小。 上述计算的卡方值服从卡方分布。...它主要包括两个阶段:初始化阶段和自底向上的合并阶段。 1、初始化阶段: 首先按照属性值的大小进行排序(对于非连续特征,需要先做数值转换,比如转为坏人率,然后排序),然后每个属性值单独作为一组。...六、Python代码实现 1.导入相关库 import numpy as np from scipy.stats import chi2 import pandas as pd from pandas

    5.9K20
    领券