首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Excel公式:提取行中的第一个非空值

标签:Excel公式,INDEX函数,MATCH函数 有时候,工作表行中的数据可能并不在第1个单元格,而我们可能会要获得行中第一个非空单元格中的数据,如下图1所示。...图1 可以使用INDEX函数/MATCH函数的组合来解决这个问题,如果找不到的话,再加上IFERROR函数来进行错误处理。...在单元格H4中输入公式: =IFERROR(INDEX(C4:G4,0,MATCH("*",C4:G4,0)),"空") 然后向下拖拉复制公式至数据单元格末尾。...公式中,使用通配符“*”来匹配第一个找到的文本,第二个参数C4:G4指定查找的单元格区域,第三个参数零(0)表示精确匹配。 最后,IFERROR函数在找不到单元格时,指定返回的值。...这里没有使用很复杂的公式,也没有使用数组公式,只是使用了常用的INDEX函数和MATCH函数组合来解决。公式很简单,只是要想到使用通配符(“*”)来匹配文本。

4.6K40

JCIM|用Transformer-decoder模型进行分子生成

受生成性预训练模型(GPT)的启发,作者及其团队训练了一个名为MolGPT的GPT模型,以预测分子生成的SMILES标记序列。这是第一个将GPT架构用于分子生成的工作。...(","C "和 "c "分别指从链、非芳香族碳和芳香族碳的分支。 从图4中可以看出,在生成第一个显著性图谱中的 "O "原子时,该模型关注之前的双键和 "N "原子。...从图中可观察到以期望的性质值为中心的分离良好的集群。 图6取决于(A)TPSA+logP、(B)SAS+logP、(C)SAS+TPSA和(D)TPSA+logP+SAS 的生成分子的性质分布。...图7 骨架条件结果的评估指标的框图 基于骨架和分子性质的生成 在研究者评估MolGPT在保持骨架结构的同时生成具有特定属性值的结构的能力的实验中,随机选择了MOSES测试集五个不同大小的骨架。...在图12中,作者展示了其他样本例子,其中TPSA、LogP和支架结构保持不变,SAS被改进到更理想的值。

3.4K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【Python】基于某些列删除数据框中的重复值

    二、加载数据 加载有重复值的数据,并展示数据。...导入数据处理的库 os.chdir('F:/微信公众号/Python/26.基于多列组合删除数据框中的重复值') #把路径改为数据存放的路径 name = pd.read_csv('name.csv...从结果知,参数为默认值时,是在原数据的copy上删除数据,保留重复数据第一条并返回新数据框。 感兴趣的可以打印name数据框,删重操作不影响name的值。...new_name_3 = name.drop_duplicates(subset='name1',inplace=True) new_name_3 结果中new_name_3的值为空,即设置inplace...但是对于两列中元素顺序相反的数据框去重,drop_duplicates函数无能为力。 如需处理这种类型的数据去重问题,参见本公众号中的文章【Python】基于多列组合删除数据框中的重复值。 -end-

    20.5K31

    【Python】基于多列组合删除数据框中的重复值

    最近公司在做关联图谱的项目,想挖掘团伙犯罪。在准备关系数据时需要根据两列组合删除数据框中的重复值,两列中元素的顺序可能是相反的。...二、基于两列删除数据框中的重复值 1 加载数据 # coding: utf-8 import os #导入设置路径的库 import pandas as pd #导入数据处理的库...import numpy as np #导入数据处理的库 os.chdir('F:/微信公众号/Python/26.基于多列组合删除数据框中的重复值') #把路径改为数据存放的路径 df =...经过这个函数就可以解决两行中值的顺序不一致问题。因为集合是无序的,只要值相同不用考虑顺序。 duplicated():判断变成冻结集合的列是否存在重复值,若存在标记为True。...numpy as np #导入数据处理的库 os.chdir('F:/微信公众号/Python/26.基于多列组合删除数据框中的重复值') #把路径改为数据存放的路径 name = pd.read_csv

    14.7K30

    Excel公式技巧93:查找某行中第一个非零值所在的列标题

    有时候,一行数据中前面的数据值都是0,从某列开始就是大于0的数值,我们需要知道首先出现大于0的数值所在的单元格。...例如下图1所示,每行数据中非零值出现的位置不同,我们想知道非零值出现的单元格对应的列标题,即第3行中的数据值。 ?...图2 在公式中, MATCH(TRUE,B4:M40,0) 通过B4:M4与0值比较,得到一个TRUE/FALSE值的数组,其中第一个出现的TRUE值就是对应的非零值,MATCH函数返回其相对应的位置...ADDRESS函数中的第一个参数值3代表标题行第3行,将3和MATCH函数返回的结果传递给ADDRESS函数返回非零值对应的标题行所在的单元格地址。...然后,传递给INDIRECT函数得到该单元格地址对应的值。 小结:本示例的数组公式相对简单,也好理解,有助于进一步理解数组公式的运作原理。 undefined

    9.9K30

    针对SAS用户:Python数据分析库pandas

    pandas为 Python开发者提供高性能、易用的数据结构和数据分析工具。该包基于NumPy(发音‘numb pie’)中,一个基本的科学计算包,提供ndarray,一个用于数组运算的高性能对象。...Series 可以认为Series 是含标记的一维数组。这个结构包括用于定位数据键值的标签索引。Series 中的数据可以是任何数据类型。pandas数据类型的详情见这里。...SAS使用FIRSTOBS和OBS选项按照程序来确定输入观察数。SAS代码打印uk_accidents数据集的最后20个观察数: ? ? ? ?...5 rows × 27 columns OBS=n在SAS中确定用于输入的观察数。 PROC PRINT的输出在此处不显示。 下面的单元格显示的是范围按列的输出。...该方法应用于使用.loc方法的目标列列表。第05章–了解索引中讨论了.loc方法的详细信息。 ? ? 基于df["col6"]的平均值的填补方法如下所示。.

    12.1K20

    深入解剖SDTM-Define.XML

    XML的展现及内部取值规则均在stylesheets中。本文介绍define.xml参数一切均是基于官方提供的define2-1.xsl(此文件不做任何更改)。...如上,XML中四列值的来源及取值如上表。在define.xml编码中,备注内容往往储存在“COM.”节点下。...其中leafID=“xxx”会在XML中检索指向的ID,进而获取内的文件名,xlink:href=“xxx”指定文档PDF的位置和文件名。...Define XML中变量的类型进行了细分,在SAS数据集中类型只有数值型和字符型俩种,而这里就不止了。 Controlled Terms or ISO Format ? ? ?...基于此点,小编利用SAS宏借助设定的Excel模版开发并完成了一套自动化生成SDTM Define的工具。如有兴趣,可以返回文章顶部或顶部原文阅读,查看Define.XML专辑。

    4.8K106

    使用SAS EnterpriseMiner进行数据挖掘:信用评分构建记分卡模型

    本文将指导您完成使用Credit Scoring for SAS® EnterpriseMiner™开发的信用记分卡的基本步骤,这是我将在信用评分中发布的一系列技巧中的第一个。...建立记分卡用于构建信用记分卡的基本流程图中的节点包括:输入数据源,数据分区,交互式分组和记分卡。在本例中,您可以使用SAS Enterprise Miner的“帮助”菜单中提供的德语信用数据集。...这个节点: 使用您可以轻松调整的选项来分类输入变量 计算每个输入变量的箱的证据权重 计算基尼和信息值,并拒绝具有这些统计值的低值的输入变量 在幕后运行的过程可以根据您可以轻松定制的某些约束找到相对于目标的输入的最佳分级...当您指定记分卡属性生成报告=是以输出不良特征时,您的结果还将包括每个观察结果降低得分最多的变量。您最多可以选择5种不利特征。...作为如何解释此列的示例,对于下面数据集的第一次观察,扣除了14个得分点,因为贷款的目的标记为1,3,8,缺失或未知。 ?

    99620

    SAS-花式报表的制作...

    关注SAS分享号,发现程序的美好 前言 很早之前,小编打算分享一篇关于SAS实现花式表格的输出,后来诸事烦身就渐渐的忘记了这一茬。日前,有朋友问了我一个表格输出问题。...小编实现上面表格的思路如下: 1.将样表分为俩个report过程输出 2.第一个report过程采用多级标题很容易实现输出第一部分(前4行) 3.第二个report过程输出后第二部分(后3行) 4.利用...变化 → 如上,左图为俩个report输出的表格,右图为通过SAS程序修改RTF标记语言后实现表格的整合。...具体实现过程与程序如下: 1、template的编写,设置表格为带边框的 2、定义宏变量,将需要采用多级标题观测值存入宏变量中,并利用report输出。...结果 → 3、利用SAS程序合并RTF,并修改RTF编码,实现上下表格无缝衔接。这里涉及到RTF合并的程序(见小编历史推文:SAS-RTF的合并【完善篇】),基于以前的程序稍作修改!

    2.5K41

    SAS分类决策树预测贷款申请评分剪枝和结果可视化

    其他变量是模型的预测变量。以下语句将数据加载到会话中并显示数据表的前 10 个观察值。...这 PARTITION 声明要求将观察结果 Hmeq 划分为不相交的子集以进行模型训练和验证。随机选择观测值作为验证子集,概率为 0.3;为训练子集选择剩余的观察值。...树形图 最终树的概览图 如绘图图例中的颜色所示,为终端节点中的观察分配了 Bad=0 或 =1 的预测。...叶节点中的第一个条形显示与训练分区中=0 或 =1Bad的预测相匹配的因变量的比例, 叶节点中的第二个条形显示与验证分区中匹配的因变量的比例。线的粗细表示哪些节点具有更多的总观测值。...创建评分代码并对新数据进行预测评分 除了查看有关树模型的信息之外,您可能有兴趣应用该模型来预测因变量未知的其他数据表中的因变量。您可以运行 SAS DATA 步代码对新数据进行评分。

    64830

    一文通解如何选择最合适的机器学习算法

    SAS中的线性回归 SAS中的逻辑回归 线性支持向量机(Linear SVM)和内核支持向量机(Kernel SVM) 内核技巧用于将非线性可分离函数映射到更高维度的线性可分离函数中。...当大多数因变量是数字时,逻辑回归和SVM应该是分类的第一个尝试。这些模型易于实现,其参数易调,性能也相当不错。所以这些模型适合初学者。...K-means / K-modes, 高斯混合模型聚类(GMM clustering) 高斯混合模型 K-means / k-modes、GMM聚类旨在将n个观察值分为k个群集。...SAS可视分析中的聚类 一个DBSCAN图像 当没有给出簇k的数量时,可以通过密度扩散连接样本来使用DBSCAN(基于密度的空间聚类)。...主成分分析(PCA),奇异值分解(SVD)和隐狄利克雷划分(LDA) 我们通常不想将大量的特征直接扔到机器学习算法中,因为一些特征可能是不相关的,或者“固有的”维度可能小于特征的数量。

    62440

    SAS-编程中的小技巧(十一)

    许久未写编程中的小技巧了,今天小编打算分享一下编程中的小技巧。 RTF单个字符标记设置 日前,有人问小编,如何设置RTF中某一个字斜体而之后的字不斜体。(如下图:p)。...下图中第一个P值都斜体并且加粗,第二个P值只有P进行了斜体和加粗。俩者实现的代码具体见下截图。 ? RTF ?...代码 Excel导入后日期错乱 在日常编程中,虽不说是经常导入Excel,但是也还是比较常用到的。到读入Excel数据导SAS中,很小概率会遇到日期格式错乱,其实小编也没遇见过几次。...例如:将Excel中的日期导入到SAS后就变成一个字符型的数字。 ? ▲日期 ? 遇见这样的问题有时候也是很苦恼的。当然在SAS中换算一下就可以更正。 ?

    93840

    在SAS里玩穿越 | 【SAS Says·扩展篇】IML:穿越 | 数说·语言

    一直以来,大众了解的SAS都是数据集操作,使用的方法是数据步和过程步。但其实,SAS这个庞大的系统中还隐藏了另一个平行世界——IML,在这个世界里,你需要一个像操作MATLAB一样的矩阵思维。...---- 在SAS里玩穿越 | 【SAS Says·扩展篇】IML:穿越 本文要解决三个问题: 第一个问题:如何把SAS数据集转换为矩阵来处理?...本集学习完之后,SAS的IML模块就告一段落,最后面是Ansta给自己布置的一道作业,大家可以一起来做一下,然后相互交流~ ---- 第一个问题:将SAS数据集转换为矩阵 Read语句可以将数据集转化为矩阵...好,第一个问题就这么愉快的结束了。...Next:下一个观测值 After:当前观测值之后的所有观测值 Point 记录号:指定观测值 以逻辑库SAShelp中的air数据集为例: ?

    2.3K60

    【SAS Says】基础篇:update、output、transpose以及相关的数据深层操作

    如上图显示的那样,左边是主数据,右边是交易数据,现在 id=2的数据出现了更新,第二个变量变成了2; id=3的数据,第一个变量需要更新成b; 另外数据还要更新的是增加了id=5的数据。...5. output:将一个观测值变成多个 ? SAS通常在数据步结尾将一个观测值写入数据中,但可以写入多个观测值,在DO loop中或单独使用output语句。...; VAR variable-list; ID语句 ID语句命名变量,这些变量值将变成新的变量名,ID变量在一个数据集中只能发生一次,如果有BY语句,那么在一个by-group中,变量值必须是唯一的。...在proc transpose这步中,BY变量是team和player。ID变量是type,它的值salary和batavg将是新变量名,将要转置的变量entry在VAR语句中指定。...第二段代码给出了每个年龄组的第一名:BY语句中自动产生了first.variable,后面的IF语句保留了每个年龄组的第一个观测值,由于数据是按照年龄组agegroup和time排序的,因此第一个观测值就是第一名

    3.8K70

    算法分析:Oracle 11g 中基于哈希算法对唯一值数(NDV)的估算

    柱状图数据:也叫直方图(histograms)记录 NDV 和它们出现的频率 NDV 也叫做唯一值数,是对表的字段唯一值个数的统计,对于第一类数据,实际上可以通过一次扫描表获取所有字段的统计数据。...由于获取 NDV 数值需要消除重复值(通过 count (distinct col) 方式获取),Oracle 是通过排序的方法将已经读取的唯一值保持在 PGA 当中,以便消除后续的重复值。...2、新 NDV 算法介绍 在11g中,采用了一种新的算法消除 NDV 计算时,数据量与 PGA 消耗之间的线性关系,从而使得通过完全扫描表获得精确统计数据成为可能。...其基本算法过程如下: 它将每个扫描到的数值通过哈希算法转换为一个二进制数值,并放入一个数据结构中,我们称该数据结构为一个纲要(synopsis); 扫描下一个数值,获取到其哈希二进制数值,将其与纲要中已有哈希值比较...,如果已经存在相同值,则丢弃该值,否则就插入纲要中; 纲要是有大小限制的,当新插入哈希值时,纲要已经达到大小限制,则按照一定规则分裂该纲要、并丢弃其中一份数据(例如,将首位为0的数值丢弃掉),此时,纲要级别也相应增加

    1.3K30

    算法分析:Oracle 11g 中基于哈希算法对唯一值数(NDV)的估算

    柱状图数据:也叫直方图(histograms)记录 NDV 和它们出现的频率 NDV 也叫做唯一值数,是对表的字段唯一值个数的统计,对于第一类数据,实际上可以通过一次扫描表获取所有字段的统计数据。...由于获取 NDV 数值需要消除重复值(通过 count (distinct col) 方式获取),Oracle 是通过排序的方法将已经读取的唯一值保持在 PGA 当中,以便消除后续的重复值。...2 新 NDV 算法介绍 在11g中,采用了一种新的算法消除 NDV 计算时,数据量与 PGA 消耗之间的线性关系,从而使得通过完全扫描表获得精确统计数据成为可能。...其基本算法过程如下: 它将每个扫描到的数值通过哈希算法转换为一个二进制数值,并放入一个数据结构中,我们称该数据结构为一个纲要(synopsis); 扫描下一个数值,获取到其哈希二进制数值,将其与纲要中已有哈希值比较...,如果已经存在相同值,则丢弃该值,否则就插入纲要中; 纲要是有大小限制的,当新插入哈希值时,纲要已经达到大小限制,则按照一定规则分裂该纲要、并丢弃其中一份数据(例如,将首位为0的数值丢弃掉),此时,纲要级别也相应增加

    1.2K70

    【从零开始学SAS】1、创建时间序列SAS数据集

    使用DATA步创建SAS数据集 1、 创建临时数据集 程序编辑窗口输入如下命令,即可产生一个名为example1_1的临时数据集 data example1_1; input time monyy7.price...时间序列数据集的处理 1、 间隔函数的使用 间隔函数INTNX可以根据需要自动产生等时间间隔的时间数据: data example1_2; input price ; time=intnx( 'month...注:intnx函数的三个参数,第一个参数是指定等时间间隔,可以是day week monthquarter year等。第二个参数是指定参照时间。...4、 缺失值插值 假设上例3月1日price值观察值缺失,运行如下程序插补 data example1_5; input price; time=intnx( 'month', '01jan2005'd..._n_-1); format time date.; cards; 3.41 3.45 . 3.53 3.45 ; procexpanddata=example1_5 out=example1_6; id

    2.2K20

    【学习】七天搞定SAS(一):数据的导入、数据结构

    SAS的数据类型 首先,sas的编程大概就两块:Data和PROC,这个倒是蛮清晰的划分。然后目前关注data部分。 SAS的数据类型还真的只有两种:数字和文本。那么看来日期就要存成文本型了。...SAS的数据读入 手动输入这种就不考虑了,先是怎么从本地文件读入。...比如我们有文本文件如下 然后SAS里面就可以用 这样就建立了一个名为toads的临时数据集,然后读入外部文件ToadJump.dat,然后告诉SAS有四个变量,其中第一个是文本型。这样就OK了。...缺失值用一个点.标记。 偶尔数据没那么规范,比如长成: 那么就要有点类似正则表达式的感觉,告诉SAS更多的参数: 这样SAS就可以正确的读数据了—类似于excel的导入文本-固定宽度分隔。...还有若干更复杂的,可以遇到时侯回来查手册。此外还有@可用来直接指定开始读的列。鉴于我接触的数据一般比较规范,这些就不细看了。 此外SAS可以指定开始读的行数,读取的行数等。

    2K120
    领券