首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

删除指定文件夹及其子文件夹中的所有文件,但保留文件夹

excelperfect 标签:VBA 经常要整理电脑中的文件,特别是每当要自查电脑文件时。每次都是将一个一个文件夹打开,将其中的文件全部删除,但要保留文件夹,以便于后面再陆续存放新的文件。...其实,这样的工作使用VBA来很好解决。 下面的程序会删除指定文件夹中的所有文件,包括其子文件夹中的文件,但会保留文件夹,即保留文件夹框架,以便再往里面存放新文件。...Sub KillFiles(strPath As String, Optional blnRecursive As Boolean) ' 本过程返回目录中的所有文件到Dictionary对象中....' 如果递归调用则同时返回子文件夹中的所有文件....具体操作为,在VBE中,单击菜单“工具——引用”,在“引用”对话框中,找到“Microsoft Scripting Runtime”并勾选其前面的复选框,如下图1所示。

53810
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    R语言调整随机对照试验中的基线协变量

    即使在各组之间的某些基线变量出现不平衡的情况下也是如此。这是因为偏差被定义为估计量(由我们的统计程序给出,如线性回归)是否在重复样本中具有等于目标参数的期望。...有时估计值会高于真实值,有时低于真实值,但只要平均值等于目标值,我们就会说估算值是无偏见的。 协变量调整 现在让我们考虑调整一个或多个基线协变量,在我们的分析中随机化时。...这通常通过拟合结果的回归模型来完成,随机组和基线变量作为协变量。 我们可以使用R来说明这一点。我们将模拟n = 50个受试者的小型研究的数据,随机化50%治疗= 0和50%治疗= 1。...该回归模型假设Y的平均值线性地取决于X,并且该关系的斜率在两组中是相同的。无法保证这些假设在任何特定研究中都能成立。因此,如果这些假设不成立,我们可能会担心使用协变量调整分析。...事实证明,在逻辑回归中调整基线协变量会降低治疗效果估计的精确度,但(会增加相应假设检验的能力)。

    1.7K10

    awk中的变量(r4笔记第93天)

    awk和sed结合起来,对于文件的横向纵向处理几乎是全方位的,可以算是文本处理中的大招了。当然awk这一强大的分本处理工具也不是浪得虚名,功能丰富,学习周期也要长些,不是一个Help文档就能说完的。...我们就按部就班,循序渐进,先来说说awk中的变量。 关于awk中的变量,有内置变量和自定义变量。 内置变量如果细分,有数据字段和数据行变量,数据变量,可能看概念不好理解。我们一个一个说明。...内建变量比如: ARGC 代表当前命令行的参数个数 ARGV 包含命令行参数的数组 ENVIRON 代表当前shell环境变量和值组成的关联数组 NF 代表数据文件中的字段总数 NR 是已处理的输入数据行数目...在脚本中给变量赋值,在命令行上给变量赋值 脚本中给变量赋值,比如我们指定一个变量test,然后初始化两次,变量值都会动态变化 ?...{ > test="first_try" > print test > test="second_try" > print test > }' first_try second_try 对于命令行中给变量赋值

    1K70

    R语言随机森林模型中具有相关特征的变量重要性

    p=13546 ---- 变量重要性图是查看模型中哪些变量有趣的好工具。由于我们通常在随机森林中使用它,因此它看起来非常适合非常大的数据集。...大型数据集的问题在于许多特征是“相关的”,在这种情况下,很难比较可变重要性图的值的解释。 为了获得更可靠的结果,我生成了100个大小为1,000的数据集。...顶部的紫色线是的可变重要性值 ,该值相当稳定(作为一阶近似值,几乎恒定)。红线是的变量重要性函数, 蓝线是的变量重要性函数 。例如,具有两个高度相关变量的重要性函数为 ?...实际上,我想到的是当我们考虑逐步过程时以及从集合中删除每个变量时得到的结果, apply(IMP,1,mean)} 在这里,如果我们使用与以前相同的代码, 我们得到以下图 plot(C,VI[2,]...然而,当我们拥有很多相关特征时,讨论特征的重要性并不是那么直观。

    1.9K20

    R语言随机森林模型中具有相关特征的变量重要性

    p=13546 ---- 变量重要性图是查看模型中哪些变量有趣的好工具。由于我们通常在随机森林中使用它,因此它看起来非常适合非常大的数据集。...例如,考虑一个非常简单的线性模型 在这里,我们使用一个随机森林的特征之间的关系模型,但实际上,我们考虑另一个特点-不用于产生数据-  ,即相关   。我们考虑这三个特征的随机森林   。...红线是的变量重要性函数,    蓝线是的变量重要性函数   。例如,具有两个高度相关变量的重要性函数为 看起来  比其他两个  要  重要得多,但事实并非如此。...我想我发现图形混乱,因为我可能会想到的  重要性 的    恒定。考虑到其他变量的存在,我们已经掌握了每个变量的重要性。...实际上,我想到的是当我们考虑逐步过程时以及从集合中删除每个变量时得到的结果, apply(IMP,1,mean)} 在这里,如果我们使用与以前相同的代码, 我们得到以下图 plot(C,VI[2,],type

    2.1K20

    关于plsql中的绑定变量(r3笔记第73天)

    在看关于shared pool的文档时,必定会提到绑定变量,也能够通过几个简单的例子对绑定变量带来影响有深刻的认识,但是在工作中,可能有时候我们就忘了绑定变量的影响了,其实有时候一个很小的变动就会导致性能几十几百倍的提升...然后我们使用如下的pl/sql来尝试从表t中取出数据然后重新插入t中。...生成的sql_id只有一个。至于parse_calls是66,我们可以断定表t中应该有66*2=132条数据。因为pl.sql是基于66条数据的基础上做了一次insert....SQL> select count(*)from t; COUNT(*) ---------- 132 然后我们来看看使用execute immediate来拼接sql语句的时候,绑定变量的情况...Elapsed: 00:00:00.09 我们来查看一下sql语句的执行情况。特别注意的是sql_text中的insert是小写。而上面的例子里面insert是大写。 这条语句进行了大量的硬解析。

    1.1K40

    拓端tecdat|R语言计量经济学:虚拟变量(哑变量)在线性回归模型中的应用

    相反,我们使用虚拟变量来衡量它们。 例子:性别 让我们假设x对y的影响在男性和女性中是不同的。 对于男性y=10+5x+ey=10+5x+e 对于女性y=5+x+ey=5+x+e。...因此,在y和x的真实关系中,性别既影响截距又影响斜率。 首先,让我们生成我们需要的数据。...接下来,让我们尝试两个虚拟变量:性别和地点 性别和地点的虚拟变量 性别并不重要,但地点很重要 让我们获取一些数据,其中性别不重要,但地点会很重要。...绘制查看x和y之间的关系,按性别给数据着色,并按地点分开。 plot(d,grid~location)  性别对Y的影响似乎是显著的。但当你比较芝加哥的数据和多伦多的数据时,截距不同,斜率也不同。...---- 最受欢迎的见解 1.R语言多元Logistic逻辑回归 应用案例 2.面板平滑转移回归(PSTR)分析案例实现 3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR) 4.R语言泊松

    1.7K20

    windows 2008 R2 64位服务器中开启php curl扩展的方法

    这篇文章主要介绍了windows 2008 R2 64位服务器中开启php curl扩展的方法,需要的朋友可以参考下 今天小编接到一客户的提问:系统是windows2008R2版 php_curl这个扩展没有开启...,我当时在想怎么可能呢,小编配了好多次每个扩展就是开启的这个函数 进服务器看了下没有任何问题,extension=php_curl.dll这个明明是开启的,libeay32.dll、ssleay32.dll...目录下也有,加载phpinfo时怎么就没有Curl项呢 重新注册在开始-运行-输入regsvr32 php_curl.dll提示不兼容,突然想到小编早上也在配置一个PHP时出现由于系统是32位64位引起的问题...,当时就在想会不会配置的方法有区别,看了下系统果然是64位的 找到系统文件下的syswow64这个文件(这个文件是windows操作系统的子系统,能够运行32位应用程序,并且在所有64位版本的windows...> 网站出现了,网站可以打开了,重新看了下phpinfo查了下里面的curl扩展也有了 这里就与大家共享下,嘿嘿~ 总结: php_curl扩展在64位下不能正常应用,则需将libeay32.dll、

    1.9K00

    R语言泊松回归对保险定价建模中的应用:风险敞口作为可能的解释变量

    p=13564 ---- 在保险定价中,风险敞口通常用作模型索赔频率的补偿变量。...当然,在进行费率评估的过程中,这可能不是一个相关的问题,因为精算师需要预测年度索赔频率(因为保险合同应提供一年的保险期)。...如果我们以曝光量的对数作为可能的解释变量进行回归,则我们期望其系数接近1。...deviance: 1064.2 on 981 degrees of freedom AIC: 3762.7 Number of Fisher Scoring iterations: 5 如果我们保留偏移量并添加变量...如果某人的风险敞口很大,那么上面输出中的负号表示该人平均应该没有太多债权。 如我们所见,这些模型产生了相当大的差异输出。注意,可能有更多的解释。

    1K30

    R语言泊松回归对保险定价建模中的应用:风险敞口作为可能的解释变量

    p=13564 ---- 在保险定价中,风险敞口通常用作模型索赔频率的补偿变量。...我们不能使用暴露作为解释变量吗?我们会得到一个单位参数吗? 当然,在进行费率评估的过程中,这可能不是一个相关的问题,因为精算师需要预测年度索赔频率(因为保险合同应提供一年的保险期)。...如果我们以曝光量的对数作为可能的解释变量进行回归,则我们期望其系数接近1。...freedomResidual deviance: 1064.2 on 981 degrees of freedomAIC: 3762.7Number of Fisher Scoring iterations: 5 如果我们保留偏移量并添加变量...如果某人的风险敞口很大,那么上面输出中的负号表示该人平均应该没有太多债权。 如我们所见,这些模型产生了相当大的差异输出。注意,可能有更多的解释。

    96920

    AutoML之自动化特征工程

    clients :有关信用合作社客户的基本信息表。每个客户端在此数据框中只有一行。 ? loans:向客户提供的贷款表。每笔贷款在此数据框中只有自己的行,但客户可能有多笔贷款。 ?...此外,虽然featuretools会自动推断实体中每个列的数据类型,但仍可以通过将列类型的字典传递给参数variable_types来重新定义数据类型。...所以严格意义上,Boruta并不是我们所需要的自动化特征工程包。 Boruta-py是brouta特征约简策略的一种实现,在该策略中,问题以一种完全相关的方式构建,算法保留对模型有显著贡献的所有特征。...所有特性的性能差异用于计算相对重要性。 Boruta函数通过循环的方式评价各变量的重要性,在每一轮迭代中,对原始变量和影子变量进行重要性比较。...其中,原始变量就是我们输入的要进行特征选择的变量;影子变量就是根据原始变量生成的变量 生成规则是: 先向原始变量中加入随机干扰项,这样得到的是扩展后的变量 从扩展后的变量中进行抽样,得到影子变量 使用python

    2.1K21

    pandas数据清洗,排序,索引设置,数据选取

    'A'].unique()# 返回唯一值的数组(类型为array) df.drop_duplicates(['k1'])# 保留k1列中的唯一值的行,默认保留第一行 df.drop_duplicates...(['k1','k2'], take_last=True)# 保留 k1和k2 组合的唯一值的行,take_last=True 保留最后一行 ---- 排序 索引排序 # 默认axis=0,按行索引对行进行排序...# 返回一个新的DataFrame,更新index,原来的index会被替代消失 # 如果dataframe中某个索引值不存在,会自动补上NaN df2 = df1.reindex(['a','b',...中的列columns设置成索引index 打造层次化索引的方法 # 将columns中的其中两列:race和sex的值设置索引,race为一级,sex为二级 # inplace=True 在原数据集上修改的...adult.set_index(['race','sex'], inplace = True) # 默认情况下,设置成索引的列会从DataFrame中移除 # drop=False将其保留下来 adult.set_index

    3.3K20

    整理了 25 个 Pandas 实用技巧,拿走不谢!

    这种方式很好,但如果你还想把列名变为非数值型的,你可以强制地将一串字符赋值给columns参数: ? 你可以想到,你传递的字符串的长度必须与列数相同。 3....我们将会使用str.split()函数,告诉它以空格进行分隔,并将结果扩展成一个DataFrame: ? 这三列实际上可以通过一行代码保存至原来的DataFrame: ?...将一个由列表组成的Series扩展成DataFrame 让我们创建一个新的示例DataFrame: ? 这里有两列,第二列包含了Python中的由整数元素组成的列表。...如果我们想要将第二列扩展成DataFrame,我们可以对那一列使用apply()函数并传递给Series constructor: ?...set_option()函数中第一个参数为选项的名称,第二个参数为Python格式化字符。可以看到,Age列和Fare列现在已经保留小数点后两位。

    3.2K10

    当常规的算法都山穷水尽之后,你可以试试python中的SMOTE算法

    权重调整 常规的包括算法中的weight,weight matrix。 改变入参的权重比,比如boosting中的全量迭代方式、逻辑回归中的前置的权重设置。...Smote算法的思想其实很简单,先随机选定n个少类的样本,如下图: ? 找出初始扩展的少类样本 再找出最靠近它的m个少类样本,如下图: ? 再任选最临近的m个少类样本中的任意一点, ?...# 筛选目标变量 aimed_date = test_date[test_date['label'] == 1] # 随机筛选少类扩充中心 index = pd.DataFrame(aimed_date.index...训练;空间内的少数类的个数/多数类的个数>=最低阀值的时候,在进行保留并纳入smote训练的初始少类样本集合中去抽样。...所以,剔除左侧的青色新增点,只保留右边的新增数据如下: ?

    2.2K110

    Python:SMOTE算法

    找出初始扩展的少类样本 再找出最靠近它的m个少类样本,如下图 ? 再任选最临近的m个少类样本中的任意一点, ?...---- # 筛选目标变量 aimed_date = test_date[test_date['label'] == 1] # 随机筛选少类扩充中心 index = pd.DataFrame(aimed_date.index...作为数据扩充的中心点 ---- # 自变量标准化 sc = StandardScaler().fit(aimed_date_new) aimed_date_new = pd.DataFrame(sc.transform...,再去原始的数据集中根据位置查找具体的数据 ---- import random r1 = [] for i in range(len(new_point.columns)): r1.append...训练;空间内的少数类的个数/多数类的个数>=最低阀值的时候,在进行保留并纳入smote训练的初始少类样本集合中去抽样 所以,剔除左侧的青色新增点,只保留右边的新增数据如下: ?

    1.7K40

    Apache Spark 1.6发布

    自从我们发布DataFrames,我们得到了大量反馈,其中缺乏编译时类型安全支持是诸多重要反馈中的一个,为解决这该问题,我们正在引入DataFrame API的类型扩展即Datasets。...Dataset API通过扩展DataFrame API以支持静态类型和用户定义函数以便能够直接运行于现有的Scala和Java类型基础上。...新的算法和能力:本版本同时也增加了机器学习算法的范围,包括: 单变量和双变量统计 存活分析 最小二乘法标准方程 平分K均值聚类 联机假设检验 ML流水线中的隐含狄利克雷分布...(Latent Dirichlet Allocation,LDA) 广义线性模型(General Liner Model,GLM)类R统计 R公式中的特征交互 GLM实例权重 DataFrames...中的单变量和双变量统计 LIBSVM数据源 非标准JSON数据 本博文只给出了本发布版本中的主要特性,我们也编译了一个更详细的发行说明集并附有可运行的例子。

    78480

    《基于Python的大数据分析基础及实战》精简读书笔记

    (其他相似的还有 map 和 filter 函数) 定义:私有变量和私有方法也就是 java 中添加了 private 修饰词的方法。Python 中使用 双下划线的方式定义。举例:__func。...知识点:Python 的注释是纯文本形式,及 ‘‘XXX’’ 的形式进行注释文档注释也是这种格式,但使用 ‘’‘XXX’’’ (三个单引号)且换行的形式。...扩展:MDS降维:多维尺度 (Multidimensional Scaling) 原则是在降维的同时尽可能的保留样本间的相对距离。具体实现方法本书没有展开讲解,这里也不做介绍了。...扩展:PCA 降维:主成分分析 (Principal Component n) 把高维线性相关的变量合成线性无关的低维变量。使用了线代中的高维投影到低维的方法。...代码:re.compile(r’[regex]’) (结合上一个小贴士,我们这里添加了 r 前缀) 注:正则表达式每次使用时都需要有两步,编译+匹配,把编译的过程单独拿了出来,肯定会加快了运行速度,时间变量的系数减少了

    46310

    【机器学习数据预处理】数据准备

    r_s=1-\frac{6\sum\limits_{i=1}^n(R_i-Q_i)^2}{n(n^2-1)} 将两个变量的值按照由小到大(或由大到小)的顺序排列,得到两个变量对应的秩, R_i 表示...r^2 越接近1,说明两个变量之间的相关性越强; r^2 越接近0,说明两个变量之间几乎不存在直线相关关系。   ...表示进行去重的列。默认为None keep 接收特定str。表示重复时保留第几个数据。first:保留第一个。last:保留最后一个。false:只要有重复都不保留。...属性内容重复   属性内容重复是指数据中存在一个或多个属性名称不同,但数据完全相同。...将含有异常值的记录直接删除这种方法简单易行,但缺点也很明显,在观测值很少的情况下,这种处理方式会造成样本量不足,可能会改变变量的原有分布,从而造成分析结果的不准确。

    10110
    领券