首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Fama French (FF) 三因子模型和CAPM模型分析股票市场投资组合风险收益可视化

这篇文章的很大一部分内容涉及从FF网站导入数据,并对其进行整理,以用于我们的投资组合收益。我们将看到,处理数据在概念上很容易理解,但在实际操作中却很耗时。...数据被打包为 zip 文件,所以需要做的不仅仅是调用 read_csv()。使用tempfile() 基础 R 中的 函数来创建一个名为 temp. 这是我们将放置压缩文件的地方。...如果我们导入不同的 FF 因子集,我们将需要指定不同的列名。 作为一种替代方法,下面的代码块在导入后将列转换为数字,但更通用。它可以应用于其他 FF 因子集合。...还将FF数据转换为十进制,并创建了一个名为R\_excess的新列,保存高于无风险利率的收益。...conf.high 和 conf.low 列来保存我们的置信区间最小值和最大值。

3.9K30

Numpy 修炼之道 (12)—— genfromtxt函数

字段名称使用names关键字定义。 当dtype=None时,每个列的类型从其数据中迭代确定。...在以下示例中,转换器convert将剥离的字符串转换为相应的浮点型或如果字符串为空,转换为-999。...使用 missing 和 filling values 在我们尝试导入的数据集中可能会丢失某些条目。在前面的示例中,我们使用转换器将空字符串转换为浮点数。...我们可以使用特殊键None为所有列定义默认值。 在下面的例子中,我们假设缺少的值在第一列中用"N/A"标记,"???"在第三列。...我们希望将这些缺失值转换为0,如果它们出现在第一列和第二列中,则转换为-999,如果它们出现在最后一列中: >>> data = "N/A, 2, 3\n4, ,???"

9.7K40
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    python数据分析之清洗数据:缺失值处理

    在使用python进行数据分析时,如果数据集中出现缺失值、空值、异常值,那么数据清洗就是尤为重要的一步,本文将重点讲解如何利用python处理缺失值 创建数据 为了方便理解,我们先创建一组带有缺失值的简单数据用于讲解...或者使用data.info()来检查所有数据 ? 可以看到一共有7行,但是有两列的非空值都不到7行 缺失值处理 一种常见的办法是用单词或符号填充缺少的值。例如,将丢失的数据替换为'*'。...我们可以使用.fillna('*') 将所有缺失值替换为* ? 当然也可以针对某一列的缺失值进行填充,比如选择score列进行填充 ? 还有一种办法是将其替换为平均值。...如果是数字,则可以包括均值;如果是字符串,则可以选择众数。比如可以将score列的缺失值填充为该列的均值 ? 当然也可以使用插值函数来填写数字的缺失值。比如取数据框中缺失值上下的数字平均值。 ?...使用的数据为之前文章使用过的NBA数据(可以查看早起python历史文章获取数据与更多分析),我们先导入数据并检查缺失值 ?

    2.1K20

    R数据科学|第八章内容介绍

    使用readr进行数据导入 本文将介绍如何使用readr包将平面文件加载到 R 中,readr 也是 tidyverse 的核心 R包之一。...如果为FALSE,将自动生成列名:X1, X2, X3等。如果col_names是一个字符向量,这些值将被用作列的名称,并且输入的第一行将被读入输出数据帧的第一行。...默认的区域设置是以美国为中心的(如R),但您可以使用locale()创建自己的区域设置,控制默认时区、编码、十进制标记、大标记和日/月名称等内容。 na 字符串的字符向量,解释为缺少的值。...quoted_na 是否引号内缺少的值应该被视为缺少的值(默认)或字符串 comment 用于标识注释的字符串 trim_ws 在解析每个字段之前,是否应该修剪其前导和尾随空格?...guess_max 用于猜测列类型的最大记录数 progress 显示进度条 skip_empty_rows 是否忽略空白行 如果能够熟练使用read_csv()函数,就能同样使用readr包中的其他函数来读取文件了

    2.2K40

    基于 mlr 包的逻辑回归算法介绍与实践(上)

    新画作整个分类过程 通过使用算法学习得到的线性模型,将新数据的铜含量(copper)和铅含量(lead)转换为它们的 log odds (或 logits)。...mutate_at(.vars = fctrs, .funs = factor) %>% #将变量转换为因子 mutate(FamSize = SibSp + Parch) %>% #定义新的变量...gather() 函数将数据转化为 untidy 形式:每个预测变量名保存在一列中,它们的值保存在另一列中。...此时报错,查看年龄数据可知存在缺失值,而逻辑回归无法处理这样的数据。 2.5 处理缺失值 处理缺失数据有两种方法: 简单地从分析中排除缺少数据的情况。 应用一种机制来填补空白。...在本例中,由于年龄缺失值较多,故使用第二种处理缺失值的方法。

    2.3K20

    R语言第二章数据处理⑤数据框列的转化和计算目录正文

    正文 本篇描述了如何计算R中的数据框并将其添加到数据框中。一般使用dplyr R包中以下R函数: Mutate():计算新变量并将其添加到数据表中。 它保留了现有的变量。...同时还有mutate()和transmutate()的三个变体来一次修改多个列: Mutate_all()/ transmutate_all():将函数应用于数据框中的每个列。...Mutate_at()/ transmutate_at():将函数应用于使用字符向量选择的特定列 Mutate_if()/ transmutate_if():将函数应用于使用返回TRUE的谓词函数选择的列...转换特定列 mutate_at():转换按名称选择的特定列: my_data2 %>% mutate_at( c("Sepal.Length", "Petal.Width"),...mutate_if()对于将变量从一种类型转换为另一种类型特别有用。

    4.2K20

    独家 | 用于数据清理的顶级R包(附资源)

    纠正错误 R有许多预先构建的方法来纠正数据错误,例如转换值,就像在Excel或SQL中那样,使用简单的逻辑,例如as.charater()将列转换为字符串。...例如,此函数将完全消除所选数据列中缺少的值。 Na.omit(YOUR_DATA_COLUMN) 有类似的选项可以用0或N / A替换空白值,具体取决于字段类型,并提高数据集的一致性。...名称 考试A 考试B 约翰 55 80 麦克 76 90 山姆 45 75 gather收集功能通过将其转换为可用的列来完成。...这个函数允许你在R studio中编写SQL代码来选择你的数据元素 Janitor包 该软件包能够通过多个列查找重复项,并轻松地从您的数据框中创建友好列。...splitstackshape包 这是一个较旧的包,可以使用数据框列中的逗号分隔值。用于调查或文本分析准备。 R拥有大量的软件包,本文只是触及了它可以做的事情的表面。

    1.4K21

    Java注解之@PathVariable

    是的,@PathVariable 注解和 @RequestParam 注解可以同时在同一个方法参数上使用。这允许您同时从路径变量和查询参数中获取请求参数的值。...这样如果 URL 中缺少路径变量 id,将会接收 null 值,并可以在方法中处理缺少路径变量的情况。 需要注意的是,将 required 属性设置为 false 可能会导致安全问题。...5、一旦选择了合适的类型转换器,Spring MVC 将使用它来将路径变量的字符串表示形式转换为方法参数的目标类型。如果转换成功,方法参数将以转换后的值传递给控制器方法。...总之,Spring MVC 使用默认的类型转换器或自定义的类型转换器来将 URL 路径变量的字符串表示形式转换为方法参数的目标类型。这样可以方便地从 URL 中提取参数并在控制器方法中使用。...例如,如果请求URL为"/users/123",则Spring MVC将从URL路径中获取"userId"变量的值(即"123"),并尝试将其转换为int类型。

    39910

    .NET 可移植性分析器

    将项目转换为面向 .NET Core 等新平台后,可以使用基于 Roslyn 的 API 分析器工具来识别引发 PlatformNotSupportedException 异常以及其他兼容性问题的 API...可并行安装意味着无需破坏其他应用即可采用新的 .NET Core 版本。 如果目标是将应用移植到 .NET Core 以支持多个平台,则建议使用此对象。...如果使用的是 ApiPort 控制台应用,.NET 可移植性报表将以指定的格式保存为文件。 默认位于当前目录中的 Excel 文件 (.xlsx) 中。...目标类型:该类型具有目标平台缺少的 API 目标成员:目标平台缺少的方法 程序集名称:缺少的 API 所在的 .NET Framework 程序集。...每个选定的目标平台都是一列,例如“.NET Core”:“不支持”值表示此目标平台不支持 API。 建议的更改:要进行更改的推荐 API 或技术。 对于许多 API,此字段当前为空或已过时。

    1.2K40

    「R」dplyr 列式计算

    ❝在近期使用 「dplyr」 进行多列选择性操作,如 mutate_at() 时,发现文档提示一系列的 「dplyr」 函数变体已经过期,看来后续要退休了,使用 across() 是它们的统一替代品,所以最近抽时间针对性的学习和翻译下...,但目前我们还没找到解决方案) 当前列 如果需要,你可以通过调用 cur_column() 来获取当前列的名字。...这是由 base R 提供的,但它并没有很好的文档,我们花了一段时间才发现它是有用的,而不仅仅是理论上的好奇。 我们可以使用数据框让汇总函数返回多列。...我们可以使用没有外部名称作为将数据框列解包为单独列的约定。 你如何转移已经存在的代码?...幸运的是,将已有的代码转换为使用 across() 实现通常是非常直观的: 去掉函数 _if(), _at() and _all() 后缀 调用 across(),第一个参数如下: 后面如果还有参数,保持原样即可

    2.5K10

    R语言缺失值的处理:线性回归模型插补

    p=14528 ​ 在当我们缺少值时,系统会告诉我用-1代替,然后添加一个指示符,该变量等于-1。这样就可以不删除变量或观测值。...---- 视频 缺失值的处理:线性回归模型插补 ---- 我们在这里模拟数据,然后根据模型生成数据。未定义将转换为NA。一般建议是将缺失值替换为-1,然后拟合未定义的模型。...如果未定义50%,则缺少数据,将删除一半的行 n=1000 x1=runif(n) x2=runif(n) e=rnorm(n,.2) y=1+2*x1-x2+e alpha=.05 indice=sample...,我们获得与第一种方法完全相同的值,该方法包括删除缺少值的行。...5.在r语言中使用GAM(广义相加模型)进行电力负荷时间序列分析 6.使用SAS,Stata,HLM,R,SPSS和Mplus的分层线性模型HLM 7.R语言中的岭回归、套索回归、主成分回归:线性模型选择和正则化

    3.6K11

    MR应知应会:MungeSumstats包

    该软件包还使用户能够灵活地将重新格式化的文件导出为制表符分隔的 VCF 或 R 本机对象,例如 data.table、GRanges 或 VRanges 对象。...小 p 值超过 R 限制,可能会导致 LDSC/MAGMA 出现错误,应进行转换。默认值为 TRUE。 convert_large_p p 值 >1 是否转换为 1?...如果不需要过滤,则使用 NULL。默认为 X、Y 和线粒体。 rmv_chrPrefix 控制是否从染色体名称中删除“chr”/“CHR”(默认为 TRUE)。...任何不在参考基因组上的 SNP 将使用染色体和碱基对位置数据从参考基因组(如果可能)进行校正。...但是,如果 youf 文件中的列标题丢失,我们提供的映射不正确,您可以提供自己的映射文件。必须是 2 列数据框,列名称为“未更正”和“已更正”。

    2.6K11

    Python—关于Pandas的缺失值问题(国内唯一)

    从旧版数据库手动传输时,数据丢失。 发生编程错误。 用户选择不填写字段。 其中一些来源只是简单的随机错误。在其他时候,可能会有更深层的原因导致数据丢失。...稍后我们将使用它来重命名一些缺失的值。 导入库后,我们将csv文件读取到Pandas数据框中。 使用该方法,我们可以轻松看到前几行。...(使用.head()方法) 从列名称中推断出以下字符组非常容易: ST_NUM:街道号码 ST_NAME:街道名称 OWN_OCCUPIED:住所所有人是否被占用 NUM_BEDROOMS:卧室数 我们还可以进行设置...遍历OWN_OCCUPIED列 尝试将条目转换为整数 如果条目可以更改为整数,请输入缺失值 如果数字不能是整数,我们知道它是一个字符串,所以继续 看一下代码,然后我将对其进行详细介绍 # 检测数据 cnt...要尝试将条目更改为整数,我们使用。int(row) 如果可以将值更改为整数,则可以使用Numpy's将条目更改为缺少的值。np.nan 另一方面,如果不能将其更改为整数,我们pass将继续。

    3.2K40

    sparksql源码系列 | 生成resolved logical plan的解析规则整理

    AddMetadataColumns Resolution fixedPoint 当节点缺少已解析属性时,将元数据列添加到子关系的输出中。...除非此规则将元数据添加到关系的输出中,否则analyzer将检测到没有任何内容生成列。此规则仅在节点已解析但缺少来自其子节点的输入时添加元数据列。这可以确保元数据列不会添加到计划中,除非使用它们。...如果名称重复,则使用最内部作用域中定义的名称。...关于减法:1.如果两边都是间隔,保持不变;2.否则,如果左侧为日期,右侧为间隔,则将其转换为DateAddInterval(l, -r);3.否则,如果右侧是区间,则将其转换为TimeAdd(l, -r...例如,如果实际数据类型为Decimal(30,0),编码器不应将输入值转换为Decimal(38,18)。然后,解析的编码器将用于将internal row反序列化为Scala值。

    3.7K40

    30 个小例子帮你快速掌握Pandas

    我们删除了4列,因此列数从14减少到10。 2.读取时选择特定的列 我们只打算读取csv文件中的某些列。读取时,列列表将传递给usecols参数。如果您事先知道列名,则比以后删除更好。...8.删除缺失值 处理缺失值的另一种方法是删除它们。“已退出”列中仍缺少值。以下代码将删除缺少任何值的行。...第一个参数是位置的索引,第二个参数是列的名称,第三个参数是值。 19.where函数 它用于根据条件替换行或列中的值。默认替换值是NaN,但我们也可以指定要替换的值。...符合指定条件的值将保持不变,而其他值将替换为指定值。 20.排名函数 它为这些值分配一个等级。让我们创建一个根据客户余额对客户进行排名的列。...29.根据字符串过滤 我们可能需要根据文本数据(例如客户名称)过滤观察结果(行)。我已经将虚构名称添加到df_new DataFrame中。 ? 让我们选择客户名称以Mi开头的行。

    10.8K10

    python数据处理 tips

    df.head()将显示数据帧的前5行,使用此函数可以快速浏览数据集。 删除未使用的列 根据我们的样本,有一个无效/空的Unnamed:13列我们不需要。我们可以使用下面的函数删除它。...注意:请确保映射中包含默认值male和female,否则在执行映射后它将变为nan。 处理空数据 ? 此列中缺少3个值:-、na和NaN。pandas不承认-和na为空。...解决方案1:删除样本(行)/特征(列) 如果我们确信丢失的数据是无用的,或者丢失的数据只是数据的一小部分,那么我们可以删除包含丢失值的行。 在统计学中,这种方法称为删除,它是一种处理缺失数据的方法。...在该方法中,如果缺少任何单个值,则整个记录将从分析中排除。 如果我们确信这个特征(列)不能提供有用的信息或者缺少值的百分比很高,我们可以删除整个列。...在这种情况下,让我们使用中位数来替换缺少的值。 ? df["Age"].median用于计算数据的中位数,而fillna用于中位数替换缺失值。

    4.4K30

    Pandas 秘籍:1~5

    序列的视觉输出风格比数据帧少。 它代表一列数据。 连同索引和值一起,输出显示序列的名称,长度和数据类型。 或者,虽然不建议这样做,但可能会出错,但是可以使用带有列名作为属性的点表示法来访问数据列。...我们通过观察count方法的结果与size属性不匹配,确定该序列中缺少值。...当像上一步那样将数字列彼此相加时,pandas 将缺失值默认为零。 但是,如果缺少特定行的所有值,则 Pandas 也会将总数也保留为丢失。...如果仔细观察,您会发现步骤 3 的输出缺少步骤 2 的所有对象列。其原因是对象列中缺少值,而 pandas 不知道如何处理字符串值与缺失值。 它会静默删除无法为其计算最小值的所有列。...duration列缺少一些值。 如果回头看步骤 1 的数据帧输出,您将看到最后一行缺少duration的值。 为此,步骤 2 中的布尔条件返回False。

    37.7K10

    Oracle 错误总结及问题解决 ORA「建议收藏」

    ORA-01151: 如果需要,请使用介质恢复以恢复块和恢复备份 ORA-01152: 文件 没有从完备的旧备份中恢复 ORA-01153: 激活了不兼容的介质恢复 ORA-01154: 数据库正在运行...ORA-01410: 无效的 ROWID 说明:当将字符转变为ROWID时,如果使用了无效的字符串,会触发此异常。...类型 ORA-13266: 将数据插入表 时出错 ORA-13267: 从层次表 读取数据时出错 ORA-13268: 从 USER_SDO_GEOM_METADATA 获取维时出错 ORA-13269...:更新分区关键字列将导致分区的更改 说明:在更新记录中的Partition Key时,如果不开启ROW MOVEMENT,则会报此错误。...-19717: 对于非 OMF 搜索, 必须指定模式 ORA-19718: 命令 ID 的长度大于 ORA-19719: 操作名称的长度大于 ORA-19720: 将 OCI 号转换为 SCN 时出错

    22.9K20
    领券