然而我的强迫症又发了,标题为什么对不齐啊。网上一研究,是因为标题是中文所致,解决方法:
本系列的前两篇都是一些笼统的介绍,供小白制定学习计划时参考,现在该铺垫的都铺垫的差不多了。循序渐进,从本篇开始会写一些能实操的内容,尽量写的很细节,有任何问题欢迎私戳。
为了让这个策略能让计算机执行,首先,要使策略符合“初始化+周期循环”框架,像这样:
作为投资者,我们常听到的一句话是“不要把鸡蛋放入同一个篮子中”,可见分散投资可以降低风险,但如何选择不同的篮子、每个篮子放多少鸡蛋,便是见仁见智的事情了,量化投资就是解决这些问题的一种工具。
“龟叔”Guido van Rossum 在1989年圣诞节期间,为了打发无聊的圣诞节而编写的一个编程语言。
从2014年起,各大量化平台开始陆续上线,可能都受到了Quantopian的启发。前段时间,界面曾经写过一篇文章,其中对各个平台的打法总结的很到位:
人工智能的触手遍及各种行业,其中最让人眼红的莫过于金融行业。伸手就能割韭菜,何乐不为!但是,要怎么样才能真正割好韭菜,各路大神也是挠破头了吧。。。现在入门还算迟吗?
随着Python编程语言的流行和普及,越来越多人对如何应用Python做金融数据分析和量化交易充满兴趣。但是不少人对量化投资本身存在一定的误解或认识不清,有的人过于异想天开,认为可以躺着挣钱(怕是只有岛国老师吧);有的人则因循守旧,认为没啥卵用;也有的人盲目追求模型的复杂性,在编程和数学中迷失了方向。
Dual Thrust策略起源于20世纪80年代,由美国著名交易员和金融作家Larry Williams首次提出。这一策略的核心思想是通过捕捉市场中的短期波动来实现盈利。Larry Williams通过多年的研究和实践,发现市场中存在一种周期性的波动模式,通过这种模式可以预测价格的短期走势。
Pandas是一个强大的分析结构化数据的工具集;它基于Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。它是Python下用于数据工作的一个强有力的工具,数据分析、机器学习、金融、统计等很多领域都有着广泛应用。想要涉足这些领域的同学,Pandas建议一定要学一学。
<数据猿导读> 2016年,大数据从商业科技、政府管理、医学、教育、经济等方方面面撼动着世界,其中,在金融领域的应用更是取得了令人瞩目的进展。然而,产业高速发展的同时必然伴随诸多问题,金融风控不仅要面
去极值的方法,可以用均值加n倍的方差,来过滤,也可以用中位数加上下范围来过滤。如聚宽就提供了winsorize和winsorize_med等方法。
作者 | 明明 出品 | AI科技大本营(公众号ID:rgznai100) 3 月 27 日,是个特殊的日子!《福布斯》网站发布了 2018 年度“亚洲 30 岁以下杰出青年”榜单。 营长怀着激动的
Python 的学习者中,有相当一部分是冲着爬虫去的。因为爬虫可以帮你解决很多工作和生活中的问题,节约你的生命。不过 Python 还有一个神秘而有趣的应用领域,那就是量化交易。 量化交易,就是以数学模型替代人的主观判断来制定交易策略。通常会借助计算机程序来进行策略的计算和验证,最终也常直接用程序根据策略设定的规则自动进行交易。 Python 由于开发方便,工具库丰富,尤其科学计算方面的支持很强大,所以目前在量化领域的使用很广泛。市面上也出现了很多支持 Python 语言的量化平台。通过这些平台,你可以很方
长型数据和宽型数据在数据分析中非常常见 ,其中宽型数据更具可读性,长型数据则更适合做分析。
大家好,文摘菌又来搞事情啦~? 本周四晚,大数据文摘联合六禾创投,三场公开课,一!起!来!? 三位公开课嘉宾分别来自六禾创投被投公司华院数据、简寻、聚宽,公开课主题跨越深度学习医疗影像识别、社交网络数
学术界很早就发现,股票市场存在显著的盈余公告后的价格偏移现象(Post-Earnings Announcement Drift PEAD)。通俗解释来说,投资者对于公司的盈利有一个预期值,如果财报公布后,公司的实际盈利超出了投资者预期,公司的股价会上升,会有明显的超额收益。如果实际盈利低于投资者预期,公司股价会下降,会有明显的负向收益。本文基于这一现象构造盈利超预期因子,并对因子进行测试。后台回复“业绩超预期”获取代码和参考文献,限时免费。
InnoDB数据引擎使用B+树构造索引结构,其中的索引类型依据参与检索的字段不同可以分为主索引和非主索引;依据B+树叶子节点上真实数据的组织情况又可以分为聚族索引和非聚族索引。每一个索引B+树结构都会有一个独立的存储区域来存放,并且在需要进行检索时将这个结构加载到内存区域。真实情况是InnoDB引擎会加载索引B+树结构到内存的Buffer Pool区域。
不同摄像机的图像传感器靶面大小不同,但常用传感器规格为4:3(H:V) 镜头成像尺寸需要大于等于摄像机成像尺寸,否则四周有黑边
斯蒂文查了查 2019 年 1 月 3 日平安银行 (000001.XSHE) 的收盘价,发现是 9.28,他默默将这个单数字存到 X0 里。
写着写着,突然发现之前的标题“常用命令介绍”已经跟内容有点脱轨了,写的已经不只是命令了……
来自聚宽:韭菜Hulk的精彩之作 博客连接:https://www.joinquant.com/post/427 缠论是寻找股价走势中的拐点,然后去根据拐点之间的相互关系来判断股价的走势。 此处寻找极
面向对象设计(OOD)是面向对象编程(OOP)必不可少的一个环节,只有好的设计,才能保障程序的质量。面向对象设计的主要任务就是类的设计,不少面向对象(OO)的先驱和前辈已经提出了很多关于类的设计原则,用于指导OOP,其中就包括类设计的五项基本原则。
介绍tidyr包中五个基本函数的简单用法:长转宽,宽转长,合并,分割,NA简单填充。
运行代码之后返回到Jupyter Notebook的主页,就能看到保存的000300.csv文件,可以下载到本地进行操作,也可以直接在聚宽的研究环境中进行操作。
继续前期依次推文PySpark入门和SQL DataFrame简介的基础上,今日对Spark中最重要的一个概念——RDD进行介绍。虽然在Spark中,基于RDD的其他4大组件更为常用,但作为Spark core中的核心数据抽象,RDD是必须深刻理解的基础概念。
况且,我也不是学金融出身的,虽然凭运气在股市赚过一些小钱,但毕竟咱不是专业的,不敢乱指挥。
RDD设计背景 RDD被设计用来减少IO出现的,提供了一中抽象的数据结构,不用担心的底层数据的分布式特性。只需将具体的应用逻辑将一些列转换进行处理。不同的RDD之间的转换操作形成依实现管道话。从而避免中间结果落地的存储。降低数据复制,磁盘IO和序列化开销。 RDD是一个不可变的分布式对象集合。每个RDD会被分成多个分区,这些分区运行在集群的不同节点上。每个分区就是一个数据集片段。RDD提供的是一种高度受限的共享内存模型,既RDD是只读的记录分区的集合,不能直接修改,只能给予文档sing的物理存储中的数据来
近年来,人工智能兴起,AI 技术逐渐渗透到各垂直领域,国内外知名机构纷纷抢占风口。2017 中国大数据人工智能创新创业大赛(www.datadreams.org)推出 BOT 大赛系列赛之病理切片识别
K-means算法简介 K-means是机器学习中一个比较常用的算法,属于无监督学习算法,其常被用于数据的聚类,只需为它指定簇的数量即可自动将数据聚合到多类中,相同簇中的数据相似度较高,不同簇中数据相似度较低。 K-menas的优缺点: 优点: 原理简单 速度快 对大数据集有比较好的伸缩性 缺点: 需要指定聚类 数量K 对异常值敏感 对初始值敏感 K-means的聚类过程 其聚类过程类似于梯度下降算法,建立代价函数并通过迭代使得代价函数值越来越小 适当选择c个类的初始中心; 在第k次迭代中,对任意一个样本,
在《从零开始学Python【30】--DBSCAN聚类(理论部分)》一文中我们侧重介绍了有关密度聚类的理论知识,涉及的内容包含密度聚类中的一些重要概念(如核心对象、直接密度可达、密度相连等)和密度聚类的具体步骤。在本次文章中,我们将通过一个小的数据案例,讲解如何基于Python实现密度聚类的实战。
大家对DNA应该都有一定的了解,那么DNA同样不仅仅是具有一级结构的碱基序列,而且还具有二级结构(双螺旋),三级结构(超螺旋)的特征。今天给大家介绍一个来预测DNA结构的R包DNAshapeR,其从基因组测序数据中以超高速、高通量的方式预测DNA形状特征。该软件包以核苷酸序列或基因组间隔作为输入,并生成各种图形表示,以供进一步分析。DNA预测使用滑动五聚体窗口,其中512个不同五聚体中的每一个都有独特的结构特征,从而在每个核苷酸位置(周向)定义了小沟宽(MGW),滚动,螺旋桨扭曲(ProT)和螺旋扭曲(HelT)的向量(周 等人,2013)。MGW和ProT定义碱基对参数,而Roll和HelT代表碱基对步长参数。首先我们看下需要安装的包:
使用PdfPlumber库提取“F:\北交所全部上市公司的招股说明书20230710\艾能聚.pdf”第174页中的所有表格,
层次聚类假设类别之间存在层次结构,将样本聚到层次化的类中。所谓层次就是一层一层的进行聚类,可以采用自顶向下的聚类策略(分裂),也可以采用自下而上的策略(凝聚)。
关于科技创新下的量化投资,这些大佬都讲了什么?
聚类分析是研究分类问题的分析方法,是洞察用户偏好和做用户画像的利器之一。聚类分析的方法非常多,能够理解经典又最基础的聚类方法 —— 层次聚类法(系统聚类) 的基本原理并将代码用于实际的业务案例是本文的目标,同时这也会为理解后续与聚类相关的推文如 K-Means 等打下基础是。
前言 我们接着《从零开始学Python【28】--K均值聚类(理论部分)》一文,继续跟大家分享一下如何借助于Python和R语言工具完成K均值聚类的实战。本次实战的数据来源于虎扑体育(https://nba.hupu.com/stats/players),我们借助于NBA球员的命中率和罚球命中率两个来给各位球员做一次“人以群分”的效果。 首先,我们使用pandas中的read_html函数读取虎扑体育网页中的球员数据表,然后再对数据作清洗(主要是数据类型的转换、变量的重命名和观测的删除): 本次一共获得28
俄罗斯方块属于超级经典的游戏, 感兴趣可以玩一下, 找回一点童年, 当然如果你对这类网页轻量小游戏很感兴趣, 可以查看我以前写过的, 《超级马里奥游戏》Chrome变身小霸王, 《Boxel Rebound》“嗨到中毒”的弹跳小方块(附自制赛道分享方法)
本文讲述了python实现删除文件与目录的方法。分享给大家供大家参考。具体实现方法如下:
BigQuant – 你的人工智能量化平台 – 可以无门槛地使用机器学习、人工智能开发量化策略,基于python,提供策略自动生成器
今天这篇是R语言 with Python系列的第三篇,主要跟大家分享数据处理过程中的数据塑型与长宽转换。 其实这个系列算是我对于之前学习的R语言系列的一个总结,再加上刚好最近入门Python,这样在总结R语言的同时,对比R语言与Pyhton在数据处理中常用解决方案的差异,每一个小节只讲一个小知识点,但是这些知识点都是日常数据处理与清洗过程中非常高频的需求。 不会跟大家啰嗦太多每一个函数的详细参数,只列出那些参数中的必要设定,总体以简单实用为原则。如若需要详细了解每一个函数的内部参数,还是需要自己查阅官方文档
今天给大家带来的是斯科尔科沃科学技术研究院lgor Kozlovskii和Petr Popov发表在Nature Communications Biology的文章“Spatiotemporal identification of druggable binding sites using deep learning”。新型蛋白质结合位点的鉴定扩大了可成药基因组,为药物发现提供了新的机会。一般来说,结合位点的存在与否取决于蛋白质的三维构象,这使得结合位点的识别类似于计算机视觉中的物体检测问题。研究人员开发了一种快速准确的深度神经网络(BiteNet)框架,适用于大规模和时空识别蛋白质结合位点。
前置说明:本文是线上环境的实战问题拆解,涉及复杂 DSL,看着会很长,但强烈建议您耐心读完。
2、宛驹:意思是千里驹,比喻英俊有为的少年。唐·骆宾王《久戍边城有怀京邑》诗:“忘情同塞马,比德类宛驹。”
首先,客户端要考虑的就是只管调用api上报:上报item可见、上报item不可见。至于是否是有效曝光,就是公共埋点SDK(中台提供)去计算了。
工业化和信息化正加速融合,制造业转型升级进程加快,基于AI的机器视觉技术已被广泛应用于工业自动化生产领域,越来越多的企业通过发力智能边缘来攫取真正的商业价值。今天,小编拿到联宝科技自行研发和生产的智能边缘计算设备LCFC EA-B310(以下简称B310),来看看联宝是如何通过这台小小的计算设备来满足客户多场景边缘计算需求。
距离上一篇从零开始学Python系列已将近1年,在这一年中我一直忙于新书的编写,如今新书已上市,即《从零开始学Python数据分析与挖掘》。接下来我可以继续分享Python相关的知识点,主题包含数据可视化、数据分析和数据挖掘。
1) 对表格图片应用深度学习进行图像分割,分割的目的是对表格线部分进行标注,分割类别是4类:横向的线,竖向的线,横向的不可见线,竖向的不可见线,类间并不互斥,也就是每个像素可能同时属于多种类别,这是因为线和线之间有交点,交点处的像素是同属多条线的。
领取专属 10元无门槛券
手把手带您无忧上云