首页
学习
活动
专区
圈层
工具
发布

DolphinDB:金融高频因子流批统一计算神器!

图中的节点有3种: 1、数据源,如price。 2、有状态的算子,如a, b, d, e。 3、无状态的算子,如c和result。 从数据源节点开始,按照既定的路径,层层推进,得到最后的因子输出。...每一个算子(有状态和无状态)在DolphinDB中都可以转化为一个唯一的字符串序列。据此,我们可以删除重复的算子,提高计算效率。 3.3 内置的状态函数 状态算子计算时需要用到历史状态。...3.7 并行处理 当需要处理大量消息时,可在DolphinDB消息订阅函数subscribeTable中指定可选参数filter与hash,让多个订阅客户端并行处理消息。...譬如,因子计算经常需要使用面板数据,完成时间序列和横截面两个维度的计算,只要把响应式状态引擎和横截面两个引擎串联处理即可完成。...在后续的版本中,DolphinDB将以行函数(rowRank,rowSum等)表示横截面操作的语义,其它向量函数表示时间序列操作,从而系统能够自动识别一个因子中的横截面操作和时间序列操作,进一步自动构建引擎流水线

4.3K00
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    新型行情中心:基于实时历史行情的指标计算和仿真系统

    窗口函数通常在一个时间序列上执行,但在行情数据处理时,时间截面分析也非常常用,这就形成了所谓的面板数据处理。...非同步关联 行情中心存储的委托、交易和快照等数据在计算时经常需要按股票和时间进行关联。当按时间关联时,通常两个表中的时间不是相等的,而是满足某种关系,譬如最近的一条记录,某个时间窗口内的记录等。...的异构回放会把这三张表“组合成一张关联的大表”,并严格按照时间序列模拟生产回放;最后,可以指定回放速度,如10000笔每秒。...DolphinDB 的增量算法计算步骤更少,计算时延更低。...2、某台湾券商原先使用Python+HDF5做K线的计算,随着台湾交易所行情频率的提高,数据量激增,原有系统无法满足需求,遂使用DolphinDB生成不同频率的K线输出至python供C端查询。

    3.9K22

    排名前十的时序数据库

    时序数据库全称为时间序列数据库。时间序列数据库主要用于指处理带时间标签(按照时间的顺序变化,即时间序列化)的数据,带时间标签的数据也称为时间序列数据。时序数据的兴起还是榜上了物联网的大风。...物联网的基础数据具有数据量大、结构单一、时间属性强、查询简单等特点,传统的关系型数据库在面对物联网数据时,显得应对发力,基本上属于功能过剩但性能不足。...RRDtool can be easily integrated in shell scripts, perl, python, ruby, lua or tcl applications. 6.TimescaleDB...DolphinDB is a high performance time-series database....如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

    4.4K30

    硕士毕业半年的茫茫社招路

    (至今不知道知乎怎么插入目录) 初入职场:期待与现实之间的鸿沟 保持学习与成长 决定辞职 体验授课生活 关于未来的思考 社招之路 字节跳动抖音 Pony.AI小马智行 快手MMU DolphinDB智臾科技...保持学习与成长 很幸运的是,我深知自己在计算机基础知识上的薄弱与匮乏,因此在工作之后,我仍然保持着之前养成的学习习惯。...xj在读研之前曾经在一家叫DolphinDB的时序数据库公司实习了相当长的一段时间。我们之前也聊起过多次他在那边实习时做的许多有意思的工作。...前些年的技术卡脖子,让国家政府意识到不能再这样下去,因此提出了去IOE的口号,希望在这些机构都能使用具有完全自主知识产权的基础软件(如数据库)。...面试中个人应该保持一个什么样的气场呢?我想这个问题见仁见智。

    1.4K31

    11年逆袭,寒门专升本职高生终成MIT博士生!自学CMU课狂发5篇顶会,全网热议

    而周信静在面试时,展现出的对raft协议原理和实现细节的熟悉程度,甚至让面试官惊掉了下巴: 在30分钟的对话过程中,基本上捋了一遍如何使用raft协议实现一个分布式数据库,从客户端到服务端的框架设计。...在入职之后,便直接让他以实习生的身份参与到了DolphinDB分布式时序数据库的内核研发当中。 期间,团队在用哈希方法来改进SQL引擎分组计算的性能时,遇到了瓶颈。...于是,周信静差不多用了一个周末的时间,做出了一个IrremovableFlatHashmap的原型,一试果然有效。...回顾这段经历时,周信静总结道:在DolphinDB实习时,自己发现了Andy的DB课程,被深深吸引。 他希望能将经典的idea应用到DB系统里,甚至创造一些idea。因此,他研究生入坑了DB。...在这项工作中,来自MIT、威斯康星大学麦迪逊分校和谷歌的团队提出了一种2-Tree结构,从而解决现有方法在管理大于内存的索引时存在的局限性。

    60920

    python面试题--1

    Python对象的Python堆空间分配由Python内存管理器完成。核心API提供了一些程序员编写代码的工具。...Python序列可以是正数和负数的索引。对于正索引,0是第一个索引,1是第二个索引,依此类推。对于负索引,( - 1)是最后一个索引,( - 2)是倒数第二个索引,依此类推。...使用命令os.remove(filename)或os.unlink(filename) 30)解释如何在Python中生成随机数?...33)使用Python的五大好处? Python包含一个巨大的标准库,适用于大多数Internet平台,如电子邮件,HTML等。...Python不需要显式内存管理,因为解释器本身会将内存分配给新变量并自动释放它们 由于使用方括号,因此易于阅读 初学者易于学习 拥有内置数据类型可以节省编程时间和工作量,从而声明变量 34)提在Python

    2.4K10

    20000颗星!100+Agent工具开源引爆GitHub,程序员集体沸腾!

    • Twitter互动:与Twitter进行搜索和时间线交互的工具。 • WeCom消息发送:支持向WeCom群组机器人发送多种类型消息的MCP应用。...• DolphinDB数据库集成:具备模式检查和查询功能的DolphinDB MCP服务器。 • Google BigQuery访问:为BigQuery提供直接访问和查询功能的服务器实现。...• Tinybird查询支持:集成Tinybird,支持查询与API功能。 • VikingDB功能集成:提供VikingDB的集合、索引介绍、向量存储和搜索功能的MCP服务器。...MCP还帮助模型更好地管理上下文信息,在与外部资源交互时,模型可以将相关信息作为上下文传递给MCP服务器,使得交互更加精准和智能。...例如,在处理复杂任务时,模型能够将之前的操作记录和相关数据传递,帮助MCP服务器理解任务背景和需求。

    55020

    Faiss:加速大规模数据相似性搜索的利器

    易于集成:Faiss可以很容易地集成到Python和其他编程语言中,并且与常见的机器学习框架(如TensorFlow和PyTorch)兼容。...使用Faiss API:Faiss提供了丰富的API,可以方便地在各种机器学习应用中使用。 考虑数据预处理:有效的数据预处理可以显著提高Faiss的性能,比如特征缩放和维度减少。.../向量数量对于具有不同nprobe值的IVFFlat索引——1, 5, 10, 和 20 使用分区索引后,可以看到搜索时间明显减少,同时保持较高的搜索精度。...向量重构 当我们使用分区索引(如IndexIVFFlat)时,原始向量与其在索引中的位置之间不再有直接的映射关系。...PQ,可以显著减少存储空间和搜索时间,同时保持足够的搜索精度。

    2.4K10

    干货 | 2024 年 Elasticsearch 常见面试题集锦

    一般几个维度考量: 第一,不定期查看日志或者出了问题第一时间查看日志,普通日志会记录集群故障。比如:wildcard 出错,出问题日志能看到。 第二,必要时候,开启慢日志查询。...8、Elasticsearch API使用和最佳实践相关问题 Q1:描述你使用Elasticsearch REST API时的一些最佳实践。...将核心 API 脚本实现,监控内存使用率,磁盘使用率、CPU使用率,一旦出问题及时邮件预警。...那么在 Python 和 Java 客户端的程序访问也是需要把 Elasticsearch 配置的证书拷贝到给定的工程路径下的。 A2:你是如何在Elasticsearch中管理细粒度的访问控制?...),就能第一时间收到预警邮件信息。

    2.2K10

    使用 plotly 绘制 Choropleth 地图

    其实所有绘图都是这样,只不过在 plotly 里体现得尤为明显,尤其是底层 API。 data 决定绘图所使用的数据,比如绘制股票折线图用的股票历史数据,绘制疫情地图用的疫情数据。...需要注意此参数中值的顺序需要和 locations 保持一致,一一对应,如河南在 locations 中的索引是 9,那么河南的确诊人数在 z 中的索引也必须是 9。...需要注意的是当你使用以下风格之一时,你就需要指定 mapbox_token(关于如何获取 token 详细可参见这里): ["basic", "streets", "outdoors", "light...有时间我会继续写一写如何在 dash 中融入这些地图,并实时更新。...Reference Mapbox Choropleth Maps | Python | Plotly Choropleth Maps | Python | Plotly 新型冠状病毒(SARS-CoV-

    14.9K41

    现代后端开发者必备技能——2018 版

    例如,如果你已经在使用PHP或Node.js,请不要使用Python或Ruby,而应尝试使用Erlang或Golang。它肯定会帮助你延伸思维,并开启你的思想到新的视野。...了解如何在应用程序中编写单元测试和集成测试。另外,了解不同的测试术语,如 mocks, stubs 等。...如果你必须选择一个,请使用Redis。 第14步 - 缓存 了解如何在你的应用程序中实施应用程序级缓存。了解如何使用Redis或Memcached并在你在 步骤12 中创建的应用程序中实施缓存。...学习如何使用 Neo4j或 OrientDB。 第24步 - 保持探索 一旦你开始学习和练习,你一定会遇到我们在这个路线图中没有涉及的东西。只要保持开放的心态和对新事物的健康渴望。...它在开始时看起来更加可怕,你可能会觉得你并没有抓住任何东西,但这是正常的,随着时间的推移,你会觉得自己越来越好。 好了,就这么多。感谢阅读。

    1.5K30

    420小时学习代码之后:如何教你免费自学Python

    有时候,在你讨论更多复杂的内容时,你不得不放弃(但是你将会使用这种洞察力来为以后提高)。直到你对你学的新技能搞到兴奋。 之后,我想要简单的总结下我怎样去自学Python编程。...今年,我尝试投资一个工作周到8-10小时。那产生40(一年大约有40个周)x8小时,那么我在这个工程上总共花费的时间将达到420小时。...我是怎么做到以及使用了什么资源? 我按照时间顺序列了一些网站与资源。 我开始用一种非常棒的方式学习Codecademy’s Python课程。...使用它,我构建了一个本地运行的搜索引擎。令人沮丧的是,这个API被限制每天只有50次查询()。 另外,我可能在下个月是繁忙的为了去开发最优化的查询机票工具并上线它。...虽然我此刻将要完成Python项目,但是这并不意味着我现在将停止学习。只需要几个星期直到我仍然摇摇欲坠的Python技能基础将彻底恶化。所以我将保持写代码状态并尝试发现使用适合我普遍的主题例子。

    73030

    Android开发技能图谱

    扩展阅读 SQLite全文搜索引擎:实现原理、应用实践和版本差异 深入理解SQLite:存储引擎、索引、事务与锁 SQLite优化实践:数据库设计、索引、查询和分库分表策略 Sqlite使用WAL模式指南...你需要熟悉一些常见的设计模式,如单例模式、工厂模式、观察者模式等,并了解如何在Android开发中应用它们。...此外,你还可以使用一些跨平台的C++库来帮助你编写跨平台的逻辑层,如Base库、Boost、POCO、ACE等。这些库提供了一些更高级的功能,如网络编程、多线程、文件系统操作、日期和时间处理等。...在编写跨平台的C++代码时,你需要注意避免使用特定平台的API和特性,以保证代码的可移植性。同时,你也需要考虑到不同平台的字节序、整数大小和对齐要求等差异,以确保代码在不同平台上的正确性和性能。...你需要了解这些服务的基本功能和使用方法,例如如何使用云数据库存储和查询数据,如何使用云函数处理服务器端逻辑,以及如何使用API获取各种在线服务(如地图、社交、支付等)。

    1.3K10

    用 Python 优雅地玩转 Elasticsearch:实用技巧与最佳实践

    尽管Elasticsearch的核心是用Java编写的,它提供了REST API,让各种编程语言的开发者都能轻松与之交互,Python当然也不例外。...今天,我们将深入探讨如何将 Elasticsearch 与 Python 结合使用,提升我们的项目到新的高度。...映射定义了索引中文档的字段类型,如文本、整数和关键词等。这有助于Elasticsearch理解字段内容并优化搜索和聚合操作。...match", name=query) response = s.execute() return response 5.7 主函数 main_ds l函数串联了上述所有步骤,展示了如何在实际应用中使用这些功能...在选择合适的客户端和API时,重要的是根据项目的具体需求和团队的熟悉程度来做出决策,以确保既能充分发挥Elasticsearch的强大功能,又能保持代码的可读性和可维护性。

    7.8K10

    让 AI 更智能的检索增强生成(Retrieval-Augmented Generation)

    它支持自动索引管理和优化,用户无需关心底层的索引细节。Pinecone 还提供了实时更新和扩展功能,能够动态地添加或删除向量数据,同时保持检索性能的稳定。...它支持自动索引管理和优化,用户无需关心底层的索引细节。Pinecone 还提供了实时更新和扩展功能,能够动态地添加或删除向量数据,同时保持检索性能的稳定。...系统集成 API 接口:通过构建 RESTful API 或其他接口,将 RAG 系统集成到现有的应用程序中。用户交互:设计用户友好的交互界面,使用户能够方便地输入查询并获取回答。...例如,当检索大量的文档或处理高维向量时,检索过程可能会变得缓慢,从而影响用户体验。解决方案:优化索引结构:使用高效的索引结构(如 IVF 索引或 PQ 索引)可以显著提高检索效率。...快速部署:通过使用预训练的嵌入模型和生成模型,RAG 系统可以在短时间内完成部署,大大缩短了开发周期和成本。

    47910

    使用 LlamaIndex、Elasticsearch 和 Mistral 进行检索增强生成(RAG)

    当我们提出问题,如“给我概述一下与水有关的问题”时,Elasticsearch进行语义搜索并返回与水问题相关的“对话”。这些“对话”连同原始问题一起被发送到本地运行的LLM以生成答案。....env,存储配置属性,如API密钥。 我们需要安装一些包。首先,在应用程序的根目录下创建一个新的Python 虚拟环境。 python3 -m venv .venv 激活虚拟环境并安装以下所需包。...运行index.py脚本以执行摄取管道: python index.py 一旦管道运行完成,我们应该在Elasticsearch中看到一个名为calls的新索引。...然而,也可以使用外部向量存储(如ElasticsearchStore)来使嵌入持久化。...然而,当你想要使用在云中运行的LLM(例如OpenAI)时,发送包含PII信息的文本是不可取的。在后续的博客中,我们将看到如何在RAG流程中屏蔽PII信息后再发送到外部LLM。

    2.5K62

    【promptulate专栏】ChatGPT框架——两行代码构建一个强大的论文总结助手

    llm 大语言模型,负责生成回答,可以支持不同类型的大语言模型 memory 负责对话的存储,支持不同的存储方式及其扩展,如文件存储、数据库存储等 tools 提供外部工具扩展调用,如搜索引擎、计算器等...- 尝试将Transformer应用于其他自然语言处理任务,如文本分类、命名实体识别等。 - 研究如何在Transformer中引入外部知识,如知识图谱等,以提高其对语义的理解和表达能力。...,平均推理时间保持在十几秒(具体事件取决于网络环境)。...因为采用并行机制,因此在使用有LLM能力的Tool或者Agent时会在同一时间内快速地多次调用API,如果你的key有限速问题,推荐你使用key-pool来解决key限速的问题(如果你是5美元的key)...总结 本文主要介绍了如何使用大语言模型开发框架promptulate构建一个论文总结助手,通过promptulate,我们还可以构建很多有意思的应用程序,如让GPT调用搜索引擎,文件检索等,后续的文章会陆续更新

    39310

    生产级RAG系统一些经验总结

    如果需要吞吐量,也可以考虑批处理检索请求(如果使用API,将多个用户查询分组到数据库)。 这些优化使实时使用的延迟保持较低。...此外,语言模型推理可能需要意识到时间。流式RAG可以在提示中纳入时间意识(例如,添加一个语句如"当前日期时间:2025-05-01 10:00 EST",让模型知道优先考虑最新信息)。...实用技巧和部署考虑因素 设计架构和选择工具后,部署RAG系统有一些实际考虑: 延迟优化 生产RAG管道引入额外步骤(检索等),因此保持低延迟很重要: 可能时使用异步调用——例如,如果进行多个检索或模型调用...如果支持,还可以启用语言模型的流式标记输出(以便用户可以在生成答案时开始看到,改善感知延迟)。 一些语言模型API和服务器允许标记流式传输,这对长答案的用户体验非常好。...问题:如何在Ubuntu上安装该工具? 答案: 这个提示明确告诉模型使用文档摘录并避免胡编乱造信息。

    46510

    Elasticsearch 8.X 最新学习路线图——一图在手,进阶跟我走!

    学习基本概念和术语,如索引、文档、分片等,是理解 Elasticsearch 的基础。...学习如何创建和使用索引模板,可以提高数据管理的效率。 2.5 动态映射 动态映射使 Elasticsearch 能够根据数据自动生成映射,这在处理结构多变的数据时非常有用。...3.5 批量 BULK API BULK API 允许我们一次性执行多个操作,如创建、更新和删除文档。掌握 BULK API 的使用方法,可以提升数据处理的效率,尤其在处理大量数据时非常有用。...掌握搜索模板 API 的使用方法,可以提升搜索效率,确保在需要重复执行相似查询时,能够快速完成操作。...10.2 使用 Python 结合 Elasticsearch Python 是一种流行的编程语言,了解如何使用 Python 与 Elasticsearch 进行交互,可以提升数据处理的灵活性,实现高效的数据操作

    2K20
    领券