LSTM(Long Short Term Memory Network)长短时记忆网络,是一种改进之后的循环神经网络,可以解决 RNN 无法处理长距离的依赖的问题,在时间序列预测问题上面也有广泛的应用。
authors:: Lu Zhang, Zhu Sun, Ziqing Wu, Jie Zhang, Yew Soon Ong, Xinghua Qu container:: Proceedings of the Thirty-First International Joint Conference on Artificial Intelligence year:: 2022 DOI:: 10.24963/ijcai.2022/521 rating:: ⭐⭐⭐ share:: false comment:: 学习目标 POI 的左右上下文信息,将用户轨迹分为历史轨迹和当前轨迹,历史轨迹使用 Transformer 用以表示未来偏好,当前轨迹使用 LSTM 学习并进行多步预测,最后整合结果。
MixHop: Higher-Order Graph Convolutional Architectures via Sparsified Neighborhood Mixing
This paper introduces a new prompting strategy called Plan-and-Solve (PS) prompting to improve the performance of large language models (LLMs) in multi-step reasoning tasks. The authors propose two components of PS prompting: devising a plan to divide the task into smaller subtasks, and carrying out the subtasks according to the plan. They also extend PS prompting with more detailed instructions to address calculation errors and improve the quality of generated reasoning steps, resulting in PS+ prompting.
大家好,这里是NewBeeNLP。今天一起来研究下LLM中的emergent abilities现象。
自 OpenAI 的 Q* 项目曝光后,引发业内众多讨论。据现有信息汇总,Q* 项目被视作 OpenAI 在探索人工通用智能(Artificial General Intelligence, AGI)道路上的一次重大尝试,有望在包括数学问题解决能力、自主学习和自我改进等多个层面对人工智能技术带来革新性突破。
not just input state get mapped to output state. but also intermediate state (which could be observed by concurrent code!)
在2013年DQN首次被提出后,学者们对其进行了多方面的改进,其中最主要的有六个,分别是: Double-DQN:将动作选择和价值估计分开,避免价值过高估计 Dueling-DQN:将Q值分解为状态价值和优势函数,得到更多有用信息 Prioritized Replay Buffer:将经验池中的经验按照优先级进行采样 Multi-Step Learning:使得目标价值估计更为准确 Distributional DQN(Categorical DQN):得到价值分布 NoisyNet:增强模型的探索能力
https://github.com/tigerneil/deep-reinforcement-learning-family
据现有信息汇总,Q*项目被视作OpenAI在探索人工通用智能(Artificial General Intelligence, AGI)道路上的一次重大尝试,有望在包括数学问题解决能力、自主学习和自我改进等多个层面对人工智能技术带来革新性突破。
当你的才华还撑不起你的野心时,请潜下心来,脚踏实地,跟着我们慢慢进步。不知不觉在单细胞转录组领域做知识分析也快两年了,通过文献速递这个栏目很幸运聚集了一些小伙伴携手共进,一起成长。
目前深度学习中热点之一就是注意力机制(Attention Mechanisms)。Attention源于人类视觉系统,当人类观察外界事物的时候,一般不会把事物当成一个整体去看,往往倾向于根据需要选择性的去获取被观察事物的某些重要部分,比如我们看到一个人时,往往先Attend到这个人的脸,然后再把不同区域的信息组合起来,形成一个对被观察事物的整体印象。
近日,Github 一位开发者 danaugrs 开源了一个新项目——Huskarl,一个专注研究和快速原型的深度强化学习框架。
MTReclib是基于PyTorch开发的用于多任务推荐系统的开源框架。在MTReclib中,我们实现了诸多经典的多任务推荐模型,并且提供了4个多任务数据集以及相应结果。该框架易于扩展,基于该框架设计新的多任务模型或者尝试新的数据集十分方便。MTReclib地址:
本文精选了上周(0424-0430)最新发布的15篇推荐系统相关论文,主要研究领域为序列推荐和点击率预估,所利用的技术包括自监督学习、多模态学习、预训练技术、扩散模型、概率逻辑推理等。
亚马逊正在许多应用领域中推进机器人技术。Amazon Robotics设计,编码,构建和制造改变游戏规则的软件应用程序,控制系统,机器人技术和相关硬件,这正在改变Amazon在全球范围内的运营方式。AWS RoboMaker为机器人开发人员提供最完整的云解决方案,以大规模模拟,测试和安全部署机器人应用程序。
The toy lang from SmallStep is too “safe” to demonstrate any runtime (or dynamic) type errors. — 运行时类型错误 So that’s add some operations (common church numeral ones), and bool type.
CVPR2022论文和代码整理:https://github.com/DWCTOD/CVPR2022-Papers-with-Code-Demo
本周二,Stability AI 推出了新一代图像合成模型 Stable Diffusion XL Turbo,引发了一片叫好。人们纷纷表示,图像到文本生成从来没有这么轻松。
下面论文列表为本小组同学推荐和整理,关于论文细节请联系论文作者。内容涵盖以下研究方向:文本生成、知识库问答、对话系统、推荐系统、情感分析、风格迁移。
这一章我们介绍能自主浏览操作网页的WebAgent和相关的评估数据集,包含初级任务MiniWoB++,高级任务MIND2WEB,可交互任务WEBARENA,多模态WebVoyager,多轮对话WebLINX,和复杂任务AutoWebGLM。
Some module (e.g.Map) not found either maunally make map.vo or proof general can solve that.
每个人似乎都在担心人工智能会如何夺走我们的工作。但令人惊讶的是,很少有人真正了解在实际环境中使用人工智能模型的基本方面。到目前为止,大多数技术人员都听说过 RAG - Retrieval Augmented Generation。简单来说,RAG 只是一种将文档或某些知识源链接到 AI 模型的方法。如果您正在考处理5 个文档,这听起来很容易。但是,如果让您考虑任何人或公司如何需要对数千、数万或数百万个文件执行此操作,则这是一个不同的问题。这是几乎所有公司都存在的问题。这就是为什么我大力倡导每个人至少对 RAG 是什么有基本的了解,因为它是使用 AI 模型所需的基本知识之一。
选文理由:从 AAAI 发布的 paper list 整体来看,令人喜悦的是靠近底层的问题研究和靠近工业界的产品研究都很多。前者保证了科研界的活跃度和今后行业发展的基础,后者则保证了短期内一些研究落地的可能性。不过,很多项目仍然有研究空间,离落地-或者说成熟期-有一定距离。比如人脸识别的项目已经发展了很多年,应用该技术的产品也很多,但今年接收的论文仍然出现不少在人脸识别方向对算法的改进和扩展的文章。说明 AI 整个行业虽然收到了公众很大的关注,也在过去几年中取得了长足的进展,从产品角度来看仍然有很长的路要走、可以走。
机器之心专栏 作者:字节跳动AI Lab、UT Austin、新加坡科技设计大学StatNLP组 目前强大的语言模型普遍在很多下游 NLP 任务中能轻易地达到比较好的结果,但在推理效果上没有达到我们的预期 [1]。字节跳动人工智能实验室与新加坡科技与设计大学提出一个基于演绎推理的方法,希望实现类似 System 2 的推理能力 [2]. 论文链接:https://arxiv.org/abs/2203.10316 研究动机 作为一类需要解题的推理过程,在数学解题任务中比较适合应用演绎推理模型。我们尝试在此任
Chain-of-Thought(CoT)是一种改进的Prompt技术,目的在于提升大模型LLMs在复杂推理任务上的表现,如算术推理(arithmetic reasoning)、常识推理(commonsense reasoning)、符号推理(symbolic reasoning)。
MC(Monte-Carlo)的方法,在Sutton的书中有比较权威并详细的说明。地址:https://rl.qiwihui.com/zh_CN/latest/index.html
1.ART: Automatic multi-step reasoning and tool-use for large language models
本次分享的是用PyTorch语言编写的深度强化学习算法的高质量实现,这些IPython笔记本的目的主要是帮助练习和理解这些论文;因此,在某些情况下,我将选择可读性而不是效率。首先,我会上传论文的实现,然后是标记来解释代码的每一部分。
In today's digital landscape, the security and speed of data transmissions are crucial. In this regard, the Transport Layer Security (TLS) protocol plays a pivotal role. Here, we'll dive deep into the new and improved TLS 1.3 protocol, with an emphasis on its handshake process, which has undergone substantial improvements in terms of speed and security compared to its predecessor, TLS 1.2.
全基因组选择, 参考群需要建多大, 这篇文章用实际数据和模拟数据证明, 参考群至少要有500才有效果. 另外, 多性状SSGBLUP比单性状SSGBLUP要好. 所以, 学好传统的数量遗传学对于基因组选择也是有帮助的.
选自arXiv 作者:Kristopher De Asis等 机器之心编译 在 AAAI 2018 接收论文列表中,来自阿尔伯塔大学强化学习和人工智能实验室 Richard S. Sutton 等研究者的一篇论文提出一种新的多步动作价值算法 Q(σ),该算法结合已有的时序差分算法,可带来更好性能。机器之心对此论文做了简要介绍,更多详细内容请查看原文。 时序差分(TD, Sutton, 1988)法是强化学习中的一个重要概念,结合了蒙特卡洛和动态规划法。TD 允许在缺少环境动态模型的情况下从原始经验中直接进行
论文快报-2021-10-Multi-task optimization and evolutionary multitasking A Multi-Variation Multifactorial Evolutionary Algorithm for Large-Scale Multi-Objective Optimization 传送门 摘要 For solving large-scale multi-objective problems (LSMOPs), the transformation-bas
在上一篇文章中,我们让 ChatGPT 来帮我们写 SQL 语句, 现在我们再挑战一下,让 ChatGPT 来帮我们数据建模。
本次整理的论文同样主要偏向于Open-Domain QA,其中主要涉及到阿拉伯语的问答(这个可以尝试转变成中文的,因为这个是有源码的)、开放问答系统搭建、开放问答效率提升、基于web表的开放问答方法、开放问答模型泛化能力研究等,最后还有一篇是关于RC(Reading Comprehension)的paper,个人觉得不错所以也放到这里面了。(四篇含源码)
机器之心 & ArXiv Weekly 参与:楚航、罗若天、梅洪源 本周主要论文包括 OpenAI 开源新模型代码,一步成图,1 秒 18 张;爆火论文打造《西部世界》雏形:25 个 AI 智能体,在虚拟小镇自由成长。 目录 CAMEL: Communicative Agents for “Mind” Exploration of Large Scale Language Model Society Consistency Models Generative Agents: Interactive S
Attention机制通俗的说,对于某个时刻的输出y,它在输入x上各个部分上的注意力,这里的注意力也就是权重,即输入x的各个部分对某时刻输入y贡献的权重,在此基础上我们先来简单理解一下Transformer模型中提到的self-attention和context-attention
https://github.com/HamaWhiteGG/langchain-java
本文总结了过去一周的开源计算机视觉相关代码,有好几篇来自顶会NeurIPS 2019、ICCV 2019 等。
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com。
如果把LLM比做关在笼子里的AI,那么它和世界交互的方式就是通过“递文字纸条”。文字是人类对世界的表示,存在着信息提炼、损失、冗余、甚至错误(曾经的地心说)。而多模态就像是让AI绕开了人类的中间表示,直接接触世界,从最原始的视觉、声音、空间等开始理解这个世界,改变世界。
在IS零售中,引入了新型MRP/RP策略W–补货(IS零售)。一开始值得一提的是,它只能用于门店和客户,而不能用于配送中心。该解决方案与MRP非常相似,具有重新订购点或时间阶段计划,但我将在本文末尾留给您决定。
Predicting the Future with Multi-scale Successor Representations
近日,Github 上开源的一个专注模块化和快速原型设计的深度强化学习框架 Huskarl 有了新的进展。该框架除了轻松地跨多个 CPU 内核并行计算环境动态外,还已经成功实现与 OpenAI Gym 环境的无缝结合。TensorFlow 发布了相应的文章来报道此研究成果。
目前机器人相关研究主要是设计机械臂来抓住特定形状的物体,但是很少有抓住可变形状物体(deformable objects)的相关研究。
0x01 Intro首先需要了解的是,随着攻击手段及攻击机制的改进,现在的攻击者往往会考虑利用分布式攻击的方式来进攻。最为直观的便是高级网络攻击会包含多个攻击阶段来实现最终目标。而传统的入侵检测系统,例如IDS、防火墙等等用于监视网络情况的工具会在被攻击期间产生大量告警。虽然这些告警中包含了关联攻击者的攻击线索,但大部分的告警是与攻击无关的误报。对于网络管理
领取专属 10元无门槛券
手把手带您无忧上云