首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

AAAI 2022 oral | 复旦x字节等提出:基于无监督编辑的反事实故事改写

作者丨陈江捷 1 前言 如何根据一个新的条件来改写一个故事的结局?这个问题的自动解决需要机器具备反事实推理能力,即根据原故事和新条件来想象新的故事结局的能力。...故事改写任务的核心问题在于:我们能否只对原始结局进行最少的编辑就能产生一个新的合理的故事结局?更重要的是,我们如何在无监督的情况下想象未来的可能性?...为了解决这个任务,系统需要反事实推理的能力,这是一个假设的思维过程,改写某些先决条件从而得到其他可能的答案,通常会以“假如……那么”的形式存在。...构建通用人工智能系统,其中巨大的挑战之一就是让机器具备反事实推理的能力。如果我做的不同呢?会有什么不同?我应该后悔我的决定吗?这些问题使系统能够做出更好、更稳健的决策。...通过施加 ,将X的值设置为改变后的条件,而不改变其余部分。因此,改变后的条件可以视为一种反事实上下文。 此任务中,具有挑战的是如何量化评估改写后的结尾是否连贯。

66220

与数据对话:大型语言模型正在改变AIOps

我最近一直在思考和撰写关于 LLM 的文章,不仅因为它是一个热门话题,而且因为我们能看到前方的那“一小段距离”对于可观察性中的 AI 来说变得越来越清晰。...在我的上一篇博文中, 我提到了我们在 Senser 正在构建的两个 LLM 用例。这篇文章重点介绍了其中之一:与数据聊天。...不幸的是,解决方案并不像将 LLM 连接到您的 NoSQL 数据库并以自由文本与之交互那样简单。它比这更复杂,但我们将带您了解一个简单、快速且经济高效的解决方案。...关键考虑因素 当我们着手在 Senser 构建一个有效的自定义查询引擎时,我们首先确定了几个关键考虑因素: 设计简单性:更复杂的设计会导致性能和可靠性问题。我们的目标是保持工程设计简单且健壮。...但是,LLM 在对 UNIX 时间进行准确的数学计算方面受到限制。为了克服这个问题,我们要求 LLM 提供与当前时间相差的 [天、小时、分钟]。然后,我们将这些组件转换为 UNIX 标准格式。

13210
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    我的领导离职了,公司损失了一个“知识库”

    然而,从公司资源的视角来看,员工可以比作某种技术数据的存储库,但除了技术数据外还有着价值很高的上下文。 我想从工程师的角度从更大的层面上来研究这个问题。...我想即使在 SpaceX 中,这些内容是否会被认为是最激动人心的阅读材料也要打一个大大的问号,或者也许我只是不了解他们。无论如何,即使有人设法阅读文档,他们也只会保留他们理解的那些内容。...我们从文档中看到了其他人的工作,以及他们强加的思维和决策方式。经常出现的情况是,当下出现的问题没有人知道答案,而知道答案的人也不再在公司工作了。...要真正了解这个过程是如何变化的,最好的入门方法是在有经验的人的指导下完成一些小的任务。 正在寻找类似 UML 的替代方案? 不幸的是,事件风暴并不能解决所有与知识流失相关的问题。...小结 在本文中,我讨论了从工程师的角度来看,公司中的知识流失是如何出现的,以及为什么它会构成威胁。生物数据存储这个术语可能听起来很不传统,但它强调了每个团队成员在保存和转移知识方面所发挥的关键作用。

    8810

    RAG 技术真的“烂大街”了吗?

    例如,阿里、Kimi、谷歌等公司的模型,上下文长度甚至可达百万,未来可能达到千万。今年二三月份,这种争论达到了高潮。当时,谷歌发布的一篇评测显示,长上下文在解决某些问题时比 RAG 表现得更好。...这表明 RAG 在工业界、产业界和学术界已经得到了共识。现在的讨论焦点是如何从技术角度解决 RAG 的痛点,而不是 RAG 是否还有存在的必要。...为了让人们更深入地了解和认识 RAG ,我认为需要有经验丰富的产品经理来设计一些易于使用的产品功能,这可能会激发大家对 RAG 更大的兴趣。...为了解决前面提到的各种痛点,比如数据抽取、命中率不高、找不到答案等问题,我们都需要通过 Agent 或称为 Agentic 的 RAG 来编排,以解决这些问题。...这样的工具可以帮助你更细致地了解和优化 RAG 的工作流程。 欧明栋: 使用 RAG 构建推荐系统确实是一个相当大的挑战。

    25110

    【科研】论文的可复现性,能否量化分析?

    从告诉我们如何通过电子邮件表现得礼貌的实用小提示,到 Elon Musk 承诺明年面世的自动驾驶汽车,这一切都似乎在向我们证明:机器学习确实是可复现的。 最新的机器学习研究的可复现性如何?...想更深入的探讨这一问题的读者可以阅读论文原文,并且论文中还有一些我认为非常有趣的附带的实验结果:要么是因为它们挑战了我们所「了解」的关于一篇好论文的设想,要么是它们产生了一些惊人的结论。...作为一个研究社区,我们需要了解我们这样做的目的是什么,我们实际上在完成什么工作。如果我们被强制要求提交代码以及向审稿人提供评价这些代码的指南,我们应该仔细思考和考虑上述二者的区别。...这项发现挑战了我之前对于构成一篇好论文的组成部分的设想,但当我对这个结论进行思考时,我发现这越来越有意义。 在论文中的某个地方,我们必须描述工作的过程。...通过这种方式,作者可以在原始论文中将各种普遍存在的反馈和问题考虑进去。将论文刊登在 arXiv 上的机制已经让这种做法成为了可能,而在会议上发表的论文也应该如此。

    71820

    日本东北大学小菅一弘教授:在教会机器人跳舞后,我们又有了更远大的目标

    今日上午,我在酒店楼顶欣赏了一下深圳的城市风光,我发现这座城市的风景非常好,尽管这样,我们依然不能忽略社会上存在的一些问题和挑战,这些都值得我们在未来去做更多努力。...为了促进机器人与人类的合作,我们需要做的包括: 使其了解任务指的是什么 使其了解人类的意图是什么 使其了解人类需要获得的具体是哪些帮助 也许还有其他的内容,但我相信这三点是最重要的,相比起 10...2005 年,《时代》杂志把我们的研究评为当时最震撼人心的一个发明。近期有个韩国人告诉我,这个舞伴机器人在韩国的名声也很响亮。 舞伴机器人还存在哪些挑战呢?...工厂的管理人员告诉我,有时工人试图按照不同的流程来进行操作,为此,我们又另外开发了一个控制系统,来应对工人不按照标准流程进行操作的问题。我们的系统会进入自主学习模式,进而习得人类新的行为模式。...我们在全球范围内遇到了各种各样的挑战和问题,当下的机器人可以做更多突破与创新,尤其是在应用方面。

    54130

    论文的可复现性,能否量化分析?

    从告诉我们如何通过电子邮件表现得礼貌的实用小提示,到 Elon Musk 承诺明年面世的自动驾驶汽车,这一切都似乎在向我们证明:机器学习确实是可复现的。 最新的机器学习研究的可复现性如何?...想更深入的探讨这一问题的读者可以阅读论文原文,并且论文中还有一些我认为非常有趣的附带的实验结果:要么是因为它们挑战了我们所「了解」的关于一篇好论文的设想,要么是它们产生了一些惊人的结论。...作为一个研究社区,我们需要了解我们这样做的目的是什么,我们实际上在完成什么工作。如果我们被强制要求提交代码以及向审稿人提供评价这些代码的指南,我们应该仔细思考和考虑上述二者的区别。...这项发现挑战了我之前对于构成一篇好论文的组成部分的设想,但当我对这个结论进行思考时,我发现这越来越有意义。 在论文中的某个地方,我们必须描述工作的过程。...通过这种方式,作者可以在原始论文中将各种普遍存在的反馈和问题考虑进去。将论文刊登在 arXiv 上的机制已经让这种做法成为了可能,而在会议上发表的论文也应该如此。

    1.1K11

    一个简单现实案例挑战 PowerBI 水平测试 - 深度解析

    欢迎大家下载这个问题,直接作答,并加入讨论群,如果做出来了,也可以提交答案。凡是参加该挑战的伙伴,最后都可以得到关于此题的深入解读,比你想象得更深更有价值。...解析与实现 问题分析,对于这个问题,从业务角度观察是一个非常简单的需求: ? 仅仅就是按照 KPI 增加一个 Rank 即可,这个增加如果在 Excel 中进行的话,其实就是拖一下即可。...这里用相对技术一些的术语来描述这三点背后需要内化的认知: 掌握迭代,行上下文,筛选上下文,上下文转换,在筛选上下文中的行上下文。...我们说这种算法叫模型层计算法,是因为在计算时回到了模型去进行计算。与之对应给出一个视图层计算法。...而对某些高手,已经可以意识到,我在这里给出了在目前的状态下,PowerBI DAX 如何实现视图层计算的通用套路。这个套路如此通用,以致于它可以一揽子解决几乎所有视图层计算的问题。

    2.7K31

    10分钟,聊聊如何准备面试!

    在工作中我主R一些比较大的跨部门合作项目,上下游联动最多的有n个部门, 我主导的系统最大能抗住xxxTPS 和 xxxQPS,一般在大型的项目结束后我都会花时间去总结复盘,整体分析项目中做好的点,不足点以及改进方案...在使用ThreadLocal应该注意什么? 前面部分你得知道项目中是用到哪个场景,怎么使用的,这又回到第一步了,你得对你所做的项目非常熟悉,至于该注意什么,这不就是八股文吗?...还还还有一部分人是真的线上问题也没解决过,但是也不会影响我们回答这个问题。你完全可以把你在测试环境中遇到的一些问题说成线上问题咯,甚至是自测遇到的问题。 项目中你哪部分最有挑战?...领导也争取过,但由于工作年限等原因,没能通过。我不想安于现状,想找一个更能发挥自己才能的平台。 ❝您好!...在上家公司,我的工作效率较高,能按时保质保量地完成工作,但前司会定期统计加班时长,并以此进行考核,导致大部分人为了加班而加班,效率非常低,我个人并不反对加班,但这种低效的常态化996,我并不认可,我希望能在更人性化管理的公司里发挥优势

    21310

    分析过688篇大模型论文,这篇论文综述了LLM的当前挑战和应用

    这个领域的发展令人目不暇接,但也正因如此,人们难以了解还有什么难题有待解决以及哪些领域已有成熟应用。...许多研究工作都没有做控制变量实验,如果模型的设计空间很大,那么这个问题就显得尤为严重。研究者认为这会阻碍对 LLM 的科学理解和技术进步。 表 2:所选 LLM 概况。N/A 表示细节缺失。...这张示意图展示了一个 API 定义框架:为了解决特定任务,可以在 prompt 中提供一个通用的 API 定义,从而让 LLM 可以使用外部代码或工具。...幻觉和偏见:医疗领域的安全性是至关重要的,这意味着出现幻觉的可能性会极大地限制当前的用例。此外,为了降低 LLM 延续现有临床数据集中的偏见的风险,还需要进一步的研究工作。...生成合成数据 LLM 具备在上下文中学习的能力,因此可以通过 prompt 让其生成合成数据集,用于训练更小型的特定领域的模型。

    1.2K50

    从SUM让人看看PowerBI DAX的坑爹之深

    4、这个疑问最严重,直接导致我可以把书撕了,不是刚才刚说好DAX有两个上下文,一个行上下文,一个筛选上下文,所有的运算都是发生在这两种上下文中,无一例外。...在很多学员中,都记住了这个特殊规则,但这里想告诉你的是:DAX有两个上下文,一个行上下文,一个筛选上下文,所有的运算都是发生在这两种上下文中,无一例外。既然无一例外,那么SUM会不会忽略行上下文呢?...回到这个问题来看,这里确实不会忽略行上下文,而是将SUM转换成了SUMX,并进入SUMX进行计算,而SUMX将创建新的迭代过程,在表中逐行迭代,进而得到了整列的聚合结果。...更复杂的迷思 来看一个更复杂的迷思来挑战你对DAX的认知吧:如何计算积累销售额,其算法是这样的: ? 其效果如下: ? 从效果上看,很容易理解,这个是积累求和的典型案例。...第10行,在创建的行上下文中来比较 DimDates[Date] 与 MAX ( DimDates[Date] ),问题来了,既然是在行上下文中,DimDates[Date] 只有一个值,那么 MAX

    3.1K20

    NeurIPS 2022 | 视觉长尾学习模型为何无法较好地落地?

    在这篇 NeurIPS 2022 论文中,来自新加坡国立、字节跳动和华为的学者表明:这个问题的本质在于实际应用中的测试集并不是单一的均匀分布的。...在去年这个时候,机器之心也报道了首篇《深度长尾学习》综述,呼吁大家正视长尾挑战!...这就导致那些在论文中看似表现良好的长尾学习模型无法较好地应用到实际场景中。 那么,这个问题可以被解决吗?让我们看看这篇 NeurIPS 2022 的新方法究竟能够为长尾学习的落地带来哪些改变吧。...为了解决这些挑战,SADE 提出了两个解决策略:(a) 特长差异化的多专家模型学习策略,(b) 多专家模型测试场景自适应组合策略,如下图所示。...为了解决这一问题,该研究观察到:给定一个测试分布,更强的专家模型往往能在预测其熟练类别样本时表现得更加稳定,即更强的专家对于其熟练类别样本的不同变体预测具有更高的预测相似性,如下表所示。

    74920

    如何探索大型开源软件库

    然后,利用这个开源项目把这个想法变成现实。在整个过程中,要确保自己了解项目的依赖项、特性和重要组件 / 类。设法集成尽可能多的特性。记住,你的第一个目标是探索这个项目的广度。...—— arandr 从这个部分过渡到计划无疑是具有挑战性的。为了简化这种转换,从源代码构建、阅读测试用例以及理解规范都非常有帮助。 测试被认为是最好的文档形式之一。...一个好的问题应该满足以下条件: 你对这个问题感兴趣 你已经具备解决这个问题所需的技能,或者在编程的过程中通过适当的学习就可以习得。 务必在分配给你的项目中找问题。...不过,这只是因为你遇到了一个糟糕的软件,通常,你只需要关注成熟代码库中一个明确定义的方面。 重现问题 如果你的工作是消除漏洞,那么在计划修复之前,你第一步首先要做的无疑是重现问题。...Peterson 的回答很好地描述了这一观点: 我发现,对于纯粹的软件问题,思考问题并测试系统,了解关于这个问题的更多信息比逐行执行代码要有用得多。

    39710

    一款性能调优利器 — 火焰图

    | 前言 工具的进化一直是人类生产力进步的标志,合理使用工具能大大提高我们的工作效率,遇到问题时,合理使用工具更能加快问题排查的进度。...产生这个问题的主要原因是,我们的线程栈是有调用关系的,即我们需要考虑线程栈的 调用链 和 出现频率 两个维度,而单一的文本表现这两种维度比较困难,所以,著名性能分析大师 brendan gregg 就提出了火焰图...方块上的字符表示一个调用名称,括号内是火焰图指向的调用在火焰图中出现的次数和这个方块占最底层方块的宽度百分比。 方块的颜色没有实际意义,相邻方块的颜色差只为了便于查看。...由上文中的火焰图特性特性,查看火焰图时,我们最主要的关注点要放在方块的宽度上,因为宽度代表了调用栈在全局出现的次数,次数代表着出现频率,而频率也就可以说明耗时。...做开发越久,越能感受得到工具的重要性,所以我准备加一个专题来专门介绍我使用的各种工具。当然,这也就更需要我更多地了解、使用和总结新的工具了。

    56930

    我真傻,招了一堆只会“谷歌”的程序员!

    ---- 最初,他们的表现确实不负期望 我的做法是,跟应聘者说明编程任务后,给他/她一台电脑,要求其在半个小时到一个小时内完成——在此期间,我会离开处理一些其他工作。...因此毫无疑问,我雇用了这些人,他们最初也确实不负期望。 对新员工来说,一般入职的头几个月是一个挑战,因为他们忙于学习任务编码,无法独自承担工作。...---- 3-6 个月后,他们集体达到了一个“平台期” 准确来说,应该是 3-6 个月后,他们的生产力集体达到了一个“平台期”,再也无法增长。更不幸的是,疫情也在那时爆发了,所有人都开始远程办公。...为了解决这个问题,我亲自下场,尝试对他们提供帮助:这个任务不会处理?你看好,我来给你演示一遍,下次你要记住…… 但很快,我就意识到这个方法效率太低,所以我决定回到处理问题的根源:技术面试。...离谱的是,这个计划在基础阶段就结束了——他们之中,只有十分之一的人了解如何使用基本实体、类型;更糟糕的是,甚至只有 2-3 人在使用内置帮助和上下文代码补全的情况下才勉强完成得不错。

    45720

    天啊,你要的智商已下线——用我们的IQ测试题研究测量神经网络的抽象推理能力

    一开始看到文章的前半部分的 IQ 测试题数据集,我在凌晨十二点花了一些时间把几个测试题做完了,但是并不是以预期中的飞速完成,然后回想体会了一下我“是如何理解题目,进而做出这些题目得到结果的”。...我就很好奇这将会是如何开展的一个研究;随着岁月的流逝,我们会不断地遗忘知识,渐渐地还给老师了,但是我们学习新知识的能力,推理思维力也不如以前, 那这个研究的成果又会是如何呢?...在本文中,受到一个著名 IQ 测试的灵感启发,我们提出一个抽象推理挑战及其相应的数据集。...为了解决这个问题,我们设计了一种用于抽象推理的新颖结构,当训练数据和测试数据不同时,我们发现该模型能够精通某些特定形式的泛化,但在其他方面能力较弱。...因此,这也为这个关键而又重要的研究领域未来的工作提供了一个明确的焦点。

    76750

    面试题精选:单链表排序也能玩出花来

    有些人觉得面试面这种题意义不大,谁实际工作中会写过单链表的排序,不都是直接调Collections.sort()吗?...我的回答是所有排序算法都可以用,但有些排序会相对简单些,本文我给出三种(选择、快排、归并)方法,剩余的几种排序算法有兴趣你可以自己实现下,当然有些可能会比较繁琐,是时候挑战下自己了[狗头]。...他们也懒得想题,再加上人的思维是具有连续性的,这就意味着大概率下一道面试题(如有)会和这道题相关,我总结这道题可以扩展的3个关键词单链表、排序、归并,基本上下一题都是这三个词的发散,这里我说下我可以发散出的题目...单链相关的题,已经烂大街了,具体参考leetcode top100 链表题 排序相关:第k大的数,上文中快排可能出现的问题以及如何解决?...另外,也征集面试题,如果你遇到了不会的题 私信告诉我,有价值的题我会给你出一篇博客。

    28210

    程序员被打断:中断和上下文切换的真正代价

    本文介绍了“上下文切换”的概念以及它所带来的心理成本。当程序员在复杂的编程任务中进行“上下文切换”时,重新回到之前的工作状态比“简单”的中断更具挑战性。...上下文切换在编程工作中是一个非常常见的问题,这可能会导致更长的工作时间、更低的工作效率以及更高的错误率。这是因为每次切换上下文时,程序员必须重新适应当前任务的上下文和状态。...失去这个功能会让我的工作流程受到难以想象的干扰。这些打开的文档对我来说代表着一个“书签”,如果没有它们,我几乎无法继续工作。...程序员非常清楚这个问题: 这是一个比听起来更严重的问题,因为你需要使用其他方法来记住你正在处理的事情。这会导致很多时间的浪费 - 来源。...代码部署后可能存在的BUG没法实时知道,事后为了解决这些BUG,花了大量的时间进行log 调试,这边顺便给大家推荐一个好用的BUG监控工具 Fundebug。

    55541

    从熟练工的状态下提升到架构师的基本功和技巧

    在目前互联网公司,上班前就得规划一天的工作,有时候想想今天要干的活技术上我不大熟,或者得催别的组要接口,所以经常有忐忑不安的感觉,一路上有时还得小跑,虽然也是弹性工作制,但总是9点前到,早到就能早开始做事情...这个步骤的难点是,在自己的机器上未必能模拟出分布式环境,所以如果可以,就找公司测试环境实践,或者自己机器上装个虚拟机。...比如在使用netty时,则需要了解如何解决半包粘包问题,在使用堆外内存时如何保证能正确回收内存。...如何才能不拘泥于细节?我目前的体会是,第一看流程,从流程里看这个组件的关键模块和重要方法,第二还是结合阿里架构师面试题里的问题,比如提到dubbo底层通讯协议,那么就把对应的模块和对应的方法看一下。...六、实践才能提升,那如何没实践机会怎么提升? 今年我在加入到一个互联网公司后,由于有机会接触到各种架构,所以感觉有所提升。

    45500

    20190707

    本文将展示,如何利用事件风暴在复杂域中,发现备选的限界上下文。 1. 为何限界上下文如此重要 在领域驱动设计的众多概念中,限界上下文很难快速掌握,至少对我而言就是如此。...一个可能的答案是:“我们没有划分正确的限界上下文。” 2. 找到限界上下文 理想情况下,限界上下文应包含针对特定目的而定制的模型——该模型应该为这个特定目的量身定制,不会为了其他目的而做出权衡。...如果对一种工作了解得十分深入,恐怕就没有时间做到对其它工作有着同样深度的理解。...我过去常常画上下文图,作为 强迫自己在项目早期提出正确问题 的一种方法 ,然后进行事件风暴工作坊,让利益相关者参与并提供正确的答案,而不需要提相应的问题。...不是每个泳道都是限界上下文,有时候它们只是某个地方的 if 语句,但是当为了突出一个独立的过程而出现泳道时,可能是 在不同的时间线上 ,那么你可能想要一个独立的模型。

    62540
    领券