首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

陶哲轩看了都直呼内行!谷歌等用LLM自动证明定理拿顶会杰出论文,上下文越全证得越好

比如Coq和Isabelle等证明助手,通过训练一个模型来一次预测一个证明步骤,并使用模型搜索可能的证明空间。...如上图所示,仅使用定理语句作为证明生成模型的输入,然后从模型中抽取证明尝试,并使用Isabelle执行证明检查。...如果Isabelle接受了证明尝试而没有错误,就说明证明成功;否则从证明生成模型中抽取另一个证明尝试。...Baldur在6336个Isabelle/HOL定理及其证明的基准上进行评估,从经验上证明了完整证明生成、修复和添加上下文的有效性。...Baldur可以与定理证明助手Isabelle合作,Isabelle对证明结果进行检查。当给定一个定理陈述时,Baldur几乎在41%的时间内能够生成一个完整的证明。

10810
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    没有Bug的OS内核? 鸿蒙黑科技之操作系统形式验证与安全认证

    等最高安全级别认证的要求 符合ARINC653等操作系统的工业标准 支持多核/可抢占/可中断等形态的并发内核 覆盖安全模型、需求、设计到源码的形式验证 可集成所有模型和证据的统一开发与验证环境 我们已经在Isabelle...我们在Isabelle/HOL中完整实现了物联网OS的安全模型和形式开发框架,包括16000行形式规约与证明,并对ARINC 653标准和一些操作系统源码进行验证分析,发现其中10个Security缺陷...为了实现并发OS内存C代码的形式验证,我们在Isabelle/HOL中开发了并发C代码形式语言及验证方法,并对Zephyr内存管理模块的C代码都做了形式化建模,最后进行组合验证。...本成果构造了ISA2形式模型(ISA in ISABELLE),包括ISA形式模型基本框架、SPARC v8和RISC-V等ISA形式模型,覆盖物联网OS内核所需的所有指令。...在Isabelle中开发了15000行的模型和证明。 ISA2是可执行的模型,C代码编译得到的二进制程序在该模型上可以执行。

    3.9K30
    领券