大型语言模型 (LLM) 的一项令人印象深刻的新兴功能是代码生成,包括用于数据库的结构 化查询语言 (SQL)。对于将自然语言文本转换为 SQL 查询、Text-to-SQL 的任务,LLM 的适配在上下文学习和微调设置中都至关重要,具体取决于所使用的适配数据量。在本文中,我们提出了一个基于 LLM 的文本到 SQL 模型 SQL-PaLM,利用 PaLM-2,在两种设置中推动了最先进的技术。Few-shot SQL-PaLM 基于为 Text-to-SQL 设计的基于执行的自洽提示方法,并在 Spider 上的测试套件准确度达到 77.3 %,据我们所知,这是第一个超越之前状态的 -大幅微调的艺术,4% 。此外,我们通过另一个 1% 证明了经过微调的 SQL-PALM 进一步优于它。为了将 SQL-PaLM 应用于现实场景,我们进一步评估了它在其他具有挑战性的 Spider 变体上的稳健性,并展示了 SQL-PaLM 的卓越泛化能力。此外,通过广泛的案例研究,我们展示了基于 LLM 的 Text-to-SQL 令人印象深刻的智能功能和各种成功推动因素。
全文阅读请见https://pan.baidu.com/s/1Me5olmRKScgIsrL74PObQQ 。
领取专属 10元无门槛券
私享最新 技术干货