前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >学会提问:AI大模型时代与ChatGPT对话的关键技能

学会提问:AI大模型时代与ChatGPT对话的关键技能

作者头像
yeedomliu
发布2023-09-25 16:32:56
1K0
发布2023-09-25 16:32:56
举报
文章被收录于专栏:yeedomliu

思维导图

序言

技术的进步正在加剧人与人之间的差距。由于人与人之间的好奇心差异,未来优生差生的差距可能会进一步拉大。优秀的学生利用AI技术学习更广阔的知识,投机取巧的学生则用AI来偷懒写作业。 在AI时代,家长和教育者应该关注孩子们的兴趣和天赋,帮助他们找到独特的价值所在,并引导他们运用AI技术提升自己。

认识AI对话

认识“Prompt工程师”这个职业

据悉,人工智能安全与研究公司Anthropic最近公开招聘“Prompt工程师和图书馆员”这一职位,其薪资范围在175000美元和335000美元之间。这个职位的高薪反映了Prompt工程师在AI领域的重要地位,同时也表明了他们在人工智能应用中所扮演的关键角色。

图1-1所示为Boss直聘网站里与ChatGPT相关的岗位情况。

编写Prompt:高杠杆技能

OpenAI的创始人Sam Altman(萨姆·奥尔特曼)曾表示:“编写一个真正出色的聊天机器人提示是一项极具影响力的技能,是用自然语言编程的早期示例。” 在当今时代,与AI互动已经成为一项技能,可以被视为一种高杠杆技能。

图1-2所示为OpenAI创始人Sam Altman在其推文所发表的观点。

关于Prompt工程师职业前景的争议

不能有效地与AI进行交流的人将面临被淘汰的风险。 能够运用自然语言有效地与AI沟通的能力可能会成为新的关键技能。

AI对话与人类对话的差异

内容/方向

描述与价值

能力预测

用小模型预测大模型的能力,以缩短开发周期和减少试错成本。

LLM评测框架

GPT-4开源的评测框架,对于中文特别重要。

中文LLM评测数据

可快速发现LLM的短板和改进方向,对促进技术发展有重大意义。

AI对话的擅长和不足

通过评测框架,我们可以更清晰地识别AI对话时的优势领域和潜在的不足,从而更有效地与AI进行交互。

提高回答质量的关键因素

提高回答质量的关键因素

描述与建议

将问题拆解为子问题

通过将复杂的问题拆分成更小、更具体的子问题,可以帮助AI更准确地回答。

设置合适的回答范围

明确限定回答的长度和范围可以获得简洁且有深度的答案,例如指定回答长度或特定的格式。

选择合适的提示方式

不同的问题可能需要不同的提示方式。如事实查询类问题使用关键词,而开放性讨论问题则设定边界,以确保AI不偏离主题。

保持批判性思维和判断能力

虽然AI有很高的回答能力,但它并非总是完美的。与AI交流时,用户应保持自己的批判性思维和判断能力,以确保得到的答案是准确和合适的。

提问技巧与AI融合

聪明提问:激发ChatGPT潜能的艺术

类型

优势/适用场景

描述

开放式问题

激发思考

鼓励深入思考,提供有价值的见解。

获得详细信息

挖掘更多的细节,全面了解问题。

建立良好沟通

有助于建立互动,使交流更轻松、自然。

封闭式问题

确认事实

确认某个信息是否正确。

快速决策

在紧迫的情况下,快速了解关键信息。

限制回答范围

在特定选项中做出选择,以便限制答案的范围和长度。

避免循环提问、加载性问题与引导性问题

主题

方法/描述

说明

避免循环提问

重新表述问题

当AI重复答案时,尝试用不同方式表述问题,有助于AI从新的角度理解问题。

引入具体场景和限制条件

为问题添加具体的背景和条件,有助于引导AI提供更具针对性的回答。

加载性问题与引导性问题

加载性问题

包含假设或倾向性的问题,可能有意或无意地设置陷阱,导致对话偏离客观事实。

引导性问题

通过问题的表述来引导回答者朝预期方向进行回答,可能限制了思考空间。

避免使用上述问题的原因

误导回答

加载性和引导性问题可能导致ChatGPT给出错误、不准确或片面的答案,降低对话价值。

影响公正性

这些问题可能导致对话中的立场、观点和事实失去公正性,使得探讨问题时不客观和全面。

限制思考

引导性问题可能限制ChatGPT的回答范围,使回答可能不包含更广泛的观点和信息。

利用元认知技巧提高提问效果

主题

技巧/方法

描述

元认知

定义

关于自己思考、学习和解决问题的过程的认识。在AI对话中,元认知可以帮助我们更好地提问。

提高提问效果的方法

反思

在提问前,花时间思考自己的知识和理解水平,以及问题的关键点。

计划

明确提问的目标,制定合适的提问策略。

监控

在对话过程中,关注自己的思考方式,并注意判断回答是否满足需求。

调整

根据回答的质量,调整提问策略,以获得更好的结果。

沃伦·贝格尔提问技巧

提问技巧

示例

描述

提出明确的问题

如何种植西红柿?

通过提出具体的问题,可以引导AI提供更准确的答案,避免了模糊和笼统的提问。

追求深度

地壳运动的原因是什么?

通过深入探讨问题的背景、原因和影响,可以获得更全面的信息,从而做出更明智的决策。

提问的顺序

公司的发展前景是什么?

通过合理安排问题的顺序,可以更有效地引导AI进行思考,从而获得更满意的答案。

提问的角度

环保对经济发展有什么影响?

通过从不同的角度提问,可以拓宽自己的视野,发现问题的多个层面,从而找到更全面的解决方案。

质疑假设

人类活动是气候变化的主要原因吗?

通过挑战一些看似理所当然的假设,可以引导AI进行更深入的思考,发现问题的新颖见解。

探求证据

疫苗接种的好处有哪些?

通过要求提供证据和依据,可以确保所获取的信息是准确和可靠的。

分析问题的关联性

食品安全问题如何影响公共卫生?

通过分析问题之间的关联性,可以更好地理解问题的全貌,从而找到更有效的解决方案。

积极寻求反馈

AI的这个答案能否更具体一些?

在与AI对话中,提供反馈并根据需求提出更具体的问题,可以使AI更好地满足用户的需求,并提高对话质量。

《如何提出一个好问题》

  1. 提出明确的问题 当小王刚刚入手了一个智能语音助手,他尝试用模糊的方式提问:“那个……怎么样?”很明显,语音助手无法理解小王的问题,给出了一个含糊不清的回答。这使小王深感困惑。但当小王改变提问方式,变得更加具体:“如何种植西红柿?”智能助手立刻给出了详细的种植步骤和注意事项。通过提出明确的问题,小王引导AI提供更准确的答案,避免了模糊和笼统的提问。
  2. 追求深度 小李在准备地理考试时,遇到了一道关于地壳运动的题目。他向AI提问:“地壳运动是什么?”AI给出了一个简单的解释。然而,小李并没有满足于此,他继续追问:“地壳运动的原因是什么?它会产生哪些影响?”通过深入探讨问题的背景、原因和影响,小李获得了更全面的信息,从而做出更明智的决策。
  3. 提问的顺序 当小陈在寻找新工作时,他试图向AI咨询关于某公司的信息。他首先询问公司的背景信息,了解公司的发展历程、业务领域和市场地位等。接着,他询问公司的具体待遇和福利政策。最后,他探讨了公司的发展前景和自己在公司的职业规划。通过合理安排问题的顺序,小陈更有效地引导AI进行思考,找到了满意的答案。
  4. 提问的角度 小明在研究环保问题时,尝试从不同角度向AI提问。他先从经济角度提问:“环保对经济发展有什么影响?”接着从社会角度提问:“环保在社会发展中扮演什么角色?”最后从科技角度提问:“环保科技的发展现状如何?”通过多角度提问,小明拓宽了自己的视野,发现了问题的多个层面,从而找到了更全面的解决方案。
  5. 质疑假设 当小华在了解气候变化时,他不满足于肤浅的观点,而是挑战一些看似理所当然的假设。他向AI提问:“为什么我们总是认为人类活动是气候变化的主要原因?还有其他可能性吗?”这样的提问引导AI进行更深入的思考,帮助小华发现问题的新颖见解。
  6. 探求证据 在与AI讨论疫苗接种的利弊时,小赵要求AI提供证据和依据,以支持其给出的答案。他问:“疫苗接种的好处有哪些?有哪些科学研究支持这一观点?”通过探求证据,小赵确保了获取的信息准确可靠。
  7. 分析问题的关联性 小丽在与AI对话时,试图了解食品安全问题与公共卫生问题之间的关联和相互影响。她问:“食品安全问题如何影响公共卫生?这两个问题之间有什么关联?”通过分析问题的关联性,小丽更好地理解了问题的全貌,从而得到了更有效的解决方案。
  8. 积极寻求反馈 在与AI对话过程中,小刚不断反馈自己的需求和疑虑。当AI给出的答案无法满足他的需求时,他会提出更具体的问题,或者要求AI从不同角度解释。这样的互动使得AI能够更好地满足小刚的需求,提高了对话质量。

与AI对话中的《学会提问》知识点

提问技巧

示例

描述

区分事实和观点

某化学物质对人体健康有什么影响?

小李明确分辨AI给出的答案中的事实和观点,并要求更详细的证据来支持这个观点。

评估信息来源

请给我一些更可靠的信息来源。

小李在查阅资料时关注作者的权威性,并要求AI提供更加可靠的资料来源。

检查逻辑与推理

你能解释一下这篇论文中的推理过程吗?

小李发现某些资料存在逻辑问题,因此他询问AI对相关资料的逻辑结构进行分析。

发现潜在的偏见和立场

你能给我提供一些不同观点的资料吗?

小李发现某些资料的作者对某种观点存在偏见,因此要求AI提供多种观点的资料以便于全面了解问题。

持有怀疑态度

这种化学物质是否对所有人都有害?

在整理资料时,小李持有怀疑态度,对某些看似合理的答案进行进一步的思考,并向AI提出挑战性问题。

总结与反思

——

小李总结了与AI的对话,认为运用提问技巧可以获得满意的答案并提高批判性思维能力。

《学会提问》

小李是一名研究生,最近在准备一篇关于环境污染对人类健康影响的论文。在撰写论文的过程中,他想要了解一下某种化学物质的具体影响。为此,他决定与AI助手ChatGPT进行一次对话。以下是小李在这次对话中如何运用提问技巧的详细描述。

  1. 区分事实和观点 小李向AI提问:“某化学物质对人体健康有什么影响?”AI回答说:“这种化学物质可能对人体健康有害,尤其是对呼吸系统造成损害。” 在这里,小李注意到AI给出的答案包含了事实和观点。为了获得更详细的信息,他询问:“你能提供一些证据来支持这个观点吗?”AI随后提供了一些研究报告和文章,详细说明了这种化学物质对人体健康的影响。
  2. 评估信息来源 在查阅AI提供的资料时,小李注意到其中有一篇文章的作者在业界并不具有权威性。因此,他要求AI:“请给我一些更可靠的信息来源。”AI随后提供了一些顶级学术期刊的论文,以及一些知名专家的观点。这使得小李能够更加信任所提供的信息。
  3. 检查逻辑与推理 在阅读AI提供的资料后,小李发现某些论文中的论述存在逻辑问题。为了弄清楚这个问题,他问道:“你能解释一下这篇论文中的推理过程吗?”AI详细地分析了这篇论文的逻辑结构,并指出了其中可能的问题。这使得小李对这个问题有了更深入的理解。
  4. 发现潜在的偏见和立场 在阅读资料的过程中,小李注意到某些论文的作者似乎对某种观点有所偏向。为了得到更多观点,他要求AI:“你能给我提供一些不同观点的资料吗?”AI接受了小李的要求,提供了一些来自不同研究团队和观点的资料。这些资料包括了关于这种化学物质影响人体健康的不同看法,使得小李能够全面了解这个问题的多个方面。
  5. 持有怀疑态度 在收集到足够的资料后,小李开始撰写论文。然而,在整理AI提供的信息时,他保持着怀疑的态度。他发现某些答案看似合理,但在深入思考后可能存在问题。因此,他提出了一些挑战性问题,如:“这种化学物质是否对所有人都有害?有无特定的剂量阈值?”这些问题使得AI重新思考并给出了更详细的回答。
  6. 总结与反思 在撰写完论文后,小李对与AI的对话进行了总结与反思。他认为,通过这次对话,他得到了满意的答案,并且AI的回答帮助他提高了批判性思维能力。同时,他也明白了在与AI对话时运用提问技巧的重要性。

其他著名的提问方法在AI时代的应用

提问方法名

创始人

描述

示例

倾听式提问

卡尔·罗杰斯

强调倾听以激发内在动力。

向AI咨询心理健康问题时,进一步提问以获取更深入的见解。

问题分类

索尔·贝尔林

将问题分为事实、解释、评价和建议四类。

在研究全球气候变化时提问:“全球气候变化的主要原因是什么?”“气候变化如何影响生态系统?”等

批判性提问

福克与拉兹纳

强调通过提问检验观点、挑战假设和识别潜在问题。

在讨论药物安全性时提问:“这种药物的副作用有哪些?”“这种药物的长期使用可能导致哪些问题?”等

智慧型提问

保罗和埃尔德尔

用提问来改善思维,提升判断力和决策能力。

制定公司战略时提问:“我们的竞争优势是什么?”“如何有效利用这些竞争优势?”等

六顶思考帽

布鲁默

鼓励从不同角度进行分析思考问题。

评估一项投资机会时,按照“六顶思考帽”的原则进行提问。

一些著名的提问方法

  1. 卡尔·罗杰斯的“倾听式提问”:这种方法强调倾听以激发内在动力。与AI对话时,我们可以通过倾听AI的回答,深入理解其逻辑和信息。例如,向AI咨询心理健康问题时,可以进一步提问以获取更深入的见解。
  2. 索尔·贝尔林的“问题分类”:贝尔林将问题分为四类,即事实、解释、评价和建议。与AI对话时,我们可以根据问题的类型提出不同的问题。例如,在研究全球气候变化时,事实问题可以是“全球气候变化的主要原因是什么”;解释问题可以是“气候变化如何影响生态系统”;评价问题可以是“目前应对气候变化的措施是否有效”;建议问题可以是“我们应该如何改善气候变化”。
  3. 福克与拉兹纳的“批判性提问”:这一方法强调通过提问来检验观点、挑战假设和识别潜在的问题。与AI对话时,我们可以运用这一方法来质疑AI的答案,挖掘更深层次的信息。例如,在讨论某种药物的安全性时,我们可以问AI:“这种药物的副作用有哪些?”“有哪些人群不适合使用这种药物?”“这种药物的长期使用可能导致哪些问题?”
  4. 保罗和埃尔德尔的“智慧型提问”:这种方法倡导用提问来改善思维,提升判断力和决策能力。在与AI对话时,可以运用这一方法以提升我们的思考和决策能力。例如,在制定公司战略时,我们可以问AI:“我们的竞争优势是什么?”“如何有效利用这些竞争优势?”“面对市场变化,我们如何调整战略以保持竞争力?”
  5. 布鲁默的“六顶思考帽”:这种方法鼓励我们在思考问题时从不同的角度进行分析。在与AI对话时,我们可以利用这一方法引导AI从多角度解析问题。例如,在评估一项投资机会时,我们可以按照“六顶思考帽”的原则进行提问

掌握Prompt

设计精准的指令

技巧名称

描述

示例

确保动词明确

使用明确的动词,以清晰地传达期望AI执行的操作。

使用“比较”“解释”“分析”“预测”等动词

合理安排信息顺序

在描述任务时,合理地安排信息顺序帮助AI理解需求。

首先提供背景信息,然后明确任务目标,最后指定输出格式。

量化指令

通过具体化任务的数量、时间范围等方式,使指令更具体。

“请在5分钟内提供3种可操作的、可快速实现的、有效节约能源的方法。”

使用肯定或否定

通过使用肯定或否定的表述,明确指令中需要包含或排除的内容。

“请介绍3种非侵入式心率监测技术,不包括心电图。”

逐步指导AI回答

在与AI交流过程中,逐步提供问题和指令,引导AI生成满足需求的答案。

首先询问AI关于一种技术的概述,然后再请AI深入解释该技术的工作原理和应用。

运用以下几个技巧来设计精准指令:

  1. 确保动词明确。使用明确的动词,如“比较”“解释”“分析”“预测”等,以清晰地传达期望AI执行的操作。
  2. 合理安排信息顺序。在描述任务时,合理地安排信息顺序可以帮助AI更好地理解你的需求。例如,首先提供背景信息,然后明确任务目标,最后指定输出格式。
  3. 量化指令。通过具体化任务的数量、时间范围等方式,使指令更具体,便于AI生成符合需求的回答。例如,“请在5分钟内提供3种可操作的、可快速实现的、有效节约能源的方法。”
  4. 使用肯定或否定。通过使用肯定或否定的表述,明确指令中需要包含或排除的内容。例如,“请介绍3种非侵入式心率监测技术,不包括心电图。”
  5. 逐步指导AI回答。在与AI交流过程中,可以逐步提供问题和指令,引导AI生成满足需求的答案。例如,首先询问AI关于一种技术的概述,然后再请AI深入解释该技术的工作原理和应用。

多样化输出格式设计

方法名称

描述

示例

指定输出风格

在提问时指定AI的答复风格,如正式、幽默、科普等。

“以幽默的方式解释量子力学。”

设置多个角色

设置不同角色,从不同的视角提出问题,让AI模拟该角色回答。

“如果你是历史学家,谈谈你对中世纪的看法。然后,如果你是科幻作家,谈谈你对中世纪的未来设想。”

要求多个答案或观点

在提问时直接要求AI提供多个答案或观点。

“请提供三种解决环保问题的方法。”

多样化的回答生成意味着生成多个能反映不同观点、角度和风格的答案,从而让我们能看到问题的多个维度。这样的输出对我们做决策、寻找创新点子、解决复杂问题等方面大有裨益。

  1. 指定输出风格。我们可以在提问时指定AI以正式、幽默、科普等风格回答,如“以幽默的方式解释量子力学。”这样,AI会根据指定风格生成答案。
  2. 设置多个角色。我们可以设置不同角色,让AI从各个角色的视角回答,如“如果你是历史学家,谈谈你对中世纪的看法。然后,如果你是科幻作家,谈谈你对中世纪的未来设想。”这样,AI会以不同角色的视角回答问题。
  3. 要求多个答案或观点。我们可以在提问时直接要求AI给出多个答案或观点,如“请提供三种解决环保问题的方法。”AI会根据要求给出三个不同的解决方案。

构建高效Prompt

CRISPE框架:进阶Prompt技巧

元素缩写

元素全称

描述

示例

CR

Capacity and Role(能力与角色)

明确告诉AI它在对话中的角色和应具备的能力。

“把自己想象成一名心理医生,为我提供情绪管理的建议。”

I

Insight(洞察力)

提供背景信息和上下文,让AI了解用户的具体需求和相关背景信息。

“我最近工作压力很大,希望能够放松心情。”

S

Statement(指令)

给AI明确的指令,告诉它我们希望它做什么。

“请为我推荐几个有效的情绪放松技巧。”

P

Personality(个性)

设定AI回答的风格或方式,如幽默、正式、温和等。

“希望你以幽默的方式回答。”

E

Experiment(尝试)

要求AI提供多个答案,以便用户有更多选择和参考。

“给我提供三种不同的情绪放松技巧。”

CRISPE框架是Matt Nigh提出的一套Prompt设计框架,这个框架旨在帮助用户设计出更为完备且高效的Prompt,使之能够完全符合用户的实际需求,而不仅仅是简单的指令性任务。CRISPE这个词汇本身包含五个元素,每个字母代表一个关键要素

  1. CR:Capacity and Role(能力与角色) 在设计Prompt时,我们需要明确告诉AI它在对话中需要扮演的角色以及应具备的能力。例如,我们可以告诉AI:“把自己想象成一名心理医生,为我提供情绪管理的建议。”这样的设定可以让AI更好地理解任务的背景,并以专业的角色为用户提供帮助。
  2. I:Insight(洞察力) Insight元素涉及背景信息和上下文,让AI了解用户的具体需求和相关的背景信息。例如,“我最近工作压力很大,希望能够放松心情。”通过提供这样的背景信息,AI可以更好地洞察用户的需求,从而给出更加贴切的回答。
  3. S:Statement(指令) 这是指明确的指令,告诉AI我们希望它做什么。例如,“请为我推荐几个有效的情绪放松技巧。”一个清晰的指令可以让AI明白我们的需求,从而给出有针对性的回答。
  4. P:Personality(个性) 这个元素指的是AI回答时所呈现的风格或方式。我们可以设定AI的回答风格为幽默、正式、温和等。例如,“希望你以幽默的方式回答。”这样可以让AI的回答更加生动有趣,也能增加与用户的互动性。
  5. E:Experiment(尝试) 这个元素要求AI为我们提供多个答案,以便用户有更多的选择和参考。例如,“给我提供三种不同的情绪放松技巧。”通过这样的方式,我们可以获得多样化的回答,从中选择最符合自己需求的方案。

图4-2所示为CRISPE框架的简化示范。

验证信息的准确性

方法名称

描述

示例

使用权威资源

优先访问权威网站和知名组织的官方发布来验证信息。

查找政府网站、知名大学或研究机构的出版物等。

询问ChatGPT提供来源

要求ChatGPT提供相关的资料、研究或引用。

在向ChatGPT提问时,要求其提供引用。

使用实时信息源

使用实时更新的信息源来获取最新数据。

股票价格、汇率等信息可以从金融网站或应用程序获得。

多问几个角度的问题

通过多角度提问同一问题来全面了解答案的准确性。

对于一个事件,可以从时间、地点、原因等不同角度提问。

结合使用专业社区或论坛

利用互联网上的专业社区和论坛来获取特定领域的专业知识。

在专业论坛提问或查找相关讨论,以获取更多关于问题的见解和答案。

一些有趣的方法,帮助你在与ChatGPT对话时轻松验证信息。

  1. 使用权威资源。优先访问权威网站和知名组织的官方发布,这些来源的信息往往更可靠。例如,查找政府网站、知名大学或研究机构的出版物等。
  2. 询问ChatGPT提供来源。在向ChatGPT提问时,可要求它提供相关的资料、研究或引用,以便你快速核实信息。
  3. 使用实时信息源。某些问题的答案可能会随着时间而变化,实时更新的信息源可以帮助你获取最新的数据。例如,股票价格、汇率等信息可以从金融网站或应用程序获得。
  4. 多问几个角度的问题。通过从不同角度提问同一问题,你可以对答案的准确性有更全面的了解。
  5. 结合使用专业社区或论坛。在互联网上有许多专业社区和论坛,那里的成员通常具有特定领域的专业知识。你可以在这些地方提问或查找相关讨论,以获取更多关于问题的见解和答案。

评估Prompt效果

评估指标

描述

为什么重要

准确性

AI回答是否正确、准确无误?

错误的信息可能会导致误导或不当的决策。

详细程度

AI回答是否足够详细,能够满足提问者的需求?

不够详细的答案可能不会完全满足用户的需求,导致进一步的追问。

一致性

AI回答是否与问题背景一致,遵循逻辑?

不一致或逻辑混乱的答案可能会使用户困惑或误解。

可理解性

AI回答是否易于理解,表达清晰?

难以理解的答案可能导致用户不满意,需要进一步的解释。

效率

AI回答是否迅速给出,符合实际应用的时间要求?

用户期望得到快速的反馈,延迟的答案可能导致用户体验不佳。

  1. 准确性。AI回答是否正确、准确无误?
  2. 详细程度。AI回答是否足够详细,能够满足提问者的需求?
  3. 一致性。AI回答是否与问题背景一致,遵循逻辑?
  4. 可理解性。AI回答是否易于理解,表达清晰?
  5. 效率。AI回答是否迅速给出,符合实际应用的时间要求?

提示工程技术入门

提示工程:一门新兴学科

实践方法名称

描述

示例

提示词设计

设计针对性、简洁、明确的提示词。

设计简洁且明确的问题句式,提高模型回答的准确性。

模型交互

调整与模型的交互方式。

控制生成文本的长度、调整输入/输出参数。

能力评估

深入了解模型的优缺点。

通过测试与分析了解模型的响应速度、准确性等。

安全性评估

降低模型生成不良内容的风险。

设计策略,过滤掉可能的误导性或不适宜的回答。

外部工具与领域知识整合

提高模型在特定领域的能力。

结合领域专家的建议,为医疗、法律等特定领域的问题提供更准确的回答。

提示工程的实践方法主要分为以下几个方面

  1. 提示词设计。根据任务需求,有针对性地设计简洁、明确且易于理解的提示词,以提高模型的准确性和可靠性。
  2. 模型交互。通过调整输入/输出参数、控制生成文本的长度和复杂性等,实现与模型的高效交互。
  3. 能力评估。通过测试、实验和分析,深入了解模型的能力和局限性,为优化提示词提供依据。
  4. 安全性评估。设计安全策略,降低模型在生成不良内容或误导性信息的风险。
  5. 外部工具与领域知识整合。利用领域专家的知识和外部工具,提高模型在特定领域的专业性能力。

应用场景

描述

具体效果或应用

问答系统

优化提示词以提高问答任务的性能。

提高大型语言模型在问答任务中的准确性和可靠性。

自然语言理解

提升自然语言处理任务中的模型性能。

在语义分析、情感分析和实体识别等任务中表现优异。

机器翻译

优化翻译任务的提示词。

提高不同语言之间的翻译质量。

编程辅助

设计针对编程任务的提示词。

提高代码生成和代码审核的效率,辅助开发者编程。

创意写作

引导模型生成具有创意的文本。

生成更具创意和原创性的文本内容。

教育辅导

提供个性化的学习建议和答疑服务。

在线教育平台能够为学生提供更加精准的学习建议和解答疑惑的服务。

提示工程在多个领域取得了显著的成果,以下是一些典型的应用场景:

  1. 问答系统。通过优化提示词,提示工程可以显著提高大型语言模型在问答任务中的准确性和可靠性。
  2. 自然语言理解。提示工程可用于提高模型在语义分析、情感分析和实体识别等自然语言处理任务中的性能。
  3. 机器翻译。提示工程可以帮助优化翻译任务中的提示词,从而提高模型在不同语言之间的翻译质量。
  4. 编程辅助。通过设计针对代码生成和代码审核等任务的提示词,提示工程可以帮助开发者更高效地进行编程工作。
  5. 创意写作。利用提示工程技术,可以引导大型语言模型生成更具创意和原创性的文本内容。
  6. 教育辅导。提示工程可以为在线教育平台提供个性化的学习建议和答疑解惑服务,提高学习效果。

基本概念:编码、解码与评估

基本概念

描述

具体内容与应用

编码

将自然语言文本转换为机器能理解的形式。

利用预训练的词嵌入如Word2Vec、GloVe或BERT将文本转为向量;关键在于选择合适的词嵌入和问题表述。

解码

从机器生成的向量中提取自然语言文本。

采用方法如贪婪解码、集束搜索和Top-K采样;权衡回答的多样性和准确性。

评估

衡量聊天机器人回答质量的过程。

采用指标如准确性、流畅性等;结合主观和客观评估,使用自动评分指标如BLEU、ROUGE。

为了更好地理解提示工程,我们需要从编码、解码与评估三个基本概念入手。

  1. 编码是将自然语言文本转换为机器能理解的形式(通常是向量)的过程。在与聊天机器人交流时,我们的问题需要经过编码,以便机器能够理解并做出回应。 编码通常利用预训练的词嵌入(如Word2Vec、GloVe或BERT)将每个单词或短语转换为向量。这些向量能够捕捉词汇的语义和语法信息,为聊天机器人提供有关问题的上下文,如图5-2所示。 编码的关键在于选取合适的预训练词嵌入和设计有效的问题表述。在提示工程中,我们需要确保问题的表述能够传达清晰、明确且易于理解的信息,以便机器生成高质量的回答。
  2. 解码是从机器生成的向量中提取自然语言文本的过程,即将向量转换回文本。在与聊天机器人交流时,我们关心的是机器如何从编码阶段获得的向量生成有意义的回答。 解码的方法有很多,如贪婪解码、集束搜索(Beam Search)和Top-K采样等。这些方法在生成回答时会考虑词汇间的概率分布和上下文关系。 在提示工程中,我们需要选择适当的解码方法,以生成流畅、一致且相关的回答。此外,还需要权衡生成回答的多样性和准确性,以实现最佳的交流效果。
  3. 评估是衡量聊天机器人回答质量的过程,以确定提示工程的有效性。评估指标通常包括准确性、流畅性、一致性、多样性等。 评估可以分为主观评估和客观评估。主观评估通常涉及人类评审员根据给定的标准对回答进行打分,而客观评估则依赖于自动评分指标(如BLEU、ROUGE等)来衡量回答的质量。 在提示工程中,我们需要结合主观评估和客观评估方法来评估聊天机器人的回答质量。这将有助于我们了解现有提示策略的优缺点,并对其进行改进,从而提高与聊天机器人的交流效果。

图5-2

简化提示工程过程:常见NLP库与工具简介

考虑方面

描述

示例与应用

明确需求

根据特定任务选择NLP库和工具

若需求为文本分类,可以考虑选择专门针对文本分类的NLP工具或库。

了解主流NLP库与工具

对比各库与工具的特点和适用场景

了解BERT、spaCy、NLTK等库的优缺点及适用任务,选择最合适的。

社区支持与文档完善

选择有强大社区和文档支持的工具

一个活跃的GitHub社区和丰富的官方文档可以助于快速解决问题和理解工具的使用方法。

性能与扩展性

确保所选工具能满足性能需求,并有良好的扩展性以适应未来变化

考虑工具的处理速度、是否支持分布式处理、是否可以轻松添加新功能或与其他工具集成等。

在选择适合的NLP库与工具时,需要考虑以下几个方面:

  1. 明确需求。根据你的需求,如文本分类、命名实体识别、情感分析等,有针对性地选择相应的NLP库和工具。
  2. 了解主流NLP库与工具。了解它们的特点、优缺点、适用场景等,有助于为特定任务选择最合适的解决方案。
  3. 社区支持与文档完善。一个活跃的社区和完善的文档可以为你提供更多的帮助,从而更快地解决实际问题。
  4. 性能与扩展性。考虑库和工具的性能和扩展性,以便在未来需求变化时,能够方便地应对。

NLP库和工具

NLP库/工具

主要描述

特点与应用

Hugging Face Transformers

流行的深度学习库,提供多种预训练NLP模型。

1. 提供BERT、GPT系列等模型。2. 文本生成、情感分析、文本分类等功能。3. 支持模型的本地/云端训练与微调。

spaCy

用于高级NLP任务的库,提供多种文本处理功能。

1. 分词、词性标注、命名实体识别等功能。2. Matcher功能,用于文本模式匹配。

OpenAI API

与OpenAI预训练模型互动的API。

1. 通过HTTP请求与GPT-3、Codex等模型交互。2. 设置参数生成文本或代码。3. 支持DALL-E API进行图像生成。

NLTK

Python的自然语言处理库,提供多种文本处理功能与语料库。

1. 词性标注、命名实体识别、语法分析等功能。2. 包含丰富的语料库和词汇资源。

  1. Hugging Face Transformers是一个非常流行的深度学习库,它为NLP任务提供了大量预训练的模型,如BERT、GPT-2、GPT-3等。它还包含一些实用功能,如用于文本生成、情感分析、文本分类等任务的pipeline。 使用Hugging Face Transformers,你可以轻松地加载预训练模型,定制模型结构和设置,以及为模型提供输入。此外,它还允许你在本地或云端进行模型训练和微调,进一步改善模型在特定任务中的性能。
  2. spaCy是一个用于高级NLP任务的库,它提供了一系列功能,包括分词、词性标注、命名实体识别、依存关系解析等。使用spaCy,你可以方便地处理和分析文本,进而为提示工程提供更有针对性的输入。 spaCy还提供了一个名为Matcher的功能,可以帮助你根据特定的规则和模式在文本中查找词汇。这在提取关键信息和构建针对性强的提示时非常有用。
  3. OpenAI API是一个用于与OpenAI预训练模型(如GPT-3和Codex)互动的API。它允许你通过简单的HTTP请求与模型进行交互,从而生成文本、编写代码或解决各种NLP任务。 使用OpenAI API,你可以方便地调用模型、设置参数(如max tokens、temperature等),并获取模型生成的结果。此外,还可以使用OpenAI的DALL-E API生成图像,进一步拓展你在提示工程中的应用范围。
  4. NLTK(Natural Language Toolkit)是一个Python编程语言的自然语言处理库。它提供了一系列功能,包括词性标注、命名实体识别、语法分析、文本相似度计算等。NLTK还包含大量语料库和词汇资源,以支持多种语言和任务。 NLTK是一个广泛使用的NLP库,可帮助你快速进行文本分析和处理,从而为提示工程提供有力支持。

提示工程技术与方法

OpenAI Playground参数设置

技巧/建议

描述

逐步调整参数

从默认设置开始,根据回答质量逐步调整模型参数。

多次尝试同一提示

因模型回答具随机性,同一提示可能有不同回答,多次尝试以评估模型性能。

结合实际应用场景

考虑实际需求在调整参数,如低温度用于准确回答,高温度用于创意写作。

理解模型选择

根据需求选择合适模型,如ChatGPT用于自然语言,Codex专为编程任务。

使用系统消息与模型互动

通过系统消息为模型提供背景和指导,帮助模型更好地理解需求。

查看并复制JSON响应

每次回答有对应JSON响应,包含所有生成信息。可以查看、复制用于其他应用或分析。

保存与分享你的实验

可保存实验到OpenAI账户,或生成分享链接与他人共享发现和寻求建议。

导出代码

提供“导出代码”功能,方便将实验结果应用到其他应用程序中。

在使用OpenAI Playground时,以下一些技巧和建议可能会对你有所帮助:

  1. 逐步调整参数。在寻找最佳设置参数时,建议你逐步进行调整。首先,尝试使用默认设置与模型进行交互。然后,根据回答的质量和满意度,逐个调整参数,以找到最适合你需求的设置。
  2. 多次尝试同一提示。由于模型生成回答具有一定的随机性,针对同一提示,你可能会得到不同的回答。因此,在评估模型的性能和效果时,建议你多次尝试同一提示,并观察回答的变化。
  3. 结合实际应用场景。在调整设置参数时,建议你结合实际应用场景进行考虑。例如,在需要准确信息的场景下,你可能需要设置较低的温度以获得更确定的回答;而在创意写作或头脑风暴等场景中,较高的温度可能会带来更有趣和独特的想法。
  4. 理解模型选择。OpenAI Playground允许你选择不同的模型,如ChatGPT、Codex等。每个模型都有自己独特的功能和优势。例如,ChatGPT是一个擅长处理自然语言任务的模型,而Codex是专为编程任务设计的。在Playground中,你可以根据你的需求选择合适的模型。
  5. 使用系统消息与模型互动。Playground还提供了一种名为系统消息(System Message)的交互方式。通过在对话中加入系统消息,你可以为模型提供背景信息和指导。系统消息在模型的上下文中提供了额外的信息,帮助模型更好地理解你的需求。
  6. 查看并复制JSON响应。OpenAI Playground为每个生成的回答提供了一个JSON响应。这个响应包含了模型生成的所有信息,包括角色、内容、时间戳等。你可以通过单击Playground中的“JSON”按钮查看完整的JSON响应。此外,你还可以将JSON响应复制到剪贴板,以便在其他应用程序中使用或进行分析。
  7. 保存与分享你的实验。Playground还允许你保存和分享你的实验。通过单击“保存”按钮,你可以将当前的实验保存到你的OpenAI账户。此外,你可以单击“分享”按钮生成一个特殊的分享链接,将你的实验与其他人共享。这使得你可以与团队成员或朋友共享有趣的发现,或寻求他们的帮助和建议。
  8. 导出代码。对于希望将生成的回答应用到其他应用程序中的用户,Playground提供了一个“导出代码”功能。通过单击“导出代码”按钮,你可以获得一段可直接在你的应用程序中使用的Python代码。这使得将Playground的实验结果应用到实际项目中变得非常简单。

OpenAI API进行提示工程实践

为了获取最佳效果,通常推荐使用性能最好的最新模型。例如,截止到2022年11月,文本生成的推荐模型是text-davinci-003,代码生成的推荐模型是code-davinci-002。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-09-23 09:20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 yeedomliu 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 思维导图
  • 序言
  • 认识AI对话
    • 认识“Prompt工程师”这个职业
      • 编写Prompt:高杠杆技能
        • 关于Prompt工程师职业前景的争议
          • AI对话与人类对话的差异
            • 提高回答质量的关键因素
            • 提问技巧与AI融合
              • 聪明提问:激发ChatGPT潜能的艺术
                • 避免循环提问、加载性问题与引导性问题
                  • 利用元认知技巧提高提问效果
                    • 沃伦·贝格尔提问技巧
                      • 与AI对话中的《学会提问》知识点
                        • 其他著名的提问方法在AI时代的应用
                        • 掌握Prompt
                          • 设计精准的指令
                            • 多样化输出格式设计
                            • 构建高效Prompt
                              • CRISPE框架:进阶Prompt技巧
                                • 验证信息的准确性
                                  • 评估Prompt效果
                                  • 提示工程技术入门
                                    • 提示工程:一门新兴学科
                                      • 基本概念:编码、解码与评估
                                        • 简化提示工程过程:常见NLP库与工具简介
                                        • 提示工程技术与方法
                                          • OpenAI Playground参数设置
                                            • OpenAI API进行提示工程实践
                                            相关产品与服务
                                            NLP 服务
                                            NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
                                            领券
                                            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档