前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Top-p采样:解锁语言模型的创意之门

Top-p采样:解锁语言模型的创意之门

作者头像
zhangjiqun
发布2025-05-16 15:52:20
发布2025-05-16 15:52:20
1110
举报
文章被收录于专栏:计算机工具计算机工具

Top - p采样 是什么:核采样:排序,累计到0.7,随机选择

在自然语言生成和大规模语言模型推理中,Top - p采样(又叫核采样,Nucleus Sampling)是一种基于累积概率的采样策略。

Top - p介绍

Top - p中的p是一个概率阈值,取值范围是0到1。它表示在生成文本时,从概率分布中选择累计概率大于或等于p的最小词集,然后从这个词集中随机选择一个词作为输出。 例如,如果p = 0.7,那么模型会从概率分布中选出累计概率达到0.7的那些词,然后从中随机挑选一个作为下一个生成的词。较低的p值会使模型更倾向于选择最可能的词,生成的文本更可预测和重复;较高的p值则会让模型考虑更大的词集,生成的文本更多样和有创意。

原理:排序,累计到0.7,随机选择
  • 概率排序与累积:模型在生成每个词时,会先对词汇表中的所有词计算一个概率分布(通常通过Softmax函数得到)。将这些词按照概率从核采样,然后依次累加这些词的概率,直到累加的概率大于或等于设定的p值为止,此时所包含的词就构成了用于采样的候选词集
  • 随机采样:从得到的候选词集中,按照它们各自的概率进行随机采样,选择其中一个词作为生成的结果。
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2025-05-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Top - p采样 是什么:核采样:排序,累计到0.7,随机选择
    • Top - p介绍
    • 原理:排序,累计到0.7,随机选择
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档