背景
我们了解相关的专业术语,其实利于大模型业务推广,尤其是一线推广过程中,能够提高专业度和客户依赖性。
大模型的文件结构(Llama-2为例)
参考:https://huggingface.co/meta-llama/Llama-2-7b
小结:PyTorch是深度学习框架之一,使用 .pth 文件(或 .pt)作为模型权重文件的标准格式。
大模型命名
模型名称的定义通常会包含一系列信息,以帮助用户快速了解模型的关键特性
一、模型架构差异
基础能力维度
量化技术方案
二、技术共性特征
大模型参数规模(DeepSeek-r1和qwen3为例)
参考:https://ollama.com/library/deepseek-r1
参考:https://ollama.com/library/qwen3
小结:
大模型参数的数量,则类比人类大脑本身的成长和成熟。
671B参数数量:这些一般指参数的个数,B是Billion/十亿的意思。
参数:是指模型内部通过海量数据学习获得的数学权重和连接关系,直接决定模型的认知能力和任务处理性能。