算法工程师

数据分析与挖掘

从部署到实践，即刻拥有你的专属龙虾助手

OpenClaw开发者专区🦞🦞🦞

自行/邀约他人一键搬运博客，享价值百万资源包

腾讯云自媒体同步曝光计划

往期视频·干货材料·成员作品 最新动态

腾讯技术创作特训营知识专栏

新邀入驻腾讯云开发者社区，福利多多！

这里是最后一部分了：怎么让英文大语言模型支持中文？（三）对预训练模型进行指令微调。

怎么让英文大语言模型支持中文？（三）进行指令微调

代码已上传到github： https://github.com/taishan1994/chinese_llm_pretrained

怎么让英文大预言模型支持中文？（二）继续预训练

代码地址：https://github.com/taishan1994/sentencepiece_chinese_bpe

怎么让英文大预言模型支持中文？（一）构建自己的tokenization

下载python
 这里以安装python3.7.1为例：
 wget https://www.python.org/ftp/python/3.7.1/Python-3.7.1.tgz
编译和安装python
prefix是指定python安装的位置
cd Python-3.7.1
./configure --prefix=/home/work/envs/python3.7.1 && make && make install
设置软连接
ln -s /home/work/envs/python3.7.1/b

【python】linux下安装python的一般方法

大语言模型目前一发不可收拾，在使用的时候经常会看到transformers库的踪影，其中xxxCausalLM和xxxForConditionalGeneration会经常出现在我们的视野中，接下来我们就来聊聊transformers库中的一些基本任务。

你还弄不清xxxForCausalLM和xxxForConditionalGeneration吗？

源码地址：transformers/configuration_utils.py at v4.28.1 · huggingface/transformers (github.com)

LLM（大语言模型）解码时是怎么生成文本的？

虽然这对常规大小的模型来说非常有效，但当我们处理一个巨大的模型时，这个工作流程有一些明显的局限性：在第1步，我们在RAM中加载一个完整版本的模型，并花一些时间随机初始化权重（这将在第3步被丢弃）。在第2步，我们在RAM中加载另一个完整版本的模型，并使用预训练的权重。如果你正在加载一个具有60亿个参数的模型，这意味着你需要为每个模型的副本提供24GB的RAM，所以总共需要48GB（其中一半用于在FP16中加载模型）。

1使用accelerate

讲在前面，chatgpt出来的时候就想过将其利用在信息抽取方面，后续也发现了不少基于这种大语言模型的信息抽取的论文，比如之前收集过的：

GPT-NER：通过大型语言模型的命名实体识别

对于一些多语言的大语言模型而言，它的词表往往很大。在下游使用这些模型的时候，可能我们不需要其它的一些语言，例如只需要中文和英文，此时，我们可以对其vocab进行裁剪，既可以大大减少参数量，也能够保留模型的性能，接下来以Bloom模型为例看看是怎么进行操作的。

怎么裁剪LLM（大语言模型）的vocab（词表）？

随着大语言模型的流行，如何让大模型在消费级GPU上进行微调训练成为了热点。掌握参数有效微调成为每个自然语言处理工程师必不可少的技能，正好hugging face开源了一个PEFT库，让我们也能够自己动手去了解参数有效微调。接下来以中文情感分析（二分类）去了解下参数有效微调。

你也可以动手参数有效微调：LoRA、Prefix Tuning、P-Tuning、Prompt Tuning

DyLoRA: Parameter-Efficient Tuning of Pretrained Models using Dynamic Search-Free Low Rank Adaptation

DyLoRA：使用动态无搜索低秩适应的预训练模型的参数有效微调

EFFICIENT AND EFFECTIVE TEXT ENCODING FOR CHINESE LL AMA AND ALPACA

Chinese-LLaMA-Alpaca技术报告

Towards Better Instruction Following Language Models for Chinese: Investigating the Impact of Training Data and Evaluation

1数据集

CHINESE OPEN INSTRUCTION GENERALIST: A PRELIMINARY RELEASE

COIG：开源四类中文指令语料库

代码：https://instruction-tuning-with-gpt-4.github.io/

用GPT4进行指令微调

https://github.com/facebookresearch/llama

LLaMA：开放和高效的基础语言模型

ChatGPT已经火了一段时间了，国内也出现了一些平替，其中比较容易使用的是ChatGLM-6B：https://github.com/THUDM/ChatGLM-6B ，主要是能够让我们基于单卡自己部署。ChatGLM的基座是GLM: General Language Model Pretraining with Autoregressive Blank Infilling论文中提出的模型，接下来我们来看看。

GLM: General Language Model Pretraining with Autoregressive Blank Infilling

代码地址：https://github.com/taishan1994/ChatSA

利用ChatGPT进行情感分析

目前colab已经不支持使用：%tensorflow_version 1.x来切换使用tensorflow1.x版本了。
 解决方法如下：

colab上更换python版本或者换成tensorflow1.x版本

我们不难发现，激活函数就是对x乘以一些数，以对某些值进行约束。
 GLU（Gated Linear Unit），其一般形式为：

PaLM中使用的激活函数：SwiGLU

文章

问答

视频

教程

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云智能顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

EdgeOne AI 安全实战专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋

腾讯云代码助手

云原生构建

TAPD 敏捷项目管理

Cloud Studio

SDK中心

API中心

命令行工具

涵盖代码开发、场景应用、自动测试全流程，助你从零构建专属AI助手

一站式MCP教程库，解锁AI应用新玩法

聚焦“写作效率、视觉美观与运行性能”三方面进行全面升级，为您提供更高效、稳定的创作环境

社区富文本&Markdown编辑器全新改版上线，欢迎大家体验!

诚挚邀请您参与本次调研，分享您的真实使用感受与建议。您的反馈至关重要，感谢您的支持与参与！

社区新版编辑器体验调研

腾讯云开发者社区推出了数据分析与挖掘专栏，为你提供了数据分析与挖掘的相关文章，致力于帮助开发者快速成长与发展。

数据分析与挖掘

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐