首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >huggingface镜像网站hf使用

huggingface镜像网站hf使用

作者头像
云未归来
发布2025-07-20 14:49:00
发布2025-07-20 14:49:00
2.3K00
代码可运行
举报
运行总次数:0
代码可运行

如何使用镜像站🌟

本站域名 hf-mirror.com,用于镜像 huggingface.co 域名。作为一个公益项目,致力于帮助国内AI开发者快速、稳定的下载模型、数据集。捐赠支持请看网页左下角,感谢支持!

更多详细用法请看《这篇教程》

方法一:网页下载

在本站搜索,并在模型主页的Files and Version中下载文件。

方法二:huggingface-cli

huggingface-cli 是 Hugging Face 官方提供的命令行工具,自带完善的下载功能。

1. 安装依赖

代码语言:javascript
代码运行次数:0
运行
复制
pip install -U huggingface_hubCopy

2. 设置环境变量 Linux

代码语言:javascript
代码运行次数:0
运行
复制
export HF_ENDPOINT=https://hf-mirror.comCopy

Windows Powershell

代码语言:javascript
代码运行次数:0
运行
复制
$env:HF_ENDPOINT = "https://hf-mirror.com"Copy

建议将上面这一行写入 ~/.bashrc3.1 下载模型

代码语言:javascript
代码运行次数:0
运行
复制
huggingface-cli download --resume-download gpt2 --local-dir gpt2Copy

3.2 下载数据集

代码语言:javascript
代码运行次数:0
运行
复制
huggingface-cli download --repo-type dataset --resume-download wikitext --local-dir wikitextCopy

可以添加 --local-dir-use-symlinks False 参数禁用文件软链接,这样下载路径下所见即所得,详细解释请见上面提到的教程。

方法三:使用 hfd

hfd 是本站开发的 huggingface 专用下载工具,基于成熟工具 git+aria2,可以做到稳定下载不断线。

1. 下载hfd

代码语言:javascript
代码运行次数:0
运行
复制
wget https://hf-mirror.com/hfd/hfd.sh
chmod a+x hfd.shCopy

2. 设置环境变量 Linux

代码语言:javascript
代码运行次数:0
运行
复制
export HF_ENDPOINT=https://hf-mirror.comCopy

Windows Powershell

代码语言:javascript
代码运行次数:0
运行
复制
$env:HF_ENDPOINT = "https://hf-mirror.com"Copy

3.1 下载模型

代码语言:javascript
代码运行次数:0
运行
复制
./hfd.sh gpt2 --tool aria2c -x 4Copy

3.2 下载数据集

代码语言:javascript
代码运行次数:0
运行
复制
./hfd.sh wikitext --dataset --tool aria2c -x 4Copy
方法四:使用环境变量(非侵入式)

非侵入式,能解决大部分情况。huggingface 工具链会获取HF_ENDPOINT环境变量来确定下载文件所用的网址,所以可以使用通过设置变量来解决。

代码语言:javascript
代码运行次数:0
运行
复制
HF_ENDPOINT=https://hf-mirror.com python your_script.pyCopy

不过有些数据集有内置的下载脚本,那就需要手动改一下脚本内的地址来实现了。

此外您还可以通过下面镜像下载方式

1.https://aliendao.cn/ 直接搜索模型,就可以下载 2.https://s3.amazonaws.com/models.huggingface.co/bert/bert-large-uncased-tokenizer.json 想要搜什么模型直接改变bert-large-uncased-tokenizer.json就行

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-03-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 如何使用镜像站🌟
    • 方法一:网页下载
    • 方法二:huggingface-cli
    • 方法三:使用 hfd
    • 方法四:使用环境变量(非侵入式)
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档