首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >官方文档大全:数据分析与AI开发——官方文档链接整理(必备)

官方文档大全:数据分析与AI开发——官方文档链接整理(必备)

作者头像
玄同765
发布2026-01-14 13:54:23
发布2026-01-14 13:54:23
810
举报

【个人主页:玄同765

大语言模型(LLM)开发工程师中国传媒大学·数字媒体技术(智能交互与游戏设计) 深耕领域:大语言模型开发 / RAG知识库 / AI Agent落地 / 模型微调 技术栈:Python / LangChain/RAG(Dify+Redis+Milvus)| SQL/NumPy | FastAPI+Docker ️ 工程能力:专注模型工程化部署、知识库构建与优化,擅长全流程解决方案 专栏传送门:LLM大模型开发 项目实战指南Python 从真零基础到纯文本 LLM 全栈实战​​​​​从零学 SQL + 大模型应用落地大模型开发小白专属:从 0 入门 Linux&Shell 「让AI交互更智能,让技术落地更高效」 欢迎技术探讨/项目合作! 关注我,解锁大模型与智能交互的无限可能

开篇:官方文档的「信息孤岛」困境

在数据分析、数据挖掘、大模型开发的学习和工作中,我们经常会遇到这样的问题:

  • 官方文档分布在不同的网站,搜索关键词时结果往往混杂着非官方的博客或教程
  • 英文官方文档阅读门槛高,部分中文翻译版本更新不及时或内容缺失
  • 工具之间的协作关系不清晰,无法快速找到对应环节的官方文档

为了解决这些问题,我们整理了一份全面、准确、更新及时的中文官方文档清单,涵盖核心语言基础、数据分析工具、可视化工具、大模型开发工具、数据库与存储、开发与部署工具等六大板块,并提供了快速检索表格工具协作关系图,帮助从业者快速定位所需资源。


一、快速检索表格

工具类型

工具名称

工具简介

中文官方文档链接

核心语言基础

Python

数据分析、数据挖掘、大模型开发的核心编程语言

https://docs.python.org/zh-cn/3/

SQL

结构化查询语言,用于关系型数据库的数据操作

https://dev.mysql.com/doc/(MySQL)、https://www.postgresql.org/docs/zh/16/(PostgreSQL)、https://docs.microsoft.com/zh-cn/sql/sql-server/(SQL Server)

数据分析工具

NumPy

科学计算的核心库,提供高性能的 N 维数组对象

https://numpy.org/doc/stable/(英文,含部分中文教程)、https://www.numpy.org.cn/(社区维护中文)

Pandas

数据分析的核心库,提供 DataFrame 和 Series 数据结构

https://pandas.pydata.org/docs/(英文,含部分中文教程)、https://pandas.pydata.org.cn/(社区维护中文)

Scikit-learn

机器学习库,提供常用的机器学习算法和工具

https://scikit-learn.org/stable/(英文,含部分中文教程)、https://sklearn.apachecn.org/(社区维护中文)

可视化工具

Matplotlib

基础可视化库,支持绘制多种类型的图表

https://matplotlib.org/stable/index.html(英文,含部分中文教程)、https://matplotlib.apachecn.org/(社区维护中文)

Seaborn

统计可视化库,基于 Matplotlib,提供更高级的 API

https://seaborn.pydata.org/(英文)、https://seaborn.apachecn.org/(社区维护中文)

Plotly

交互式可视化库,支持生成 HTML、SVG、PDF 格式的图表

https://plotly.com/python/(英文)、https://plotly.apachecn.org/(社区维护中文)

大模型开发工具

Hugging Face Hub

大模型共享平台,提供大量预训练模型

https://huggingface.co/docs/hub/zh

Transformers

大模型调用和微调库,支持 Hugging Face Hub 上的大多数模型

https://huggingface.co/docs/transformers/zh

PyTorch

深度学习框架,用于大模型的开发、训练和推理

https://pytorch.org/docs/zh/

TensorFlow

深度学习框架,用于大模型的开发、训练和推理

https://www.tensorflow.org/versions/r2.15/guide/(英文,含部分中文教程)、https://www.tensorflow.org.cn/(中文官网)

数据库与存储

MySQL

关系型数据库,用于存储结构化数据

https://dev.mysql.com/doc/

PostgreSQL

关系型数据库,支持复杂的查询和数据类型

https://www.postgresql.org/docs/zh/16/

MongoDB

非关系型数据库,用于存储半结构化和非结构化数据

https://www.mongodb.com/docs/zh/

Redis

内存数据库,用于存储缓存和会话数据

https://redis.io/docs/zh/

Milvus

向量数据库,用于存储大模型的嵌入向量

https://milvus.io/docs/zh/

开发与部署工具

Git

版本控制工具,用于代码管理和协作

https://git-scm.com/book/zh/v2/

Docker

容器化部署工具,用于打包应用和依赖

https://docs.docker.com/(英文,含部分中文教程)、https://www.docker.org.cn/(中文社区)

VS Code

代码编辑器,支持多种编程语言和插件

https://code.visualstudio.com/docs(英文,含部分中文教程)、https://code.visualstudio.com/docs/getstarted/locales#_install-language-packs(安装中文语言包)


二、工具协作关系图

代码语言:javascript
复制
graph TD
    A[数据采集] --> B[数据存储]
    B --> C[数据清洗]
    C --> D[数据分析]
    D --> E[数据可视化]
    E --> F[大模型训练]
    F --> G[大模型部署]
    G --> H[应用开发]
    
    subgraph 数据存储
        B1[MySQL]
        B2[PostgreSQL]
        B3[MongoDB]
        B4[Redis]
        B5[Milvus]
    end
    
    subgraph 数据清洗与分析
        C1[NumPy]
        C2[Pandas]
        C3[Scikit-learn]
    end
    
    subgraph 数据可视化
        E1[Matplotlib]
        E2[Seaborn]
        E3[Plotly]
    end
    
    subgraph 大模型开发
        F1[Hugging Face Hub]
        F2[Transformers]
        F3[PyTorch]
        F4[TensorFlow]
    end
    
    subgraph 开发与部署
        G1[Git]
        G2[Docker]
        G3[VS Code]
    end

三、核心语言基础工具

3.1 Python
工具简介

Python 是数据分析、数据挖掘、大模型开发的核心编程语言,具有语法简洁、易用、生态丰富等特点。

中文官方文档链接

https://docs.python.org/zh-cn/3/

文档特色
  • 包含完整的 Python 语法、标准库、高级特性等内容
  • 提供大量的示例代码和说明
  • 支持按主题、版本搜索文档
适用场景
  • 零基础学习 Python
  • 查找 Python 标准库的用法
  • 学习 Python 的高级特性
3.2 SQL
工具简介

SQL 是结构化查询语言,用于关系型数据库的数据操作,包括查询、插入、更新、删除等。

中文官方文档链接
文档特色
  • 包含完整的 SQL 语法、数据类型、函数等内容
  • 提供大量的示例代码和说明
  • 支持按主题、版本搜索文档
适用场景
  • 学习 SQL 语法
  • 查找数据库的函数和操作
  • 优化 SQL 查询

四、数据分析工具

4.1 NumPy
工具简介

NumPy 是科学计算的核心库,提供高性能的 N 维数组对象,支持向量化运算和广播机制。

中文官方文档链接
文档特色
  • 包含完整的 NumPy 数组操作、数学函数、线性代数、随机数生成等内容
  • 提供大量的示例代码和说明
  • 支持按主题、版本搜索文档
适用场景
  • 数值计算
  • 数组操作
  • 线性代数计算
  • 随机数生成
4.2 Pandas
工具简介

Pandas 是数据分析的核心库,提供 DataFrame 和 Series 数据结构,支持数据读取、清洗、处理、分析等操作。

中文官方文档链接
文档特色
  • 包含完整的 Pandas 数据结构、数据读取、数据清洗、数据处理、数据分析等内容
  • 提供大量的示例代码和说明
  • 支持按主题、版本搜索文档
适用场景
  • 数据读取(Excel、CSV、SQL 等)
  • 数据清洗(缺失值处理、重复值处理、异常值处理等)
  • 数据处理(数据合并、数据分组、数据透视等)
  • 数据分析(描述性统计、相关性分析、时间序列分析等)
4.3 Scikit-learn
工具简介

Scikit-learn 是机器学习库,提供常用的机器学习算法和工具,包括分类、回归、聚类、降维等。

中文官方文档链接
文档特色
  • 包含完整的 Scikit-learn 算法、数据预处理、模型评估、模型选择等内容
  • 提供大量的示例代码和说明
  • 支持按主题、版本搜索文档
适用场景
  • 机器学习算法学习
  • 数据预处理
  • 模型评估
  • 模型选择

五、可视化工具

5.1 Matplotlib
工具简介

Matplotlib 是基础可视化库,支持绘制多种类型的图表,包括折线图、柱状图、散点图、饼图、热力图等。

中文官方文档链接
文档特色
  • 包含完整的 Matplotlib 图表绘制、图表配置、图表保存等内容
  • 提供大量的示例代码和说明
  • 支持按主题、版本搜索文档
适用场景
  • 基础图表绘制
  • 图表配置
  • 图表保存
5.2 Seaborn
工具简介

Seaborn 是统计可视化库,基于 Matplotlib,提供更高级的 API,支持绘制统计图表。

中文官方文档链接
文档特色
  • 包含完整的 Seaborn 图表绘制、图表配置、图表保存等内容
  • 提供大量的示例代码和说明
  • 支持按主题、版本搜索文档
适用场景
  • 统计图表绘制
  • 数据分布可视化
  • 相关性分析可视化
5.3 Plotly
工具简介

Plotly 是交互式可视化库,支持生成 HTML、SVG、PDF 格式的图表,支持交互操作。

中文官方文档链接
文档特色
  • 包含完整的 Plotly 图表绘制、图表配置、图表保存等内容
  • 提供大量的示例代码和说明
  • 支持按主题、版本搜索文档
适用场景
  • 交互式图表绘制
  • 数据展示
  • 报告生成

六、大模型开发工具

6.1 Hugging Face Hub
工具简介

Hugging Face Hub 是大模型共享平台,提供大量预训练模型,包括 GPT、BERT、LLaMA 等。

中文官方文档链接

https://huggingface.co/docs/hub/zh

文档特色
  • 包含完整的 Hugging Face Hub 使用指南、模型搜索、模型下载、模型上传等内容
  • 提供大量的示例代码和说明
  • 支持按主题、版本搜索文档
适用场景
  • 模型搜索
  • 模型下载
  • 模型上传
  • 模型共享
6.2 Transformers
工具简介

Transformers 是大模型调用和微调库,支持 Hugging Face Hub 上的大多数模型,提供简单易用的 API。

中文官方文档链接

https://huggingface.co/docs/transformers/zh

文档特色
  • 包含完整的 Transformers 模型调用、模型微调、模型推理等内容
  • 提供大量的示例代码和说明
  • 支持按主题、版本搜索文档
适用场景
  • 模型调用
  • 模型微调
  • 模型推理
  • 模型部署
6.3 PyTorch
工具简介

PyTorch 是深度学习框架,用于大模型的开发、训练和推理,具有动态计算图、易用、灵活等特点。

中文官方文档链接

https://pytorch.org/docs/zh/

文档特色
  • 包含完整的 PyTorch 张量操作、自动微分、模型定义、模型训练、模型推理等内容
  • 提供大量的示例代码和说明
  • 支持按主题、版本搜索文档
适用场景
  • 大模型开发
  • 大模型训练
  • 大模型推理
  • 模型部署
6.4 TensorFlow
工具简介

TensorFlow 是深度学习框架,用于大模型的开发、训练和推理,具有静态计算图、高性能、可扩展等特点。

中文官方文档链接
文档特色
  • 包含完整的 TensorFlow 张量操作、自动微分、模型定义、模型训练、模型推理等内容
  • 提供大量的示例代码和说明
  • 支持按主题、版本搜索文档
适用场景
  • 大模型开发
  • 大模型训练
  • 大模型推理
  • 模型部署

七、数据库与存储

7.1 MySQL
工具简介

MySQL 是关系型数据库,用于存储结构化数据,具有高性能、稳定、易用等特点。

中文官方文档链接

https://dev.mysql.com/doc/

文档特色
  • 包含完整的 MySQL 安装、配置、数据操作、数据库管理等内容
  • 提供大量的示例代码和说明
  • 支持按主题、版本搜索文档
适用场景
  • 结构化数据存储
  • 关系型数据操作
  • 数据库管理
7.2 PostgreSQL
工具简介

PostgreSQL 是关系型数据库,支持复杂的查询和数据类型,具有高性能、稳定、可扩展等特点。

中文官方文档链接

https://www.postgresql.org/docs/zh/16/

文档特色
  • 包含完整的 PostgreSQL 安装、配置、数据操作、数据库管理等内容
  • 提供大量的示例代码和说明
  • 支持按主题、版本搜索文档
适用场景
  • 结构化数据存储
  • 关系型数据操作
  • 数据库管理
7.3 MongoDB
工具简介

MongoDB 是非关系型数据库,用于存储半结构化和非结构化数据,具有高性能、灵活、可扩展等特点。

中文官方文档链接

https://www.mongodb.com/docs/zh/

文档特色
  • 包含完整的 MongoDB 安装、配置、数据操作、数据库管理等内容
  • 提供大量的示例代码和说明
  • 支持按主题、版本搜索文档
适用场景
  • 半结构化和非结构化数据存储
  • 非关系型数据操作
  • 数据库管理
7.4 Redis
工具简介

Redis 是内存数据库,用于存储缓存和会话数据,具有高性能、稳定、易用等特点。

中文官方文档链接

https://redis.io/docs/zh/

文档特色
  • 包含完整的 Redis 安装、配置、数据操作、数据库管理等内容
  • 提供大量的示例代码和说明
  • 支持按主题、版本搜索文档
适用场景
  • 缓存数据存储
  • 会话数据存储
  • 数据库管理
7.5 Milvus
工具简介

Milvus 是向量数据库,用于存储大模型的嵌入向量,支持高效的向量检索。

中文官方文档链接

https://milvus.io/docs/zh/

文档特色
  • 包含完整的 Milvus 安装、配置、数据操作、数据库管理等内容
  • 提供大量的示例代码和说明
  • 支持按主题、版本搜索文档
适用场景
  • 向量数据存储
  • 向量检索
  • 数据库管理

八、开发与部署工具

8.1 Git
工具简介

Git 是版本控制工具,用于代码管理和协作,具有分布式、高效、易用等特点。

中文官方文档链接

https://git-scm.com/book/zh/v2/

文档特色
  • 包含完整的 Git 安装、配置、代码管理、协作等内容
  • 提供大量的示例代码和说明
  • 支持按主题、版本搜索文档
适用场景
  • 代码管理
  • 代码协作
  • 版本控制
8.2 Docker
工具简介

Docker 是容器化部署工具,用于打包应用和依赖,具有轻量级、可移植、可重复等特点。

中文官方文档链接
文档特色
  • 包含完整的 Docker 安装、配置、镜像管理、容器管理、网络管理等内容
  • 提供大量的示例代码和说明
  • 支持按主题、版本搜索文档
适用场景
  • 应用打包
  • 依赖管理
  • 容器化部署
8.3 VS Code
工具简介

VS Code 是代码编辑器,支持多种编程语言和插件,具有轻量级、高效、易用等特点。

中文官方文档链接
文档特色
  • 包含完整的 VS Code 安装、配置、代码编辑、插件管理等内容
  • 提供大量的示例代码和说明
  • 支持按主题、版本搜索文档
适用场景
  • 代码编辑
  • 插件管理
  • 代码调试

附 相关 思维导图 下载:

【免费】思维导图:Numpy知识整理.xmind资源-CSDN下载

【免费】思维导图:Pandas核心知识体系.xmind资源-CSDN下载

【免费】思维导图:Matplotlib数据可视化全攻略.xmind资源-CSDN下载

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2026-01-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 开篇:官方文档的「信息孤岛」困境
  • 一、快速检索表格
  • 二、工具协作关系图
  • 三、核心语言基础工具
    • 3.1 Python
      • 工具简介
      • 中文官方文档链接
      • 文档特色
      • 适用场景
    • 3.2 SQL
      • 工具简介
      • 中文官方文档链接
      • 文档特色
      • 适用场景
  • 四、数据分析工具
    • 4.1 NumPy
      • 工具简介
      • 中文官方文档链接
      • 文档特色
      • 适用场景
    • 4.2 Pandas
      • 工具简介
      • 中文官方文档链接
      • 文档特色
      • 适用场景
    • 4.3 Scikit-learn
      • 工具简介
      • 中文官方文档链接
      • 文档特色
      • 适用场景
  • 五、可视化工具
    • 5.1 Matplotlib
      • 工具简介
      • 中文官方文档链接
      • 文档特色
      • 适用场景
    • 5.2 Seaborn
      • 工具简介
      • 中文官方文档链接
      • 文档特色
      • 适用场景
    • 5.3 Plotly
      • 工具简介
      • 中文官方文档链接
      • 文档特色
      • 适用场景
  • 六、大模型开发工具
    • 6.1 Hugging Face Hub
      • 工具简介
      • 中文官方文档链接
      • 文档特色
      • 适用场景
    • 6.2 Transformers
      • 工具简介
      • 中文官方文档链接
      • 文档特色
      • 适用场景
    • 6.3 PyTorch
      • 工具简介
      • 中文官方文档链接
      • 文档特色
      • 适用场景
    • 6.4 TensorFlow
      • 工具简介
      • 中文官方文档链接
      • 文档特色
      • 适用场景
  • 七、数据库与存储
    • 7.1 MySQL
      • 工具简介
      • 中文官方文档链接
      • 文档特色
      • 适用场景
    • 7.2 PostgreSQL
      • 工具简介
      • 中文官方文档链接
      • 文档特色
      • 适用场景
    • 7.3 MongoDB
      • 工具简介
      • 中文官方文档链接
      • 文档特色
      • 适用场景
    • 7.4 Redis
      • 工具简介
      • 中文官方文档链接
      • 文档特色
      • 适用场景
    • 7.5 Milvus
      • 工具简介
      • 中文官方文档链接
      • 文档特色
      • 适用场景
  • 八、开发与部署工具
    • 8.1 Git
      • 工具简介
      • 中文官方文档链接
      • 文档特色
      • 适用场景
    • 8.2 Docker
      • 工具简介
      • 中文官方文档链接
      • 文档特色
      • 适用场景
    • 8.3 VS Code
      • 工具简介
      • 中文官方文档链接
      • 文档特色
      • 适用场景
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档