首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

HCIP-AI MindSpore 认证课程大纲

该阶段详细介绍计算机视觉、注意力机制与Transformer、自然语言处理、语音处理等 AI 核心领域技术,并重点介绍华为开源深度学习框架MindSpore。

共计 54 课时。

第一节:计算机视觉技术概述与图像处理基础 - (3 课时)

- 什么是计算机视觉;计算机视觉技术发展简史;计算机视觉技术的应用领域;计算机视觉技术在人工智能产业中的重要性及作用;

- 什么是图像处理;图像处理常见需求点;图像处理技术分类;图像处理工具介绍;图像的表示与数字化;图像的表示方法;图像数字化过程:采样、量化、编码;基本图处理操作:缩放、旋转、镜像;

- 图像增强:亮度调整、对比度增强;图像滤波:均值滤波、高斯滤波、中值滤波;图像的边缘检测:Sobel、Prewitt、Canny 算子;图像分割:阈值分割、区域分割、边缘分割;

- 图像二值化:全局二值化、自适应二值化;形态学图像处理:腐蚀、膨胀、开操作、闭操作;形态学应用:图像去除噪声、图像分割;

第二节:图像的特征提取与描述 - (3 课时)

- 关键点检测:关键点的概念与特征、角点、边缘点;常见的关键点检测算法:Harris 角点检测、Shi-Tomasi 角点检测;图像的局部特征与全局特征;

- 特征向量的表示与匹配:特征向量的表示方法(向量、直方图、直方图梯度);特征向量的相似度度量方法(欧氏距离、汉明距离、余弦相似度);特征匹配算法(最近邻匹配、RANSAC 算法);

第三节:图像分类与目标(对象)检测 - (3 课时)

- 什么是图像分类;分类任务的定义与实施流程;基本图像分类器介绍:SVM、决策树、神经网络;使用深度学习框架进行图像分类任务;

- 对象检测基础概念;对象检测任务的定义及实施流程;基于滑动窗口的方法;

- 基于深度学习的对象检测方法:RCNN、Fast RCNN 网络论文精读;基于深度学习的对象检测方法:YOLOv8 及其历史版本论文精读;

第四节:图像分割与语义分割 - (3 课时)

- 图像分割基础概念;图像分割任务的定义与流程;基于阈值、区域和边缘的图像分割方法介绍;基于深度学习的图像分割方法:FCN、U-Net、SegNet 论文精读;

- 语义分割基础概念;语义分割任务的定义与实施流程;基于全卷积神经网络的语义分割方法;语义分割应用案例介绍:自动驾驶、医学影像分析;

第五节:目标检测模型构建实战-Kaggle 赛题精讲 - (3 课时)

第六节:注意力机制与 Transformer - (3 课时)

- 什么是注意力机制;什么是 Transformer;

- 注意力机制与 Transformer 的背景及含义;注意力机制和 Transformer 在自然语言处理和其他领域中的重要应用;注意力机制的定义和基本概念;

- 注意力机制的作用和优势;注意力机制的发展简史;注意力机制相关经典论文精读;自注意力机制核心原理;自注意力机制与 Transformer 的关系;

- Encoder 与 Decoder 结构及其组件;编码器结构及组件:多头自注意力层、前馈全连接层;解码器结构和组件:编码器-解码器注意力层、多头自注意力层、前馈全连接层;

第七节:Transformer 的训练及应用 - (3 课时)

- Transformer 模型的训练流程;Transformer 模型的训练数据准备及预处理;

- Transformer 训练的优化器选择;

- Transformer 应用领域;

第八节:自然语言处理概述与文本处理基础 - (3 课时)

- 什么是自然语言处理;自然语言处理的应用领域;自然语言处理技术在人工智能领域的重要性;自然语言处理技术的发展趋势;

- 文本处理技术简介;文本处理的应用领域;文本处理任务的实施流程;什么是文本预处理;文本预处理实施步骤:分词、定义、作用;

- 分词方法:基于空格、标点、词典的分词方法;中英文分词工具介绍;什么是标记化;文本预处理实施步骤:标记化、定义、作用;

- 标记化方法:单词、标点符号、数字标记化方法;中英文标记化工具介绍;什么是停用词;文本预处理实施步骤:停用词、定义、作用;

- 常见的停用词列表和移除方法;什么是词形还原;词形还原定义及作用;词干提取和词形还原的区别;常见词形还原方法和工具介绍;

- 什么是词袋模型;词袋模型的定义及作用;文档-词矩阵表示及基于词频的向量化方法;词袋模型的局限性和改进方法;词频-逆文档频率 TF-IDF;TF-IDF 的定义和作用;TF-IDF 在文本分类和信息检索中的应用;TF-IDF 方法的实现和优化技巧;什么是词嵌入;词嵌入的意义及作用;Word2Vec、GloVe、FastText 等常见词嵌入模型介绍;

第九节:语言理解技术 - (3 课时)

- 什么是词性标注;什么是命名体识别;词性标注及命名体识别的任务及方法;

- 常用词性标注及命名体识别模型和工具介绍;

- 什么是句法分析;什么是语法树;句法分析的概念及目标;常见的句法分析方法:依存句法分析、短语结构句法分析;

- 解析树与语法树的概念和表示方法;

第十节:语言生成技术 - (3 课时)

- 什么是语言模型;语言模型的定义和作用;基于统计方法和神经网络的语言模型实战;什么是文本生成;文本生成模型的定义和作用;

- 文本生成任务的常见模型:循环神经网络 RNN、长短期记忆网络 LSTM、门控循环单元 GRU、基于注意力机制的 Transformer 应用实战;

- 什么是机器翻译;机器翻译的定义和作用;什么是文本摘要;文本摘要的定义和作用;

- 机器翻译和文本摘要常见模型:神经机器翻译、抽取式与生成式文本摘要;

第十一节:语义理解技术 - (3 课时)

- 什么是文本分类;文本分类任务的定义和常见应用;什么是情感分析;情感分析任务的定义和常见应用;

- 基于机器学习和深度学习的文本分类模型与情感分析模型;

- 什么是文本相似度;文本相似度计算的定义和应用场景;基于词向量和深度学习的文本相似度计算方法;

- 语义匹配任务常见模型:Siamese 网络、BERT;

第十二节:常用自然语言处理工具库及综合实战 - (3 课时)

- 常用的自然语言处理工具和库:NLTK、spaCy、Stanford NLP、Gensim;

- 自然语言处理技术综合实战:Kaggle 赛题精讲;

第十三节:语音处理技术概述与语音信号处理基础 - (3 课时)

- 什么是语音处理技术;语音处理技术的应用领域;语音处理技术在人工智能领域的重要性;什么是语音信号;语音信号处理技术概述;什么是声波;声波的定义与基本性质;声波的频率、振幅、相位;

- 人类语音系统的基本结构和功能;声带、嘴唇等器官在语音生成中的作用;

- 语音信号的采样与量化;采样频率和量化位数的概念及影响;声音信号的数字化流程;语音信号的分析与表示:声谱图;声谱图的作用;如何绘制声谱图和读取信息;

- 时域特征与频域特征的概念;时域特征:波形图、能量、过零率;频域特征:频谱图、功率谱密度、梅尔频率倒谱系数;短时傅里叶变换 STFT;声学模型概念;语音信号的声学模型:线性预测 LPC 模型;声道模型和共振峰分析;语音信号的降噪与增强:滤波器、频域处理、谱减法;

第十四节:语音特征提取与表示 - (3 课时)

- 语音特征提取简介;声学特征介绍;提取声学特征的方法和工具;

- 语音表示方法介绍;基于特征向量的表示方法:声学特征向量;深度学习方法中的语音表示:端到端语音识别模型;

第十五节:语音识别与理解技术 - (3 课时)

- 语音识别任务全流程解析;语音识别流程:特征提取、声学模型、语言模型;

- 常见声学模型:隐马尔科夫模型 HMM 的基本原理及应用;

- 深度学习中的声学模型应用;

- 常用的语音识别工具和库:Kaldi、DeepSpeech、PocketSphinx;

第十六节:MindSpore 简介 - (3 课时)

- AI 框架的发展简史;AI 部署及生产层面的思考;什么是 MindSpore;MindSpore 的总体架构;

- MindSpore 各个子系统功能详解;MindSpore 特性;MindSpore 关键技术;

第十七节:MindSpore API 详解 - (3 课时)

- MindSpore 内置模型库概览;MindSpore API 封装结构概览;

- MindSpore 神经网络基础 API 应用;MindSpore 计算机视觉 API 封装;

MindSpore 自然语言处理 API 封装;MindSpore 语音处理 API 封装;

第十八节:实践应用案例向 MindSpore 迁移实战 - (3 课时)

- 计算机视觉实践案例的 MindSpore 迁移实战;

- 自然语言处理实践案例的 MindSpore 迁移实战;

- 语音处理实践案例的 MindSpore 迁移实战;

附赠:Python 基础编程快速入门

该阶段详细介绍机器学习所必须掌握的 Python 编程知识,共计 36 课时

附赠:机器学习的数学理论基础

该阶段详细介绍学习数据挖掘算法所必须的数学理论,包含微积分、线性代数、概率论与数理统计及凸优化理论,共计 84 课时。

誉天课程咨询热线18571829619 微信同号 QQ:1746063655

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OfKWmQgTiJb4D8KHZWL0wONg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券