大家好,今天分享一个优秀的开源教程——超 20 万字的《PyTorch实用教程》(第二版),其第一版已经超 7.2K 颗星。
在教程中用了超 5 万字,详细介绍了计算机视觉(CV)中的八大应用场景,并且配套完整项目代码,完全开源。
以胸部X光片二分类任务为案例, 完整的介绍图像分类任务的训练过程。其中, 涉及
以脑部MRI肿瘤数据为例, 介绍图像语义分割的训练、 推理过程。其中,涉及:
以无人机场景目标检测为例,通过YOLOv5模型进行目标检测实战。其中,涉及:
近万字的目标跟踪项目介绍,以车流量计数场景,通过YOLOv5模型和DeepSORT算法,完成大桥的车流量计数。内容丰富详实,包括:
以CycleGAN为例介绍GAN的原理与代码实现,内容涉及:
以DDPM(《Denoising Diffusion Probabilistic Models》)为基础,介绍扩散模型的原理与代码实现。内容包括:
图像描述是CV与NLP结合的一个典型任务,也是CV与NLP桥梁,教程中介绍图像描述模型的训练及使用,包括经典的CNN+RNN,以及现在流行的多模态模型,内容包括:
该案例基于CLIP+Faiss+Flask构建了以文搜图、以图搜图的在线图像检索系统,内容丰富,涉及理论基础和详细代码实践,知识点涵盖: