首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#model

DeepSeek Model Zoo:解锁预训练模型的宝藏地图(12/18)

正在走向自律

摘要:DeepSeek Model Zoo 是一个集多种先进预训练模型于一体的宝库,涵盖自然语言处理(NLP)、计算机视觉(CV)和语音等多个领域。这些模型在各...

8910

机器学习|从0开发大模型之复现DeepSeek的aha moment

用户1904552

前面一篇文章介绍了《从0开发大模型之DeepSeek的GRPO》,并且实现了一个简单版本的 GRPO 代码,不过从工程领域来看,并没有复现DeepSeek-R1...

8100

机器学习|从0开始大模型之模型LoRA训练

用户1904552

继续《从0开发大模型》系列文章,上一篇用全量数据做微调,训练时间太长,参数比较大,但是有一种高效的微调方式LoRA。

28410

【YOLOv8】YOLOv8改进系列(3)----替换主干网络之ConvNeXt V2

HABuo

论文提出了一个全卷积掩码自编码器框架和一个新的全局响应归一化(Global Response Normalization, GRN)层,用于增强 ConvNeX...

3300

Model Context Protocol 的使用场景与方法

井九

Model Context Protocol (MCP) 是一种由 Anthropic 开发的开放标准,旨在解决 AI 应用与外部数据源和工具集成中的挑战。在当...

12610

Consider defining a bean of type ‘com.zzy.java_gobang.model.UserMapper‘ in your configuration报错解决方案

阑梦清川

今天的这个问题足足花费了我两个小时,真的没想到,但是这个spring-boot学习的时候确实会出现各种各样的牛鬼蛇神式的错误,今天真的让我开眼了~~

6100

【YOLOv8】YOLOv8改进系列(2)----替换主干网络之FasterNet(CVPR 2023)

HABuo

神经网络在计算机视觉任务(如图像分类、目标检测和分割)中取得了显著的性能提升,但随着应用的普及,对低延迟和高吞吐量的需求也日益增加。为了实现更快的神经网络,研究...

19710

释放大模型潜力:Model Context Protocol 引领 API 开发新纪元

马超的博客

  Model Context Protocol(简称MCP)是由人工智能公司Anthropic提出的一种API开发标准,旨在实现AI助手与数据源的无缝连接。M...

26110

【YOLOv8】YOLOv8改进系列(1)----替换主干网络之EfficientViT(CVPR2023)

HABuo

EfficientViT:作者是来自香港中文大学和微软研究院的研究团队。论文的主要内容是提出了一种新型的高效视觉变换器(Vision Transformer,简...

15810

可本地部署使用的大模型显存资源估算工具

AlphaHinex

🤗 Model Memory Calculator[1] 是 🤗 Accelerate[2] 库提供的一个模型显存计算工具,可估算模型训练或推理时所需的显存大小...

11100

鸿蒙开发利器:JsonToArkTS 一键生成 Model 类

徐建国

JsonToArkTS 在线工具助力开发者快速将复杂 JSON 转换为 ArkTS 接口或类,大幅提升鸿蒙应用开发效率。

7500

AI智能化提取——基于Segment Anything Model 2 Geospatial 中的进行房屋建筑提取分析

此星光明

基于Meta的"分割一切模型"(SAM),SAMGeo Python工具包为地理空间数据带来了先进的图像分割能力。本实践研讨会专为渴望在项目中释放GeoAI潜力...

9000

Maven运行任何命令都报错“Internal error: java.lang.ArrayIndexOutOfBoundsException”

kongxx

今天遇到一个奇怪的问题,在maven工程下运行任何mvn命令都报“Internal error: java.lang.ArrayIndexOutOfBounds...

6800

每月都有重磅研究,2024全年值得一读的论文都在这了

机器之心

2024 年,是 AI 领域让人兴奋的一年。在这一年中,各大科技公司、机构发布了数不胜数的研究。

5500

GitHub Models

JusterZhu

Above, we switched models in the playground to compare different models under th...

7700

R语言基于ARMA-GARCH-VaR模型拟合和预测实证研究分析案例

拓端

本文显示了如何基于潜在的ARMA-GARCH模型(当然也涉及更广泛意义上的QRM)来拟合和预测风险价值(VaR)。

8610

以波士顿房价预测为例,演示过拟合问题和解决办法

GeekLiHua

腾讯 | 业务安全工程师 (已认证)

使用Scikit-Learn库中的波士顿房价数据集,该数据集包含了房屋的各种特征以及相应的房价。

7910

什么是偏拟合和什么是过拟合,解决方法是什么

GeekLiHua

腾讯 | 业务安全工程师 (已认证)

过拟合指的是模型在训练集上表现良好,但在测试集或实际应用中表现不佳的现象。通常,过拟合是由于模型过度学习了训练集中的噪声和细节,而忽略了数据的真正趋势。这导致模...

11710

Vue的基本组件3.1(v-model)

GeekLiHua

腾讯 | 业务安全工程师 (已认证)

简介:本文旨在用最短的篇幅和例子,代入大家入门vue,也是本博主的一个学习记录,本文主要介绍的组件有,v-mind。

8810

【深度学习】多目标融合算法(二):底部共享多任务模型(Shared-Bottom Multi-task Model)

LDG_AGI

在朴素的深度学习ctr预估模型中(如DNN),通常以一个行为为预估目标,比如通过ctr预估点击率。但实际推荐系统业务场景中,更多是多种目标融合的结果,比如视频推...

9110
领券