首页
学习
活动
专区
工具
TVP
发布

第一专栏

专栏成员
103
文章
54295
阅读量
21
订阅数
在prompt使用占位符实现提高信息替换成功率和替换位置准确率【prompt】【LLM】
造数据集的时候遇到的,llm不能很好的帮你替换,替换的内容不对,或者是替换的位置不对,比如这里就是替换位置不对,只盯着doc2替换,无视你的替换位置的变化。 待处理文本
来杯Sherry
2024-05-12
1380
解决Milvus官网提供的单机版docker容器无法启动,以及其它容器进程与Milvus容器通信实现方案【Milvus】【pymilvus】【Docker】
我的需求是做混合检索单机版可以满足,要走Docker容器部署,还需要和另一个容器中的程序做通信。官方文档提供的Milvus安装启动Milvus方案,见文档:传送门
来杯Sherry
2024-04-29
4210
怎么通过isinstance(Obj,Class)验证?【isinstance】
最近有这样一个项目,这个项目可以用一个成熟的项目的构造树,读取树,再检索的过程,现在有新的需求,另一个逻辑构造同样节点结构的树,pickle序列化保存,再使用原来项目的读取、检索函数,当我完成存储正准备读取的时候,这个成熟的项目的健壮性,拒绝了我的树,这里的拒绝逻辑具体用到了instance,这是一个判断obj是不是class的实例的python内置函数,(据说,obj是继承的子类也过,感兴趣可以验证下,我这里的任务是识别为该类实例化的对象) 使用dir(my_tree)、dir(original_tree)可以看到对象属性方法的不同:
来杯Sherry
2024-04-27
1270
解决在linux中执行tailscale up却不弹出验证网址【Tailscale】【Linux】
最近有远程办公需求,需要连接内网服务器,又不太想用todesk,于是找到一个安全免费可用的Tailscale · Best VPN Service for Secure Networks,在windows中顺利注册账号后,登陆了我的windows device后,在linux中按照官网流程输入:
来杯Sherry
2024-04-23
4190
ablation study
“消融实验”(ablation study)通常指的是通过逐步移除系统的一部分来评估该系统的贡献。这种方法旨在理解系统的不同组成部分对整体系统性能的影响(简单说,控制变量做评估)。这种实验设计常用于机器学习、计算机科学、生物学等领域。
来杯Sherry
2023-11-13
1.1K0
LLM-TAP随笔——有监督微调【深度学习】【PyTorch】【LLM】
答案映射 将模型的输出与最终的标签做映射。映射规则是人为制定的,比如,将“太好了”、“好”映射为“正面”标签,将“不好”,“糟糕”映射为“负面”标签,将“一般”映射为“中立”标签。
来杯Sherry
2023-09-26
4130
LLM-TAP随笔——语言模型训练数据【深度学习】【PyTorch】【LLM】
构建词元表:覆盖绝大部分的输入词,并避免词表过大所造成的数据稀疏问题。 BPE 将字节视为合并的基本符号。 算法过程
来杯Sherry
2023-09-26
5630
LLM-TAP随笔——大语言模型基础【深度学习】【PyTorch】【LLM】
这个架构常用于编码器-解码器架构是一种常用于序列到序列(Seq2Seq)任务的深度学习架构。序列到序列的问题举例:NLP问题(机器翻译、问答系统和文本摘要)。
来杯Sherry
2023-09-26
6430
循环神经网络——下篇【深度学习】【PyTorch】【d2l】
设计多个隐藏层,目的是为了获取更多的非线性性。深度循环神经网络需要大量的调参(如学习率和修剪) 来确保合适的收敛,模型的初始化也需要谨慎。
来杯Sherry
2023-09-19
4310
循环神经网络——中篇【深度学习】【PyTorch】【d2l】
来杯Sherry
2023-09-19
3410
循环神经网络——上篇【深度学习】【PyTorch】【d2l】
序列模型主要用于处理具有时序结构的数据, **时序数据是连续的,**随着时间的推移,如电影评分、电影奖项、电影导演演员等。
来杯Sherry
2023-09-19
3990
卷积神经网络——下篇【深度学习】【PyTorch】
批量归一化可以解决深层网络中梯度消失和收敛慢的问题,通过固定每个批次的均值和方差来加速收敛,一般不改变模型精度。批量规范化已经被证明是一种不可或缺的方法,它适用于几乎所有图像分类器。
来杯Sherry
2023-08-24
3020
卷积神经网络——中篇【深度学习】【PyTorch】
全连接层是网络里参数比重最高的地方(参数=输入通道*高*宽*输出通道*高*宽),尤其是卷积后的第一个全连接层。而卷积层参数就小得多。所以用卷积层替代全连接层,参数会更少。
来杯Sherry
2023-08-24
2660
卷积神经网络——上篇【深度学习】【PyTorch】
(convolutional neural networks,CNN)是机器学习利用自然图像中一些已知结构的创造性方法,需要更少的参数,在处理图像和其他类型的结构化数据上各类成本,效果,可行性普遍优于全连接层。
来杯Sherry
2023-08-24
5320
动手学DL——MLP多层感知机【深度学习】【PyTorch】
加入一个或多个隐藏层+激活函数来克服线性模型的限制, 使其能处理更普遍的函数关系类型,这种架构通常称为多层感知机(multilayer perceptron)。
来杯Sherry
2023-08-10
1.2K0
线性神经网络——softmax 回归随笔【深度学习】【PyTorch】【d2l】
softmax 函数是一种常用的激活函数,用于将实数向量转换为概率分布向量。它在多类别分类问题中起到重要的作用,并与交叉熵损失函数结合使用。
来杯Sherry
2023-07-24
4280
线性神经网路——线性回归随笔【深度学习】【PyTorch】【d2l】
3.1、线性回归 线性回归是显式解,深度学习中绝大多数遇到的都是隐式解。 3.1.1、PyTorch 从零实现线性回归 %matplotlib inline import random impo
来杯Sherry
2023-07-24
6590
动手学DL——深度学习预备知识随笔【深度学习】【PyTorch】
多加一个括号,结果都是一致的,都是表示二维张量,张量形状都是(4,9),所以二维有两种写法,但再加一层括号,形状就变成了(1,4,9)三维,判断维数技巧:最外面的括号去掉开始数,比如:
来杯Sherry
2023-07-24
3720
算法练习——力扣随笔【LeetCode】【C++】
一开始上手力扣不习惯,OJ 的题目提交的是完整代码,力扣上的C++只提交目标函数代码,比如某个题目你只需要完成topKFrequent(nums,k)这个函数。
来杯Sherry
2023-07-24
2650
2023复试——机试随笔【c++】【考研】
建议用嘴说说,,写代码时间一长脑子一涨,很容易码错,找了半天错误,和正确结果就差一天,不就是2月的问题吗,不就是闰年判断有问题吗???
来杯Sherry
2023-07-24
4000
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档