首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场

喔家ArchiSelf

一个20多年的老码农 一个半吊子全栈工匠
专栏成员
359
文章
576573
阅读量
43
订阅数
拆解OpenAI最大对手的杀手锏:为什么会是MCP?
当Model Context Protocol(MCP)在2024年11月首次亮相时,技术社区曾短暂为之振奋——从Copilot到Cognition再到Cursor,主流AI工具链玩家相继宣布接入支持。然而这场技术狂欢如同流星划过,直到2025年2月AI工程师峰会上演了惊人转折。令人意外的是,这场长达120分钟的技术布道竟在社交媒体引发病毒式传播。这场现象级传播背后,是开发者社区对MCP规范白皮书技术细节的饥渴,更是对首个"AI原生协议标准"时代来临的集体觉醒。
半吊子全栈工匠
2025-05-26
1610
智能体间协作的"巴别塔困境"如何破解?解读Agent通信4大协议:MCP/ACP/A2A/ANP
AI 智能体的兴起触发了AI应用协作的新领域。这些智能体不再局限于被动的聊天机器人或独立的系统,它们现在被设计用于推理、计划和协作ーー跨任务、跨域甚至跨组织。但随着这一愿景成为现实,一个挑战很快浮出水面: 智能体如何以一种安全、可伸缩和可互操作的方式可靠地相互交流、共享上下文并共同做出决策?
半吊子全栈工匠
2025-05-19
2420
CodeBuddy的七种武器
中学时代非常喜欢看武侠小说,“飞雪连天射白鹿,笑书神侠倚碧鸳”自然不在话下,还看过梁羽生的《白发魔女传》与《七剑下天山》等书,当然还有古龙的《多情剑客无情剑》《绝代双骄》等,以及颇具特色的《七种武器》。近来使用CodeBuddy,于是借用“七种武器”的噱头,聊一下CodeBuddy的七个功能特性,过一把武侠瘾。
半吊子全栈工匠
2025-05-13
901
如何选择Embedding Model?关于嵌入模型的10个思考
在大模型应用中,尤其基于RAG框架的大模型应用,嵌入模型(embedding Model)是不可或缺的关键组件。这里总结了笔者在实践中关于潜入模型的10个思考,希望对大家有所帮助。
半吊子全栈工匠
2025-05-06
1K0
大模型应用系列:两万字解读MCP
【引】AI Agent的实际效能高度依赖于其可集成的工具生态。当Agent无法接入关键数据源或功能接口时,其应用价值将大幅受限。这一核心挑战直接决定了Agent能否在真实场景中发挥作用。
半吊子全栈工匠
2025-04-26
91K47
从零构建大模型之Transformer公式解读
【引】收到图灵寄来的两本书《大模型应用开发极简入门》和《从零构建大模型》,重新点燃了自己深入理解大模型内部机制的热情,不能只知其然而不知其所以然,于是重温大模型核心的transformer架构, 尝试用25个公式进行解读,遂成此文。
半吊子全栈工匠
2025-04-14
8.8K0
从Service Mesh 到 Agentic Mesh
Mesh 是一种网络技术,其核心特点是节点之间可以动态互联,通过多跳路由实现数据的高效传输。Mesh 网络中的每个节点既能发送/接收数据,也能为其他节点转发数据,形成一张自组织、自修复的网状结构。例如,物联网的智能家居设备通过 Zigbee 或 Thread 协议组成 Mesh,低功耗且覆盖范围广。
半吊子全栈工匠
2025-04-07
4790
大模型应用的能力分级
对大模型应用的能力分级就像给学生打分一样,能让我们更清楚它的本事有多大。能力分级能帮我们设定目标,知道AI现在能干什么,未来还要学什么。有了统一的分级方式,大家就能公平比较不同AI的水平,推动技术进步。同时,不同分级的AI适合干不同的活儿,能帮我们找到最合适的帮手。另外,能力分级让普通人更容易理解AI的能力,避免过度期待或担心。
半吊子全栈工匠
2025-03-31
1.2K0
来了!10个构建Agent的大模型应用框架
随着生成式人工智能(GenAI)的蓬勃发展,基于大型模型的应用已经悄然融入我们的日常工作和生活,它们在诸多领域中显著提升了生产力和工作效率。为了更便捷地构建这些基于大模型的应用程序,开源社区和产品开发者们正以前所未有的速度进行创新。
半吊子全栈工匠
2025-03-24
8.2K0
AI 驱动的数据分析:Data Agent
数据曾被誉为新的石油,但这种说法正在演变。随着人工智能的兴起,算力已经成为企业推动创新和成功的关键资源。生成式人工智能所涉及到知识工作和创造性工作的领域 ,如果生成式人工智能可以让这些人至少提高 10% 的效率和 / 或创造力, 他们不仅变得更快、更有效率,而且比以前更有能力。因此,生成式人工智能具有创造数万亿美元经济价值的潜力。
半吊子全栈工匠
2025-03-17
1.4K0
LLM运行框架对比:ollama与vllm浅析
开源的LLM已经成为程序员、爱好者和希望在日常工作中使用生成式AI并保持隐私的用户的最佳选择,对于企业的私有化部署而言也是如此。这些模型提供了优秀的性能,有时在许多任务中可以与大型的闭源模型 (如 GPT-4o 或 Claude Sonnet 3.5) 相媲美。
半吊子全栈工匠
2025-03-10
1.5K1
架构设计过程中的10点体会
在软件工程领域,任何脱离实际业务需求的架构设计都是一种不负责任的行为,甚至可以称之为"技术层面的形式主义"。这种设计倾向往往表现为过度追求技术新颖性、盲目采用复杂架构模式,或者为了架构而架构的设计理念。很多技术债务也是由于架构设计与业务需求脱节造成的。
半吊子全栈工匠
2025-03-03
980
解读DeepSeek-R1
DeepSeek-R1 并不是从零开始训练的。它从一个比较强大LLM (DeepSeek-V3-base)开始,进而成为一个推理大模型。为了做到这一点,使用了强化学习(RL),当 LLM 做了一些有益于推理的事情时,进行奖励,否则进行惩罚。
半吊子全栈工匠
2025-02-25
5100
DeepSeek 到底用了多少GPU呢?
【引子】近来,大家一直在谈论 DeepSeek R1,即 671B 的参数巨兽。如果得到这样的一个大模型,到底花费了600 万美元还是2.48 亿美元呢?到底用了多少张GPU呢?
半吊子全栈工匠
2025-02-10
2.9K0
性能优化之动态加载
在过去近三十年的职业生涯里,有几年专注于运行时环境的开发与实现。在runtime中,动态加载技术是其中的基石之一。动态加载技术是指在系统运行过程中,根据需要把程序和数据从外存或网络加载到内存中的过程。其中,lazy loading(懒加载),也被称为延迟加载,是动态加载技术的一种常见实现方式。
半吊子全栈工匠
2025-01-20
1990
性能约定:API 限速
速率限制是一种关键的控制机制,用于管理 API 的请求流,非常类似于调节器。速率限制不仅仅是控制请求的总数,它还关系到如何以及在哪里应用这些限制。根据 API 的需要,可以根据各种因素(如用户 ID、 IP 地址或特定类型的 API 调用)来实现速率限制。
半吊子全栈工匠
2025-01-13
2390
微秒级高性能网络初探
如果我们的预期是将网络延时从10ms 降低到1ms,那么应该先分析这些时延的具体构成,很有可能瓶颈并不是网络传输;如果目标是将网络延时降低到微秒级或者百微秒级,那么我们才可能使用到高性能网络,例如RDMA技术。
半吊子全栈工匠
2025-01-07
1620
大模型应用的10个架构挑战
ChatGPT 从正式发布到拥有1亿用户仅仅用了5天的时间,基于大型语言模型(简称大模型,或基础模型)的应用给软件行业乃至整个社会带来巨大的影响。作为一名软件系
半吊子全栈工匠
2024-12-24
7400
大模型应用系列:从MLOps到LLMOps
【引子】在IT领域中,DevOps 是软件工程效能的重要方法论以及工具集, 在人工智能领域同样如此。
半吊子全栈工匠
2024-12-23
3370
WEB语义化的新探索:浅析LLMs.txt
【引】有人迷恋使用大模型生成各种有趣的内容, 有人沉醉于大模型相关技术的探索,没有对错,只在于你的乐趣所在。
半吊子全栈工匠
2024-12-19
5510
点击加载更多
活动推荐
社区活动
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档