LLM - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签LLM

#LLM

LLM调用的最佳数据格式：TOON，成本直降50%｜附Java使用指南

程序猿DD 22小时前2025-11-24 13:46:25

TOON格式在LLM调用时候除了在Token数量上的优化之外，不可忽略的是LLM检索准确率。如果单纯Token数量减少了，而准确率下降了，那意义就不大了。

4600

LLM 系列（十五）：Positional Encoding

磊叔的技术博客 1天前2025-11-24 09:07:55

位置编码的演进，是从一个为 “顺序失忆症” 打上的 “补丁”，演变为 Transformer 架构中（尤其是现代 LLM）最核心、最精妙的设计之一，以下表格总结...

3900

LLM 系列（十六）：输出采样

磊叔的技术博客 1天前2025-11-24 09:06:35

本文将深入探究从模型内部计算到最终词元选择的完整流程，从经典的确定性策略，到构成现代 LLM 基石的随机采样策略。

3900

LLM&RAG快速应用小册-极客时间

用户11859227 4天前2025-11-21 10:18:11

随着人工智能技术的飞速发展，大语言模型（LLM）已成为教育领域的重要辅助工具。然而，传统大模型在知识更新、事实准确性以及个性化内容生成方面仍存在局限。在此背景下...

7910

LLM&RAG快速应用小册

用户11919230 4天前2025-11-20 15:31:48

在当今的经济环境下，每一个企业都在寻找那把能够“降本增效”的黄金钥匙。传统的做法往往是优化流程、缩减预算，但这些手段的效果已逼近天花板。然而，一场由人工智能驱动...

12810

边缘LLM推理：闪存如何突破显存与性能瓶颈？

数据存储前沿技术 4天前2025-11-20 14:00:16

大型语言模型（LLM）正加速向资源受限的边缘设备渗透，但部署这些数十亿参数的模型面临巨大挑战。如何在有限的GPU显存（如PC的<16GB）和高昂的硬件成本间取得...

8910

LOBE-CHAT Docker 容器化部署指南

轩辕镜像 6天前2025-11-19 09:46:16

LOBE-CHAT 是一款开源、可扩展、高性能的聊天机器人框架，专注于支持私有 ChatGPT/LLM 网页应用部署。作为基于容器化架构的中间件，它提供了灵活的...

16810

161_艺术创作：LLM辅助音乐与绘画 - 2025年跨模态生成的创意链分析与实现技术研究

安全风信子 6天前2025-11-18 15:34:18

在2025年，人工智能技术，特别是大型语言模型(LLM)已经深刻改变了艺术创作的方式和边界。传统上，音乐作曲和视觉艺术创作被视为截然不同的领域，各自拥有独特的创...

11010

160_社交媒体分析：舆情监测 - 2025年LLM驱动的实时流情感聚类与多模态舆情洞察技术实现

安全风信子 6天前2025-11-18 15:13:29

在2025年，基于LLM嵌入的实时聚类算法是舆情监测系统的核心。这种算法结合了LLM的语义理解能力和现代聚类技术，能够实时识别和分组具有相似情感和主题的社交媒体...

11210

165_本专栏结束&制造业场景：LLM优化供应链预测 - 2025年基于生产日志的时间序列预测语义提取技术与实践

安全风信子 6天前2025-11-18 14:29:26

LLM具有强大的语义理解和特征提取能力，这使其在处理非结构化文本数据方面具有显著优势。LLM能够理解文本的上下文含义、识别关键实体和事件、提取隐含信息等。这些能...

12210

164_电商应用：个性化推荐与LLM - 2025年结合用户行为数据的智能推荐系统设计与实时性挑战分析

安全风信子 6天前2025-11-18 14:29:12

基于上述原则，我们设计了一个融合LLM的电商推荐系统架构。该架构主要包括数据层、特征工程层、召回层、排序层、LLM增强层和服务层六个核心部分。

13610

从网页到结构化数据，只需要一个 Prompt：LLM 解析器实战

jackcode 7天前2025-11-18 10:41:49

“帮我把这个页面的标题、时间、正文抓出来。” “又改版了，再修一下 XPath 吧。” “嗯？这个栏目怎么又换模板了？”

9010

DIFY-WEB Docker 容器化部署指南

轩辕镜像 7天前2025-11-18 10:29:19

DIFY-WEB是Dify.AI的前端应用Docker镜像，Dify是一款LLM应用开发平台，目前已支持超过10万款应用的构建。该平台集成了Backend as...

27210

Firecrawl - 让网页数据无缝适配LLM的高效工具

wangmcn 7天前2025-11-18 09:41:43

在 AI 大模型时代，获取高质量、结构化的网页数据是许多开发者和企业的核心需求。Firecrawl 作为一款专注于网页数据处理的 API 服务，凭借其强大的爬取...

13510

构建AI智能体：语言模型的“解码策略”：一文读懂AI文本生成的采样方法

未闻花名 7天前2025-11-18 08:18:51

不知道大家有没有刷到过一个趣味玩法，在输入法的文本框以一个什么字开头，一直按下一个下一个，可以生成一句看似完整且有趣的话，这是最早期的通过键盘记忆形成的词组文本...

21210

从 0 搭建 LLM 不再难！这个 PyTorch 项目帮你吃透大模型底层逻辑

fangpin 7天前2025-11-17 22:30:48

学习 LLM 的最好方式，从来不是 “看一百篇文章”，而是 “亲手写一遍代码”。llm-from-scratch就像一位 “耐心的导师”，把复杂的 Transf...

11700

首个基于LLM的开源音频大模型！阶跃星辰重磅开源Step-Audio-EditX：P声音如此简单！

AI生成未来 7天前2025-11-17 18:41:21

文章链接：https://arxiv.org/pdf/2511.03601 开源链接：https://github.com/stepfun-ai/Step-Au...

17810

vLLM中如何实现大模型推理加速技术？

aaronwjzhao 6天前2025-11-18 17:38:16

输入三个prompt，token长度分别是：31、29、30，vllm会concat成一个长度为90个token的输入，一次跑完prefill。

19721

#LLM

LLM调用的最佳数据格式：TOON，成本直降50%｜附Java使用指南

LLM 系列（十五）：Positional Encoding

LLM 系列（十六）：输出采样

LLM&RAG快速应用小册-极客时间

LLM&RAG快速应用小册

边缘LLM推理：闪存如何突破显存与性能瓶颈？

LOBE-CHAT Docker 容器化部署指南

161_艺术创作：LLM辅助音乐与绘画 - 2025年跨模态生成的创意链分析与实现技术研究

160_社交媒体分析：舆情监测 - 2025年LLM驱动的实时流情感聚类与多模态舆情洞察技术实现

165_本专栏结束&制造业场景：LLM优化供应链预测 - 2025年基于生产日志的时间序列预测语义提取技术与实践

164_电商应用：个性化推荐与LLM - 2025年结合用户行为数据的智能推荐系统设计与实时性挑战分析

从网页到结构化数据，只需要一个 Prompt：LLM 解析器实战

DIFY-WEB Docker 容器化部署指南

Firecrawl - 让网页数据无缝适配LLM的高效工具

构建AI智能体：语言模型的“解码策略”：一文读懂AI文本生成的采样方法

从 0 搭建 LLM 不再难！这个 PyTorch 项目帮你吃透大模型底层逻辑

首个基于LLM的开源音频大模型！阶跃星辰重磅开源Step-Audio-EditX：P声音如此简单！

vLLM中如何实现大模型推理加速技术？

热门专栏

腾讯开源的专栏

腾讯云服务器团队的专栏

腾讯技术工程官方号的专栏

深度学习思考者

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐