你训练大语言模型(LLM)用的什么框架?有没有想过不用框架训练 GPT-2?
GitHub 上就有这么一位大神(Andrej Karpathy),他仅用大约 1k 行的 C 代码就完成了 GPT-2 模型的训练,代码纯手撸、不依赖任何机器学习框架,作者这么做仅仅是觉得很有趣。尽管这个项目(llm.c)的教学意义大于实用价值,但开源一周便收获了 15k Star,可见大家对他技术的认可和惊叹。
目光回到本周其他的开源热搜项目,在线的数据库设计工具 DrawDB 和程序员专属的在线工具集合 it-tools,它们方便快捷、点开就能用。Spring 框架也想要赶上 AI 潮流,推出了帮助开发 AI 应用的 Spring 框架 spring-ai,旨在简化开发 AI 应用的复杂度。开源的托管网站平台 Coolify,让你通过点点就能部署在线服务。看来不管是硬核的手撸框架,还是提供便利的工具,在 GitHub 上都是很受欢迎的。
1. 开源新闻
上面说的 llm.c 项目(github.com/karpathy/llm.c)作者 Andrej Karpathy,他博士就读于斯坦福大学,曾就职于特斯拉的自动驾驶部门负责人、OpenAI 的创始成员。
Andrej Karpathy 热衷于深度神经网络和开源,在 GitHub 上有 71k 的粉丝。他的另外一个开源项目 nanoGPT,也是 GitHub 热榜(Trending)的常客。
nanoGPT 是用于训练/微调中等规模 GPT 模型的库。它是对 minGPT 的重写,这次的重点是速度和效率而不是教育性,值得一提的是 minGPT 的作者也是 Andrej Karpathy。
GitHub 地址:github.com/karpathy/nanoGPT
主语言:JavaScript,Star:4.7k,周增长:3.8k
这个开源项目是一个免费、简单、强大的数据库实体关系(DBER)在线编辑器,无需注册即可直接在浏览器中使用。它提供了直观、可视化的操作界面,用户通过点击即可构建数据库表和导出建表语句,还可以导入建表语句,实现可视化编辑、错误检查等。支持 MySQL、PostgreSQL、SQLite、MariaDB、SQL Server 共 5 种常用的关系数据库。
GitHub 地址→github.com/drawdb-io/drawdb
主语言:Java,Star:1.7k,周增长:300
这是由 Spring 官方开源的用于简化包含 AI 功能的应用开发的 Java 框架,它可以轻松接入 OpenAI、Microsoft、Amazon、Google 和 Huggingface 等主流模型供应商,以及聊天、文本生成图像的模型类型,支持提示工程、AI 模型转 POJO 对象、矢量数据库、RAG(检索增强生成)等有助于开发 AI 应用的功能。
GitHub 地址→github.com/spring-projects/spring-ai
主语言:PHP,Star:13k,周增长:800
这是一个免费、自托管、可替代 Heroku / Netlify / Vercel 等平台的开源项目,它提供了一个 Web 平台,用户可以在上面管理、部署各种 Web 应用和数据库服务,比如多种编程语言的动态网站、静态网页、WordPress、MongoDB、Redis 等。不挑服务器可以是自己的服务器,也可以是任意云服务器,只要支持 SSH 连接即可,服务器最低配置仅需 2C2G 即可。
GitHub 地址→github.com/coollabsio/coolify
主语言:Vue,Star:9.9k,周增长:500
该项目采用 Vue.js(Vue 3)和 Naive UI 组件库开发,汇集了对开发人员和 IT 从业者有用的工具。它免费、界面清爽、功能丰富,支持包括中文在内的多国语言,提供了加密、转化器、网络、文本等开发常用工具。
GitHub 地址→github.com/CorentinTh/it-tools
主语言:TypeScript、Python,Star:31k,周增长:300
该项目利用生成式 AI 的能力,成为你的第二大脑。你可以将多种格式的文本、数据、语言和视频上传给它,之后再和它对话时,它会学习你上传的内容后回答你的问题,支持接入多种 LLM 和 Docker 一键部署。
GitHub 地址→github.com/QuivrHQ/quivr
在这个章节,将会分享下本周 HelloGitHub 网站上的热门开源项目,欢迎与我们分享你上手这些开源项目后的使用体验。
主语言:Other
这是一份包含后端、前端、运维部署等方向的学习路径图,提供了全面、实用、交互式的学习指南,解决开发者面临技术选型困难、自学路径不明晰等痛点。
项目详情→hellogithub.com/repository/50587cd6e95e4fb0b3c787104028e9d2
主语言:Rust
该项目可以在终端上模拟一些很忙的假象,比如编译、扫描、下载等。这些操作都是假的,实际上什么都没有发生,所以不会影响你的电脑,适用于 Windows、Linux、macOS 操作系统。
项目详情→hellogithub.com/repository/6a78a0168ffc4a9f931b0ac1983aea9f
无论是崇拜大神们的技术造诣,还是探索开源世界中的新奇工具,都希望大家可以从中获得启发和收获。如果看完这些还不过瘾,可以通过阅读往期回顾的内容,找到更多热门开源项目。