前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >解放双手:借助 AI 完成浏览器自动化! | 开源日报 No.313

解放双手:借助 AI 完成浏览器自动化! | 开源日报 No.313

作者头像
小柒
发布2024-07-31 19:14:25
3770
发布2024-07-31 19:14:25
举报
文章被收录于专栏:开源服务指南

Skyvern-AI/skyvernhttps://github.com/Skyvern-AI/skyvern

Stars: 5.5k License: AGPL-3.0

skyvern 是使用 LLMs 和计算机视觉自动化基于浏览器的工作流程。

  • 提供简单的 API 端点,完全自动化手动工作流程
  • 添加了计算机视觉和 LLMs 来解析实时视口中的项目,并与之交互
  • 可以在从未见过的网站上操作,无需定制代码
  • 抵抗网站布局更改,没有预先确定的 XPaths 或其他选择器系统正在寻找导航时
  • 利用 LLMs 推理交互以确保覆盖复杂情况

python/cpythonhttps://github.com/python/cpython

Stars: 61.3k License: NOASSERTION

cpython 是 Python 编程语言的官方实现。 该项目的主要功能、关键特性、核心优势包括:

  • 提供了 Python 编程语言的官方实现版本
  • 可在多个平台上构建和运行
  • 提供详细的文档和开发指南,方便开发者参与贡献
  • 支持各种构建选项和配置,并提供了相关的构建说明文档

NVIDIA/NeMohttps://github.com/NVIDIA/NeMo

Stars: 11.0k License: Apache-2.0

NeMo 是一个可扩展的生成式 AI 框架,专为研究大型语言模型、多模态和语音 AI(自动语音识别和文本到语音)的研究人员和开发人员构建。 NeMo 的主要功能、关键特性和核心优势包括:

  • 支持大型语言模型和多模态
  • 提供预训练模型和优化增强
  • 支持混合专家和强化学习
  • 可在任何云和本地环境中进行开发和扩展
  • 可以加速语音识别的准确性和速度

deepseek-ai/DeepSeek-V2https://github.com/deepseek-ai/DeepSeek-V2

Stars: 3.1k License: MIT

DeepSeek-V2 是一个强大、经济高效的专家混合语言模型。 该项目主要功能、关键特性和核心优势包括:

  • 拥有 236B 总参数,其中每个标记激活了 21B
  • 相较于 DeepSeek 67B,DeepSeek-V2 在提升性能的同时节省了 42.5% 的训练成本,并将最大生成吞吐量提升至 5.76 倍
  • 在多种基准测试和开放式生成评估中表现出显著性能
  • 提供模型下载、评估结果、模型架构以及 API 平台等信息

DataTalksClub/llm-zoomcamphttps://github.com/DataTalksClub/llm-zoomcamp

Stars: 2.5k License: NOASSERTION

llm-zoomcamp 是一个关于构建能够回答有关知识库问题的 AI 机器人的免费在线课程。

  • 10 周学习如何构建能够回答有关知识库问题的 AI 机器人
  • 覆盖 LLMs 和 RAG 等主题
  • 不需要先前接触过人工智能或机器学习
  • 提供预备课程研讨会、视频和代码资源
  • 计划涵盖 LLMs 和 RAG 介绍、自托管 LLMs、向量数据库与检索技术等内容
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-07-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 开源服务指南 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Skyvern-AI/skyvernhttps://github.com/Skyvern-AI/skyvern
  • python/cpythonhttps://github.com/python/cpython
  • NVIDIA/NeMohttps://github.com/NVIDIA/NeMo
  • deepseek-ai/DeepSeek-V2https://github.com/deepseek-ai/DeepSeek-V2
  • DataTalksClub/llm-zoomcamphttps://github.com/DataTalksClub/llm-zoomcamp
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档