部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >开源项目利用browser-use-webui和DeepSeek把浏览器打造成一个AI Agent智能体!

开源项目利用browser-use-webui和DeepSeek把浏览器打造成一个AI Agent智能体!

原创
作者头像
星哥玩云
发布于 2025-03-27 10:12:08
发布于 2025-03-27 10:12:08
96801
代码可运行
举报
文章被收录于专栏:星哥的AI自留地星哥的AI自留地
运行总次数:1
代码可运行

开源项目利用browser-use-webui和DeepSeek把浏览器打造成一个AI Agent智能体!

大家好,我是星哥,之前介绍了几款开源的AI Agent的项目,比如 OpenManus、autoMate 今天继续给大家带来一个开源AI Agent的项目。

browser-use和browser-use-webui

image-20250327180743081
image-20250327180743081

browser-use

简介:Make websites accessible for AI agents 开源地址: https://github.com/browser-use/browser-use

Browser-Use 是一个开源的网页自动化库,它通过提供一个简单的接口,让 LLM 能够与网站进行互动。这个库支持多标签管理、XPath 提取和视觉模型处理,使得自动化网页操作变得更加简单和高效。支持所有 LangChain 聊天模型,包括但不限于 GPT-4o、GPT-4o Mini、Claude 3.5 Sonnet 和 LLama 3.1 405B。这些模型都是当前领先的大型语言模型,能够处理各种复杂的语言相关任务。

browser-use-webui

browser-use开源地址: 简介:Run AI Agent in your browser. 开源地址:https://github.com/browser-use/web-ui

browser-use-webui 主要功能

提供了全新的网页界面,简单好用,方便操作。 支持更多大语言模型,比如 Gemini、OpenAI、Azure 等,哦,还有最近爆火的国产大模型 DeepSeek,未来还会加更多。 支持用自己的浏览器,不用再反复登录,还能录屏。 定制了更智能的 Agent,通过优化后的提示让浏览器使用更高效。

安装browser-use-webui

这个项目已在 Github 开源,想玩的都可以试试,用 Python 写的,版本必须在 3.11 以上。

系统环境

系统:Windows11专业版

CPU: 英特尔I7-13700KF

内存: 32G

硬盘:1T nvme SSD +4T 机械

显卡:RTX 4070 Ti

python版本:Python 3.13.2

第1步:克隆项目

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
git clone https://github.com/browser-use/web-ui.git
cd web-ui

第2步:设置Python环境

我们建议使用 uv 管理Python环境。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
uv venv --python 3.11

我这边不使用他的建议

用Anaconda Prompt

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
(base) C:\Users\Administrator>cd C:\Users\Administrator\Desktop\AI\web-ui
(base) C:\Users\Administrator\Desktop\AI\web-ui>
​
conda create -n browser_use_webui python=3.11
conda activate browser_use_webui

第3步:安装依赖

安装 Python包

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip install -r requirements.txt 
​
或者:pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple

安装浏览器插件

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
playwright install --with-deps chromium
​
playwright install
image-20250327165405905
image-20250327165405905

第4步:修改配置

把 .env.example 文件复制一份重命名为.env,用编辑器打开.env并添加API键和其他设置

默认的配置文件:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
OPENAI_ENDPOINT=https://api.openai.com/v1
OPENAI_API_KEY=ANTHROPIC_API_KEY=
ANTHROPIC_ENDPOINT=https://api.anthropic.com
​
GOOGLE_API_KEY=AZURE_OPENAI_ENDPOINT=
AZURE_OPENAI_API_KEY=
AZURE_OPENAI_API_VERSION=2025-01-01-preview
​
DEEPSEEK_ENDPOINT=https://api.deepseek.com
DEEPSEEK_API_KEY=MISTRAL_API_KEY=
MISTRAL_ENDPOINT=https://api.mistral.ai/v1
​
OLLAMA_ENDPOINT=http://localhost:11434ALIBABA_ENDPOINT=https://dashscope.aliyuncs.com/compatible-mode/v1
ALIBABA_API_KEY=MOONSHOT_ENDPOINT=https://api.moonshot.cn/v1
MOONSHOT_API_KEY=
​
# Set to false to disable anonymized telemetry
ANONYMIZED_TELEMETRY=false
​
# LogLevel: Set to debug to enable verbose logging, set to result to get results only. Available: result | debug | info
BROWSER_USE_LOGGING_LEVEL=info
​
# Chrome settings
CHROME_PATH=
CHROME_USER_DATA=
CHROME_DEBUGGING_PORT=9222
CHROME_DEBUGGING_HOST=localhost
# Set to true to keep browser open between AI tasks
CHROME_PERSISTENT_SESSION=false
CHROME_CDP=
# Display settings
# Format: WIDTHxHEIGHTxDEPTH
RESOLUTION=1920x1080x24
# Width in pixels
RESOLUTION_WIDTH=1920
# Height in pixels
RESOLUTION_HEIGHT=1080
​
# VNC settings
VNC_PASSWORD=youvncpassword
​

修改的配置

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 路径 Chrome 浏览器路径(检查下自己的路径),例如
# Mac OS "/Applications/Google Chrome.app/Contents/MacOS/Google Chrome"
# Windows "C:\Program Files\Google\Chrome\Application\chrome.exe"
CHROME_PATH="/Applications/Google Chrome.app/Contents/MacOS/Google Chrome"
​
# 浏览器的用户数据路径,例如
# Mac OS "/Users/<YourUsername>/Library/Application Support/Google/Chrome"
# Windows "C:\Users\<YourUsername>\AppData\Local\Google\Chrome\User Data"
CHROME_USER_DATA="/Users/<YourUsername>/Library/Application Support/Google/Chrome"
​
# 还有一些大模型的 API Key 也要改
...

我这边修改的chrome的地址,根据你电脑的环境填写。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
CHROME_PATH="C:\Program Files\Google\Chrome\Application\chrome.exe"
CHROME_USER_DATA="C:\Users\Administrator\AppData\Local\Google\Chrome\User Data"

第5步:启动运行

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
python webui.py --ip 127.0.0.1 --port 7788

浏览器访问 http://127.0.0.1:7788/,看到如下界面就成功了

image-20250327165725759
image-20250327165725759

完成安装browser-use-webui

使用browser-use-webui

1、配置 Agent

注意,这里的 “Use Vision”,默认是选中状态,如果使用的 DeepSeek 不能勾选,因为 DeepSeek 不支持视觉输入,注意这里很多人踩坑,一定要注意。

image-20250327165910582
image-20250327165910582

2、配置大模型

单击“LLM Settings”,我这边设置的硅基流动的 deepseek,你也可以用其他的

Base URL填写:https://api.siliconflow.cn/v1/chat/completions

API Key:填写自己申请到的key

model Name填写:deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

image-20250327171535436
image-20250327171535436

3、浏览器设置

设置一下分辨率

image-20250327171720830
image-20250327171720830

4、运行

点击,run agent

image-20250327171821021
image-20250327171821021

结果

结果是['404 page not found', '404 page not found', '404 page not found']

image-20250327175007903
image-20250327175007903
image-20250327175029033
image-20250327175029033

修改成openai的接口

用deepseek一直没有跑通,改成ChatGPT的接口再试试

image-20250327175426926
image-20250327175426926

git动画

browser-use-webui-google.agent_history
browser-use-webui-google.agent_history

用命令执行中文:

打开新浪,检索最近的10条新闻

browser-use-webui-sina.agent_history
browser-use-webui-sina.agent_history

最后

感兴趣的大家可以试试哦,安装browser-use-webui打造成一个AI Agent智能体。

写文不易,如果你都看到了这里,请点个赞和在看,分享给更多的朋友;也别忘了关注星哥玩云!这里有满满的干货分享,还有轻松有趣的技术交流~点个赞、分享给身边的小伙伴,一起成长,一起玩转技术世界吧! 😊

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
使用 browser-use-webui 进行网页信息填写和录入
在数字化时代,网页信息填写和录入是许多业务流程中的重要环节,例如注册账户、提交在线表单或更新个人信息。这些任务往往耗时且容易出错,而自动化工具的引入可以显著提高效率并减少人为失误。GitHub 上的 browser-use/web-ui 项目为这一需求提供了一个创新且实用的解决方案。
叶子Tenney
2025/03/13
1K0
使用 browser-use-webui 进行网页信息填写和录入
Deepseek-V3 计算机使用:这是一个完全免费的 AI 代理,一句话操控浏览器(Browser Use)
Hi,这里是Aitrainee,欢迎阅读本期新文章。 Deepseek V3模型推出后,社区里有许多基于这个模型做的实践。 以前有一个浏览器使用代理:Brow
AI进修生
2025/01/07
4.3K0
Deepseek-V3 计算机使用:这是一个完全免费的 AI 代理,一句话操控浏览器(Browser Use)
AI浏览器自动化实战
短短几个月内,Browser use 已在 GitHub 上获得超过 5 万颗 star:
程序员NEO
2025/04/16
4880
AI浏览器自动化实战
Browser Use - 让AI能够控制你的浏览器
在科技飞速发展的当下,人工智能(AI)已经渗透到我们生活的方方面面,而AI智能体与浏览器的连接,正逐渐成为互联网发展的全新趋势,引发了大众对上网体验变革的无限期待。这种创新的融合,就像是为传统浏览器插上了智能的翅膀,将为我们带来前所未有的互联网交互感受。
wangmcn
2025/03/18
6441
Browser Use - 让AI能够控制你的浏览器
在AI 智能体Agent行业:什么是computer-use和 broswer-use ?
近年来,随着大语言模型(LLM)和自主代理(Agent)技术的迅速发展,越来越多的企业和研发团队开始探索如何利用 AI 自动化日常任务。其中,“computer-use”与“browser-use”作为两种不同的应用模式,正逐渐成为业界关注的焦点。本文将深入解析这两种模式的概念、实现原理、应用场景以及未来的发展趋势。
猫头虎
2025/03/07
1.1K0
在AI 智能体Agent行业:什么是computer-use和 broswer-use ?
DeepSeek+PyTest+Browser Use:新一代UI自动化解决方案
当传统爬虫与测试工具遭遇瓶颈时,Browser Use + 大模型已悄然开启新范式——通过类人化决策链实现智能数据抓取与自适应UI测试,让代码拥有“人”的智慧:理解页面语义、模拟视觉判断、动态修正操作路径,真正突破规则化脚本的天花板!
老_张
2025/03/27
7140
DeepSeek+PyTest+Browser Use:新一代UI自动化解决方案
推荐一款Python开源的AI自动化工具:Browser Use
在当今数字化时代,自动化技术的发展日新月异,Python 凭借其简洁的语法和丰富的库资源,成为众多开发者实现自动化任务的首选语言。
测试开发技术
2025/01/14
7.9K0
推荐一款Python开源的AI自动化工具:Browser Use
一个8000行代码的开源项目,融了1700万美元:两人四天打造的Browser Use是如何闪电崛起的?
本周,初创公司 Browser Use 宣布完成 1700 万美元融资,由 Felicis Ventures 领投,A Capital、Nexus Ventures、Y Combinator、Paul Graham、Liquid2、SV Angel、Pioneer Fund 等跟投。
深度学习与Python
2025/03/31
2360
一个8000行代码的开源项目,融了1700万美元:两人四天打造的Browser Use是如何闪电崛起的?
Manus 无邀请码,试试 开源平替本地部署 OpenManus
OpenManus 出现后,邀请码一票难求,开源项目 OpenManus 团队称仅用3 小时就实现了初步功能,网传 OpenManus 提示词以及底层使用工具被爆出,现在你不用等邀请码,本文教你本地部署开源项目 OpenManus ,可直接对接本地私有大模型。
Lcry
2025/03/16
3160
Manus 无邀请码,试试 开源平替本地部署 OpenManus
一款由字节复刻Manus的开源AI自动化任务处理工具:LangManus,它通过LLM和网络搜索、网页爬取、浏览器控制等各种工具结合来实现任务自动化,可以实现本地部署使用,支持国产AI大模型API
在人工智能和自动化技术不断发展的今天,如何高效地将多个工具和智能体结合在一起,以完成复杂的任务,成为了众多开发者的挑战。LangManus应运而生,它通过集成大语言模型(LLM)、网络搜索、网页爬取和浏览器控制等多种工具,能够自动化处理多步骤复杂的研究任务。本文将详细介绍LangManus的架构、功能、安装和使用方法。
猫头虎
2025/03/23
2.2K0
一款由字节复刻Manus的开源AI自动化任务处理工具:LangManus,它通过LLM和网络搜索、网页爬取、浏览器控制等各种工具结合来实现任务自动化,可以实现本地部署使用,支持国产AI大模型API
AI智能体(六)
Dify是一个开源的Agent开发平台,使用Dify有两种方式,一种是使用Dify的在线平台。https://cloud.dify.ai。
算法之名
2025/02/06
3560
AI智能体(六)
如何在本地部署开源通用智能体OpenManus &OpenManus-OWL项目?
近期,国内团队推出的通用型AI Agent产品Manus因在GAIA基准测试中刷新性能记录引发行业关注,其"手脑协同"能力可完成简历筛选、旅行规划等复杂任务,内测邀请码一度被炒至数万元。但对于开发者而言,依赖商业产品存在技术黑箱与成本限制。值得庆幸的是,Meta GPT团队与Camel团队已分别开源了 OpenManus和OpenManus-OWL ,为开发者提供了自主部署的解决方案。本文将深入解析本地部署的技术路径与替代方案。
猫头虎
2025/03/09
1.4K0
AI智能体研发之路-工程篇(二):Dify智能体开发平台一键部署
先分享dify项目的github:https://github.com/langgenius/dify
LDG_AGI
2024/08/13
7.1K0
AI智能体研发之路-工程篇(二):Dify智能体开发平台一键部署
不只有Manus!免邀请码的 flowith 和三个开源项目:GWL、OpenHands、browser-use
昨天发了一篇文章提到了开源复刻 Manus 的项目:《一文看懂Manus:实测体验+开源复刻方案,无需等待邀请码》,有朋友推荐了另外一个23年已经发布的项目 OWL。
技术人生黄勇
2025/03/10
9890
不只有Manus!免邀请码的 flowith 和三个开源项目:GWL、OpenHands、browser-use
使用LangGraph构建你的第一个AI Agent-附完整代码
AI Agent 指的是有能力主动思考和行动的智能体,能够以类似人类的方式工作,通过大模型来“理解”用户需求,主动“规划”以达成目标,使用各种“工具”来完成任务,并最终“行动”执行这些任务。
wayn
2025/04/18
3100
使用LangGraph构建你的第一个AI Agent-附完整代码
完全开源!全新多合一AI智能体框架来了:无缝支持多种工具、多种任务
AI智能体(AI Agent)正在成为技术领域的焦点,尤其是随着OpenAI、Anthropic等大模型提供商不断增强其API能力,构建自主AI智能体的门槛正在显著降低。
新智元
2025/05/12
1450
完全开源!全新多合一AI智能体框架来了:无缝支持多种工具、多种任务
一个让AI投简历帮自己找工作的 AI Agent
它能够查看你的简历,通过网络为你精准匹配合适的工作机会,并且还能代你撰写工作申请。
AIGC新知
2025/01/10
2200
一个让AI投简历帮自己找工作的 AI Agent
Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页
AI智能体可能还没有一个大家都认可的定义,但这并不妨碍一大堆创业公司争相打造智能体工具,来自动化处理各种任务。
新智元
2025/03/27
1470
Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页
有点尴尬,Manus的饥饿营销被OpenManus开源项目击碎,部署即用,不用邀请码
这一周最火的当属 "Manus" 了,通过官方提供的演示视频真的让人惊叹,网友一码难求。不过反转来的有点太快,有一个团队5个人3个小时就解决了这个难题,并且还给开源出来了,导致天价邀请码崩盘。让我们一起看看怎么回事?
create17
2025/03/17
1620
有点尴尬,Manus的饥饿营销被OpenManus开源项目击碎,部署即用,不用邀请码
从 Arc,Dia,Fellou之后,一码难求,AI 的风刮到了浏览器?
自manus之后,浏览器(browser-use)重新进入人们的视野,这种新产品的交互模式打开了一种新的思路。
AIGC新知
2025/04/24
5860
从 Arc,Dia,Fellou之后,一码难求,AI 的风刮到了浏览器?
推荐阅读
使用 browser-use-webui 进行网页信息填写和录入
1K0
Deepseek-V3 计算机使用:这是一个完全免费的 AI 代理,一句话操控浏览器(Browser Use)
4.3K0
AI浏览器自动化实战
4880
Browser Use - 让AI能够控制你的浏览器
6441
在AI 智能体Agent行业:什么是computer-use和 broswer-use ?
1.1K0
DeepSeek+PyTest+Browser Use:新一代UI自动化解决方案
7140
推荐一款Python开源的AI自动化工具:Browser Use
7.9K0
一个8000行代码的开源项目,融了1700万美元:两人四天打造的Browser Use是如何闪电崛起的?
2360
Manus 无邀请码,试试 开源平替本地部署 OpenManus
3160
一款由字节复刻Manus的开源AI自动化任务处理工具:LangManus,它通过LLM和网络搜索、网页爬取、浏览器控制等各种工具结合来实现任务自动化,可以实现本地部署使用,支持国产AI大模型API
2.2K0
AI智能体(六)
3560
如何在本地部署开源通用智能体OpenManus &OpenManus-OWL项目?
1.4K0
AI智能体研发之路-工程篇(二):Dify智能体开发平台一键部署
7.1K0
不只有Manus!免邀请码的 flowith 和三个开源项目:GWL、OpenHands、browser-use
9890
使用LangGraph构建你的第一个AI Agent-附完整代码
3100
完全开源!全新多合一AI智能体框架来了:无缝支持多种工具、多种任务
1450
一个让AI投简历帮自己找工作的 AI Agent
2200
Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页
1470
有点尴尬,Manus的饥饿营销被OpenManus开源项目击碎,部署即用,不用邀请码
1620
从 Arc,Dia,Fellou之后,一码难求,AI 的风刮到了浏览器?
5860
相关推荐
使用 browser-use-webui 进行网页信息填写和录入
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档