Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Tornado异步模式

Tornado异步模式

作者头像
py3study
发布于 2020-01-15 09:02:45
发布于 2020-01-15 09:02:45
1.6K00
代码可运行
举报
文章被收录于专栏:python3python3
运行总次数:0
代码可运行

先介绍下背景:由于工作需要,前段时间又写了一段爬虫去获取和更新一些数据。之前爬虫主要用Scrapy框架批量爬取一些页面数据,或者用Gevent调用目标站点的接口。偶然看到了Tornado,听说这个框架很强大,所以打算这次爬虫用Tornado试试。不足之处,欢迎指正。

总的来说,Tornado是Python里面一个轻量的异步非阻塞的框架,性能非常不错,最新版本的异步协程是基于Python内置的asyncio来实现(老版本用装饰器实现异步)。Tornado可以用来做Web服务,或者利用其异步功能,完成一些异步执行的操作,比如爬虫(PySpider就是基于Tornado实现)。

本次任务,涉及到调用百度自然语言理解(NLU)平台UNIT的一些接口,实现一些自动化和批量操作,比如词槽导入导出,开始机器学习训练,批量测试语句等等。没有拿到百度UNIT平台的接口文档,所以只能通过爬虫形式,模拟用户登录,然后进行各种操作。为了让本篇看起来更简洁,本次不打算详细介绍如何爬取百度UNIT平台,统一调用httpbin(http://www.httpbin.org/get)进行简化。百度UNIT平台的爬虫后续再补充。

说了那么多,重点来了。Tornado两种异步模式:

1,add_callback(基于asyncio,资源消耗少,性能还不错)

2,run_in_executor((基于线程池/进程池,性能很好,但是资源消耗要高于add_callback的方案)

add_callback方案:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from tornado.ioloop import IOLoop, PeriodicCallback
import requests

# 业务逻辑操作写在这里
def job():
    url    = 'http://www.httpbin.org/get'
    resp   = requests.get(url)
    print(resp.text)


async def runner():
    loop   = IOLoop.current()
    #任务派发写在这里
    for i in range(10):
        loop.add_callback(job)

    print('This will be executed before loop is finished')


if __name__ == '__main__':
    IOLoop.current().run_sync(runner)

run_in_executor方案:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from tornado.ioloop import IOLoop, PeriodicCallback
import requests
from concurrent.futures import ThreadPoolExecutor

# 业务逻辑写在这里
def job():
    url    = 'http://www.httpbin.org/get'
    resp   = requests.get(url)
    print(resp.text)


async def runner():
    loop   = IOLoop.current()

    # 也可以用进程池ProcessPoolExecutor
    exectutor  = ThreadPoolExecutor(20)
    # 任务派发写在这里
    for i in range(10):
        loop.run_in_executor(exectutor, job)

    print('This will be executed before loop is finished')


if __name__ == '__main__':
    IOLoop.current().run_sync(runner)
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019/06/09 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
[译]Tornado协程
Tornado 4.3于2015年11月6日发布,该版本正式支持Python3.5的async/await关键字,并且用旧版本CPython编译Tornado同样可以使用这两个关键字,这无疑是一种进步。其次,这是最后一个支持Python2.6和Python3.2的版本了,在后续的版本了会移除对它们的兼容。现在网络上还没有Tornado4.3的中文文档,所以为了让更多的朋友能接触并学习到它,我开始了这个翻译项目,希望感兴趣的小伙伴可以一起参与翻译,项目地址是tornado-zh on Github,翻译好的文档在Read the Docs上直接可以看到。欢迎Issues or PR。
Jintao Zhang
2018/08/27
9980
Tornado入门(三)【协程】
在Tornado中,协程是推荐使用的异步方式。协程使用yield关键字暂停或者恢复执行,而不是回调链的方式。
用户2936342
2018/08/27
1.3K0
Tornado 源码阅读:初步认识
来源:国夫君 segmentfault.com/a/1190000002971992 ioloop `ioloop`是`tornado`的核心模块,也是个调度模块,各种异步事件都是由他调度的,所以必须弄清他的执行逻辑 源码分析 而`ioloop`的核心部分则是 `while True`这个循环内部的逻辑,贴上他的代码下 def start(self): if self._running: raise RuntimeError("IOLoop is already running") self.
小小科
2018/05/03
5980
Tornado 源码阅读:初步认识
爬虫性能相关
根据文章内容撰写摘要总结。
coders
2018/01/04
6460
【Tornado】协程队列和异步DNS解析器在Tornado项目里的实战表现已经运用详解
从队列中删除项目并将其返回。 返回可等待项目龙卷风。util在项目可用或引发after TimeoutError超时后解析。 超时可以是一个表示时间的数字(使用tornado.ioloop.ioloop.time,通常是time.time)datetime timedelta对象用于相对于当前时间的截止时间。指示先前排队的任务已完成。
上进小菜猪
2022/12/13
9230
把酒言欢话聊天,基于Vue3.0+Tornado6.1+Redis发布订阅(pubsub)模式打造异步非阻塞(aioredis)实时(websocket)通信聊天系统
    “表达欲”是人类成长史上的强大“源动力”,恩格斯早就直截了当地指出,处在蒙昧时代即低级阶段的人类,“以果实、坚果、根作为食物;音节清晰的语言的产生是这一时期的主要成就”。而在网络时代人们的表达欲往往更容易被满足,因为有聊天软件的存在。通常意义上,聊天大抵都基于两种形式:群聊和单聊。群聊或者群组聊天我们可以理解为聊天室,可以有人数上限,而单聊则可以认为是上限为2个人的特殊聊天室。
用户9127725
2022/08/08
2.2K0
把酒言欢话聊天,基于Vue3.0+Tornado6.1+Redis发布订阅(pubsub)模式打造异步非阻塞(aioredis)实时(websocket)通信聊天系统
tornado 的协程调度原理
菜皮日记
2023/12/18
2310
Python Web 框架:Tornado
**备注:** Tornado应该运行在类Unix平台,为了达到最佳的性能和扩展性,仅推荐Linux和BSD(充分利用Linux的epoll工具和BSD的kqueue达到高性能处理的目的)
周小董
2019/03/25
1.6K0
Python Web 框架:Tornado
tornado6与python3.7
On Python 3, IOLoop is always a wrapper around the asyncio event loop. 这是我重新复习tornado的原因,tornado放弃了之前自己实现的tornado.ioloop,全面拥抱asyncio的event_loop.这个改动是非常大的, 而且阅读tornado的源码可以发现其中大部分函数都支持了类型检验,和返回值提示,值得阅读.
py3study
2020/01/02
1.2K0
真正的 Tornado 异步非阻塞
專 欄 ❈正小歪,Python 工程师,主要负责 Web 开发和日志数据处理。博客文章《真正的 Tornado 异步非阻塞》、《使用 JWT 让你的 RESTful API 更安全》等多次入选知名技术社区每日精选。《使用 Shipyard 搭建 Docker 集群》被选入 Dockerone 周报。 个人博客: https://www.hexiangyu.me GitHub: https://github.com/zhengxiaowai❈ 其中 Tornado 的定义是 Web 框架和异步网络库,其中他
Python中文社区
2018/01/31
4.3K0
真正的 Tornado 异步非阻塞
Tornado集成Apscheduler
熟悉Python的人可能都知道,Apscheduler是python里面一款非常优秀的任务调度框架,这个框架是从鼎鼎大名的Quartz移植而来。
py3study
2020/01/15
2.1K0
Python自动化开发学习-爬虫3
讲师的博客:https://www.cnblogs.com/wupeiqi/p/6229292.html 在编写爬虫时,性能的消耗主要在IO请求中,当单进程单线程模式下请求URL时必然会引起等待,从而使得请求整体变慢。 比如找10个国外的资源爬取,慢的效果就很明显。
py3study
2020/01/06
6690
强大的异步爬虫 with aiohttp
看到现在网络上大多讲的都是requests、scrapy,却没有说到爬虫中的神器:aiohttp
小歪
2018/07/25
1.2K0
Python Web 框架:Tornado1.Tornado2.安装3.使用4.Tornado 代码解析
备注: Tornado应该运行在类Unix平台,为了达到最佳的性能和扩展性,仅推荐Linux和BSD(充分利用Linux的epoll工具和BSD的kqueue达到高性能处理的目的)
Python攻城狮
2018/08/23
7240
Python Web 框架:Tornado1.Tornado2.安装3.使用4.Tornado 代码解析
Python 异步爬虫原理解析及爬取实战
爬虫是 IO 密集型任务,比如我们使用 requests 库来爬取某个站点的话,发出一个请求之后,程序必须要等待网站返回响应之后才能接着运行,而在等待响应的过程中,整个爬虫程序是一直在等待的,实际上没有做任何的事情。
叶庭云
2022/05/08
9000
Python  异步爬虫原理解析及爬取实战
关于Tornado:真实的异步和虚假的异步
    我们知道Tornado 优秀的大并发处理能力得益于它的 web server 从底层开始就自己实现了一整套基于 epoll 的单线程异步架构,其他 web 框架比如Django或者Flask的自带 server 基本是基于 wsgi 写的简单服务器,并没有自己实现底层结构。而tornado.ioloop 就是 tornado web server 最底层的实现。
用户9127725
2022/08/08
6980
关于Tornado:真实的异步和虚假的异步
aiohttp 异步http请求-1.快速入门 get 请求示例
前言 在 python 的众多 http 请求库中,大家最熟悉的就是 requests 库了,requests 库上手非常容易,适合入门学习。 如果平常工作中对发请求不追求效率和并发的情况下,requests 完全可以满足大部分需求。但是想发大量的请求,比如几万个请求的时候,可能需要等待几个小时,requests 库就不能满足需求了。 初学者建议先学习requests 库,熟练掌握requests 库才能更好的学习 aiohttp 异步框架。 同步与异步 requests只能发送同步请求,aiohttp只能
上海-悠悠
2022/04/21
2.7K0
aiohttp 异步http请求-1.快速入门 get 请求示例
python 基于aiohttp的异步爬虫实战
钢铁知识库,一个学习python爬虫、数据分析的知识库。人生苦短,快用python。
钢铁知识库
2022/09/19
1.1K0
以寡治众各个击破,超大文件分片上传之构建基于Vue.js3.0+Ant-desgin+Tornado6纯异步IO高效写入服务
    分治算法是一种很古老但很务实的方法。本意即使将一个较大的整体打碎分成小的局部,这样每个小的局部都不足以对抗大的整体。战国时期,秦国破坏合纵的连横即是一种分而治之的手段;十九世纪,比利时殖民者占领卢旺达, 将卢旺达的种族分为胡图族与图西族,以图进行分裂控制,莫不如是。
用户9127725
2022/08/08
5040
以寡治众各个击破,超大文件分片上传之构建基于Vue.js3.0+Ant-desgin+Tornado6纯异步IO高效写入服务
大型fastapi项目实战 高并发请求神器之aiohttp(上) [建议收藏]
在 Python 众多的 HTTP 客户端中,最有名的莫过于 requests、aiohttp 和 httpx。在不借助其他第三方库的情况下,requests 只能发送同步请求;aiohttp 只能发送异步请求;httpx 既能发送同步请求,又能发送异步请求。在并发量大的情况下,如何高效的处理数据,异步是我们的优选,今天我们主要详解的是在生产环境广泛使用的 aiohttp。
python编程从入门到实践
2021/02/04
11K1
推荐阅读
相关推荐
[译]Tornado协程
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验