用 Python 中的 asyncio 轻松进行异步编程 - 构建快速且高效的应用程序

异步编程在现代软件开发中变得越来越重要，Python 的 asyncio 包提供了一组功能强大的工具，用于构建快速、可扩展且高效的异步应用程序。在本文中，我们将探讨什么是 asyncio、它是如何工作的，以及它的一些用例示例。

什么是异步？

Asyncio 是一个 Python 包，它提供事件循环、协程和其他用于构建异步应用程序的工具。它在 Python 3.4 中引入，此后成为该语言的标准部分。

asyncio 的核心是提供一个事件循环，这是一种允许多个任务在单个线程中并发运行的编程结构。这是通过使用协程实现的，协程是可以在执行过程中的特定点暂停和恢复的函数。通过在事件循环中使用协程，可以编写看似同步但实际上异步执行的代码。

异步如何工作？

asyncio 的核心是事件循环，它负责管理应用程序中的所有异步任务。当事件循环启动时，它首先等待事件发生。这些事件可能包括 I/O 操作（例如从套接字读取或写入文件）、计时器到期或其他异步任务。

当一个事件发生时，事件循环被唤醒并选择其中一个准备执行的任务。然后事件循环继续执行该任务，直到它完成或需要暂停（例如，等待另一个 I/O 操作完成）。此时，事件循环选择另一个任务来执行并继续该过程。

示例用例

让我们从简单到复杂探索一些示例，了解如何使用 asyncio 构建异步应用程序。

简单用例：并行 HTTP 请求

asyncio 的一个简单用例是发出并行 HTTP 请求。这是一个例子：

import asyncio
import aiohttp

async def fetch_url(session, url):
    async with session.get(url) as response:
        return await response.text()

async def main():
    async with aiohttp.ClientSession() as session:
        urls = [
            'https://www.toutiao.com',
            'https://www.taobao.com',
            'https://www.baidu.com'
        ]
        tasks = [fetch_url(session, url) for url in urls]
        results = await asyncio.gather(*tasks)
        print(results)

asyncio.run(main())

在这个例子中，我们使用 aiohttp 库来发出 HTTP 请求。我们定义了一个协程fetch_url，它接受一个会话和一个 URL 并返回响应文本。然后我们定义一个main协程，它创建一个会话和要获取的 URL 列表，为每个 URL 创建一个任务列表，然后用于asyncio.gather等待所有任务完成。最后，我们打印结果。

一般用例：网页抓取

asyncio 的另一个用例是网络抓取。这是一个例子：

import asyncio
import aiohttp
from bs4 import BeautifulSoup

async def fetch_url(session, url):
    async with session.get(url) as response:
        return await response.text()

async def scrape_page(session, url):
    html = await fetch_url(session, url)
    soup = BeautifulSoup(html, 'html.parser')
    links = [link.get('href') for link in soup.find_all('a')]
    return links

async def main():
    urls = [
        'https://www.python.org/',
        'https://www.baidu.com/',
        'https://www.toutiao.com/',
        'https://www.example.com/',
    ]

    async with aiohttp.ClientSession() as session:
        tasks = [asyncio.create_task(scrape_page(session, url)) for url in urls]
        pages = await asyncio.gather(*tasks)

    for url, links in zip(urls, pages):
        print(f'Links on {url}:')
        for link in links:
            print(link)

asyncio.run(main())

在这个用例中，我们使用 asyncio 和 aiohttp 来抓取网页并从中提取链接。我们定义了一个协程scrape_page，它接受一个会话和一个 URL，用fetch_url检索页面 HTML，然后使用 BeautifulSoup 解析 HTML 并提取所有链接。然后我们定义一个main协程，它创建一个会话和一个要抓取的 URL 列表，为每个 URL 创建一个任务列表，并用于asyncio.gather等待所有任务完成。

复杂用例：分布式系统

最后，让我们考虑一个更复杂的 asyncio 用例：构建分布式系统。在这个场景中，我们要构建一个由多个节点组成的系统，每个节点负责处理数据并与其他节点通信。我们将使用 asyncio 和asyncio.Queue类来实现这个系统。

import asyncio

async def worker(worker_id, queue):
    while True:
        item = await queue.get()
        print(f'Worker {worker_id} processing item {item}')
        await asyncio.sleep(1)
        queue.task_done()

async def main():
    num_workers = 3
    num_items = 10

    queue = asyncio.Queue()

    # 启动worker
		workers = [asyncio.create_task(worker(i, queue)) for i in range(num_workers)]
    
    # 添加项目到队列中
    for i in range(num_items):
        await queue.put(i)

    # 等待队列清空
    await queue.join()

    # 取消worker 
    for worker_task in workers:
        worker_task.cancel()

asyncio.run(main())

在这个例子中，我们定义了一个工作协程，它接受一个工作 ID 和一个队列，并重复等待一个项目被添加到队列中。当一个项目被添加时，worker 处理它（在这种情况下，只是打印一条消息并休眠 1 秒）然后通过调用 queue.task_done() 将项目标记为完成。然后我们定义一个主协程，它创建一个队列，启动一些工作任务，向队列添加一些项目，等待队列为空，然后取消工作任务。

这是一个非常简单的分布式系统示例，但它演示了如何使用 asyncio 和 asyncio.Queue 类来实现基本的消息传递系统。

为什么异步很重要？

异步编程在现代软件开发中变得越来越重要，尤其是在 Web 应用程序中。通过使用 asyncio，开发人员可以构建快速、可扩展且高效的异步应用程序，这些应用程序可以处理大量并发。

此外，asyncio 使编写兼具高性能和可读性的代码变得更加容易。通过使用协程和事件循环，开发人员可以编写看似同步且易于理解的代码，即使它实际上是异步执行的。

总体而言，asyncio 是任何想要构建快速、可扩展且高效的异步应用程序的 Python 开发人员的重要工具。无论您是构建简单的并行 HTTP 请求客户端还是复杂的分布式系统，asyncio 都能胜任。

展开阅读全文

页面更新：2024-03-21

标签：高效应用程序个协队列分布式定义快速轻松事件简单项目系统

1 2 3 4 5

用 Python 中的 asyncio 轻松进行异步编程 - 构建快速且高效的应用程序

什么是异步？

异步如何工作？

示例用例

简单用例：并行 HTTP 请求

一般用例：网页抓取

复杂用例：分布式系统

为什么异步很重要？

掌握VS项目配置「进阶」— 编译器链接器配置

「云原生」k8s 离线部署讲解和实战操作

誓圆超声电机之梦

强网络、重赋能、促协同，山东移动助力千兆城市建设迈上新台阶

击败OPPO和vivo，冲上5G安卓手机新增第一名，12GB+256GB才2059元

人工智能GPT爆火，揭露新型黑色产业链，民众失业率或将急剧攀升

河套连港深 “科创森林”处处涌动生机

国内5746家企业彻底退出芯片企业，中国芯未来渺茫？阿里摊牌了

全球海拔最高的洲-南极洲

穿越时空的奇迹：探索曲速推进器的可能性

都2023年了，为什么苹果还不舍得用曲面屏？

Take-Two CEO表示，AI将改进工具但它不会让人们制造出更好的GTA

Meta官宣深入AI大战！推出先进大型语言模型欲背刺ChatGPT

臭氧到底是“好气”还是“坏气”？

207米！广州“腾讯广州总部”最新工程进度

掌握VS项目配置「进阶」— 编译器链接器配置

杜国栋 - 投资项目债务人外逃后的境外追债

宝宝拉肚子怎么办？这个快速指南要收好

《原子之心》首批Mod分享自定义FOV/DLAA支持

十大改变中国历史走向的事件：沙丘之变

ThinkStation P358工作站评测：12核AMD处理器高能又高效

科技金融产出推动更多有关科技创新项目的发展以及科技

湖北襄阳新发地农批城再陷“烂尾”漩涡大量商铺公寓闲

美军通过无人机人脸识别项目引发个体目标可能被追杀

锂电池CCD视觉系统表面缺陷检测的关键作用!