如何使用Python发送HTTP请求(requests库)?

答案:使用requests库可简洁发送HTTP请求。通过get()、post()等方法发送请求,配合params、headers、json等参数传递数据,利用raise_for_status()处理错误,使用Session保持会话、复用连接,提升效率与代码可读性

如何使用python发送http请求(requests库)?

Python中发送HTTP请求,最简洁、最符合直觉的方式莫过于使用

requests

库。它将底层HTTP连接的复杂性封装得很好,让我们能以一种非常“Pythonic”的风格来与Web服务交互,无论是获取数据、提交表单还是处理API调用,都变得异常轻松。

解决方案

使用

requests

库发送HTTP请求,核心在于调用其提供的各种请求方法,如

get()

post()

put()

delete()

等。首先,你得确保你的环境中安装了它:

pip install requests

安装完毕,我们就可以开始使用了。最常见的操作是发送GET请求来获取资源,比如从一个API端点拉取数据:

import requests# 1. 发送一个简单的GET请求try:    response = requests.get('https://api.github.com/users/octocat')    # 检查响应状态码,如果不是200,会抛出HTTPError    response.raise_for_status()    # 打印响应内容    print("GET请求成功!")    print(f"状态码: {response.status_code}")    print(f"响应头: {response.headers['Content-Type']}")    print(f"响应JSON数据: {response.json()}")except requests.exceptions.HTTPError as errh:    print(f"HTTP错误: {errh}")except requests.exceptions.ConnectionError as errc:    print(f"连接错误: {errc}")except requests.exceptions.Timeout as errt:    print(f"超时错误: {errt}")except requests.exceptions.RequestException as err:    print(f"其他请求错误: {err}")print("-" * 30)# 2. 发送一个POST请求,通常用于提交数据# 假设我们想向一个虚拟的API提交一些数据post_data = {    'name': 'John Doe',    'email': 'john.doe@example.com',    'message': 'Hello from Python requests!'}# 对于JSON数据,使用json参数更方便,requests会自动设置Content-Type为application/jsontry:    post_response = requests.post('https://httpbin.org/post', json=post_data)    post_response.raise_for_status()    print("POST请求成功!")    print(f"状态码: {post_response.status_code}")    print(f"服务器收到的JSON数据: {post_response.json()['json']}")except requests.exceptions.RequestException as err:    print(f"POST请求错误: {err}")print("-" * 30)# 3. 发送带查询参数的GET请求# 比如搜索GitHub仓库params = {'q': 'requests+language:python', 'sort': 'stars', 'order': 'desc'}try:    search_response = requests.get('https://api.github.com/search/repositories', params=params)    search_response.raise_for_status()    print("带参数的GET请求成功!")    print(f"第一个搜索结果的名称: {search_response.json()['items'][0]['full_name']}")except requests.exceptions.RequestException as err:    print(f"带参数的GET请求错误: {err}")

这段代码展示了

requests

库的几个核心功能:发送GET和POST请求,处理JSON数据,以及如何优雅地处理网络请求中可能出现的各种错误。你会发现,它真的把HTTP的复杂性隐藏得很好,让开发者能专注于业务逻辑本身。

立即学习“Python免费学习笔记(深入)”;

处理请求中的常见错误和异常,确保代码健壮性

在实际的Web交互中,网络请求往往是脆弱的,各种意外情况层出不穷:网络中断、服务器无响应、请求超时、认证失败、API返回错误状态码等等。因此,仅仅发送请求是不够的,我们必须妥善处理这些潜在的错误,才能让我们的程序足够健壮。

requests

库在这方面做得相当不错,它将不同类型的错误封装在

requests.exceptions

模块下。最基础的,我们通常会用

try...except

块来捕获这些异常。例如,

requests.exceptions.ConnectionError

会在无法连接到服务器时抛出,

requests.exceptions.Timeout

则在请求超时时触发。

但我个人觉得,最常用也最关键的一个是

response.raise_for_status()

。这个方法非常巧妙,它会检查响应的状态码。如果状态码表示一个客户端错误(4xx)或服务器错误(5xx),它就会自动抛出一个

requests.exceptions.HTTPError

。这省去了我们手动检查

response.status_code >= 400

的麻烦,让错误处理逻辑更加清晰。

举个例子,假设你正在调用一个需要认证的API,但你忘记传递Token,服务器很可能会返回一个401 Unauthorized。如果你没有使用

raise_for_status()

,你的代码可能会继续尝试解析响应体,最终因为响应体不是预期的JSON格式而崩溃。但有了它,程序会立即抛出

HTTPError

,我们就能在

except

块中捕获并处理,比如记录日志、重试或者通知用户。

import requests# 尝试访问一个不存在的页面,预期会得到404try:    bad_response = requests.get('https://httpbin.org/status/404')    bad_response.raise_for_status() # 这里会抛出HTTPError    print("这个不应该被打印出来")except requests.exceptions.HTTPError as e:    print(f"捕获到HTTP错误: {e}")    print(f"错误状态码: {e.response.status_code}")except requests.exceptions.RequestException as e:    print(f"捕获到其他请求错误: {e}")# 模拟一个连接超时try:    # 设置一个非常短的超时时间,例如0.001秒    requests.get('https://www.google.com', timeout=0.001) except requests.exceptions.Timeout as e:    print(f"捕获到超时错误: {e}")except requests.exceptions.RequestException as e:    print(f"捕获到其他请求错误: {e}")

通过这样的组合,我们不仅能应对网络连接层面的问题,也能有效处理HTTP协议层面的错误,让程序在面对各种“不确定性”时,依然能保持优雅和稳定。

如何发送带参数、头部或认证信息的复杂请求?

很多时候,简单的GET或POST请求是远远不够的。真实的Web服务往往要求我们发送更复杂的请求,比如带查询参数、自定义HTTP头部、表单数据、JSON负载,甚至是各种形式的认证信息。

requests

库对此提供了非常直观的接口。

1. 查询参数 (Query Parameters):前面已经提过,对于GET请求,我们可以通过

params

参数传递一个字典,

requests

会自动将其编码并附加到URL后面。

# 搜索GitHub仓库,指定语言和排序方式params = {'q': 'python web framework', 'language': 'python', 'sort': 'stars', 'order': 'desc'}response = requests.get('https://api.github.com/search/repositories', params=params)print(f"查询参数请求URL: {response.url}")

这样,URL就会变成类似

https://api.github.com/search/repositories?q=python+web+framework&language=python&sort=stars&order=desc

2. 自定义HTTP头部 (Custom Headers):HTTP头部非常重要,它承载着请求的元数据,比如

User-Agent

(标识客户端类型)、

Content-Type

(请求体的媒体类型)、

Authorization

(认证凭证)等。通过

headers

参数,我们可以传递一个字典来设置这些头部。

headers = {    'User-Agent': 'MyCustomPythonApp/1.0',    'Accept': 'application/json',    'X-Custom-Header': 'Hello from Python'}response = requests.get('https://httpbin.org/headers', headers=headers)print("自定义头部请求响应:")print(response.json()['headers']) # httpbin会回显所有收到的头部

这在与某些需要特定User-Agent或API Key的API交互时尤其有用。

3. 表单数据 (Form Data):当我们需要模拟HTML表单提交时,通常是POST请求,并且数据以

application/x-www-form-urlencoded

格式发送。

requests

通过

data

参数处理这种场景,传入一个字典即可。

form_data = {    'username': 'testuser',    'password': 'testpassword'}response = requests.post('https://httpbin.org/post', data=form_data)print("表单数据提交响应:")print(response.json()['form']) # httpbin会回显收到的表单数据

4. JSON数据 (JSON Payload):现代API通常期望请求体是JSON格式。

requests

提供了

json

参数,它会自动将Python字典序列化为JSON字符串,并设置

Content-Type

application/json

。这比手动

json.dumps()

并设置

headers

要方便得多。

json_payload = {    'title': 'My New Post',    'body': 'This is the content of my new post.',    'userId': 1}response = requests.post('https://jsonplaceholder.typicode.com/posts', json=json_payload)print("JSON数据提交响应:")print(f"状态码: {response.status_code}")print(response.json())

5. 认证 (Authentication):

requests

内置了对基本认证(Basic Authentication)和摘要认证(Digest Authentication)的支持。

基本认证:

from requests.auth import HTTPBasicAuthresponse = requests.get('https://httpbin.org/basic-auth/user/passwd', auth=HTTPBasicAuth('user', 'passwd'))print(f"基本认证响应状态: {response.status_code}")print(response.json())

更简洁的方式是直接传入一个元组:

auth=('user', 'passwd')

OAuth等复杂认证:对于OAuth或其他更复杂的认证机制,通常需要手动在

headers

中添加

Authorization

字段,或者使用专门的库(如

requests-oauthlib

)来生成认证头部。

这些选项的组合使用,让

requests

能够应对几乎所有常见的HTTP请求场景。它强大的功能和简洁的API,确实是Python进行网络编程的首选工具

何时应该使用Requests会话(Session)以及它的优势?

在许多Web交互场景中,我们不仅仅是发送单个独立的请求。我们可能会进行一系列相关的请求,例如:先登录,然后访问用户个人资料,接着提交一个表单。在这些连续的请求中,通常需要保持一些状态,比如认证凭证(cookies)、自定义的头部信息,甚至是底层的TCP连接。这时候,

requests.Session

对象就显得非常重要和高效了。

我发现,很多初学者在进行一系列请求时,往往会重复地在每个

requests.get()

requests.post()

调用中设置相同的

headers

params

cookies

。这不仅代码冗余,而且效率低下,因为每次独立的请求都可能需要重新建立TCP连接,并重新进行SSL/TLS握手,这会带来不必要的延迟。

requests.Session

的作用正是为了解决这些问题。当你创建一个

Session

对象后,它会为你维护以下几个关键特性:

持久化Cookies:

Session

对象会自动在请求之间存储和发送cookies。这意味着如果你在登录请求中收到了认证cookie,后续所有通过该

Session

发送的请求都会自动携带这个cookie,无需手动管理。默认参数: 你可以为

Session

对象设置默认的

headers

params

auth

等。这些设置会自动应用到所有通过该

Session

发送的请求上,极大地简化了代码。TCP连接复用: 这是性能上的一大优势。

Session

对象会尽可能地复用底层的TCP连接。这意味着在发送多个请求到同一个主机时,不需要每次都重新建立连接,从而减少了网络延迟和资源消耗。尤其是在高并发或对延迟敏感的应用中,这一点至关重要。

让我们通过一个例子来看看

Session

的实际应用:

import requests# 创建一个Session对象s = requests.Session()# 为Session设置默认的User-Agent头部s.headers.update({'User-Agent': 'MyPersistentPythonClient/1.0'})# 1. 模拟登录,获取cookies# 假设这是一个登录接口,成功后会返回认证cookielogin_url = 'https://httpbin.org/cookies/set/sessioncookie/12345'login_response = s.get(login_url)print(f"登录响应状态码: {login_response.status_code}")print(f"Session中的Cookies (登录后): {s.cookies.get('sessioncookie')}")# 2. 访问一个需要认证的页面# 这个请求会自动带上Session中存储的cookieprotected_url = 'https://httpbin.org/cookies'protected_response = s.get(protected_url)print(f"访问受保护页面响应状态码: {protected_response.status_code}")print(f"受保护页面收到的Cookies: {protected_response.json()['cookies']}")# 3. 发送一个POST请求,它也会使用Session的默认头部post_data = {'item': 'new_product'}post_response = s.post('https://httpbin.org/post', data=post_data)print(f"POST请求响应状态码: {post_response.status_code}")print(f"POST请求使用的User-Agent: {post_response.json()['headers']['User-Agent']}")# 清理Session,关闭连接(可选,通常在程序结束时自动进行)s.close()

在这个例子中,

s

这个

Session

对象就像一个“记忆体”,它记住了登录时获取的

sessioncookie

,并在后续访问受保护页面时自动带上。同时,我们只设置了一次

User-Agent

,它就被所有通过

s

发出的请求所共享。更重要的是,在后台,

requests

会尝试复用与

httpbin.org

之间的TCP连接,从而提升了效率。

总而言之,当你需要进行一系列相互关联的HTTP请求,或者对性能有较高要求时,

requests.Session

是你的不二之选。它能让你的代码更简洁、更高效,并且更好地模拟真实用户的浏览行为。

以上就是如何使用Python发送HTTP请求(requests库)?的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1369712.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月14日 09:53:56
下一篇 2025年12月14日 09:54:14

相关推荐

  • Python中的*args和**kwargs有什么作用和区别?

    args和kwargs用于增强函数灵活性,args收集位置参数为元组,kwargs收集关键字参数为字典,二者在函数定义中收集参数,在调用时可解包传递,适用于可变参数场景。 *args 和 **kwargs 是Python中两个非常强大的语法糖,它们允许函数接受可变数量的参数。简单来说, *args …

    好文分享 2025年12月14日
    000
  • 如何反转一个字符串?

    反转字符串的核心是将字符顺序倒置,常用方法包括语言内置函数(如Python切片、JavaScript的split-reverse-join)、手动循环和递归。内置方法最简洁高效,时间复杂度O(n),推荐优先使用;手动循环适用于需精细控制的场景;递归虽优雅但有栈溢出风险,慎用于长字符串。实际应用包括回…

    2025年12月14日
    000
  • 使用 Matplotlib 和 Seaborn 进行数据可视化

    Matplotlib 提供精细控制,Seaborn 简化统计绘图,两者结合可高效实现数据可视化:先用 Seaborn 快速探索数据,再用 Matplotlib 调整细节与布局,实现美观与功能的统一。 在使用 Python 进行数据可视化时,Matplotlib 和 Seaborn 无疑是两把利器。它…

    2025年12月14日
    000
  • Python中处理包含转义字符的JSON字符串:深入理解原始字符串与F-字符串

    本文深入探讨了在Python中处理包含转义字符的JSON字符串时,原始字符串(r前缀)和F-字符串(f前缀)的使用误区与正确实践。核心问题在于Python字符串字面量解析与JSON转义规则之间的差异,特别是在使用json.loads()解析嵌套JSON或包含反斜杠的字符串时。文章将通过具体示例,阐明…

    2025年12月14日
    000
  • 优雅地终止长时间运行的Asyncio任务:Asyncio.Event的实践指南

    本文深入探讨了在Python asyncio中优雅地终止长时间运行的异步任务的有效方法。针对Task.cancel()方法在某些场景下无法立即停止任务的问题,本文提出并详细阐述了如何利用asyncio.Event机制实现任务的受控停止。通过具体代码示例,读者将学习如何构建响应式、可控的异步任务,确保…

    2025年12月14日
    000
  • 优雅地终止异步任务:asyncio.Event的实践应用

    在asyncio编程中,Task.cancel()方法有时无法按预期停止长时间运行的任务,因为它依赖于任务内部处理CancelledError或在await点检查取消状态。本文将深入探讨Task.cancel()的局限性,并介绍一种更可靠、更优雅的协作式终止机制:使用asyncio.Event。通过…

    2025年12月14日
    000
  • Pandas中条件滚动累加的向量化实现

    本文旨在解决Pandas DataFrame中基于条件和时间窗口进行累加计算的效率问题。通过详细分析迭代方法的局限性,并引入Pandas groupby_rolling函数,展示了如何高效地对指定分组内的历史数据在特定时间窗内进行条件求和。教程提供了示例代码,并强调了数据预处理、排序及窗口定义等关键…

    2025年12月14日
    000
  • asyncio 长运行任务的优雅终止策略:告别 cancel() 的局限性

    本文探讨了 asyncio 中 Task.cancel() 方法在终止长时间运行任务时的局限性,特别是当任务内部循环紧密或不频繁地让出控制权时。我们提出并详细演示了使用 asyncio.Event 实现协作式、优雅的任务终止机制,通过共享事件对象,允许主程序安全地向后台任务发送停止信号,确保任务能够…

    2025年12月14日
    000
  • 如何实现对象的比较操作(__eq__, __lt__等)?

    要实现自定义对象的比较,需定义富比较方法如__eq__、__lt__等,确保类型检查时返回NotImplemented,并通过functools.total_ordering简化代码;若重写__eq__,还需正确实现__hash__以保证对象可哈希,尤其在对象不可变时基于相等属性计算哈希值;对于包含…

    2025年12月14日 好文分享
    000
  • 优雅地停止 asyncio 长运行任务:asyncio.Event 的应用

    asyncio.Task.cancel() 并非总能立即停止长运行任务,尤其当任务不主动处理取消信号时。本文将介绍一种更可靠的机制:利用 asyncio.Event 对象实现异步背景任务的优雅停止。通过让任务定期检查 Event 状态,我们可以在外部发出停止信号,从而确保任务在适当的时机安全退出,避…

    2025年12月14日
    000
  • 如何使用 unittest 或 pytest 进行单元测试?

    unittest和pytest是Python中主流的测试框架,前者是标准库、需继承TestCase类,后者更灵活、支持原生assert;推荐根据项目需求选择,pytest适合大多数场景,而unittest适用于无外部依赖限制的项目。 unittest 和 pytest 都是Python生态中用于编写…

    2025年12月14日
    000
  • 谈谈 Python 的鸭子类型(Duck Typing)和多态

    鸭子类型与多态使Python代码灵活且可扩展,其核心在于对象的行为而非类型,只要对象具有所需方法即可被调用,无需继承特定类或实现接口。这与Java等静态语言依赖显式接口不同,Python在运行时动态检查行为,实现“经验式”多态。这种设计提升代码复用性与扩展性,但也需通过单元测试、文档、类型提示(如P…

    2025年12月14日
    000
  • 详解 Python 的垃圾回收机制:引用计数与分代回收

    Python的垃圾回收机制主要通过引用计数和分代回收协同工作。引用计数即时回收无引用对象,实现高效内存管理,但无法处理循环引用;分代回收则通过将对象按存活时间分为三代,定期检测并清除循环引用,弥补引用计数的不足。两者结合,既保证了内存释放的及时性,又解决了复杂场景下的内存泄露问题,构成了Python…

    2025年12月14日
    000
  • 解决Docker中Uvicorn/FastAPI连接拒绝问题的实用指南

    本文旨在解决Uvicorn/FastAPI应用在Docker容器中运行时,宿主机无法连接的常见“连接拒绝”错误。核心问题在于Docker容器的端口未正确映射到宿主机。我们将详细探讨Uvicorn配置、Dockerfile设置以及关键的Docker端口映射命令,提供清晰的步骤和示例,确保您的FastA…

    2025年12月14日
    000
  • 通过requirements.txt文件为pip安装传递构建配置

    本文将指导您如何在Python项目的requirements.txt文件中,利用pip install命令的–config-settings选项,为特定包传递构建时配置或环境变量。这对于需要特殊编译参数的包(如在安装ctransformers时启用CT_METAL)至关重要,确保安装过程…

    2025年12月14日
    000
  • 类变量和实例变量有什么区别?

    类变量属于类本身,被所有实例共享,修改会影响全部实例;实例变量属于每个实例,独立存在,互不影响。类变量适用于共享数据如常量、计数器,实例变量用于对象独有属性如姓名、状态。可变类变量易引发意外共享,继承中子类可遮蔽父类类变量,而实例变量通过super()继承并保持独立。 类变量和实例变量的核心区别在于…

    2025年12月14日
    000
  • Pandas DataFrame列中基于条件删除字符串特定部分的教程

    本教程详细讲解如何在Pandas DataFrame的字符串列中,根据特定条件(例如分隔符数量)删除字符串中指定位置后的内容。文章通过实际案例,演示了如何利用map函数结合lambda表达式和字符串方法,高效且灵活地处理数据,并讨论了不同场景下的策略选择。 1. 问题描述与挑战 在数据清洗和预处理过…

    2025年12月14日
    000
  • 如何应对反爬虫策略?

    应对反爬虫需综合运用多维度策略,核心是模拟真实用户行为并动态调整战术。首先通过请求头伪装、构建高质量代理IP池(区分数据中心、住宅、移动IP)规避基础封锁;其次针对JavaScript渲染内容,优先采用API逆向工程直接获取数据,无法实现时再使用Selenium、Playwright等无头浏览器执行…

    2025年12月14日
    000
  • 如何从任务生成器创建异步任务执行机制

    本文介绍了如何利用Python的asyncio库,结合任务生成器,实现异步任务的执行。重点在于避免使用await直接等待任务完成,而是通过create_task创建任务并将其添加到事件循环中,并通过asyncio.sleep(0)或TaskGroup等机制,确保事件循环能够调度其他任务,从而实现真正…

    2025年12月14日
    000
  • 使用TaskGroup实现异步任务生成器的任务执行

    本文介绍了如何使用异步任务生成器和 asyncio 库在 Python 中实现异步任务执行。核心思想是利用 asyncio.TaskGroup (Python 3.11+) 创建任务组,并使用 create_task 方法将生成器产生的任务添加到任务组中,同时通过 await asyncio.sle…

    2025年12月14日
    000

发表回复

登录后才能评论
关注微信