
解决Python下载法兰克福证券交易所Blob URL数据难题
许多Python用户在下载网络文件时,常遭遇Blob URL导致文件下载不完整或无法读取的问题。本文提供从法兰克福证券交易所网站下载“主数据(下载,xlsx)”Excel文件的Python解决方案。
问题:直接使用urllib或wget访问Blob URL,只会下载到289字节的不可读文件。这是因为服务器端设置了访问限制,未提供正确的用户代理信息时,返回错误信息而非实际文件。
解决方案:模拟浏览器行为,伪装成正常用户请求。在请求头中添加user-agent信息,欺骗服务器,使其认为请求来自浏览器,从而绕过访问限制。
立即学习“Python免费学习笔记(深入)”;
以下代码分别提供Python 2和Python 3的解决方案:
Python 3:
import urllib.request as requesturl = 'http://www.xetra.com/blob/1193366/b2f210876702b8e08e40b8ecb769a02e/data/all-tradable-etfs-etcs-and-etns.xlsx'# 模拟Safari浏览器用户代理user_agent = 'Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25'req = request.Request(url, headers={'User-Agent': user_agent})with request.urlopen(req) as response: file_content = response.read() # 将文件内容写入文件 with open('etf_data.xlsx', 'wb') as f: f.write(file_content) print("文件已成功下载到etf_data.xlsx")
Python 2:
import urllib2url = 'http://www.xetra.com/blob/1193366/b2f210876702b8e08e40b8ecb769a02e/data/All-tradable-ETFs-ETCs-and-ETNs.xlsx'# 模拟Safari浏览器用户代理user_agent = 'Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25'req = urllib2.Request(url, headers={'User-Agent': user_agent})with urllib2.urlopen(req) as response: file_content = response.read() # 将文件内容写入文件 with open('etf_data.xlsx', 'wb') as f: f.write(file_content) print("文件已成功下载到etf_data.xlsx")
代码中,我们使用user-agent模拟Safari浏览器请求。urlopen函数发送包含模拟用户代理的请求,从而成功下载文件。代码将下载的文件内容写入名为etf_data.xlsx的文件中。请注意,此URL的有效性取决于法兰克福证券交易所网站结构,未来可能发生变化。 建议使用更健壮的错误处理机制来处理潜在的网络错误。
以上就是Python下载法兰克福证券交易所Blob URL数据时遇到问题怎么办?的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1358437.html
微信扫一扫
支付宝扫一扫