入门爬虫,不讲道理,只摆问题

其实我也算是入门爬虫,目前也还有很多东西没有吃透,比如很多人入门选择使用的正则式我就没记清楚,对于很多反扒也并不算特别深入。但这并不影响我学习爬虫的信心和兴趣。。。没办法,必须要学啊。很多数据我不能跪着求别人给,因为别人不会给。。。被逼着学习爬虫,希望我的学习能有好结果吧

import json

import re

import requests

from requests import RequestException

url = “https://movie.douban.com/cinema/nowplaying/shanghai/”

###headers={‘User-Agent’: ‘Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36’}

response = requests.get(url,headers=headers)

html = response.text

pattern = re.compile(‘

.*?入门爬虫,不讲道理,只摆问题‘, re.S)

items = re.findall(pattern, html)

for item in items:

a={‘title’: item[0],’score’: item[1],’image’: item[2],}

print(a)

这样写要报错:

入门爬虫,不讲道理,只摆问题

所以:

虽然例子简单,但是对于新手来说还有很多不友好的地方,我在学习的时候发现程序报错。

仔细检查代码之后发现:

requests.get(url)得到的结果是【418】,是被网站反扒了。需要加一个请求的头

headers={‘User-Agent’: ‘Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36’} —随便百度的,你可以用自己的电脑浏览器

最后:

url = “https://movie.douban.com/cinema/nowplaying/shanghai/”

headers={‘User-Agent’: ‘Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36’}

response = requests.get(url,headers=headers)

html = response.text

pattern = re.compile(‘

.*?入门爬虫,不讲道理,只摆问题‘, re.S)

items = re.findall(pattern, html)

for item in items:

a={‘title’: item[0],’score’: item[1],’image’: item[2],}

print(a)

入门爬虫,不讲道理,只摆问题

以上就是入门爬虫,不讲道理,只摆问题的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/170174.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月1日 02:07:18
下一篇 2025年11月1日 02:08:01

相关推荐

  • Golang如何实现静态资源文件管理

    Go 1.16+ 使用 //go:embed 将静态资源嵌入二进制,通过 embed.FS 与 net/http 实现文件服务,支持开发时本地读取、生产时嵌入,结合环境变量切换资源来源,提升部署效率。 在Go语言开发中,静态资源文件(如HTML、CSS、JS、图片等)的管理通常通过内置的 net/h…

    2025年12月16日
    000
  • Golang如何实现Benchmark结果可视化

    使用go test -bench生成JSON格式基准数据,通过脚本提取每操作耗时、内存分配等指标,结合Chart.js或Matplotlib绘图,或用benchstat分析多轮结果,实现可视化对比。 Go语言自带的go test -bench命令可以生成基准测试结果,但原始输出是文本形式,不利于对比…

    2025年12月16日
    000
  • Golang如何处理Web表单提交异常

    答案:处理Golang Web表单异常需验证请求方法、内容类型,安全解析表单数据并校验字段存在性与合法性,对类型转换错误进行捕获,返回清晰错误提示。1. 检查r.Method是否为POST,非POST返回400;2. 验证Content-Type匹配表单格式,否则拒绝请求;3. 调用r.ParseF…

    2025年12月16日
    000
  • 如何在Golang中理解数据类型转换_Golang数据类型转换方法详解

    Go语言中所有类型转换必须显式声明,基本类型间通过强制转换实现,如int与float64互转会截断小数;字符串与数值类型需用strconv包的Atoi、Itoa、Parse和Format系列函数;接口类型通过类型断言获取具体类型,字节切片与字符串可直接转换但涉及内存拷贝;自定义类型需显式转换,结构体…

    2025年12月16日
    000
  • 如何在Golang中读取CSV文件_Golang CSV文件读取方法汇总

    答案:Golang中读取CSV文件常用csv.Reader,支持全量读取、逐行读取、跳过表头、自定义分隔符及处理复杂字段,适用于不同场景且无需第三方库。 在Golang中读取CSV文件非常简单,主要依赖标准库encoding/csv和os包。下面介绍几种常见的读取CSV文件的方法,适用于不同场景。 …

    2025年12月16日
    000
  • Go语言中利用go install命令一次性构建多个二进制文件

    本文详细介绍了如何使用go语言的`go install`命令,通过路径通配符`…`实现一次性构建位于同一根目录下多个`main`包的二进制文件。这种方法无需借助外部构建工具,简化了多应用项目的构建流程,适用于`go get`、`go build`等其他go命令,显著提升开发效率。 Go语…

    2025年12月16日
    000
  • Go语言中模拟动态方法调用:实现Ruby send 等效功能

    go语言不内置类似ruby `send` 的动态方法调用机制。本文将介绍两种实现方式:一是利用 `map[string]func()` 注册函数并按名称调用,适用于预定义函数集合;二是使用 `reflect` 包进行运行时反射,以实现更通用的动态方法调用。文章将通过示例代码和注意事项,指导读者在go…

    2025年12月16日
    000
  • 高效管理Go多二进制文件安装:使用go install root/…模式

    本文详细介绍了如何在Go语言项目中,利用`go install root/…`命令一次性构建并安装位于指定根目录下所有`main`包对应的多个可执行文件。通过引入`…`通配符模式,开发者可以避免为每个二进制文件单独执行`go install`,从而简化构建流程,提高开发效率。…

    2025年12月16日
    000
  • 使用字符串调用 Go 对象方法:模拟 send() 函数

    本文介绍了在 Go 语言中如何实现类似 Ruby 中 `send()` 方法的功能,即通过字符串动态调用对象方法。由于 Go 语言本身不支持直接通过字符串调用函数,本文将探讨两种实现方法:使用 `map` 注册函数和使用反射。通过这两种方法,开发者可以灵活地根据字符串动态地执行不同的函数,从而实现更…

    2025年12月16日
    000
  • 在Geany中配置Go语言运行环境:解决‘go: not found’错误

    本教程旨在解决在geany编辑器中运行go语言代码时遇到的“go: not found”错误。核心解决方案是在geany的构建命令设置中,将go可执行文件的完整路径配置到执行命令中,例如使用`/path/to/go/bin/go run “%f”`,确保geany能正确找到并…

    2025年12月16日
    000
  • Geany集成Go开发环境:运行Go代码的完整指南

    本教程详细介绍了如何在geany集成开发环境中正确配置go语言程序的运行环境。当遇到“go: not found”错误时,核心解决方案是修改geany的构建命令设置,指定go可执行文件的完整路径来执行go源代码,从而确保程序能够顺利编译和运行。 在使用Geany进行Go语言开发时,开发者可能会遇到一…

    2025年12月16日
    000
  • 在Go中稳健处理 text/template 文件路径的教程

    本文旨在解决go语言中 `text/template` 包在加载模板文件时遇到的路径问题,特别是当 `go test` 从不同目录执行时导致的“文件未找到”错误。核心解决方案包括理解当前工作目录(cwd)对相对路径解析的影响,以及如何通过统一项目执行目录、利用 `os.getwd()` 和 `fil…

    2025年12月16日
    000
  • Geany中配置Go语言开发环境:解决“go: not found”问题

    本教程旨在解决在geany编辑器中运行go程序时遇到的“go: not found”错误。核心解决方案是在geany的“构建命令”设置中,为“执行”命令指定go可执行文件的完整路径,例如`/path/to/go/bin/go run “%f”`,确保geany能够正确找到并执…

    2025年12月16日
    000
  • 在Geany中配置和运行Go语言代码

    本文详细介绍了如何在geany集成开发环境中配置go语言的运行命令,以解决常见的“go: not found”错误。通过指定go可执行文件的完整路径,用户可以顺利在geany中编译并执行go代码,从而提升开发效率。 在Geany集成开发环境中运行Go语言代码时,开发者可能会遇到“go: not fo…

    2025年12月16日
    000
  • Go与Dart跨平台数据传输:Protocol Buffers序列化实践

    本文详细介绍了如何在go后端与dart前端之间高效、类型安全地传输数据。教程涵盖了protocol buffers的安装配置、`.proto`消息定义、go语言中的数据序列化,以及dart语言中的数据反序列化过程,并提供了完整的代码示例,旨在帮助开发者实现基于http的跨语言结构化数据通信。 Go与…

    2025年12月16日
    000
  • 使用Protocol Buffers在Go与Dart之间高效传输结构化数据

    本教程详细介绍了如何利用protocol buffers在go后端序列化结构化数据,并通过ajax将其传输至dart前端进行反序列化。文章涵盖了环境搭建、`.proto`文件定义、代码生成、go服务端的对象创建与数据序列化发送,以及dart客户端的数据接收与反序列化处理,旨在提供一套完整的跨语言数据…

    2025年12月16日
    000
  • 在Geany中配置Go语言运行环境

    本教程旨在解决在geany集成开发环境中运行go语言代码时遇到的“go: not found”错误。核心解决方案在于明确指定go可执行文件的完整路径,通过geany的“构建命令设置”功能,将执行命令修改为`/path/to/go/bin/go run “%f”`,从而确保ge…

    2025年12月16日
    000
  • Go语言JSON美化打印教程

    本文详细介绍了在go语言中如何使用`encoding/json`包的`marshalindent`函数来美化输出json数据。通过设置前缀和缩进字符串,可以使json结构更具可读性,无论是对go数据结构进行编码,还是对现有json字符串进行格式化,都能轻松实现。 在Go语言开发中,处理JSON数据是…

    2025年12月16日
    000
  • 基于Protocol Buffers实现Go后端与Dart前端的数据交互

    本教程详细介绍了如何利用Protocol Buffers在Go后端对结构化数据进行序列化,并通过Ajax传输至Dart前端进行反序列化。内容涵盖了环境搭建、.proto文件定义、代码生成、Go语言中的数据封装与序列化,以及Dart语言中的数据请求与反序列化,旨在提供一套完整的跨语言数据通信解决方案,…

    2025年12月16日
    000
  • Go语言中模拟动态方法调用:实现类似Ruby send的功能

    go语言原生不支持像ruby `send`那样通过字符串动态调用函数或方法。本文将介绍两种主要实现方式:一种是利用go的函数作为一等公民的特性,通过`map[string]func()`构建函数映射表,实现高效且类型安全的动态调用;另一种是利用`reflect`包进行运行时反射,实现更灵活但开销更大…

    2025年12月16日
    000

发表回复

登录后才能评论
关注微信