Python如何制作网络爬虫？Scrapy框架

程序猿 • 2025年12月14日 07:04:25 • 用户投稿 • 阅读 0

使用python和scrapy制作网络爬虫的核心流程包括：安装scrapy、创建项目、定义spider、编写解析逻辑并利用选择器提取数据；2. scrapy通过设置user-agent、使用代理ip池、配置下载延迟和autothrottle、集成selenium或scrapy-splash等方式应对反爬机制；3. 数据存储与导出方式包括直接输出为json、csv、xml文件，或通过item pipelines将数据存入mysql、postgresql、sqlite、mongodb等数据库，也可推送至消息队列或云存储；4. 常见陷阱有选择器错误、allowed_domains限制、忽略robots.txt、异步逻辑误解和编码问题，调试技巧包括使用scrapy shell测试选择器、查看日志、保存响应内容、使用pdb断点调试以及设置dont_filter=true进行请求重试，最终通过持续测试与优化实现稳定抓取。

用Python制作网络爬虫，特别是借助Scrapy框架，这绝对是条高效且令人着迷的路径。Scrapy不只是一个库，它是一整套成熟的爬虫框架，帮你把数据抓取、处理、存储的很多繁琐工作都自动化了，让你能更专注于如何从页面上提取你真正想要的信息。

解决方案

要用Python和Scrapy制作网络爬虫，核心流程其实挺清晰的，虽然初次接触可能会觉得概念有点多，但一旦上手，你会发现它真的能把效率拉满。

首先，你需要安装Scrapy。这很简单，打开你的终端或命令行，敲入：

pip install scrapy

安装完成后，我们通常会从创建一个Scrapy项目开始。这就像为你的爬虫任务搭一个脚手架：

scrapy startproject my_crawler_project

进入这个新创建的项目目录后，你就可以开始定义你的爬虫（Spider）了。Spider是Scrapy里最核心的部分，它定义了如何爬取一个网站以及如何从爬取到的页面中提取数据。你可以用命令生成一个基本的Spider：

cd my_crawler_project

scrapy genspider example_spider example.com

这会为你生成一个名为

example_spider.py

的文件，里面包含了基本的Spider结构。一个典型的Spider会包含

name

（爬虫的唯一标识）、

start_urls

（爬虫开始抓取的URL列表）和

parse

方法。

parse

方法是Scrapy收到响应后默认调用的回调函数，你在这里编写解析逻辑。

立即学习“Python免费学习笔记（深入）”；

# my_crawler_project/my_crawler_project/spiders/example_spider.pyimport scrapyclass ExampleSpider(scrapy.Spider):    name = "example_spider"    allowed_domains = ["example.com"] # 限制爬取范围，防止爬出界    start_urls = ["http://www.example.com/page1", "http://www.example.com/page2"]    def parse(self, response):        # 这是一个示例，假设我们要提取页面标题和链接        title = response.css('h1::text').get()        links = response.css('a::attr(href)').getall()        # 使用yield返回数据或新的请求        yield {            'title': title,            'url': response.url,            'extracted_links': links,        }        # 假设我们还想跟踪页面上的其他链接        for next_page_link in links:            if next_page_link is not None:                # 使用response.urljoin处理相对路径                yield response.follow(next_page_link, callback=self.parse)

在上面的

parse

方法中，我们使用了Scrapy强大的选择器（Selectors）来提取数据，支持CSS选择器和XPath。

yield

关键字在这里非常关键，它用于生成Item（你想要抓取的数据）或者新的Request（新的待抓取页面）。

通常，我们会定义一个

Item

来规范化我们想要抓取的数据结构。在

items.py

文件中：

# my_crawler_project/my_crawler_project/items.pyimport scrapyclass MyCrawlerProjectItem(scrapy.Item):    # 定义你的数据字段    title = scrapy.Field()    url = scrapy.Field()    extracted_links = scrapy.Field()    # 还可以添加其他字段，比如发布日期、作者等

然后，在你的Spider中导入并使用它：

# my_crawler_project/my_crawler_project/spiders/example_spider.py# ...from my_crawler_project.items import MyCrawlerProjectItemclass ExampleSpider(scrapy.Spider):    # ...    def parse(self, response):        item = MyCrawlerProjectItem()        item['title'] = response.css('h1::text').get()        item['url'] = response.url        item['extracted_links'] = response.css('a::attr(href)').getall()        yield item        # ...

数据抓取后，你可能还需要对它们进行清洗、验证或存储。Scrapy的

Item Pipelines

就是为此而生。在

pipelines.py

中定义你的处理逻辑，然后在

settings.py

中启用它们。

最后，运行你的爬虫，通常在项目根目录下执行：

scrapy crawl example_spider -o output.json

-o

参数可以将抓取到的数据直接输出到JSON、CSV等文件。

这只是Scrapy的冰山一角，它还有中间件、设置文件等诸多功能，让你可以精细控制爬虫的行为，处理各种复杂的场景。

Scrapy如何处理反爬机制？

在网络爬虫的世界里，反爬机制就像网站设下的迷宫，总得想办法绕过去。Scrapy本身虽然强大，但应对反爬，很多时候需要我们手动配置和一些策略。这不像有个按钮一按就搞定，更像是玩一场策略游戏，需要针对不同网站的特点来调整。

最常见也最基础的反爬，就是检查你的

User-Agent

。很多网站会识别那些一看就是机器人的

User-Agent

字符串，然后直接拒绝访问。Scrapy默认的

User-Agent

就是“Scrapy/X.Y.Z”，这明摆着告诉人家“我是爬虫”。解决办法很简单，在项目的

settings.py

里设置一个看起来像真实浏览器的

User-Agent

：

USER_AGENT = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'

如果你想更进一步，可以维护一个

User-Agent

列表，通过自定义下载中间件（Downloader Middleware）来实现随机切换，让每次请求的身份都不同。

IP限制也是个大头。网站会监控来自同一个IP的请求频率，一旦发现异常，就可能封禁这个IP。这时，代理IP池就派上用场了。你可以购买或收集一些高质量的代理IP，然后同样通过下载中间件，让Scrapy的每个请求都通过不同的代理IP发出。这块儿配置起来稍微复杂一点，涉及到代理的验证、轮换策略，甚至失败重试机制。但一旦搭建起来，效果立竿见影。

请求频率控制也是一个关键点。有些网站不会直接封IP，而是通过返回验证码或者降低响应速度来“劝退”你。Scrapy的

DOWNLOAD_DELAY

设置就能派上用场，它会让你每次请求之间间隔一段时间，模拟人类的浏览行为。

DOWNLOAD_DELAY = 2  # 每次请求间隔2秒

Scrapy还有一个

AUTOTHROTTLE

扩展，能根据网站的响应情况动态调整下载延迟，这比固定延迟要智能得多，能更好地平衡效率和反反爬。

对于一些依赖JavaScript渲染内容的网站，Scrapy默认是无法处理的，因为它只抓取原始HTML。这时候，你就需要集成像

Scrapy-Splash

或者

Selenium

这样的工具。

Scrapy-Splash

是一个轻量级的JavaScript渲染服务，Scrapy可以把请求发给它，让它渲染完成后再把HTML返回给Scrapy处理。而

Selenium

则是一个更重量级的浏览器自动化工具，可以模拟用户在浏览器中的所有操作，包括点击、滚动、填写表单等，但它的性能开销相对较大。

最后，遇到验证码（CAPTCHA）或者复杂的登录流程，这通常是最头疼的。简单的图片验证码可能可以接入第三方打码平台，但行为验证码、滑动验证码等就非常棘手了，很多时候需要人工介入或者更高级的机器学习模型来识别。这块儿往往是爬虫工程师最“绝望”的地方，因为这意味着你可能需要放弃一部分数据，或者投入巨大的精力去攻克。

总之，处理反爬是一个持续学习和迭代的过程，没有一劳永逸的方案。你需要根据目标网站的具体情况，灵活运用Scrapy的各种配置和扩展，甚至结合外部工具。

Scrapy的数据存储与导出有哪些方式？

Scrapy抓取到的数据，最终肯定是要保存下来的，不然爬虫就白忙活了。Scrapy在数据存储和导出方面提供了相当多的灵活性，从最简单的文件输出到复杂的数据库集成，应有尽有。我个人觉得，选择哪种方式，主要看你的数据量、后续的数据处理需求以及你对数据持久化的要求。

最直接、最便捷的方式，就是直接输出到文件。Scrapy内置了多种格式的导出器：

JSON/JSON Lines: 这是我最常用的，因为它结构清晰，易于阅读和解析。JSON Lines（每行一个JSON对象）特别适合大数据量，因为它允许你流式地写入和读取，而不需要一次性加载所有数据到内存。

scrapy crawl your_spider -o output.json

scrapy crawl your_spider -o output.jl

(JSON Lines)CSV: 如果你的数据结构比较扁平，或者需要用电子表格软件打开，CSV是个不错的选择。

scrapy crawl your_spider -o output.csv

XML: 虽然现在用得少了，但Scrapy也支持XML格式导出。

scrapy crawl your_spider -o output.xml

这些文件导出方式非常适合快速测试、小规模数据抓取或者作为临时存储。但对于需要频繁查询、更新或者大规模的数据，文件就不那么方便了。

这时候，数据库就成了更好的选择。Scrapy通过

Item Pipelines

与各种数据库无缝集成。

Item Pipelines

是Scrapy处理Item（你抓取到的数据）的组件链，每个Item在被Scrapy处理之前，都会经过你定义的管道。你可以在管道里进行数据清洗、去重，然后插入到数据库。

关系型数据库 (如MySQL, PostgreSQL, SQLite): 这种方式非常常见。你需要在

pipelines.py

中编写代码，使用像

SQLAlchemy

、

psycopg2

或

mysql-connector-python

这样的库来连接数据库，并执行INSERT或UPDATE操作。一个简单的SQLite管道可能长这样：

# my_crawler_project/my_crawler_project/pipelines.pyimport sqlite3class SQLitePipeline:    def __init__(self):        self.conn = sqlite3.connect('my_data.db')        self.cur = self.conn.cursor()        self.cur.execute('''            CREATE TABLE IF NOT EXISTS articles (                title TEXT,                url TEXT PRIMARY KEY,                extracted_links TEXT            )        ''')        self.conn.commit()    def process_item(self, item, spider):        try:            self.cur.execute('''                INSERT INTO articles (title, url, extracted_links) VALUES (?, ?, ?)            ''', (item.get('title'), item.get('url'), str(item.get('extracted_links'))))            self.conn.commit()        except sqlite3.IntegrityError: # 处理主键冲突，例如URL重复            spider.logger.warning(f"Duplicate item found: {item.get('url')}")        return item    def close_spider(self, spider):        self.conn.close()

别忘了在

settings.py

中启用你的管道：

ITEM_PIPELINES = {'my_crawler_project.pipelines.SQLitePipeline': 300,}

NoSQL数据库 (如MongoDB, Redis): 对于非结构化或半结构化数据，NoSQL数据库可能更合适。比如MongoDB，你可以直接将Scrapy Item（本质上是字典）存储为JSON文档。同样，你需要一个对应的Python客户端库（如

pymongo

）并在管道中实现逻辑。

除了这些，如果你需要将数据推送到消息队列（如Kafka, RabbitMQ）进行实时处理，或者上传到云存储（如AWS S3, Google Cloud Storage），也都可以通过自定义

Item Pipelines

来实现。管道的强大之处在于，它为你提供了一个集中处理抓取数据的“钩子”，你可以根据业务需求，自由地扩展和定制数据处理流程。

选择哪种存储方式，真的取决于你的具体需求。如果是为了快速验证一个想法，或者数据量不大，文件导出最省心。如果数据需要长期保存、频繁查询，或者与其他系统集成，那么数据库无疑是更专业的选择。

开发Scrapy爬虫时常见的陷阱与调试技巧？

开发Scrapy爬虫，就像解谜一样，充满乐趣，但也难免会遇到一些让你挠头的问题。我个人在调试Scrapy时，经常会遇到一些重复性的“坑”，但好在Scrapy提供了不少趁手的工具来帮助我们排查。

常见的陷阱：

选择器（Selectors）错误： 这是最最常见的。你看着浏览器开发者工具里的XPath或CSS路径，觉得万无一失，结果爬虫跑起来就是抓不到数据。

原因: 网站的HTML结构可能动态加载、或者你复制的路径太绝对，经不起一点点变化。有时，

::text

和

::attr()

的用法也会混淆。表现:

item['field']

为空，或者抓到了一堆

None

。

start_urls

或

allowed_domains

设置不当：

原因:

start_urls

里写错了URL，或者

allowed_domains

设置得太严格，导致Scrapy直接过滤掉了有效的请求。表现: 爬虫启动后很快就结束，或者日志里出现大量“Filtered offsite request”的警告。

忽略

robots.txt

： Scrapy默认是遵守

robots.txt

规则的。如果你要爬取的路径被

robots.txt

禁止了，Scrapy就不会去爬。

原因: 没有在

settings.py

中设置

ROBOTS_TXT_OBEY = False

（如果你确实需要忽略）。表现: 爬虫不抓取任何页面，或者只抓取了

robots.txt

允许的部分。

异步特性理解不足： Scrapy是异步的，这意味着你的

parse

方法返回

yield

一个

Request

后，这个请求会立刻被调度，而不是等待当前页面的所有处理完成。如果你的逻辑依赖于某个请求的结果，但没有正确使用回调函数（

callback

），就可能出问题。

原因: 试图在

parse

方法中直接获取一个尚未完成的请求结果。表现: 数据缺失，或者逻辑流程混乱。

反爬机制触发： 网站检测到你是爬虫，直接返回空内容、验证码、或者HTTP 403/404/500错误。

原因:

User-Agent

太明显、请求频率过高、没有使用代理等。表现: 日志里大量HTTP错误码，或者抓取到的页面内容不正确。

编码问题： 有时候，网站的编码不是UTF-8，或者响应头里没有正确声明编码，导致抓取到的中文等非ASCII字符显示为乱码。

原因: 没有正确处理

response.encoding

或手动指定编码。表现: 抓取到的文本内容是乱码。

趁手的调试技巧：

scrapy shell

：这是我的“瑞士军刀”。当你对某个页面的HTML结构或选择器拿不准时，

scrapy shell

能让你在一个交互式环境中模拟请求并测试选择器。

scrapy shell "http://www.example.com/some_page"

进入shell后，你可以直接使用

response.css()

、

response.xpath()

来测试你的选择器，甚至可以

view(response)

在浏览器中查看当前响应的页面，这简直太方便了。

日志（Logging）： Scrapy的日志系统非常详细，默认会输出很多有用的信息，比如请求状态码、被过滤的请求等。

设置日志级别： 在

settings.py

中设置

LOG_LEVEL = 'DEBUG'

可以获取更详细的日志信息，帮助你追踪请求和响应的每一个细节。自定义日志： 在你的Spider中，可以使用

self.logger.info("...")

或

self.logger.debug("...")

来输出自定义的调试信息，帮助你理解代码的执行流程和变量的值。

查看下载的响应： 当你怀疑某个请求返回的内容不对劲时，可以将

response.body

保存到本地文件，然后用浏览器打开查看。

# 在parse方法中with open('debug_response.html', 'wb') as f:    f.write(response.body)

这能让你直观地看到Scrapy实际接收到的页面内容，判断是抓取问题还是解析问题。

pdb

或IDE调试器： 对于复杂的逻辑问题，直接在代码中设置断点，使用Python的内置调试器

pdb

或者PyCharm等IDE的调试功能，一步步跟踪代码执行，查看变量状态，是最直接有效的办法。

import pdb; pdb.set_trace() # 在你想设置断点的地方加入这行

dont_filter=True

：在调试Request时，如果你想重复发送某个请求（即使Scrapy认为它是重复的），可以在

Request

对象中设置

dont_filter=True

。这在测试特定URL或调试循环抓取时非常有用，但记得调试完要移除。

调试爬虫是一个经验积累的过程。多动手，多观察日志，多使用

scrapy shell

，你会发现自己解决问题的能力会越来越强。毕竟，每一次成功的爬取，背后都可能是一次又一次的试错和调整。

以上就是Python如何制作网络爬虫？Scrapy框架的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1367034.html

ai css mongodb mysql py python python编程 redis windows 工具浏览器

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

查看Python版本怎样在Windows注册表中查看查看Python版本的注册表查询技巧

上一篇 2025年12月14日 07:04:17

Python函数怎样在函数中使用 for 循环 Python函数中循环应用的入门教程

下一篇 2025年12月14日 07:04:35

好文分享

CSS mask属性无法获取图片：为什么我的图片不见了？

CSS mask属性无法获取图片在使用CSS mask属性时，可能会遇到无法获取指定照片的情况。这个问题通常表现为：网络面板中没有请求图片：尽管CSS代码中指定了图片地址，但网络面板中却找不到图片的请求记录。问题原因：此问题的可能原因是浏览器的兼容性问题。某些较旧版本的浏览器可能不支持CSS…

程序猿
2025年12月24日
15000
好文分享

如何用dom2img解决网页打印样式不显示的问题？

用dom2img解决网页打印样式不显示的问题想将网页以所见即打印的的效果呈现，需要采取一些措施，特别是在使用了bootstrap等大量采用外部css样式的框架时。问题根源在常规打印操作中，浏览器通常会忽略css样式等非必要的页面元素，导致打印出的结果与网页显示效果不一致。这是因为打印机制只识别…

程序猿
2025年12月24日
12000
好文分享

如何用 CSS 模拟不影响其他元素的链接移入效果？

如何模拟 css 中链接的移入效果在 css 中，模拟移入到指定链接的效果尤为复杂，因为链接的移入效果不影响其他元素。要实现这种效果，最简单的方法是利用放大，例如使用 scale 或 transform 元素的 scale 属性。下面提供两种方法： scale 属性： .goods-item:ho…

程序猿
2025年12月24日
7000
好文分享

Uniapp 中如何不拉伸不裁剪地展示图片？

灵活展示图片：如何不拉伸不裁剪在界面设计中，常常需要以原尺寸展示用户上传的图片。本文将介绍一种在 uniapp 框架中实现该功能的简单方法。对于不同尺寸的图片，可以采用以下处理方式：极端宽高比：撑满屏幕宽度或高度，再等比缩放居中。非极端宽高比：居中显示，若能撑满则撑满。然而，如果需要不拉伸不…

程序猿
2025年12月24日
4000
好文分享

PC端H5项目如何实现适配：流式布局、响应式设计和两套样式？

PC端的适配方案及PC与H5兼顾的实现方案探讨在开发H5项目时，常用的屏幕适配方案是postcss-pxtorem或postcss-px-to-viewport，通常基于iPhone 6标准作为设计稿。但对于PC端网项目，处理不同屏幕大小需要其他方案。 PC端屏幕适配方案 PC端屏幕适配一般采用流…

程序猿
2025年12月24日
10000
好文分享

CSS 元素设置 10em 和 transition 后为何没有放大效果？

CSS 元素设置 10em 和 transition 后为何无放大效果？你尝试设置了一个 .box 类，其中包含字体大小为 10em 和过渡持续时间为 2 秒的文本。当你载入到页面时，它没有像 YouTube 视频中那样产生放大效果。原因可能在于你将 CSS 直接写在页面中在你的代码示例中，C…

程序猿
2025年12月24日
5000
好文分享

如何实现类似横向U型步骤条的组件？

横向U型步骤条寻求替代品希望找到类似横向U型步骤条的组件或 CSS 实现。潜在解决方案根据给出的参考图片，类似的组件有：图片所示组件：图片提供了组件的外观，但没有提供具体的实现方式。参考链接：提供的链接指向了 SegmentFault 上的另一个问题，其中可能包含相关的讨论或解决方案建议。 …

程序猿
2025年12月24日
10001
好文分享

如何让小说网站控制台显示乱码，同时网页内容正常显示？

如何在不影响用户界面的情况下实现控制台乱码？当在小说网站上下载小说时，大家可能会遇到一个问题：网站上的文本在网页内正常显示，但是在控制台中却是乱码。如何实现此类操作，从而在不影响用户界面（UI）的情况下保持控制台乱码呢？答案在于使用自定义字体。网站可以通过在服务器端配置自定义字体，并通过在客户端…

程序猿
2025年12月24日
8000
好文分享

如何优化CSS Grid布局中子元素排列和宽度问题？

css grid布局中的优化问题在使用css grid布局时可能会遇到以下问题：问题1：无法控制box1中li的布局 box1设置了grid-template-columns: repeat(auto-fill, 20%)，这意味着容器将自动填充尽可能多的20%宽度的列。当li数量大于5时，它们…

程序猿
2025年12月24日
9000
好文分享

SASS 中的 Mixins

mixin 是 css 预处理器提供的工具，虽然它们不是可以被理解的函数，但它们的主要用途是重用代码。不止一次，我们需要创建多个类来执行相同的操作，但更改单个值，例如字体大小的多个类。 .fs-10 { font-size: 10px;}.fs-20 { font-size: 20px;}.fs-…

程序猿
2025年12月24日
2000
好文分享

如何在地图上轻松创建气泡信息框？

地图上气泡信息框的巧妙生成地图上气泡信息框是一种常用的交互功能，它简便易用，能够为用户提供额外信息。本文将探讨如何借助地图库的功能轻松创建这一功能。利用地图库的原生功能大多数地图库，如高德地图，都提供了现成的信息窗体和右键菜单功能。这些功能可以通过以下途径实现：高德地图 JS API 参考文…

程序猿
2025年12月24日
4000
好文分享

如何使用 scroll-behavior 属性实现元素scrollLeft变化时的平滑动画？

如何实现元素scrollleft变化时的平滑动画效果？在许多网页应用中，滚动容器的水平滚动条（scrollleft）需要频繁使用。为了让滚动动作更加自然，你希望给scrollleft的变化添加动画效果。解决方案：scroll-behavior 属性要实现scrollleft变化时的平滑动画效果…

程序猿
2025年12月24日
0000
好文分享

CSS mask 属性无法加载图片：浏览器问题还是代码错误？

CSS mask 属性请求图片失败在使用 CSS mask 属性时，您遇到了一个问题，即图片没有被请求获取。这可能是由于以下原因：浏览器问题：某些浏览器可能在处理 mask 属性时存在 bug。尝试更新到浏览器的最新版本。代码示例中的其他信息：您提供的代码示例中还包含其他 HTML 和 CSS …

程序猿
2025年12月24日
0000
好文分享

如何为滚动元素添加平滑过渡，使滚动条滑动时更自然流畅？

给滚动元素平滑过渡如何在滚动条属性（scrollleft）发生改变时为元素添加平滑的过渡效果？解决方案：scroll-behavior 属性为滚动容器设置 scroll-behavior 属性可以实现平滑滚动。 html 代码： click the button to slide right!…

程序猿
2025年12月24日
6000
好文分享

如何用 CSS 实现链接移入效果？

css 中实现链接移入效果的技巧在 css 中模拟链接的移入效果可能并不容易，因为它们不会影响周围元素。但是，有几个方法可以实现类似的效果： 1. 缩放最简单的方法是使用 scale 属性，它会放大元素。以下是一个示例：立即学习“前端免费学习笔记（深入）”； .goods-item:hover…

程序猿
2025年12月24日
4000
好文分享

网页使用本地字体：为什么 CSS 代码中明明指定了“荆南麦圆体”，页面却仍然显示“微软雅黑”？

网页中使用本地字体本文将解答如何将本地安装字体应用到网页中，避免使用 src 属性直接引入字体文件。问题：想要在网页上使用已安装的“荆南麦圆体”字体，但 css 代码中将其置于第一位的“font-family”属性，页面仍显示“微软雅黑”字体。立即学习“前端免费学习笔记（深入）”；答案： …

程序猿
2025年12月24日
3000
好文分享

如何选择元素个数不固定的指定类名子元素？

灵活选择元素个数不固定的指定类名子元素在网页布局中，有时需要选择特定类名的子元素，但这些元素的数量并不固定。例如，下面这段 html 代码中，activebar 和 item 元素的数量均不固定： *n *n 如果需要选择第一个 item元素，可以使用 css 选择器 :nth-child()。该…

程序猿
2025年12月24日
3000
好文分享

如何用 CSS 实现类似卡券的缺口效果？

类似卡券的布局如何实现想要实现类似卡券的布局，可以使用遮罩（mask）来实现缺口效果。示例代码： .card { -webkit-mask: radial-gradient(circle at 20px, #0000 20px, red 0) -20px;} 效果：立即学习“前端免费学习笔记（…

程序猿
2025年12月24日
0000
好文分享

使用 SVG 如何实现自定义宽度、间距和半径的虚线边框？

使用 svg 实现自定义虚线边框如何实现一个具有自定义宽度、间距和半径的虚线边框是一个常见的前端开发问题。传统的解决方案通常涉及使用 border-image 引入切片图片，但是这种方法存在引入外部资源、性能低下的缺点。为了避免上述问题，可以使用 svg（可缩放矢量图形）来创建纯代码实现。一种方…

程序猿
2025年12月24日
2000
好文分享

如何用纯代码实现自定义宽度和间距的虚线边框？

自定义宽度和间距的虚线边框提问：如何创建一个自定义宽度和间距的虚线边框，如下图所示：元素宽度：8px元素高度：1px间距：2px圆角：4px 解答：传统的解决方案通常涉及使用 border-image 引入切片的图片来实现。但是，这需要引入外部资源。本解答将提供一种纯代码的方法，使用 svg…

程序猿
2025年12月24日
0000