R语言：使用purrr::safely()处理循环中的错误，避免中断并收集结果

程序猿 • 2025年12月22日 21:27:00 • 好文分享 • 阅读 1

本文详细介绍了在R语言中，如何利用purrr包的safely()函数来健壮地处理迭代过程中的错误。当循环因遇到无效数据（如无法访问的网址或不存在的文件）而中断时，safely()能够捕获错误，允许循环继续执行，并为失败的项返回预设的默认值（如NA行），从而避免手动筛选数据，提高代码的鲁棒性和开发效率。

迭代处理中的常见问题：循环中断

在r语言的数据处理实践中，我们经常需要对一个列表或向量中的每个元素执行相同的操作，例如批量读取文件、爬取网页数据或调用api。通常，我们会使用for循环或lapply等函数来实现这一目标。然而，当数据源中包含“不良”或无效的元素时（例如，一个无法访问的网址、一个不存在的文件路径，或者一个格式错误的数据），这些操作可能会抛出错误，导致整个循环意外中断。

例如，在进行网页抓取时，如果遇到一个无法解析的URL，rvest::read_html()函数可能会报错，进而中断后续所有URL的处理。传统的解决方案可能包括：

手动筛选： 在运行循环之前，手动检查并移除所有已知会导致错误的元素。这种方法耗时且不适用于大规模或动态的数据集。使用tryCatch： 在循环内部使用tryCatch结构来捕获错误。虽然有效，但tryCatch的语法相对繁琐，且在处理结果时可能需要额外的逻辑来区分成功和失败的项。

这两种方法都增加了代码的复杂性或降低了开发效率。更理想的情况是，当遇到错误时，循环能够继续执行，并自动记录失败情况（例如，在结果集中为失败的项填充NA值），而不是直接崩溃。

解决方案：利用purrr::safely()实现健壮迭代

purrr包是R中一个强大的函数式编程工具，它提供了一系列函数来简化迭代操作。其中，safely()函数是解决上述循环中断问题的优雅方案。

safely()函数的作用是包装一个可能抛出错误的函数。当这个被包装的函数执行时，safely()会捕获任何错误，并始终返回一个包含两个元素的列表：

result：如果原函数成功执行，这里存储其返回值；如果发生错误，这里存储NULL（或通过otherwise参数指定的默认值）。error：如果发生错误，这里存储错误信息；如果成功执行，这里存储NULL。

通过这种方式，即使原函数抛出错误，safely()包装后的函数也不会中断执行流，而是将错误信息封装起来，允许迭代继续进行。

示例：批量读取CSV文件并处理错误

为了更好地说明safely()的用法，我们以批量读取CSV文件为例。假设我们有一个文件路径列表，其中一些路径是有效的，而另一些是无效的（文件不存在）。

准备工作：创建测试文件

首先，我们创建一些用于测试的CSV文件和一些不存在的路径。

# 确保安装了所需的包if (!requireNamespace("purrr", quietly = TRUE)) install.packages("purrr")if (!requireNamespace("readr", quietly = TRUE)) install.packages("readr")if (!requireNamespace("dplyr", quietly = TRUE)) install.packages("dplyr")library(purrr)library(readr)library(dplyr)# 创建一个用于存放测试文件的目录dir.create("test_data", showWarnings = FALSE)# 创建两个有效的CSV文件write_csv(mtcars %>% head(10), "test_data/mtcars1.csv")write_csv(mtcars %>% tail(10), "test_data/mtcars2.csv")# 定义包含有效和无效路径的列表file_paths <- c(  "test_data/mtcars1.csv",  "test_data/non_existent_file.csv", # 这是一个不存在的文件  "test_data/mtcars2.csv")message("测试文件路径：")print(file_paths)

定义一个可能失败的函数

接下来，我们定义一个函数，它接收文件路径，读取CSV文件，并返回前5行数据。如果文件不存在，read_csv会抛出错误。

read_csv_head <- function(path) {  df <- read_csv(path, progress = FALSE, show_col_types = FALSE)  df % head(5)  return(df)}

不使用safely()的传统迭代

尝试直接使用map()（或for循环）来应用read_csv_head函数：

message("n--- 不使用 safely() 的迭代 (会中断) ---")# 尝试运行以下代码会因为 "non_existent_file.csv" 而中断# tryCatch(#   {#     results_normal <- map(file_paths, read_csv_head)#     print(results_normal)#   },#   error = function(e) {#     message("错误捕获：", e$message)#   }# )message("直接使用 map() 会在遇到 'test_data/non_existent_file.csv' 时中断。")message("为避免中断本教程的执行，此处不实际运行该代码块。")

正如预期，当read_csv_head尝试读取test_data/non_existent_file.csv时，map()操作会中断，并且我们无法获取到mtcars2.csv的读取结果。

使用safely()包装函数并处理结果

现在，我们使用safely()来包装read_csv_head函数。为了满足在失败时返回NA行的需求，我们可以利用safely()的otherwise参数。首先，我们需要一个空的数据框作为模板，它具有与成功读取的数据框相同的列结构。

message("n--- 使用 safely() 包装函数 ---")# 1. 获取一个成功的读取结果，作为定义空数据框模板的依据# 假设我们知道成功的df会有哪些列，这里从第一个成功路径获取sample_df <- read_csv_head(file_paths[1])# 创建一个与sample_df结构相同的空数据框，用于填充错误项empty_placeholder_df %  mutate(across(everything(), ~NA)) # 将所有列填充为NA，并确保是1行message("空数据框模板 (用于填充错误项):")print(empty_placeholder_df)# 2. 使用 safely() 包装函数，并指定 otherwise 参数safe_read_csv_head <- safely(read_csv_head, otherwise = empty_placeholder_df)# 3. 使用 map() 进行迭代all_results_safely <- map(file_paths, safe_read_csv_head)message("n--- safely() 迭代的原始输出结构 ---")print(all_results_safely)# 4. 提取最终结果并合并# all_results_safely 现在是一个列表的列表，每个子列表包含 result 和 error# 我们可以直接提取 result 部分，因为 otherwise 已经处理了错误情况final_combined_df %  map("result") %>%  bind_rows(.id = "source_index") # .id 参数会添加一个列来标识原始输入的位置message("n--- 合并后的最终数据框 (包含 NA 行) ---")print(final_combined_df)# 5. 查看错误信息 (如果需要)errors_info %  map("error") %>%  compact() # 移除NULL值，只保留有错误的信息message("n--- 捕获到的错误信息 ---")if (length(errors_info) > 0) {  print(errors_info)} else {  message("没有捕获到错误。")}

从输出可以看出：

all_results_safely是一个包含三个元素的列表，每个元素都是一个子列表，其中包含result和error。对于test_data/mtcars1.csv和test_data/mtcars2.csv，result中包含了正确读取的数据框，error为NULL。对于test_data/non_existent_file.csv，result中包含了我们定义的empty_placeholder_df（一行NA值），error中包含了详细的错误信息。final_combined_df成功合并了所有结果，其中失败的项被替换为了一行NA值，满足了原始问题中“放置一行NA”的要求。errors_info列表则单独收集了所有发生的错误，便于后续的错误分析或日志记录。

适配网页抓取场景

这个解决方案可以直接应用于原始问题中的网页抓取场景。步骤如下：

定义网页抓取函数： 创建一个R函数，它接收一个URL作为参数，执行read_html()、html_nodes()、html_text()等操作，并返回所需的数据框。定义空数据框模板： 根据网页抓取函数预期返回的数据框结构，创建一个全为NA的单行数据框作为模板。使用safely()包装抓取函数： safe_scrape_function 使用map()迭代URL列表： all_scrape_results 提取并合并结果： final_scrape_df % map(“result”) %>% bind_rows(.id = “source_url_index”)。检查错误： scrape_errors % map(“error”) %>% compact()。

这样，即使遇到“坏网站”导致抓取失败，循环也不会中断，失败的网站会在最终结果中以NA行表示，而成功的抓取结果则被完整保留。

注意事项与最佳实践

otherwise参数的重要性： safely()的otherwise参数是实现“在失败时返回NA行”的关键。它确保了即使函数抛出错误，result部分也能有一个预期的结构（例如，一个空数据框或一个特定值），从而方便后续的bind_rows()操作。结果的统一结构： 确保safely()包装的函数在成功时返回的结果与otherwise参数指定的默认值具有兼容的结构（例如，相同的列名和数据类型），这样bind_rows()才能顺利合并。错误日志与分析： safely()将错误信息封装在error组件中，这使得我们可以在迭代完成后统一查看和处理所有错误，而不是在循环中逐个处理。这对于调试和生产环境中的错误监控非常有价值。其他purrr安全函数：possibly()：与safely()类似，但只返回成功结果或指定默认值（如NULL），不返回错误对象。如果你的目标只是替换失败结果而不需要详细错误信息，possibly()可能更简洁。quietly()：捕获函数产生的消息、警告和输出，但不捕获错误。清理测试文件： 在教程结束后，可以清理创建的测试文件。

# 清理测试文件和目录unlink("test_data", recursive = TRUE)message("n测试文件和目录已清理。")

总结

通过purrr::safely()函数，R语言开发者可以构建更加健壮和容错的迭代代码。它优雅地解决了循环因单个错误而中断的问题，使得在处理不确定数据源（如网络请求、文件系统操作）时，能够高效地收集所有可能的成功结果，并清晰地标识和记录失败情况。这种函数式编程的思维方式不仅提高了代码的可靠性，也大大简化了错误处理的逻辑，是现代R数据科学工作流中的一个重要工具。

以上就是R语言：使用purrr::safely()处理循环中的错误，避免中断并收集结果的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1580408.html

ai app csv csv文件 html node 工具常见问题

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

JavaScript音频播放控制：实现点击新音乐时暂停当前播放

上一篇 2025年12月22日 21:26:52

CSS浮动布局中页脚定位与清除浮动技巧

下一篇 2025年12月22日 21:27:03

好文分享

Uniapp 中如何不拉伸不裁剪地展示图片？

灵活展示图片：如何不拉伸不裁剪在界面设计中，常常需要以原尺寸展示用户上传的图片。本文将介绍一种在 uniapp 框架中实现该功能的简单方法。对于不同尺寸的图片，可以采用以下处理方式：极端宽高比：撑满屏幕宽度或高度，再等比缩放居中。非极端宽高比：居中显示，若能撑满则撑满。然而，如果需要不拉伸不…

程序猿
2025年12月24日
4000
好文分享

如何让小说网站控制台显示乱码，同时网页内容正常显示？

如何在不影响用户界面的情况下实现控制台乱码？当在小说网站上下载小说时，大家可能会遇到一个问题：网站上的文本在网页内正常显示，但是在控制台中却是乱码。如何实现此类操作，从而在不影响用户界面（UI）的情况下保持控制台乱码呢？答案在于使用自定义字体。网站可以通过在服务器端配置自定义字体，并通过在客户端…

程序猿
2025年12月24日
7000
好文分享

如何在地图上轻松创建气泡信息框？

地图上气泡信息框的巧妙生成地图上气泡信息框是一种常用的交互功能，它简便易用，能够为用户提供额外信息。本文将探讨如何借助地图库的功能轻松创建这一功能。利用地图库的原生功能大多数地图库，如高德地图，都提供了现成的信息窗体和右键菜单功能。这些功能可以通过以下途径实现：高德地图 JS API 参考文…

程序猿
2025年12月24日
4000
好文分享

如何使用 scroll-behavior 属性实现元素scrollLeft变化时的平滑动画？

如何实现元素scrollleft变化时的平滑动画效果？在许多网页应用中，滚动容器的水平滚动条（scrollleft）需要频繁使用。为了让滚动动作更加自然，你希望给scrollleft的变化添加动画效果。解决方案：scroll-behavior 属性要实现scrollleft变化时的平滑动画效果…

程序猿
2025年12月24日
0000
好文分享

如何为滚动元素添加平滑过渡，使滚动条滑动时更自然流畅？

给滚动元素平滑过渡如何在滚动条属性（scrollleft）发生改变时为元素添加平滑的过渡效果？解决方案：scroll-behavior 属性为滚动容器设置 scroll-behavior 属性可以实现平滑滚动。 html 代码： click the button to slide right!…

程序猿
2025年12月24日
6000
好文分享

如何选择元素个数不固定的指定类名子元素？

灵活选择元素个数不固定的指定类名子元素在网页布局中，有时需要选择特定类名的子元素，但这些元素的数量并不固定。例如，下面这段 html 代码中，activebar 和 item 元素的数量均不固定： *n *n 如果需要选择第一个 item元素，可以使用 css 选择器 :nth-child()。该…

程序猿
2025年12月24日
3000
好文分享

使用 SVG 如何实现自定义宽度、间距和半径的虚线边框？

使用 svg 实现自定义虚线边框如何实现一个具有自定义宽度、间距和半径的虚线边框是一个常见的前端开发问题。传统的解决方案通常涉及使用 border-image 引入切片图片，但是这种方法存在引入外部资源、性能低下的缺点。为了避免上述问题，可以使用 svg（可缩放矢量图形）来创建纯代码实现。一种方…

程序猿
2025年12月24日
2000
好文分享

如何让“元素跟随文本高度，而不是撑高父容器？

如何让元素跟随文本高度，而不是撑高父容器在页面布局中，经常遇到父容器高度被子元素撑开的问题。在图例所示的案例中，父容器被较高的图片撑开，而文本的高度没有被考虑。本问答将提供纯css解决方案，让图片跟随文本高度，确保父容器的高度不会被图片影响。解决方法为了解决这个问题，需要将图片从文档流中脱离…

程序猿
2025年12月24日
1000
好文分享

为什么 CSS mask 属性未请求指定图片？

解决 css mask 属性未请求图片的问题在使用 css mask 属性时，指定了图片地址，但网络面板显示未请求获取该图片，这可能是由于浏览器兼容性问题造成的。问题如下代码所示：立即学习“前端免费学习笔记（深入）”； icon [data-icon=”cloud”] { –icon-cl…

程序猿
2025年12月24日
3000
好文分享

如何利用 CSS 选中激活标签并影响相邻元素的样式？

如何利用 css 选中激活标签并影响相邻元素？为了实现激活标签影响相邻元素的样式需求，可以通过 :has 选择器来实现。以下是如何具体操作：对于激活标签相邻后的元素，可以在 css 中使用以下代码进行设置： li:has(+li.active) { border-radius: 0 0 10px…

程序猿
2025年12月24日
2000
好文分享

如何模拟Windows 10 设置界面中的鼠标悬浮放大效果？

win10设置界面的鼠标移动显示周边的样式（探照灯效果）的实现方式在windows设置界面的鼠标悬浮效果中，光标周围会显示一个放大区域。在前端开发中，可以通过多种方式实现类似的效果。使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

程序猿
2025年12月24日
3000
好文分享

为什么我的 Safari 自定义样式表在百度页面上失效了？

为什么在 Safari 中自定义样式表未能正常工作？在 Safari 的偏好设置中设置自定义样式表后，您对其进行测试却发现效果不同。在您自己的网页中，样式有效，而在百度页面中却失效。造成这种情况的原因是，第一个访问的项目使用了文件协议，可以访问本地目录中的图片文件。而第二个访问的百度使用了 ht…

程序猿
2025年12月24日
1000
好文分享

如何用前端实现 Windows 10 设置界面的鼠标移动探照灯效果？

如何在前端实现 Windows 10 设置界面中的鼠标移动探照灯效果想要在前端开发中实现 Windows 10 设置界面中类似的鼠标移动探照灯效果，可以通过以下途径： CSS 解决方案 DEMO 1: Windows 10 网格悬停效果：https://codepen.io/tr4553r7/pe…

程序猿
2025年12月24日
1000
好文分享

使用CSS mask属性指定图片URL时，为什么浏览器无法加载图片？

css mask属性未能加载图片的解决方法使用css mask属性指定图片url时，如示例中所示： mask: url(“https://api.iconify.design/mdi:apple-icloud.svg”) center / contain no-repeat; 但是，在网络面板中却…

程序猿
2025年12月24日
1000
好文分享

如何用CSS Paint API为网页元素添加时尚的斑马线边框？

为元素添加时尚的斑马线边框在网页设计中，有时我们需要添加时尚的边框来提升元素的视觉效果。其中，斑马线边框是一种既醒目又别致的设计元素。实现斜向斑马线边框要实现斜向斑马线间隔圆环，我们可以使用css paint api。该api提供了强大的功能，可以让我们在元素上绘制复杂的图形。立即学习“前端…

程序猿
2025年12月24日
1000
好文分享

图片如何不撑高父容器？

如何让图片不撑高父容器？当父容器包含不同高度的子元素时，父容器的高度通常会被最高元素撑开。如果你希望父容器的高度由文本内容撑开，避免图片对其产生影响，可以通过以下 css 解决方法：绝对定位元素： .child-image { position: absolute; top: 0; left: …

程序猿
2025年12月24日
1000
CSS 帮助

我正在尝试将文本附加到棕色框的左侧。我不能。我不知道代码有什么问题。请帮助我。 css .hero { position: relative; bottom: 80px; display: flex; justify-content: left; align-items: start; color:…

程序猿
2025年12月24日 • 好文分享
3000
好文分享

前端代码辅助工具：如何选择最可靠的AI工具？

前端代码辅助工具：可靠性探讨对于前端工程师来说，在HTML、CSS和JavaScript开发中借助AI工具是司空见惯的事情。然而，并非所有工具都能提供同等的可靠性。个性化需求关于哪个AI工具最可靠，这个问题没有一刀切的答案。每个人的使用习惯和项目需求各不相同。以下是一些影响选择的重要因素：立…

程序猿
2025年12月24日
1000
好文分享

如何用 CSS Paint API 实现倾斜的斑马线间隔圆环？

实现斑马线边框样式：探究 css paint api 本文将探究如何使用 css paint api 实现倾斜的斑马线间隔圆环。问题：给定一个有多个圆圈组成的斑马线图案，如何使用 css 实现倾斜的斑马线间隔圆环？答案：立即学习“前端免费学习笔记（深入）”；使用 css paint api…

程序猿
2025年12月24日
1000
好文分享

如何使用CSS Paint API实现倾斜斑马线间隔圆环边框？

css实现斑马线边框样式想定制一个带有倾斜斑马线间隔圆环的边框？现在使用css paint api，定制任何样式都轻而易举。 css paint api 这是一个新的css特性，允许开发人员创建自定义形状和图案，其中包括斑马线样式。立即学习“前端免费学习笔记（深入）”；实现倾斜斑马线间隔圆环 …

程序猿
2025年12月24日
1000