linux中sed和awk有什么区别

区别:1、sed是流编辑器,而awk是文本格式化工具,报告生成器;2、awk适合对文件进行抽取整理,sed适合对文件进行编辑;3、sed读取一行数据,会以行作为单位进行处理,而awk读取一行,会切割成字段,以字段(列)为单位,进行细节处理。

linux中sed和awk有什么区别

本教程操作环境:CentOS 6系统、Dell G3电脑。

awk

awk是一种程序语言,对文档资料的处理具有很强的功能。awk擅长从格式化报文或从一个大的文本文件中抽取数据。

awk 命令是逐行扫描文件(从第 1 行到最后一行),寻找含有目标文本的行,如果匹配成功,则会在该行上执行用户想要的操作;反之,则不对行做任何处理。

awk 命令的基本格式为:

awk [选项] '脚本命令' 文件名

此命令常用的选项以及各自的含义,如表 1 所示。

       表 1 awk 命令选项以及含义                选项                含义

               -F fs               指定以 fs 作为输入行的分隔符,awk 命令默认分隔符为空格或制表符。               -f file               从脚本文件中读取 awk 脚本指令,以取代直接在命令行中输入指令。               -v var=val               在执行处理过程之前,设置一个变量 var,并给其设备初始值为 val。

awk 的强大之处在于脚本命令,它由 2 部分组成,分别为匹配规则和执行命令,如下所示:

'匹配规则{执行命令}'

这里的匹配规则,和 sed 命令中的 address 部分作用相同,用来指定脚本命令可以作用到文本内容中的具体行,可以使用字符串(比如 /demo/,表示查看含有 demo 字符串的行)或者正则表达式指定。另外需要注意的是,整个脚本命令是用单引号(”)括起,而其中的执行命令部分需要用大括号({})括起来。

在 awk 程序执行时,如果没有指定执行命令,则默认会把匹配的行输出;如果不指定匹配规则,则默认匹配文本中所有的行。

举个简单的例子:

[root@localhost ~]# awk '/^$/ {print "Blank line"}' test.txt

在此命令中,/^$/ 是一个正则表达式,功能是匹配文本中的空白行,同时可以看到,执行命令使用的是 print 命令,此命令经常会使用,它的作用很简单,就是将指定的文本进行输出。因此,整个命令的功能是,如果 test.txt 有 N 个空白行,那么执行此命令会输出 N 个 Blank line。

sed

sed 命令采用的是流编辑模式,最明显的特点是,在 sed 处理数据之前,需要预先提供一组规则,sed 会按照此规则来编辑数据。

sed 会根据脚本命令来处理文本文件中的数据,这些命令要么从命令行中输入,要么存储在一个文本文件中,此命令执行数据的顺序如下:

每次仅读取一行内容;

根据提供的规则命令匹配并修改数据。注意,sed 默认不会直接修改源文件数据,而是会将数据复制到缓冲区中,修改也仅限于缓冲区中的数据;

有道小P 有道小P

有道小P,新一代AI全科学习助手,在学习中遇到任何问题都可以问我。

有道小P 64 查看详情 有道小P

将执行结果输出。

当一行数据匹配完成后,它会继续读取下一行数据,并重复这个过程,直到将文件中所有数据处理完毕。

sed 命令的基本格式如下:

sed [选项] [脚本命令] 文件名

该命令常用的选项及含义,如表 1 所示。

       表 1 sed 命令常用选项及含义                选项                含义

               -e 脚本命令               该选项会将其后跟的脚本命令添加到已有的命令中。               -f 脚本命令文件               该选项会将其后文件中的脚本命令添加到已有的命令中。               -n               默认情况下,sed 会在所有的脚本指定执行完毕后,会自动输出处理后的内容,而该选项会屏蔽启动输出,需使用 print 命令来完成输出。               -i               此选项会直接修改源文件,要慎用。

成功使用 sed 命令的关键在于掌握各式各样的脚本命令及格式,它能帮你定制编辑文件的规则。

sed和awk的区别

sed是流编辑器,而awk是文本格式化工具,报告生成器

如果文件是格式化的,即由分隔符分为多个域的,优先使用awk

awk适合对文件的抽取整理,sed适合对文件的编辑。

awk适合按列(域)操作,sed适合按行操作

sed:每次读入一行来处理的,sed 适合简单的文本替换和搜索,sed读取一行,以行作为单位,进行处理。

awk:每次读入一行来处理的(同sed),但awk读取一行,切割成字段,以字段(列)为单位,进行细节处理。

相关推荐:《Linux视频教程》

以上就是linux中sed和awk有什么区别的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/258385.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月4日 08:14:21
下一篇 2025年11月4日 08:15:08

相关推荐

  • 如何使用Xvfb在GitLab CI/CD中运行Pyglet渲染测试

    本文详细介绍了在GitLab CI/CD无头环境中运行Pyglet渲染测试时遇到的`NoSuchConfigException`问题,并提供了一套完整的解决方案。通过正确配置和启动Xvfb虚拟显示服务器,确保Pyglet在持续集成流程中能够成功创建OpenGL上下文并执行图形渲染测试,从而实现自动化…

    2025年12月15日
    000
  • 处理压缩的.tar.Z文件:Python与Pandas的实战指南

    本文旨在解决在python环境中处理`.tar.z`格式压缩文件时遇到的常见问题,特别是当文件被错误地重命名导致无法读取数据时。我们将深入探讨`.tar`和`.z`扩展名的含义,并提供使用python标准库`tarfile`模块进行正确解压缩和数据读取的专业教程,确保您能高效地处理这类双重压缩的归档…

    好文分享 2025年12月15日
    000
  • 解决VS Code中Python解释器差异导致的运行问题

    本文旨在解决vs code中python代码运行结果与终端不一致的问题,尤其是在使用python 3特有语法(如`print()`函数的`sep`参数)时出现的错误。核心原因通常是vs code内部选择了错误的python解释器版本。教程将详细指导用户如何验证、选择并配置正确的python 3解释器…

    2025年12月15日
    000
  • Python FileNotFoundError 深度解析与文件路径处理教程

    本文深入探讨了python中常见的`filenotfounderror`(错误码2),详细解析了其发生原因,主要归结为文件路径不正确或对当前工作目录的误解。教程提供了识别、诊断和解决此类错误的实用方法,包括理解相对路径与绝对路径、使用`os`模块进行路径管理和调试,并通过具体代码示例指导读者正确处理…

    2025年12月15日
    000
  • 解决Kivy安装失败:Python版本兼容性问题指南

    kivy安装失败通常是由于python版本不兼容。本文详细解析了当kivy尚不支持最新python版本(如3.12)时,如何通过选择合适的python环境或使用虚拟环境来成功安装kivy,确保开发环境的稳定性和兼容性。 理解Kivy安装失败的常见原因 在尝试使用pip install kivy命令安…

    2025年12月15日
    000
  • 使用Python监控动态网页库存并发送Discord通知:从静态抓取到无头浏览器

    本文旨在指导读者如何使用Python构建一个商品库存监控机器人,并实时通过Discord发送通知。文章将深入探讨在面对JavaScript动态加载内容的网站时,传统网页抓取工具(如BeautifulSoup)的局限性,并详细介绍如何利用无头浏览器(如Selenium)来模拟用户行为、获取动态数据,最…

    2025年12月15日
    000
  • 解决 NumPy 安装中 Meson 构建系统错误的指南

    本文旨在解决在 windows 环境下使用 `pip` 安装 numpy 时遇到的 meson 构建系统错误,特别是涉及 `attributeerror: ‘nonetype’ object has no attribute ‘endswith’` 和…

    2025年12月15日
    000
  • 解决AWS Lambda Docker容器中Pytest重复执行问题

    在使用aws sam本地调用docker容器时,pytest测试框架可能出现重复执行的情况。这通常是由于dockerfile中对entrypoint指令的误用造成的。aws lambda基础镜像已预设其运行时入口点,自定义entrypoint会与基础镜像冲突。通过移除dockerfile中自定义的e…

    2025年12月15日
    000
  • 深入理解 Hatch 虚拟环境存储机制与自定义实践

    hatch 作为一个现代 python 项目管理工具,默认将虚拟环境存储在其管理的数据目录中,而非项目根目录。本文将解释 hatch 采用这种策略的原因,并提供详细教程,指导用户如何利用 `–data-dir` 选项自定义虚拟环境的存储位置,从而满足特定项目或工作流的需求,同时探讨这种默…

    2025年12月15日
    000
  • 通过SSH终端访问远程GUI应用程序的专业指南

    本教程详细介绍了如何在windows系统上,利用x11转发技术通过ssh连接远程linux设备(如raspberry pi),并显示其gui应用程序(如tkinter界面)。通过配置putty的x11转发功能并运行xming x服务器,开发者可以便捷地在本地调试和交互远程gui,无需频繁切换物理连接…

    2025年12月15日
    000
  • 解决Kivy安装失败:Python版本兼容性问题解析与对策

    本文旨在解决kivy框架安装过程中常见的兼容性问题,特别是当使用最新python版本时遇到的`subprocess-exited-with-error`和`no matching distribution found`错误。核心解决方案是选择与kivy及其依赖库兼容的python版本,并结合虚拟环境…

    2025年12月15日
    000
  • Python包管理:使用Pip和虚拟环境替代Conda的安装方法

    本文详细阐述了如何在不安装Conda的情况下,利用Python的`pip`包管理器和虚拟环境来管理和安装项目依赖。通过创建独立的虚拟环境、激活环境并从`requirements.txt`文件安装Python包,提供了一种高效且标准化的替代方案,适用于主要依赖Python库的项目,确保依赖隔离与项目可…

    2025年12月14日
    000
  • 在不使用Conda的情况下,通过Pip管理Python环境与安装软件包

    本教程旨在指导用户如何在不安装conda的情况下,利用python内置的`venv`模块创建独立的虚拟环境,并通过`pip`工具高效安装和管理python软件包。文章将详细阐述如何处理conda的`environment.yaml`文件,使其兼容`pip`安装流程,并提供完整的操作步骤、代码示例及重…

    2025年12月14日
    000
  • 解决Kivy安装失败:Python版本兼容性与环境配置指南

    kivy安装失败,特别是遇到`subprocess-exited-with-error`或`no matching distribution found`等依赖错误时,其核心原因往往是python版本不兼容。本文将深入探讨kivy对python版本的严格要求,并提供一套完整的解决方案,指导用户通过选…

    2025年12月14日
    000
  • python curses模块是什么?

    答案是Python的curses模块用于创建终端文本用户界面,支持光标控制、窗口管理、键盘输入处理和颜色显示,通过curses.wrapper()初始化并自动恢复终端状态,需手动刷新屏幕以更新内容。 Python 的 curses 模块是一个用于在终端中创建文本用户界面(TUI)的工具。它允许开发者…

    2025年12月14日
    000
  • python中cffi模块如何使用?

    cffi用于Python调用C函数,支持ABI和API模式。ABI模式直接加载共享库调用C函数,如用ffi.dlopen()调用libc的puts和printf;API模式通过set_source()定义C代码并编译成扩展模块,如封装add函数供Python使用。需注意字符串为bytes、结构体声明…

    2025年12月14日
    000
  • Python 初学者最常见的环境搭建误区

    安装Python时未添加到PATH会导致命令无法识别,需重新安装并勾选“Add Python to PATH”;2. 应避免混淆Python 2与3,务必安装Python 3.x版本并通过python –version确认;3. 初学者不应过度依赖PyCharm等复杂IDE,建议先使用I…

    2025年12月14日
    000
  • python函数超时怎么自动退出?

    答案:Python中实现函数超时退出的常用方法有三种:1. 使用signal模块(仅限Unix/Linux),通过alarm设置定时器,超时触发TimeoutError;2. 使用concurrent.futures的ThreadPoolExecutor,跨平台通用,通过result(timeout…

    2025年12月14日
    000
  • python中sys模块是什么?

    sys模块是Python内置模块,用于获取系统信息、操作命令行参数、控制输入输出流及程序退出。通过sys.version、sys.platform等可查看版本和操作系统;sys.argv获取命令行参数;sys.stdin、stdout、stderr支持重定向;sys.exit()用于退出程序,sys…

    2025年12月14日
    000
  • 如何安装python中pandas 1.1.0版本?

    安装pandas 1.1.0需先升级pip:python -m pip install –upgrade pip,再执行pip install pandas==1.1.0,建议在虚拟环境中进行,最后用python -c “import pandas as pd; print(…

    2025年12月14日
    000

发表回复

登录后才能评论
关注微信