Linux四剑客grep、find、sed、awk使用全解析
笔记哥 /
04-17 /
32点赞 /
0评论 /
357阅读
## 介绍
Linux四剑客是指在Linux系统中非常常用的四个命令工具,它们分别是grep、find、sed和awk。这四个工具在Linux系统中具有非常强大的功能,可以方便快捷地对文本进行搜索、处理和查找。
## grep命令
### 作用
grep命令主要用于过滤文件内容,在文件中找到你需要或者不要的内容,类似与一个漏斗.
### 语法
`grep [选项] [关键字] 文件`
### 常用选项说明
这里只列出了实际工作中常用的选项,如果有其它的选项漏掉的,可以进行评论
- -i:不区分关键字的大小写,ignore case
- -n:显示文件的行号
- -v:取反,排除关键字
- -r:递归搜索指定目录下的所有文件,例如`grep -r "pattern" /path/to/directory`
- -c:计数,只返回匹配的行数,类似`wc -l`命令
- -e:同时搜索多个模式,匹配任意一个即可。例如`grep -e "pattern1" -e "pattern2" file.txt`
- -E:可以使用正则表达式,例如`grep -E "pattern1|pattern2" file.txt`
- -l:在多个文件中搜索时,只显示包含匹配模式的文件名,而不是文件内容。例如`grep -l "pattern" *.txt`
- -L:在多个文件中搜索时,只显示不包含匹配模式的文件名。例如`grep -L "pattern" *.txt`
- -C:显示匹配行前后的指定行数。例如`grep -C 2 "pattern" file.txt`
- -F:匹配包含固定字符串的行。例如`grep -F "fixed" string file.txt`
- -A:显示匹配行后的指定行数。如`grep -A 2 "pattern" file.txt`
- -B:显示匹配行前的指定行数。如`grep -B 2 "pattern" file.txt`
## find命令
### 作用
find 是一个在 Linux 和 Unix 系统中非常强大的命令行工具,用于在文件系统中搜索文件和目录。它可以根据文件名、路径、大小、修改时间、权限等多种条件进行搜索
### 语法
```csharp
find [搜索路径] [选项] [表达式]
```
- 搜索路径,指定从哪个目录开始搜索,如果不指定搜索深度,默认会在指定目录下递归搜索。如果不指定目录,默认从当前目录开始
- 选项:用于控制搜索行为,例如递归深度,搜索类型等
- 表达式:用于定义搜索条件,如文件名、大小、修改时间等
### 常用选项
- -name:根据文件名搜索
```csharp
#搜索/etc目录下hosts文件
[root@master:~]# find /etc/ -name "hosts"
/etc/hosts
#搜索/etc目录下所有以conf结尾的文件
[root@master:~]# find /etc -name "*.conf"
/etc/nscd.conf
/etc/nsswitch.conf
...
/etc/modules-load.d/modules.conf
/etc/request-key.d/id_resolver.conf
/etc/kubernetes/scheduler.conf
```
- -type:指定文件类型
- f:文件类型为普通文件
- d:文件类型为目录
- l:文件类型为符号链接
```csharp
# 搜索/etc目录下所有的目录
[root@master:~]$ find /etc/ -type d
# 搜索/etc目录下所有的文件
[root@master:~]$ find /etc/ -type f
# 搜索/etc目录下所有的符号连接
[root@master:~]$ find /etc/ -type l
```
- -size:根据文件大小搜索
- +n:文件大于n
- -n:文件小于n
- n:文件等于n
- 单位:`c`(byte)、`k`(kb)、`M`(Mib)、`G`(Gib)
```csharp
# 搜索/etc目录下大于10K的文件
[root@master:~]$ find /etc/ -size +10k
/etc/login.defs
/etc/X11/rgb.txt
/etc/ld.so.cache
```
- -mtime:根据文件修改时间搜索,单位天。
- +n:超过 n 天。
- -n:少于 n 天。
- n:正好 n 天。
```csharp
#查找etc目录下修改时间大于30天的文件
[root@master:~]$ find /etc/ -mtime +30
```
- -mmin:根据文件修改时间搜索,单位分钟
- +m:超过 m 分钟
- -m:少于 m 分钟
- m:正好 m 分钟
```csharp
#查找etc目录下修改时间大于30分钟的文件
[root@master:~]$ find /etc/ -mmin +30
```
- -perm:根据文件权限进行搜索
```csharp
[root@master:~]$ find /etc/ -perm 755
```
- -user:根据文件拥有者进行搜索
```csharp
# 搜索etc目录下,用户为root的文件
[root@master:~]$ find /etc/ -user root
```
- -group:根据文件所属组进行搜索
```csharp
[root@master:~]$ find /etc/ -group root
```
- -maxdepth:限制搜索的最大深度,也就是指定递归搜索的深度
1代表指定目录下,2代表指定目录下的下一层目录,依次递归下去
```csharp
# 查找当前目录下以conf结尾的文件
[root@master:~]$ find /etc/ -maxdepth 1 -name "*.conf"
```
- -empty:查找空目录或空文件
```csharp
# 查找空目录
[root@master:~]$ find /etc/ -type d -empty
# 查找空文件
[root@master:~]$ find /etc/ -type f -empty
```
- -delete:直接删除文件
```csharp
# 查找到空文件直接删除
[root@master:~]$ find /var/ -type f -empty -delete
```
- -exec:对搜索到的文件执行命令
```csharp
# 查找到空文件进行删除
[root@master:~]$ find /var/ -type f -empty -exec rm -f {} \
```
- -a:使用-a(逻辑与,and)或者默认的空格分隔符组合多个条件
```csharp
[root@master:~]$ find /path/to/search -type f -size +10M -mtime +30
```
- -o:使用-o(逻辑或,or)组合多个条件
```csharp
#搜索文件扩展名为txt或log的文件
[root@master:~]$ find /path/to/search \( -name "*.txt" -o -name "*.log" \)
```
## sed命令
sed(Stream Editor)是一个流式文本编辑器,用于对文本进行快速的、非交互式的编辑。它能够对输入的文本进行各种操作,如替换、删除、插入、提取等,并将结果输出到标准输出(stdout)。
### 基本语法
```csharp
sed [选项] '编辑命令' 文件名
```
- 选项:用于控制 sed 的行为,例如 -i 表示直接修改文件,-n 表示静默模式。
- 编辑命令:定义对文本的具体操作,通常放在单引号或双引号中。
- 文件名:指定要处理的文件。如果省略文件名,sed 会从标准输入读取数据。
`sed`常用选项:
- -n:默认情况下,sed会在所有的脚本执行完毕后,自动输出处理后的内容,而该选项会屏蔽自动输出,需要使用print命令来完成输出。一般结合p使用
- -i:此选项会直接修改源文件,要慎用
- -i.bak:先备份再修改文件内容,推荐使用
- -r:支持扩展正则
### `sed` 打印行
示例一:打印出文件所有的内容
```csharp
[root@master:~]# sed '' /etc/passwd
root:x:0:0:root:/root:/bin/bash
#...省略万字内容
devops:x:1000:1000::/home/devops:/bin/sh
```
示例二:打印出文件的第五行数据
```csharp
[root@master:~]# sed -n '5p' /etc/passwd
sync:x:4:65534:sync:/bin:/bin/sync
```
示例三:打印出文件的第五行至第十行数据
```csharp
[root@master:~]# sed -n '5,10p' /etc/passwd
sync:x:4:65534:sync:/bin:/bin/sync
games:x:5:60:games:/usr/games:/usr/sbin/nologin
man:x:6:12:man:/var/cache/man:/usr/sbin/nologin
lp:x:7:7:lp:/var/spool/lpd:/usr/sbin/nologin
mail:x:8:8:mail:/var/mail:/usr/sbin/nologin
news:x:9:9:news:/var/spool/news:/usr/sbin/nologin
```
示例四:打印出文件的最后一行数据
```csharp
[root@master:~]# sed -n '$p' /etc/passwd
devops:x:1000:1000::/home/devops:/bin/sh
```
### `sed` 过滤内容
示例一:过滤包含root的行
```csharp
[root@master:~]# sed -n '/root/p' /etc/passwd
root:x:0:0:root:/root:/bin/bash
```
示例二:过滤包含root和devops的行
```csharp
[root@master:~]# sed -nr '/root|devops/p' /etc/passwd
root:x:0:0:root:/root:/bin/bash
devops:x:1000:1000::/home/devops:/bin/sh
```
### `sed` 替换文件内容
语法:
```csharp
sed [选项] 's#源内容#要修改的内容#g' 文件名
选项说明:
-i:替换文件
-i.bak:先备份文件为源文件名.bak
```
示例:
```csharp
# 先模拟数据
[root@master:~]# cat>1.txt< huangsir
> huangsir
> huangsir666
> EOF
# 不加-i选项,发现并没有替换文件内容
[[root@master:~]]# sed s#huangsir#root#g 1.txt
root
root
root666
[root@master:~]# cat 1.txt
huangsir
huangsir
huangsir666
# 添加-i.bak进行替换
root@master:~# sed -i.bak s#huangsir#root#g 1.txt
root@master:~# ll 1.txt 1.txt.bak
-rw-r--r-- 1 root root 18 Apr 17 16:28 1.txt
-rw-r--r-- 1 root root 30 Apr 17 16:26 1.txt.bak
root@master:~# cat 1.txt
root
root
root666
root@master:~# cat 1.txt.bak
huangsir
huangsir
huangsir666
# 直接修改,不备份
root@master:~# sed -i s#huangsir#root#g 1.txt.bak
root@master:~# cat 1.txt.bak
root
root
root666
```
示例:分组进行替换
```csharp
root@master:~# echo 123456 | sed -r 's#(12)(34)(56)#\1\2\3#g'
123456
root@master:~# echo 123456 | sed -r 's#(12)(34)(56)#\3\2\1#g'
563412
```
### `sed` 删除内容
编辑命令中添加d可以删除文件内容
示例:删除某一行的数据
```csharp
# 删除第一行的数据
sed -i '1d' 1.txt
# 删除最后一行的数据
sed -i '$d' 1.txt
# 删除前缀为1的行
sed -i '/^1/d' 1.txt
```
### `sed` 增加文件内容
指令:
- c:replace:clean 清空指定行,然后写入内容
- a:apennd,在指定那行下面增加一行
- i:insert,在指定那行上面增加一行
示例:在文件第一行下增加一行数据
```csharp
# 在第一行后追加一行haha数据
sed -i '1a haha' 1.txt
```
## awk命令
`awk`能够对文本文件进行复杂的分析、处理和格式化操作。与 sed 不同,awk 更适合处理结构化的文本数据,例如带有分隔符的表格数据。
作用:取行、取列、统计与计算
### 语法
```csharp
awk [选项] '模式 {动作}' 文件名
```
常用选项
- -F:指定字段分隔符(默认为空白字符,如空格或制表符)。
- -f:从文件中读取 awk 脚本。
- -v:定义变量的初始值
### 使用awk取行
awk中内置变量`NR`表示行
示例:
```csharp
# 取出第一行的数据
root@master:~# awk 'NR==1' /etc/passwd
root:x:0:0:root:/root:/bin/bash
# 取出第三行到第十行的数据
root@master:~# awk 'NR>=3 && NR<=10' /etc/passwd
bin:x:2:2:bin:/bin:/usr/sbin/nologin
sys:x:3:3:sys:/dev:/usr/sbin/nologin
sync:x:4:65534:sync:/bin:/bin/sync
games:x:5:60:games:/usr/games:/usr/sbin/nologin
man:x:6:12:man:/var/cache/man:/usr/sbin/nologin
lp:x:7:7:lp:/var/spool/lpd:/usr/sbin/nologin
mail:x:8:8:mail:/var/mail:/usr/sbin/nologin
news:x:9:9:news:/var/spool/news:/usr/sbin/nologin
# 取出包含bash的行
root@master:~# awk '/bash/' /etc/passwd
root:x:0:0:root:/root:/bin/bash
# 取出包含root和devops的行
root@master:~# awk '/root|devops/' /etc/passwd
root:x:0:0:root:/root:/bin/bash
devops:x:1000:1000::/home/devops:/bin/sh
# 取出文件中指定时间段内的日志
root@master:~# awk '/11:00:00/,/11:10:00/' /acces.log
```
### awk取列
awk中内置变量`NF`表示列
示例:
```csharp
# 取出/etc/hosts文件的第三列、最后一列
root@master:~# awk '{print $3,$NF}' /etc/hosts
localhost
following hosts
ip6-localhost ip6-loopback
ip6-allnodes
ip6-allrouters
iv-ydpkgu0jcwwh2yox8410 iv-ydpkgu0jcwwh2yox8410
# 对齐
root@master:~# awk '{print $3,$NF}' /etc/hosts | column -t
localhost
following hosts
ip6-localhost ip6-loopback
ip6-allnodes
ip6-allrouters
iv-ydpkgu0jcwwh2yox8410 iv-ydpkgu0jcwwh2yox8410
```
### awk取行取列
示例:取出`ip a s eth0`的IP地址
```csharp
root@master:~# ip a s eth0
2: eth0: mtu 1500 qdisc mq state UP group default qlen 1000
link/ether 00:16:3e:16:5b:ef brd ff:ff:ff:ff:ff:ff
inet 10.3.0.86/20 brd 10.3.15.255 scope global dynamic eth0
valid_lft 310239265sec preferred_lft 310239265sec
inet6 fe80::216:3eff:fe16:5bef/64 scope link
valid_lft forever preferred_lft forever
root@master:~# ip a s eth0 | awk 'NR==3' | awk -F 'inet |/20' '{print $2}'
10.3.0.86
```
示例:统计free结果中内存空闲率
```csharp
root@master:~# free | awk 'NR==2{print $NF/$2}'
0.82089
root@master:~# free | awk 'NR==2{print $NF/$2*100"%"}'
82.0729%
```
### awk计算
大多数情况都可以使用`awk`进行算数运算,`awk`可以进行整数、小数的运算
基础用法示例:
```csharp
root@master:~$ awk 'BEGIN{print 1/3}'
0.333333
root@master:~$ awk 'BEGIN{print 2*3}'
6
root@master:~$ awk 'BEGIN{print 3+3}'
6
root@master:~$ awk 'BEGIN{print 4-3}'
1
```
携带变量示例
`awk -v`选项用于创建或修改awk中的变量,-v是shell脚本与awk的桥梁
在awk中各种变量直接使用即可,不要加上$,如果加上了会被awk认为是取列
```csharp
root@master:~$ num1=2
root@master:~$ num2=5
root@master:~$ awk -va1=${num1} -va2=${num2} 'BEGIN{print a1/a2}'
0.4
root@master:~$ awk -va1=${num1} -va2=${num2} 'BEGIN{print a1*a2}'
10
root@master:~$ awk -va1=${num1} -va2=${num2} 'BEGIN{print a1+a2}'
7
root@master:~$ awk -va1=${num1} -va2=${num2} 'BEGIN{print a1-a2}'
-3
```
本文来自投稿,不代表本站立场,如若转载,请注明出处:http//www.knowhub.vip/share/2/2344
- 热门的技术博文分享
- 1 . ESP实现Web服务器
- 2 . 从零到一:打造高效的金仓社区 API 集成到 MCP 服务方案
- 3 . 使用C#构建一个同时问多个LLM并总结的小工具
- 4 . .NET 原生驾驭 AI 新基建实战系列Milvus ── 大规模 AI 应用的向量数据库首选
- 5 . 在Avalonia/C#中使用依赖注入过程记录
- 6 . [设计模式/Java] 设计模式之工厂方法模式
- 7 . 5. RabbitMQ 消息队列中 Exchanges(交换机) 的详细说明
- 8 . SQL 中的各种连接 JOIN 的区别总结!
- 9 . JavaScript 中防抖和节流的多种实现方式及应用场景
- 10 . SaltStack 远程命令执行中文乱码问题
- 11 . 推荐10个 DeepSeek 神级提示词,建议搜藏起来使用
- 12 . C#基础:枚举、数组、类型、函数等解析
- 13 . VMware平台的Ubuntu部署完全分布式Hadoop环境
- 14 . C# 多项目打包时如何将项目引用转为包依赖
- 15 . Chrome 135 版本开发者工具(DevTools)更新内容
- 16 . 从零创建npm依赖,只需执行一条命令
- 17 . 关于 Newtonsoft.Json 和 System.Text.Json 混用导致的的序列化不识别的问题
- 18 . 大模型微调实战之训练数据集准备的艺术与科学
- 19 . Windows快速安装MongoDB之Mongo实战
- 20 . 探索 C# 14 新功能:实用特性为编程带来便利