百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Shell脚本怎么写?Linux命令之awk上期(awk是一门语言概述)

ahcoder 2025-01-03 13:57 12 浏览

同学们好啊,今天周末,昨天加了一天班,今天才腾出手来,给大家讲讲linux 里功能可能是最强大的命令,awk。

awk 可谓是一个小型化的编程语言,看着像是一个命令而已,其实内里乾坤那可是真的大,不知道今天这篇文章是否能给大家完全讲清楚,如果一节课讲不清楚的话,我们可能还得增加一次。

好的,按照惯例,我们先回顾一下之前学习的内容,如果你想不起来之前的内容的话,请点击下面链接跳转回忆一下:

Shell脚本怎么写?(0)

Shell脚本怎么写?(1)——Shell 变量类型和定义

Shell脚本怎么写?(1-2)——Shell 变量的高级用法

Shell脚本怎么写?之 Shell脚本中的流程控制(1)

Shell脚本怎么写?之 Shell脚本中的流程控制(2)

Shell脚本怎么写?之简单Shell 脚本编写实践

Shell脚本怎么写?之简单Shell 脚本函数和模块

Shell脚本怎么写?Linux命令三剑客之sed命令

好了,废话不多说,我们开始今天的内容吧。

按照上节课讲过的,我们想了解一个新的linux 命令时,先找一下男人,执行一把 man awk。

结果如下:

先贴一段awk 的概览描述如下:

awk 是一种处理文本文件的语言,是一个强大的文本分析工具。

awk 通过提供编程语言的功能,如变量、数学运算、字符串处理等,使得对文本文件的分析和操作变得非常灵活和高效。

我们经常使用awk 处理以行为粒度的数据,大家一定要记着这个,这是我们在做脚本编程时,有那么多工具命令,具体选择什么工具和命令才能简洁的实现我们想要的功能的基础。

下面先看一个示例,了解一下awk 的强大:

场景如下:

我们有一个score.txt 的文件,具体内容如下:

我们有个需求,假设这个文件的来源是某个程序生成的日志数据文件,当前格式的可读性很差,我们想自动化的处理以上日志文件的数据,并生成一个可读格式的报表。

此时我们就可以使用awk来简单的实现这个功能,而不需要借助任何除了linux 之外的工具和其它语言(如python等)。

那怎么实现呢?

请看下面的内容:

可以看到,我们的score.txt 的日志文件,分别有五列,awk 以行为粒度进行处理。

我们通过简单的awk 脚本语言,把数据进行整理,格式化,求和和平均值等操作后,进行格式化输出。

先看下处理后的运行结果,然后我们再详细解读下以上脚本的每个部分的具体含义。(写到这里的时候,我感觉今天一篇文章估计是介绍不完了,下一篇将继续介绍awk在Linux上的额使用,今天能把awk的语法介绍清楚就不错了)。

我们怎么使用上面的cal.awk 脚本处理score.txt 文件呢?

命令如下:

awk -f cal.awk score.txt
// -f 后跟awk脚本文件名
// 最后跟要处理的文件名即可

执行结果如下:

看到了吧,awk 语言真的强大,可以做变量的保存,分支流程控制,加减乘除计算,格式化输入输出等,它就是一门小型的完备的编程语言。

好的,下面我们来细致的介绍一下awk 的语法和脚本的含义。

我们以每行注释的形式解释一下上面的代码。

#!/bin/awk -f
// 说明是awk脚本,用awk -f 解释的文本

#before running
BEGIN {
        math = 0
        english = 0
        computer = 0

        printf "Name    No.   Math    English    Computer    Total\n"
        printf "--------------------------------------------------\n"
}
/* 
1. BEGIN 包裹的部分,整个
awk处理流程中只会执行一次,
就是在程序开始执行时,

2. 在BEGIN中,我们做了一些
初始化操作,定义了 math,
english, computer 这三个
变量的值。

3. 并打印了格式化头的内容
注意awk 的printf 语法没有
括号其它的跟shell的printf
基本一致,也跟c语言的差不
多
*/

#running main // 这是注释
{
        math += $3
    english += $4
        computer += $5
        printf "%-6s %-6s %4d %8d %8d %8d\n", $1,$2,$3,$4,$5,$3+$4+$5
}
/*
这个大括号里的内容,我们讲过,
awk是以行为粒度进行文本处理
的,所有这个大括号内的内容,
每处理一行,就会调用一次

有多少行文本内容待处理,
就会调用多少次,相当于
一个隐式的for 循环,循环
次数是行数

在这里,我们进行了变量
的递增处理

$1--$5 代表的每一列的数据
awk中默认使用FS=' ' 空格
来进行分列。
score.txt 的内容按照空格
可以分为五列
因此入参$1 - $5 分别代表
某一特定行的某一特定列
的内容
*/

#after running
END {
        printf "--------------------------------------------------\n"
        printf "Total:%10d %8d %8d \n", math, english, computer
        printf "AVERAGE:%10.2f %8.2f %8.2f\n", math/NR, english/NR, computer/NR
}

/*
最后是END 括起来的部分,
只会在最终处理完成后,
执行收尾工作,仅执行一次

在此,我们打印了变量的汇总
结果

其中NR 是awk 的内置变量,
代表总行数

math/NR 即为数学成绩的
平均值
其它同理
*/

好了,以上就是我们通过注释的形式,解释了一下上面的脚本各个部分的含义,相信大家仔细阅读我写的注释部分,一定会对awk 脚本命令有个初步的了解,至少在awk 脚本执行分为几个部分,每个部分的执行特征, 一些简单的awk 内置变量,变量的定义和使用,格式化输出等方面有个初步的了解。

鉴于这篇文章已经过长了,信息量有点大了,我们的awk命令讲解将再有一期下期,详细介绍awk 内置的其它变量和awk 的流程控制语句以及再linux 脚本中,我们结合top ,ls 等命令查到的结果如何经过awk 进行进一步加工处理等内容。

欲看后事如何,请听下回分解。。。如果你觉得我写的还行的话,别忘了关注哟。

相关推荐

ARM64内核内存布局图(ARM64内核内存布局图解)

ARM64架构处理器采用48位物理寻址机制,最大可以寻找到256TB的物理地址空间。对于目前的应用来说已经足够了,不需要扩展到64位的物理地址寻址。虚拟地址也同样最大支持48位支持,所以在处理器的架构...

ARM64 linux 调试串口通信(ARM64 linux 调试串口通信实验报告)

ARM64linux调试串口通信随着国产机普及很多工作也转移到了新平台上,以前调试设备用的笔记本电脑也换成新国产ARM64架构的了。本文以绿联CM204USB-A转RJ45Console调试线...

Gentoo Linux 终止对 Itanium IA-64 体系的支持

GentooLinux是最后几个继续维护Itanium(IA-64)架构构建的Linux发行版之一,但现在这些已停产的英特尔处理器正在逐步淘汰。由于Linux6.7内核放弃了对Itan...

如何检查 Linux 系统是 32 位还是 64 位?这9个命令查的又快又准!

在Linux系统中,位数(bit)通常指的是CPU架构的位宽,即CPU一次能够处理的数据量。32位系统和64位系统在内存寻址能力、计算性能和软件支持上存在显著差异:「32位系统」:...

调出好画面!带你玩转飞凌嵌入式AM62x开发板的显示接口

来源:飞凌嵌入式官网“显示”是嵌入式开发板最为重要的功能之一,能够支持更多种类、更高规格的显示接口,意味着它能够应对的使用场景也更加广泛。每一款嵌入式开发板在出厂前都会做屏幕调试,但在客户的实际项目开...

带你玩转AM62x开发板的显示接口——LVDS的显示和修改方式

此前小编已为大家介绍过OK6254-C开发板的RGB显示和修改方式,今天将继续为大家介绍OK6254-C开发板的LVDS显示和修改方式。话不多说,我们进入正题。1、LVDS接口规格飞凌嵌入式OK62...

AM335x继任者?AM6254性能解析(am2361p)

飞凌嵌入式FET6254-C核心板基于TISitaraTMAM62x系列工业级处理器设计开发,采用ARMCortex-A53架构,主频最高可达1.4GHz;并集成了丰富的接口,可广泛应用于的工...

如何在 Linux 发行版中安装微信和 QQ?

很多人因为工作沟通的原因需要用到微信和QQ,那么如何在Linux发行版中安装微信和QQ呢?以下是一些尝试的解决方法。QQ上一个版本的QQLinux版还是在2009年,而在现在,基于N...

MySQL:物理备份工具XBK(mysql 备份方案)

XBK的优缺点:XBK(PerconaXtraBackup)优点:1.免费2.热备:备份期间不阻塞innodb和XtraDB表,但会阻塞Myisam表3.物理备份:备份恢复快XBK缺点:1.不支持远...

AMD锐龙9 9950X CPU AIDA64跑分曝光:比7950X最高快45%

IT之家6月26日消息,Anandtech论坛网友igor_kavinski本周一发布帖子,分享了AMD旗舰锐龙99950X处理器的AIDA64基准测试跑分,与当前基于Z...

qemu linux内核(5.10.209)开发环境搭建

版本信息宿主机:ubuntu20.04.6LTS(FocalFossa)虚拟机:ubuntu20.04.6LTS(FocalFossa)安装宿主机的步骤省略,和一般的在vmware中安...

iPhone 7成刷机神器,成功运行乌班图、Linux、安卓

在智能机刚开始流行的时候,很多手机发烧友都喜欢刷机,当时民间大神们制作了特别多优化的ROM。后来随着手机硬件的逐步提升,以及厂商们对系统的大力优化,让大家对于刷机的兴趣也越来越少。不知道大家还记得这部...

12 款最佳免费开源 Linux 渲染器 | 火狐浏览器 130.0 版本更新

12款最佳免费开源Linux渲染器Linux的一大优势在于其拥有丰富的开源软件,可以满足艺术家、摄影师、动画师和设计师的需求。凭借价格低廉的硬件、免费的软件以及少量的才能和灵感,任何人都可以创...

Linux中xargs 命令详解与实用场景

xargs是Linux系统中常用的命令行工具之一,它能够从标准输入构造参数列表并传递给其他命令使用,是处理批量数据操作时的重要利器。一、xargs的基本语法xargs[OPTION]...[C...

Linux 磁盘扩容(非LVM)方式(linux扩容lvm磁盘容量)

今天接到一个客户的需求,CentOS的/分区容量太小了,OA系统所有的数据都在这下面,由于当时前同事给客户安装系统时采用了标准分区,而不是LVM逻辑卷,所以不支持在线扩容。df-hT查看磁盘使...