百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

awk与sed序列(5)awk条件、循环和数组

mhr18 2024-09-26 14:02 19 浏览 0 评论

今天介绍一下awk里面的条件、循环和数组相关的基础知识

条件语句

语法如下:

if(expression){
 action1;
 action2;
}[else
 action]

注:expression 为空或者0时,表达式为假条件操作符

awk中提供的条件操作符可以在C语言中找到,它的形式为:

expr?action1:action2

当expr为真时,执行action1,为假时执行action2。

循环

循环是一种用于重复执行一个或者多个操作的结构。在awk中循环结构可以用while、do或for语句指定。

While循环

while循环语法:

while (condition){
 action
}

Do循环

Do循环语法为:

do
 action
while(condition)

For循环

For循环语法:

for(set_counter;test_counter;increment_counter){
 action
}

for循环由3个表达式组成:

set_counter:设置计数器变量的初值。

test_counter:描述在循环开始时要测试的条件。

increatment_counter:每次在循环底部递增计数器,且恰好在重新测试test_counter之前。

影响流控制的其他语句

在一个循环中有两个可以影响控制流,break和continue。

break语句顾名思义就是退出循环,这样将不再继续执行循环。

continue语句在到达循环底部之前终止当前的循环,并从循环的顶部开始一个新的循环。

有两个语句能影响主输入循环,next和exit。

next语句能够导致读入下一个输入行,并返回到脚本顶部。这个可以避免对当前输入行执行其他的操作过程。

exit语句是主输入循环退出并将控制转移到END规则,如果END存在的话。如果没有定义END规则,或在END中应用exit语句,则终止脚本的执行。

另外,它可以使用一个表达式作为参数,该表达式将作为awk的退出状态返回,如果没有提供表达式,那么将返回0。如果为exit语句设置一个初值,然后在END中再次调用没有参数的exit,则使用第一个值。

数组

在awk中不必指明数组的大小,只需要为数组指定标识符。

$awk 'BEGIN{arr[1]="ouhanzhong";print arr[1]}'
$ouhanzhong

还可以和awk内置变量联系起来用。如NR,记录编号。

关联数组

awk中,所有的数组都是关联数组。关联数组的独特之处在于它的下标可以是一个字符串或者一个数值。

有一个特殊的循环语法可以访问关联数组的所有元素,它是for循环的一个版本

 for(variable in array){
 do something with array[variable]
}

array是一个数组名字。variable是一个变量,可以将它看作和普通for循环计数器一样递增的临时变量。该变量在每次循环时被赋予一个特殊的下标。

重要的是需要记住awk中的所有数组下标都是字符串类型。即使使用数字作为下标,awk将自动将它们转换为字符串。

测试数组中的成员资格

关键词in也是一个操作符,用在条件表达式中来测试一个下标是否是数组的成员,表达式为:

 item in array

如果array[item]存在则返回1,不存在则返回0。

用split()创建数组

内置函数split()能够将任何字符串分解到数组的元素中。这个函数对于从字段中提取“子字段”是很有用的。

函数split()的语法为:

 n = split(string,array,separator)

string是要被分解到名字为array的元素中的输入字符串。数组的下标从1开始到n,n即为数组中元素的个数。元素根据指定的separate分隔符来分解。

[oracle@centos ~]$ echo "Ou Han Zhong tet ttt"|awk -F' ' '{n=split($0,y," ");print n}'
输出:
5
[oracle@centos ~]$ echo "Ou Han Zhong"|awk -F' ' '{n=split($0,y," ");print y[n-1]}'
输出:
Han

删除数组元素

awk提供了一个语句用于从数组中删除一个元素。语法是:

 delete array[subscript]

这里的方括号是必须的。这个语句将删除array中下标为subscript的元素。

多维数组

需要注意,awk数组是关联数组,只要通过数组引用它的key,就会自动创建改序列。如下:

[oracle@centos ~]$ awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";if(tB["c"]!="1"){print "no found";};for(k in tB){print k,tB[k];}}'
输出:
no found
a a1
b b1
c

上面代码 tB[“c”] 会自动创建序列。

awk的多维数组在本质上是一维数组,更确切一点,awk在存储上并不支持多维数组。awk提供了逻辑上模拟二维数组的访问方式。

例如,array[2,4] = 1这样的访问是允许的。awk使用一个特殊的字符串SUBSEP (\034)作为分割字段,在上面的例子中,关联数组array存储的键值实际上是2\0344。

类似一维数组的成员测试,多维数组可以使用if ( (i,j) in array)这样的语法,但是下标必须放置在圆括号中。

类似一维数组的循环访问,多维数组使用 for ( item in array )这样的语法遍历数组。与一维数组不同的是,多维数组必须使用split()函数来访问单独的下标分量。split ( item, subscr, SUBSEP)

[oracle@centos ~]$ awk 'BEGIN{
> for(i=1;i<=9;i++){
> for(j=1;j<=9;j++){
> tarr[i,j]=i*j;
> print i,"*",j,"=",tarr[i,j];
> }
> }
> }'
1 * 1 = 1
1 * 2 = 2
1 * 3 = 3
1 * 4 = 4
1 * 5 = 5
1 * 6 = 6
1 * 7 = 7
1 * 8 = 8
....
9 * 7 = 63
9 * 8 = 72
9 * 9 = 81

作为系统变量的数组

awk中提供了两个系统变量,他们是数组。

ARGV

这是一个命令行参数的数组,不包括脚本本身和任何调用awk指定的选项。这个数组中的元素的个数可以从ARGC中获得。数组中的第一个元素的下标是0(和awk中的其他数组不同,而和C一致),最后一个下标是ARGC-1。

ENVIRON

一个环境变量数组,数组中的每个元素时当前环境变量的值,而其下标是环境变量的名字。

命令行参数数组

注意,如果你在shell脚本中调用了awk,命令行的参数将传递给shell而不是传递给awk。你必须将shell脚本的命令行参数,传递给在shell脚本中的awk程序。例如你可以用“$*”将shell脚本中的所有命令行参数传递给awk。如下所示:

awk '
 BEGIN{
 for(x=0;x<ARGC;==x){
 print ARGV[x];
 print ARGC;
 }' $*

在特殊情况下,如果ARGV的元素的值是一个空串(“ “),awk将跳过它并继续处理下一个元素。

环境变量数组

awk 'BEGIN{
> for (env in ENVIRON)
> print env "=" ENVIRON[env];
> }'
输出:
AWKPATH=.:/usr/share/awk
SSH_ASKPASS=/usr/libexec/openssh/gnome-ssh-askpass
LANG=en_US.UTF-8
HISTSIZE=1000
...
jpg=01;35:*.gif=01;35:*.bmp=01;35:*.xbm=01;35:*.xpm=01;35:*.png=01;35:*.tif=01;35:
ORACLE_SID=ORCL

可以使用变量名作为数组的下标访问任意元素:

ENVIRON["HISTSIZE"]

也可以修改数组ENVRION中的任意元素:

ENVRION["HISTSIZE"]=100

但是这个改变并不改变用户的真实环境。

相关资料

1. sed与awk编程语言

相关推荐

甲骨文签署多项大型云协议,其一未来可贡献超300亿美元年收入

IT之家7月1日消息,根据甲骨文Oracle当地时间6月30日向美国证券交易委员会(SEC)递交的FORM8-K文件,该企业在始于2025年6月1日的202...

甲骨文获TEMU巨额合同,后者大部分基础设施将迁移至Oracle云

IT之家6月23日消息,Oracle甲骨文创始人、董事长兼首席技术官LarryEllison(拉里埃里森)在本月早些时候的2025财年第四财季和全财年财报电话会议上表示,Oracle...

Spring Boot 自定义数据源设置,这些坑你踩过吗?

你在使用SpringBoot进行后端开发的过程中,是不是也遇到过这样的问题:项目上线后,数据库连接总是不稳定,偶尔还会出现数据读取缓慢的情况,严重影响了用户体验。经过排查,发现很大一部分原因竟然...

一个开箱即用的代码生成器(一个开箱即用的代码生成器是什么)

今天给大家推荐一个好用的代码生成器,名为renren-generator,该项目附带前端页面,可以很方便的选择我们所需要生成代码的表。首先我们通过git工具克隆下来代码(地址见文末),导入idea。...

低代码建模平台-数据挖掘平台(低代码平台的实现方式)

现在来看一下数据连接。·这里是管理数据连接的空间,点击这里可以新增一个数据连接。·输入连接名称,然后输入url,是通过gdbc的方式去连接的数据库,目前是支持mysql、oracle以及国产数据库达梦...

navicat 17.2.7连接oracle数据库提示加载oracle库失败

系统:macOS15.5navicat版本:navicatpremiumlite17.2.7连接oracle测试报错:加载oracle库失败【解决办法】:放达里面找到程序,显示简介里面勾选“使...

开源“Windows”ReactOS更新:支持全屏应用

IT之家6月17日消息,ReactOS团队昨日(6月16日)在X平台发布系列推文,公布了该系统的最新进展,包括升级Explorer组件,支持全屏应用,从Wine项目引入了...

SSL 推出采用全模拟内置混音技术的模拟调音台Oracle

英国调音台传奇品牌SolidStateLogic宣布推出Oracle——一款采用全模拟内置混音技术的调音台,在紧凑的AWS尺寸机箱内集成了大型调音台的功能。该调音台提供24输入和...

47道网络工程师常见面试题,看看有没有你不会的!

你们好,我的网工朋友。网络工程师面试的时候,都会被问到什么?这个问题其实很泛,一般来说,你肯定要先看明白岗位需求写的是什么。基本上都是围绕公司需要的业务去问的。但不可否认的是,那些最基础的概念,多少也...

汉得信息:发布EBS系统安装启用JWS的高效解决方案

e公司讯,从汉得信息获悉,近日,微软官方宣布InternetExplorer桌面应用程序将于2022年6月15日正式停用。目前大部分客户都是使用IE浏览器打开EBS的Form界面,IE停用后,只能使...

36.9K star ! 推荐一个酷炫低代码开发平台!功能太强!

前言最近在逛github,看看能不能搜罗到一些对自己有帮助的开源软件。不经意间看到一个高star的java开源项目:jeecg-boot。进入在线演示版一看,感叹实在是太牛了!此开源项目不管是给来学习...

Linux新手入门系列:Linux下jdk安装配置

本系列文章是把作者刚接触和学习Linux时候的实操记录分享出来,内容主要包括Linux入门的一些理论概念知识、Web程序、mysql数据库的简单安装部署,希望能够帮到一些初学者,少走一些弯路。注意:L...

手把手教你在嵌入式设备中使用SQLite3

摘要:数据库是用来存储和管理数据的专用软件,使得管理数据更加安全,方便和高效。数据库对数据的管理的基本单位是表(table),在嵌入式linux中有时候它也需要用到数据库,听起来好难,其实就是几个函数...

JAVA语言基础(java语言基础知识)

一、计算机的基本概念什么是计算机?计算机(Computer)全称:电子计算机,俗称电脑。是一种能够按照程序运行、自动高速处理海量数据的现代化智能电子设备。由硬件和软件组成、没有安装过任何软件的计算机称...

再见 Navicat!一款开源的 Web 数据库管理工具!

大家好,我是Java陈序员。在日常的开发工作中,常常需要与各种数据库打交道。而为了提高工作效率,常常会使用一些可视化工具进行操作数据库。今天,给大家介绍一款开源的数据库管理工具,无需下载安装软件,基...

取消回复欢迎 发表评论: