L i n ux常用命令之awklinux教程http://ww w.linuxprob e.c o m/
标题 awk命令的使用
作用 awk是非常好用的数据处理工具主要处理每一行的字段内的数据默认的字段的分割符为空格键或[tab]键
一、 awk脚本的基本结构awk 'BEGIN{print "start"} pattern {commands} END{print "ends"} 'file //一个awk脚本通常由 BEGIN语句块、能够使用模式匹配的通用语句块、 END语句块3部分组成这三部分是可选的任意一部分都可以不出现在脚本中
//通常是被单引号或双引号括住的
例如 awk 'BEGIN{i=0} {i++}END{print i} ' filenameawk "BEGIN{i=0} {i++}END{print i} " filename
二、 awk的执行过程awk 'BEGIN {commands} pattern{commands}END{commands} ' f ilename
[1]第一步执行BEGIN{commands}语句块中的语句
[2]第二步从文件或标准输入stdin读取一行然后执行pattern{commands}语句块它逐行扫描文件第一行到最后一行重复这个过程直到文件全部被读取完毕
[3]第三步 当读至输入流末尾时候执行END{commands}语句块
BEGIN语句块在awk开始从输入流中读取行之前被执行这是一个可选的语句块。 比如变量的初始化、打印输出表格的表头等语句通常可以写在BEGIN语句块中。
END语句块在awk从输入流读取完所有的行之后执行 比如打印所有行的分析结果这类信息汇总都是在END语句块中完成。
三、 awk内置变量
[1] $n是当前行的按照指定域分隔符默认是空格或[T AB] ]键分割后的第n个字段 比如n为1表示第1个字段 n为2表示第2个字段
[2] $0则是记录了执行过程中当前行的文本内容
[3]NF每一行($0)拥有的字段总数
[4]NR 目前awk所处理的"第几行"数据
[5]FNR表示当前所处理的文本内的"第几行"数据
[6]FS 目前的域分割符号可以通过FS字段指定文本的域分割符
[7]OFS输出字段的分割符默认是一个空格
[8]ORS输出的记录分割符默认是一个换行
[9]ARG IN D命令行中处理的当前文件的位置从1开始
[10]AR G C命令行参数的数目
[11]AR GV命令行参数的数组
四、 awk实例
例1 pay.txt文件内容格式:姓名、第一个月工资、第二个月工资、第三个月工资将每一个人的三月工资总和计算出来
Name 1st 2nd 3th
VBird 2300 3400 2500
Bmtsai 2000 2000 2300
Bird2 4300 4200 4100
命令 awk 'NR==1{printf ("%10s%10s%10s%10s%10s\n", $1, $2, $3,$4, "Total") } NR>=2{total=$2+$3+$4; printf ("%10s%10s%10s%10s%10s\n",$1, $2, $3, $4,total) } ' pay.txt
输出
解释 NR表示当前处理的行数行号 如果满足NR==1即处理的是第一行的内容Name 1st 2nd 3th就执行后面的括弧中的打印printf命令如果满足NR>=2那么就会执行第一个括弧中的命令{total=$2+$3+$4; printf
("%10s%10s%10s%10s%10s\n", $1, $2, $3, $4,total) } 。所以 awk命令格式中的pattern决定了是否对当前输入的行执行其后面的commands。
例2将a.dat的第一列内容和第二列内容相加a. dat内容 b.dat内容
命令 awk
'BEGIN{i=0; j=0}FNR==NR{array[i++]=$1;next} {total=array[j ]+$1;printarray[j ] ,$1,total; j++} ' a.dat b.dat
或awk
'BEGIN{i=0; j=0}ARGIND==1{array[i++]=$1}ARGIND==2{total=array[j ]+$1;print array[j ] ,$1,total; j++} ' a.dat b.dat
输出结果
解释 NR和FNR是awk内置变量表示行号 NR表示处理的记录的行数 FNR表示当前处理的文件的行数 因为awk的参数可以同时跟多个文件名并且按照其出现的顺序逐个输入并处理而NR 表示截止当前处理的总的行数而FNR表示当前所处理的文
件的行数。能能够导致读入下一个输入行并返回到脚本的顶部这可以避免对当前输入行执行其他的操作过程。
例3去除重复记录--假设某文件test.da记录如下
命令 awk ' !a[$0]++{print $0} ' test.da
输出
解释 awk默认数组的初始值是0 当记录已经出现在的数组a中的时候那么!a[$0]为假所以就不会执行后面的print $0
linux教程http://www. linuxprobe. com/
HostKvm 商家我们算是比较熟悉的国内商家,商家主要还是提供以亚洲数据中心,以及直连海外线路的服务商。这次商家有新增香港和俄罗斯两个机房的高防服务器方案。默认提供30GB防御,且目前半价优惠至4.25美元起步,其他方案的VPS主机还是正常的八折优惠。我们看看优惠活动。香港和俄罗斯半价优惠:2021fall,限购100台。通用优惠码:2021 ,八折优惠全部VPS。我们看看具体的套餐。1、香港高...
提速啦(www.tisula.com)是赣州王成璟网络科技有限公司旗下云服务器品牌,目前拥有在籍员工40人左右,社保在籍员工30人+,是正规的国内拥有IDC ICP ISP CDN 云牌照资质商家,2018-2021年连续4年获得CTG机房顶级金牌代理商荣誉 2021年赣州市于都县创业大赛三等奖,2020年于都电子商务示范企业,2021年于都县电子商务融合推广大使。资源优势介绍:Ceranetwo...
CloudCone针对中国农历新年推出了几款特别套餐, 其中2019年前注册的用户可以以13.5美元/年的价格购买一款1G内存特价套餐,以及另外提供了两款不限制注册时间的用户可购买年付套餐。CloudCone是Quadcone旗下成立于2017年的子品牌,提供VPS及独立服务器租用,也是较早提供按小时计费VPS的商家之一,支持使用PayPal或者支付宝等付款方式。下面列出几款特别套餐配置信息。CP...