Perl使用技巧

Perl使用技巧

Perl哈希嵌套数组

https://blog.csdn.net/weixin_56198196/article/details/120978024

1)访问哈希中的数组的元素：

$hash{$key}[position]; 就可以访问哈希里嵌套的数组的元素了，这里的position就是指要访问第几个元素(从0开始的)

2)把数组直接赋值给哈希中的数组：

$hash{$key}=[@array]; 就可以把数组传递给哈希了

3)push():

向数组中添加元素

push(@{$hash{$key}},element);

如果是添加一组数

push(@{$hash{$key}},@array);

注：

1）$hash{$key}[0]=2，这里的$key假设为“apple”，如果要print的话，apple不要带上双引号，类似这样 print"$hash{"apple"}[0]",这样是会报错的，写为 print"$hash{apple}[0]" 就可以了

2）print($hash{$array}); 得到的是array的地址，不是其中的元素，想要看其中有什么元素要这样写 print(@{$hash{$array}});

3）需要初始化：$hash{$key} = [()];

Perl哈希嵌套哈希

与哈希嵌套数组类似，例：

定义：$hash{$key1}->{$key2} = $a

取用值：$hash{$key1}->{$key2}

取用键：keys %{$hash{$key1}}

Perl数组排序

https://www.jb51.net/article/67894.htm
https://blog.csdn.net/zxianyong/article/details/5931487

Perl有个内置函数叫做sort，毫无疑问的可以排序一个数组。其最简单的形式是传递一个数组，它会返回排序后的元素组成的数组：@sorted = sort @original。

基于ASCII码排序

my @words = qw(foo bar zorg moo);
my @sorted_words = sort @words;
# bar' 'foo' 'moo' 'zorg'

my @words = qw(foo bar Zorg moo);
my @sorted_words = sort @words;
# 'Zorg' 'bar' 'foo' 'moo'

Perl的sort的工作方式是这样的，它遍历原始数组的每两个元素；每次把左边的值放入变量$a，把右边的值放入变量$b。然后调用比较函数。如果$a的内容应该在左边的话，比较函数会返回1；如果$b应该在左边的话，返回-1，两者一样的话，返回0。

通常你看不到比较函数，sort会根据ASCII码表对值进行比较，不过如果你想的话，你可以显式的写出来：sort { $a cmp $b } @words;

这段代码会跟没有使用块的sort @words达到同样的效果。

这里你可以看到，默认Perl使用cmp作为比较函数。这是因为正是cmp可以做这里边我们需要的工作。它比较两边的字符串的值，如果左边参数“小于”右边参数，就返回1；如果左边参数“大于”右边参数，就返回-1；如果相等，就返回0。

按字母顺序排列（忽略大小写）

my @words = qw(foo bar Zorg moo);
my @sorted_words = sort { lc($a) cmp lc($b) } @words;  # 调用lc函数返回小写
# bar' 'foo' 'moo' 'Zorg'

对数值排序（使用`<=>`）

my @numbers = (14, 3, 12, 2, 23);
my @sorted_numbers = sort { $a <=> $b } @numbers;
# 2 3 12 14 23

Hash 按 keys 排序

## 按ASCII码排序
my %hash = ( 'a' => 'd', 'b' => 'e', 'c' => 'f' );
foreach my $key ( sort keys %hash ) {
    print $key, "=>", $hash{$key}, "\n";
}

## 按数值排序
my %hash = ( 'a' => 2, 'b' => 3, 'c' => 1 );
foreach my $key ( sort { $a <=> $b } keys %hash ) {
    print $key, "=>", $hash{$key}, "\n";
}

Hash 按 value 排序

# 按ASCII码排序
my %hash = ( 'a' => 'd', 'b' => 'e', 'c' => 'f' );
foreach my $key ( sort { $hash{$a} cmp $hash{$b} } keys %hash ) {
    my $value = $hash{$key};
}

# 按数值从小到大排序
my %hash = ( 'a' => 2, 'b' => 3, 'c' => 1 );
foreach my $key ( sort { $hash{$a} <=> $hash{$b} } keys %hash ) {
    my $value = $hash{$key};
}

# 按数值从大到小排序（a和b互换位置）
my %hash = ( 'a' => 2, 'b' => 3, 'c' => 1 );
my @keysd = sort { $hash{$b} <=> $hash{$a} } keys %hash;
foreach my $key ( sort { $hash{$b} <=> $hash{$a} } keys %hash ) {
    my $value = $hash{$key};
}

Perl数组去重

https://www.cnblogs.com/mmtinfo/p/11970736.html

利用hash去重

my @list = qw /1 2 3 2 1 4 aa a bb c b bb d/;
foreach (@list) { print "$_ "; }
# 1 2 3 2 1 4 aa a bb c b bb d

my %hash;
my @uniq = grep { ++$hash{$_} < 2 } @list;
foreach (@uniq) { print "$_ "; }
# 1 2 3 4 aa a bb c b d

基本原理是将原数组元素作为hash的key，遍历计数，grep函数筛选出只出现一次的key，放入新的数组@uniq中。

利用uniq函数去重

这个函数所在的模块：List::MoreUtils

use List::MoreUtils qw(uniq);
#use List::MoreUtils ':all';

my @list = qw /1 2 3 2 1 4 aa a bb c b bb d/;
foreach (@list) { print "$_ "; }
# 1 2 3 2 1 4 aa a bb c b bb d

my @uniq = uniq(@list);
foreach (@uniq) { print "$_ "; }
# 1 2 3 4 aa a bb c b d

Perl函数参数传递与返回值

https://www.cnblogs.com/tobecrazy/archive/2013/06/11/3131887.html

参数传递

普通模式：参数中没有数组和哈希

#!/usr/bin/perl -w
use strict;
sub getparameter
{
    my $i;
    for($i=0;$i<=$#_;$i++)
    {
        print "It's the ";
        print $i+1;
        print "parameter: $_[$i] \n";
    }
}

# 调用函数
&getparameter($first,$second .. $end)

无论参数有多少个，均能正常传递。

文艺模式：参数中包含数组

还是这个函数，只不过我们传递的参数里包括一个数组

use strict;
sub getparameter
{
    my $i;
    for($i=0;$i<=$#_;$i++)
    {
        print "It's the ";
        print $i+1;
        print "parameter: $_[$i] \n";
    }
}
my @array=("this","is","a","test");
my $variable="this is another test";
&getparameter($variable,@array);

当我们只传入2个参数，一个数组，一个变量，结果是这样，变成了5个参数。无论数组在前还是在后，都是显示5个参数。由此@_会把数组每一个值当做一个参数储存。那我的疑问是perl能否正确的把传递的数组还原成数组而不是单个变量？？？

那我们换一种方式接受参数：

use strict;
sub getparameter
{
    (my @arr,my $var)=@_;
    print "It's the 1st parameter: @arr \n";
    print "It's the 2nd parameter: $var \n";

}
my @array=("this","is","a","test");
my $variable="this is another test";
&getparameter(@array,$variable);

结果令人意外，$variable传递的参数丢失，同时数组却取得所有参数，相当于把变量归为数组的一个元素。perl接受传递来的数组，会贪婪的把变量变成数组的元素。所以在接受参数传递赋值时，不要把数组放前面。

改成这样就好了：

use strict;
sub getparameter
{
    (my $var,my @arr)=@_;
    print "It's the 1st parameter: $var \n";
    print "It's the 2nd parameter: @arr \n";

}
my @array=("this","is","a","test");
my $variable="this is another test";
&getparameter($variable,@array);

如果要传递2个数组怎么办？？？可以采用引用的方式：

use strict;
sub getparameter
{
    (my $arr1,my $arr2)=@_;
    print "It's the 1st parameter: @$arr1 \n";
    print "It's the 2nd parameter: @$arr2 \n";

}
my @array1=("this","is","a","test");
my @array2=qw/this is another test/;
&getparameter(\@array1,\@array2);

perl使用引用是在变量或数组前加\，相当于地址传递

The Arrow Operators (`->`)

https://www.shlomifish.org/lecture/Perl/Newbies/lecture2/references/arrow.html

An arrow (->) followed by a square ([]) or curly brackets ({}) can be used to directly access the elements of an array or a hash referenced by a certain hash. For instance: $array_ref->[5] will retrieve the 5th element of the array pointed to by $array_ref.

An example:

do "lol.pl";         # Load the other file (foo)
my $cont = get_contents();

print $cont->{'title'}, "\n";
print $cont->{'subs'}->[0]->{'url'}, "\n";
print $cont->{'subs'}->[0]->{'subs'}->[1]->{'title'}, "\n";

Note that the arrows following the first arrow are optional as perl sees that the programmer wishes to access the subseqeunt sub-items. However, the first one is mandatory because the expression $array_ref{'elem'} looks for the hash %array_ref.

Perl正则表达式

https://blog.csdn.net/blog_abel/category_2657845.html
https://www.runoob.com/perl/perl-regular-expressions.html
https://perl-book.junmajinlong.com/ch6/12_y_tr.html

匹配操作符`m/regex/`

用于匹配一个字符串语句或者一个正则表达式，如m//、~//、$a=~/a/; $b!~/b/。模式匹配有一些常用的修饰符，如下表所示：

修饰符	描述
i	忽略模式中的大小写
m	多行模式
o	仅赋值一次
s	单行模式，”.”匹配”\n”（默认不匹配）
x	忽略模式中的空白
g	全局匹配
cg	全局匹配失败后，允许再次查找匹配串

perl处理完后会给匹配到的值存在三个特殊变量名:

$`: 匹配部分的前一部分字符串
$&: 匹配的字符串
$’: 还没有匹配的剩余字符串

如果将这三个变量放在一起,你将得到原始字符串。

查找替换`s/regex/rep/mod`

替换操作修饰符如下表所示：

修饰符	描述
i	取消大小写敏感性
m	默认的正则开始^和结束”$“只是对于正则字符串如果在修饰符中加上”m”，那么开始和结束将会指字符串的每一行：每一行的开头就是”^”，结尾就是”$”
o	表达式只执行一次
x	表达式中的空白字符将会被忽略，除非它已经被转义
r	默认情况下，s///的返回值是替换成功的次数，然后改变原始标量。使用r修饰符，可以让这个替换操作返回替换后的字符串，而原始标量的值不会发生变化。
g	替换所有匹配的字符串
e	替换字符串作为表达式

s///

$f = "'quoted words'";
print $f,"\n" if $f =~ s/^'(.*)'$/$1/;  # quoted words
# $1指的是引用了第一组(.*)的内容。注意 标量 $f 匹配后本身内容发生了变化

s///r

$f = "'quoted words'";
$n = $f =~ s/^'(.*)'$/$1/r;
print $f,"\n";  # 'quoted words'
print $n,"\n";  #  quoted words

s///g

$z = "time hcat to feed the cat hcat";
$z =~ s/cat/AAA/g;
print $z,"\n";  # time hAAA to feed the AAA hAAA
$z =~ s/cat|the/AAA/g;
print $z,"\n";  # time hAAA to feed AAA AAA hAAA

s///e

## reverse all the words in a string
$x = "the cat in the hat";
$x =~ s/(\w+)/reverse $1/ge;  # $x contains "eht tac ni eht tah"
## convert percentage to decimal
$x = "A 39% hit rate";
$x =~ s!(\d+)%!$1/100!e;  # $x contains "A 0.39 hit rate"
## s/// 可以用 s!!! , s{}{} , s{}// 进行替换

转化操作符`tr/regex/rep/`

用于字符映射转换。以下是转化操作符相关的修饰符：

修饰符	描述
c	转化所有未指定字符
d	删除所有指定字符
s	把多个相同的输出字符缩成一个

例：

$str="abcdef";
$str =~ tr/a-z/A-Z/;
say $str;  # ABCDEF

$str="aaa bbb ccc ddd";
$str =~ tr/ab/xy/c;
say $str;  # aaaybbbyyyyyyyy

$str="abc ddd eee fff";
$str =~ tr/de/x/d;    # d替换为x，e被删除，结果abc xxx  fff
$str =~ tr/abcf/mn/d; # a->m b->n，cf被删除，结果"mn xxx  "

$str = "aabbccdd";
$str =~ tr/a//s;  # 连续的a替换为单个a，结果abbccdd
$str =~ tr/b/b/s; # 连续的b替换为单个b，结果abccdd
$str =~ tr/c/*/s; # 连续的c替换为单个*，结果ab*d

表达式	描述
.	匹配除换行符以外的所有字符
x?	匹配 0 次或一次 x 字符串
x*	匹配 0 次或多次 x 字符串,但匹配可能的最少次数
x+	匹配 1 次或多次 x 字符串,但匹配可能的最少次数
.*	匹配 0 次或多次的任何字符
.+	匹配 1 次或多次的任何字符
{m}	匹配刚好是 m 个的指定字符串
{m,n}	匹配在 m个以上 n个以下的指定字符串
{m,}	匹配 m个以上的指定字符串
[]	匹配符合 [] 内的字符
[^]	匹配不符合 [] 内的字符
[0-9]	匹配所有数字字符
[a-z]	匹配所有小写字母字符
[^0-9]	匹配所有非数字字符
[^a-z]	匹配所有非小写字母字符
^	匹配字符开头的字符
$	匹配字符结尾的字符
\d	匹配一个数字的字符,和 [0-9] 语法一样
\d+	匹配多个数字字符串,和 [0-9]+ 语法一样
\D	非数字,其他同 \d
\D+	非数字,其他同 \d+
\w	英文字母或数字的字符串,和 [a-zA-Z0-9_] 语法一样
\w+	和 [a-zA-Z0-9_]+ 语法一样
\W	非英文字母或数字的字符串,和 [^a-zA-Z0-9_] 语法一样
\W+	和 [^a-zA-Z0-9_]+ 语法一样
\s	空格,和 [\n\t\r\f] 语法一样
\s+	和 [\n\t\r\f]+ 一样
\S	非空格,和 [^\n\t\r\f] 语法一样
\S+	和 [^\n\t\r\f]+ 语法一样
\b	匹配以英文字母,数字为边界的字符串
\B	匹配不以英文字母,数值为边界的字符串
a\|b\|c	匹配符合a字符或是b字符或是c字符的字符串
abc	匹配含有 abc 的字符串 (pattern) () 这个符号会记住所找寻到的字符串,是一个很实用的语法.第一个 () 内所找到的字符串变成 $1 这个变量或是 \1 变量,第二个 () 内所找到的字符串变成 $2 这个变量或是 \2 变量,以此类推下去.
/pattern/i	i 这个参数表示忽略英文大小写,也就是在匹配字符串的时候,不考虑英文的大小写问题. \ 如果要在 pattern 模式中找寻一个特殊字符,如 “*“,则要在这个字符前加上 \ 符号,这样才会让特殊字符失效

懒惰限定符

默认情况下，Perl 的正则表达式是“贪婪地”，也就是说它们将尽可能多地匹配字符。要改变匹配特点，只须简单地在量词（加号[+]或星号[*]）后面加一个问号（?）即可。如下：

表达式	描述
*?	重复任意次，但尽可能少重复
+?	重复1次或更多次，但尽可能少重复
??	重复0次或1次，但尽可能少重复
{n,m}?	重复n到m次，但尽可能少重复
{n,}?	重复n次以上，但尽可能少重复

Perl文件操作

https://www.cnblogs.com/wanghuixi/p/12072840.html

文件测试	测试操作符提供的信息
-r	文件或目录可读
-w	文件或目录可写
-x	文件或目录执行
-o	文件或目录归用户所有
-R	文件或目录对真正用户可读
-W	文件或目录对真正用户可写
-X	文件或目录对真正用户执行
-O	文件或目录归真正用户所有
-e	文件或目录存在
-z	文件存在且大小为0
-s	文件或目录存在且不为0(返回字节数)
-f	文件为普通文件
-d	文件为目录
-l	文件为符号链接
-p	文件为命名管道(FIFO)
-S	文件为一个套口(socket)
-b	文件为块特殊文件
-c	文件为字符特殊文件
-t	打开tty控制台的文件句柄
-u	文件或目录是设置用户ID号
-g	文件或目录是设置用户组ID号
-k	文件或目录的sticky位置位
-T	文件是文本文件
-B	文件是二进制文件
-M	以天为单位的存在时间
-A	以天为单位访问时间
-C	以天为单位同代码更改时间

例：

#!/usr/bin/perl
print "YES" if -e "/var/log/messages";

liuyujie0136's Website

Perl使用技巧

Perl哈希嵌套数组

Perl哈希嵌套哈希

Perl数组排序

基于ASCII码排序

按字母顺序排列（忽略大小写）

对数值排序（使用`<=>`）

Hash 按 keys 排序

Hash 按 value 排序

Perl数组去重

利用hash去重

利用uniq函数去重

Perl函数参数传递与返回值

参数传递

普通模式：参数中没有数组和哈希

文艺模式：参数中包含数组

The Arrow Operators (`->`)

Perl正则表达式

匹配操作符`m/regex/`

查找替换`s/regex/rep/mod`

转化操作符`tr/regex/rep/`

更多正则表达式规则

懒惰限定符

Perl文件操作

Perl使用技巧

Perl哈希嵌套数组

Perl哈希嵌套哈希

Perl数组排序

基于ASCII码排序

按字母顺序排列（忽略大小写）

对数值排序（使用<=>）

Hash 按 keys 排序

Hash 按 value 排序

Perl数组去重

利用hash去重

利用uniq函数去重

Perl函数参数传递与返回值

参数传递

普通模式：参数中没有数组和哈希

文艺模式：参数中包含数组

The Arrow Operators (->)

Perl正则表达式

匹配操作符m/regex/

查找替换s/regex/rep/mod

转化操作符tr/regex/rep/

更多正则表达式规则

懒惰限定符

Perl文件操作

对数值排序（使用`<=>`）

The Arrow Operators (`->`)

匹配操作符`m/regex/`

查找替换`s/regex/rep/mod`

转化操作符`tr/regex/rep/`