Perl basics - sed, Awk の発展系としての Perl

[2014/03/24新規] [2014/09/12更新]

主な形式
sed, Awk 風な説明
sed, Awk 風な Perl スクリプトの概要
簡単な説明
Perl スクリプトの概要
例題
参考文献

主な形式

perl -[n|p][l]e 'script' [file...]
perl [-n|-p][-l] script_file [file...]

sed, Awk 風な説明

perl -n は『レコード』と呼ばれる行を一つずつパターンスペース '$_' に入力する。perl -p はさらにそのパターンスペース '$_' を出力する。Perl スクリプトを '-e script' や 'script_file' で指定することにより様々な処理をすることができる。

まず、入力行は sed, Awk とは異なり、レコードセパレータである改行コード '\n' が取り除かれずにパターンスペース '$_' に入る。但し、'-l' オプションを指定すると、改行コードが取り除かれ、出力のレコードセパレータに改行コード '\n' が設定される。

また、perl -na は、Awk のように、フィールドセパレータである空白を区切りとして '$F[0]', '$F[1]', '$F[2]', 〜にその行の『フィールド』群が入る。

sed, Awk 風な Perl スクリプトの概要

Awk のように 'BEGIN', 'END' のような前処理と、後処理を記す特殊ブロックが使えるが、他はすべてサブルーチンか主処理となる。そして、sed, Awk のようなマッチの範囲「式, 式」に処理されるブロックはサポートされないが、条件式で '..' 演算子(２つの式が sed スタイルのときは '...' 演算子)を用いることでそれと似た制御ができる。

例えば以下は、Awk では awk '/^<pre>/,/<\/pre>$/' となる、HTML の 'pre' タグを含むそれに囲まれた行を表示する Perl スクリプトである。

	perl -ne 'print if (/^<pre>/../<\/pre>$/)'

ここで、'print' は 'print $_' と等価である。

例えば以下は、sed では sed -e 's/&/\&/g;s/</\</g;s/>/\>/g' となる、ソースコードを HTML にペーストできるように「<」から「<」への変換等を行なう Perl スクリプトである。

	perl -pe 's/&/&amp;/g; s/</&lt;/g; s/>/&gt;/g'

このように Perl スクリプトは、オプションにより sed, Awk 風に書けるようになっている。

簡単な説明

perl -n は『レコード』と呼ばれる行を一つずつパターンスペース '$_' に入力する、以下とほぼ等価なスクリプトとなる。

	perl -e 'while (<>) {…}'

これはさらに以下とほぼ等価なスクリプトとなる。

	perl -e '
unshift(@ARGV, "-") unless @ARGV;
while (defined($ARGV = shift @ARGV)) {
  open(FH, $ARGV);
  while ($_ = <FH>) {
    …
  }
  close(FH)
}'

perl -p はさらにそのパターンスペース '$_' を出力する、以下とほぼ等価なスクリプトとなる。

	perl -e '
while (<>) {
  …
}
continue {
  print
}'

これはさらに以下とほぼ等価なスクリプトとなる。

	perl -e '
unshift(@ARGV, "-") unless @ARGV;
while (defined($ARGV = shift @ARGV)) {
  open(FH, $ARGV);
  while ($_ = <FH>) {
    …
  }
  continue {
    print $_
  }
  close(FH)
}

まず、入力行は sed, Awk とは異なり、レコードセパレータである改行コード '\n' が取り除かれずにパターンスペース '$_' に入る。但し、'-l' オプションを指定すると、改行コードが取り除かれ、出力のレコードセパレータに改行コード '\n' が設定される、以下とほぼ等価なスクリプトとなる。

	perl -e 'BEGIN{ $\ = "\n" } while (<>) { chomp; … }'

また、perl -na は、Awk のように、フィールドセパレータである空白を区切りとして '$F[0]', '$F[1]', '$F[2]', 〜にその行の『フィールド』群が入る、以下とほぼ等価なスクリプトとなる。

	perl -e 'while (<>) { @F = split(' ', $_); … }'

このように Perl は様々な場面で省略可能な引数などのサポートが手厚く、簡素に書ける反面、一見不明瞭なコードになりがちである。

Perl スクリプトの概要

例えば先の、HTML の 'pre' タグを含むそれに囲まれた行を表示する Perl スクリプトは、省略せずに書けば以下のようになる。

	perl -e '
while (<>) {
  print $_ if ($_ =~ /^<pre>/ .. $_ =~ /<\/pre>$/)
}'

例えば先の、ソースコードを HTML にペーストできるように「<」から「<」への変換等を行なう Perl スクリプトは、省略せずに書けば以下のようになる。

	perl -e '
while (<>) {
  $_ =~ s/&/&amp;/g;
  $_ =~ s/</&lt;/g;
  $_ =~ s/>/&gt;/g
}
continue {
  print $_
}'

スクリプトは宣言か文のリストからなり、宣言はピクチャ書式とサブルーチン、文は代入式、制御構文、関数呼び出し、ブロック '{' 宣言か文のリスト '}' である。宣言か文の区切りは ';' で区切る。シェルや C/C++ の文と似ているが '}' 直前の ';' が省略できることが異なる。

型

Perl の変数には、'$' から始まるスカラ変数、'@' から始まる配列変数、'%' から始まるハッシュ変数があり、その値は数値、文字列、リファレンスの型を扱える。配列、ハッシュの値は '$' から始まる変数名と '[添字]' や '{キー}' でアクセスする。

特に、変数には数値と文字列が区別なく扱える一方で、文字列の '0' を意図せず数値として評価されてしまうなど、注意が必要となる。

配列変数は:

#!/usr/bin/perl
@list = (1, 2, 3, 4, 5);
print $list[1], "\n";	# 要素: 2
print $list[3], "\n";	# 要素: 4
print scalar @list, "\n";	# 要素数: 5

ハッシュ変数は:

#!/usr/bin/perl
%hash = ('foo' => 'Foo',
	 'bar' => 'Bar');
print $hash{'foo'}, "\n";	# 値: 'Foo'
print $hash{'bar'}, "\n";	# 値: 'Bar'
print scalar keys %hash, "\n";	# 要素数: 2

変数へのリファレンスは '\' で表し、デリファレンスはアクセスしたい型に応じて '$', '@', '%' を用いる。

スカラ変数へのリファレンス:

#!/usr/bin/perl
$scalar = 'A Happy New Year!';
$ref = \$scalar;
print $$ref, "\n";	# 文字列: A Happy New Year!

配列変数へのリファレンスは:

#!/usr/bin/perl
@list = (1, 2, 3, 4, 5);
$ref = \@list;
print $$ref[1], "\n";	# 要素: 2
print $$ref[3], "\n";	# 要素: 4
print scalar @$ref, "\n";	# 要素数: 5

ハッシュ変数へのリファレンスは:

#!/usr/bin/perl
%hash = ('foo' => 'Foo',
         'bar' => 'Bar');
$ref = \%hash;
print $$ref{'foo'}, "\n";	# 値: 'Foo'
print $$ref{'bar'}, "\n";	# 値: 'Bar'
print scalar keys %$ref, "\n";	# 要素数: 2

スカラへのリファレンスは '\' で表し、無名配列へのリファレンスは […]、無名ハッシュへのリファレンスは {…} で記述できる。

スカラへのリファレンス:

#!/usr/bin/perl
$ref = \'A Happy New Year!';
print $$ref, "\n";	# 文字列: A Happy New Year!

無名配列へのリファレンスは:

#!/usr/bin/perl
$ref = [ 1, 2, 3, 4, 5 ];
print $$ref[1], "\n";	# 要素: 2
print $$ref[3], "\n";	# 要素: 4
print scalar @$ref, "\n";	# 要素数: 5

無名ハッシュへのリファレンスは:

#!/usr/bin/perl
$ref = { 'foo' => 'Foo',
         'bar' => 'Bar' };
print $$ref{'foo'}, "\n";	# 値: 'Foo'
print $$ref{'bar'}, "\n";	# 値: 'Bar'
print scalar keys %$ref, "\n";	# 要素数: 2

他に、上記を応用した「多次元配列」や「構造体」がある。

制御構文

以下の制御構文が使用できる。シェルの 'elif', C の 'else if' ではなく 'elsif' であること、C の 'continue' ではなく 'next'、シェル/C の 'break' ではなく 'last' であることに注意。

if () {} [elsif {}] [else {}]
unless () {} [elsif {}] [else {}]
while () {} [continue {}]
until () {} [continue {}]
{ do { {} [continue {}] } while () }
{ do { {} [continue {}] } until () }
for (;;) {}
for (@) {}
continue {}
last [label]
next [label]
redo [label]
return [$]
exit [$]
foreach [var] (@) {}
goto label

'switch' は基本的にはサポートされないが、代わりに 'switch' 風なブロックや 'given', 'when' 構文が存在する。

以上は C/C++ とは異なり必ずブロックを必要とし、単文は書けない。しかし、以下のような制御構文であれば、ブロックではなく単文で記述できる。

print if ()
print unless ()
print while ()
print until ()
print for ()
print foreach ()

演算子

Perl の演算子は C/C++ のそれとおよそ同じだが、加えて、文字列や正規表現のための演算子など多数存在する。特に注意すべき演算子を以下にあげる。

Perl	C/C++	備考
`expr1 . expr2`	`string(expr1) + string(expr2)`	文字列の連結
`lvalue .= expr`	`string(lvalue) += string(expr)`	文字列の連結の代入
`expr1 ** expr2`	`pow(expr1, expr2)`	指数関数
`lvalue **= expr`	`lvalue = pow(lvalue, expr)`	指数関数の代入
`expr1 =~ expr2`	`regex_search(expr1, , regex(expr2, ...))`	C/C++ のビット否定ではなく、正規表現のマッチ
`expr1 !~ expr2`	`!regex_search(expr1, , regex(expr2, ...))`	C/C++ のビット否定ではなく、正規表現のマッチの否定
`expr1 eq expr2`	`string(expr1) == string(expr2)`	文字列の比較として、等しい
`expr1 ne expr2`	`string(expr1) != string(expr2)`	文字列の比較として、等しくない
`expr1 lt expr2`	`string(expr1) < string(expr2)`	文字列の比較として、小さい
`expr1 gt expr2`	`string(expr1) > string(expr2)`	文字列の比較として、大きい
`expr1 le expr2`	`string(expr1) <= string(expr2)`	文字列の比較として、等しいか小さい
`expr1 ge expr2`	`string(expr1) >= string(expr2)`	文字列の比較として、等しいか大きい

特殊変数

Perl における主な特殊変数は以下の通りである。

@ARGV - コマンドライン引数の配列 $ARGV[0], $ARGV[1] ... $ARGV[@ARGV-1]
$ARGV - 現在読み込み中のファイル名
ARGV - 現在読み込み中のファイルハンドル
%ENV - 環境変数の連想配列 $ENV{名前}
$RS, $/ - 入力のレコードセパレータ。既定値は "\R"
$NR, $. - 入力のレコード数
$ORS, $\ - 出力のレコードセパレータ。既定値は "undef"
$OFS, $, - 出力のフィールドセパレータ。既定値は "undef"
$SUBSEP, $; - 疑似的な多次元配列の添字の区切り。既定値は "\x1c,\034,28,^\,IS4(FS)"
$ARG, $_ - 既定のパターンスペース
@ARG, @_ - サブルーチンに渡された引数の配列
$MATCH, $& - 正規表現で最後にマッチした文字列
$PREMATCH, $` - 正規表現で最後にマッチした直前の文字列
$POSTMATCH, $' - 正規表現で最後にマッチした直後の文字列
$LAST_PAREN_MATCH, $+ - 正規表現で最後にマッチした最後のグループの文字列
%LAST_PAREN_MATCH, %+ - 正規表現で最後にマッチした名前付きグループの文字列のハッシュ
@LAST_MATCH_START, @- - 正規表現で最後にマッチしたグループの文字列の先頭のオフセットの配列
@LAST_MATCH_END, @+ - 正規表現で最後にマッチしたグループの文字列の終端のオフセットの配列
%- - 正規表現で最後にマッチした名前付きグループの文字列の配列のハッシュ
$1, $2, ... ${$#+} - 正規表現で最後にマッチしたグループの文字列
@F - '-a' オプションでレコード毎に格納されるフィールドの配列

エスケープ文字

Perl におけるエスケープ文字は以下の通りである。

\a - "^G,BEL,アラート(alert)"
\b - "^H,BS,バックスペース(backspace)"、但し、[] 内のみ。
\t - "^I,HT,水平タブ(horizontal tab)"
\n - "^J,LF,改行(new-line)"
\f - "^L,FF,改頁(form feed)"
\r - "^M,CR,行頭復帰(carriage return)"
\v - "^K,VT,垂直タブ(vertical tab)"、但し、[] 内のみ。
\e - "^[,ESC,エスケープ(escape)"
\OOO - 8進数の文字コード
\o{OOO} - 8進数の文字コード
\xHH - 16進数の文字コード
\x{HHHH} - 16進数のワイド文字コード
\cC - 制御文字。C には任意の文字。
\N{NAME} - Unicode 名の文字
\N{U+HHHH} - Unicode 文字
\l - 次の文字を小文字化。[] 内では不可。
\u - 次の文字を大文字化。[] 内では不可。
\L - \E まで小文字化。[] 内では不可。
\U - \E まで大文字化。[] 内では不可。
\Q - \E まで非英数字文字をバックスラッシュでエスケープ化。[] 内では不可。
\E - 上述の終端。[] 内では不可。
\w - 英数字とアンダースコア「_」
\W - 上記以外
\s - 空白
\S - 上記以外
\d - 数字
\D - 上記以外
\p{} - Unicode プロパティの文字
\P{} - 上記以外
\X - Unicode「拡張書記素クラスタ」。[] 内では不可。
\C - Unicode 内で単一のオクテット。[] 内では不可。
\K - 直前を保持、$& に含めない。[] 内では不可。
\N - 改行以外の文字。[] 内では不可。
\v - 垂直空白の文字クラス
\V - 上記以外
\h - 水平空白の文字クラス
\H - 上記以外
\R - 総称的な改行。[] 内では不可。
\b - ワード境界。但し、[] 内では上述。
\B - 上記以外。[] 内では不可。
\A - 文字列の先頭。[] 内では不可。
\Z - 文字列の末尾。[] 内では不可。
\z - 同上。[] 内では不可。
\G - 文字列の先頭か前回のマッチ直後。[] 内では不可。
\1 - 後方参照。1 には正の整数。[] 内では不可。
\g1 - 後方参照。1 には正の整数。[] 内では不可。
\g{1} - 後方参照。1 には正の整数。[] 内では不可。
\g{-1} - 相対後方参照。1 には負の整数。[] 内では不可。
\g{name} - 名前後方参照。[] 内では不可。
\k'name' - 名前後方参照。[] 内では不可。
\k<name> - 同上
\k{name} - 同上

このように Perl では非常に多くのエスケープ文字がサポートされる。

組み込み関数

算術関数

abs [$] - 値 $ の絶対値。$ を省略した場合 $_。
atan2 $y, $x - 値 $y/$x についての逆正接関数
cos [$] - ラジアン値式 $ についての余弦関数。$ を省略した場合 $_。
sin [$] - ラジアン値式 $ についての正弦関数。$ を省略した場合 $_。
exp [$] - 値式 $ についての指数関数。$ を省略した場合 $_。
log [$] - 値式 $ についての対数関数。$ を省略した場合 $_。
sqrt [$] - 値式 $ の平方根。$ を省略した場合 $_。
int [$] - 値式 $ の小数点以下切捨て。$ を省略した場合 $_。
rand [$] - 値式 $ のとき [0, $) の乱数。$ を省略した場合 1。
srand [$] - 正整数 $ で rand のシード設定。$ を省略した場合は自動設定。
acos [$] - 値式 $ についての逆余弦関数。$ を省略した場合 $_。但し、Math::Trig 要。
asin [$] - 値式 $ についての逆正弦関数。$ を省略した場合 $_。但し、Math::Trig 要。
tan [$] - ラジアン値式 $ についての正接関数。$ を省略した場合 $_。但し、Math::Trig 要。
sqrt [$] - 値式 $ の複素数平方根。$ を省略した場合 $_。但し、Math::Complex 要。

配列関数

pop [@] - 配列の最後の値を返し、それを除いて、配列サイズを一つ減らす。引数を省略した場合、'@ARGV'(サブルーチン内は '@_') と見なす
push @, @l - 配列にリスト(または値) @l を末尾に追加する。
shift [@] - 配列の最初の値を返し、それを除いて、配列サイズを一つ減らす。引数を省略した場合、'@ARGV'(サブルーチン内は '@_') と見なす
unshift @, @l - 配列にリスト(または値) @l を先頭に追加する。
splice @, $offset[, $length, @l] - 配列の要素の削除および、リスト(または値) @l の追加の操作

リスト関数

grep $, @ - リストから式 $ が真である要素のリストを返す。式において、要素は $_ にセットされる。
grep {} @ - リストからブロック {} が真である要素のリストを返す。ブロックにおいて、要素は $_ にセットされる。
map $, @ - リストの要素に式 $ を適用した要素のリストを返す。式において、要素は $_ にセットされる。
map {} @ - リストの要素にブロック {} を適用した要素のリストを返す。ブロックにおいて、要素は $_ にセットされる。
sort [{}] @ - リストをブロック {} が返す比較で並べ変えたリストを返す。ブロックはサブルーチン名でもよい。
join $, @ - 文字列式 $ をセパレータとしてリストを単一の文字列へ連結
split $pattern[, $, $n] - 文字列式 $ を正規表現 $pattern で複数の文字列へ分割。$ を省略した場合 $_。
qw/WORD LIST/ - ワード列のリストを返す。
reverse [$_] - リストの逆順のリストを返す。
unpack $template[, $] - pack の $template 形式に従ってバイナリ文字列式 $ からリストを生成する。$ を省略した場合 $_。

ハッシュ関数

exits $ - 式 $ で表されるハッシュのキー、もしくは、配列の要素が存在するか否かを返す。
delete $ - 式 $ で表されるハッシュのキーと値、もしくは、リストの要素を削除し、それを返す。
each @ - 配列 @ の添字と値を次々と返し、最後は偽を返す。
each % - ハッシュ % のキーと値を次々と返し、最後は偽を返す。
each $ - 配列かハッシュへのリファレンス式 $ の添字と値もしくはキーと値を次々と返し、最後は偽を返す。

keys @ - 配列 @ の添字を次々と返し、最後は偽を返す。
keys % - ハッシュ % のキーを次々と返し、最後は偽を返す。
keys $ - 配列かハッシュへのリファレンス式 $ の添字もしくはキーと値を次々と返し、最後は偽を返す。

values @ - 配列 @ の値を次々と返し、最後は偽を返す。
values % - ハッシュ % の値を次々と返し、最後は偽を返す。
values $ - 配列かハッシュへのリファレンス式 $ の値を次々と返し、最後は偽を返す。

文字列関数

chr [$] - コード値 $ で表される文字を返す。$ を省略した場合 $_。
ord [$] - 文字列式 $ の一文字目ので表されるコード値を返す。$ を省略した場合 $_。

chomp [$] - 文字列変数 $ の文字列の末尾の改行を削除する。$ を省略した場合 $_。
chop [$] - 文字列変数 $ の文字列の末尾の一文字を削除する。$ を省略した場合 $_。

length [$] - 文字列式 $ の長さを返す。$ を省略した場合 $_。
lc [$] - 文字列式 $ を小文字化した文字列を返す。$ を省略した場合 $_。
lcfirst [$] - 文字列式 $ を頭文字だけ小文字化した文字列を返す。$ を省略した場合 $_。
uc [$] - 文字列式 $ を大文字化した文字列を返す。$ を省略した場合 $_。
ucfirst [$] - 文字列式 $ を頭文字だけ大文字化した文字列を返す。$ を省略した場合 $_。
reverse [$] - 文字列式 $ を逆順にした文字列を返す。$ を省略した場合 $_。引数がリストの場合はリスト関数の reverse。

substr $s, $i[, $n] - 文字列式 $s の部分文字列 [$i,$i+$n] を返す。$i は [0,]。$n を省略した場合、または $n>length($s)-$i の場合、$n=length($s)-m となる。
substr $s, $i, $n, $r - 同上だが、$s の部分文字列は $r で置換される。
sprintf $format, @ - 書式 $format に従ってリスト @ を出力した文字列を返す。

hex [$] - １６進文字列としての式 $ で表される値を返す。$ を省略した場合 $_。
oct [$] - ８進文字列としての式 $ で表される値を返す。$ を省略した場合 $_。

index $s, $t[, $i] - 文字列 $s の部分文字列 $t を位置 $i から前に検索して位置 [$i,] を返す。見つからなかった場合は -1 を返す。$i を省略した場合 0。
rindex $s, $t[, $i] - 文字列 $s の部分文字列 $t を位置 $i から後に検索して位置 [$i,] を返す。見つからなかった場合は -1 を返す。$i を省略した場合 0。

pack $template, @ - $template 形式に従ってリスト $ からバイナリ文字列を生成する。

q// - 文字列の生成、変数展開なし。
qq// - 文字列の生成、変数展開あり。
tr/// - 文字置換の生成、変数展開なし。
y/// - 同上
qr// - 正規表現の生成、変数展開あり。
m// - 正規表現による検索の生成、変数展開あり。
s/// - 正規表現による置換の生成、変数展開あり。

quotemeta [$] - 文字列式 $ 内のすべての非英数字文字をバックスラッシュでエスケープしたものを返す。$ を省略した場合 $_。
pos [$] - 対象となるスカラ文字列 $ に対する最後のグローバル検索 m//g が終了した位置を返す。$ を省略した場合 $_。

split - 説明済み。
study [$] - 対象となるスカラ文字列 $ に対する正規表現検索について予め学習しておく。$ を省略した場合 $_。

入出力関数

binmode handle - ファイルハンドル handle をテキストモードではなくバイナリモードで読み書きできるようにし、成功なら真、失敗なら undef を返す。
close [handle] - ファイルハンドル handle に関連付けられたファイルやパイプを閉じ、$. をリセットする。handle を省略した場合、カレントに選択されたファイルハンドル。
die @ - リスト @ を標準エラーに表示して例外を発生させる。
eof [handle] - ファイルハンドル handle がファイルの最後なら真を返す。handle を省略した場合、最後に読み込みを行なったファイルハンドル。
eof () - <> 演算子で読み込まれるファイルリスト @ARGV や STDIN のすべてのファイルの最後なら真を返す。
fileno handle - ファイルハンドル handle のファイル記述子を返す。
flock handle, op - ファイルハンドル handle を op で flock(2) する。
getc [handle] - ファイルハンドル handle に関連付けられたファイルやパイプから１文字読み込む。handle を省略した場合、標準入力。
print [handle [@]] - ファイルハンドル handle にリスト @ を表示。但し、$, で区切られ $\ で終端するが、既定値はどちらも undef。handle を省略した場合、カレントに選択されたファイルハンドル。@ を省略した場合 $_。
printf [handle ] $format, @ - ファイルハンドル handle に書式 $format に従いリスト @ を表示。
read handle, $, $length[, $offset] - ファイルハンドル handle からスカラ変数に $length バイトを読み込み、読み込んだバイト数を返す。
say [handle [@]] - ファイルハンドル handle にリスト @ を表示。但し、$, で区切られ ^J で終端するが、既定値は前者のみ undef。handle を省略した場合、カレントに選択されたファイルハンドル。@ を省略した場合 $_。
seek handle, $position, $whence - ファイルハンドル handle の位置を指定。$position は正負のバイト数、$whence は 0: SEEK_SET, 1: SEEK_CUR, 2: SEEK_END のいずれか。
select [handle] - ファイルハンドル handle をカレントに選択する。handle を省略した場合、最後に読み込みを行なったファイルハンドル。
tell [handle] - ファイルハンドル handle の位置を返す。handle を省略した場合、最後に読み込みを行なったファイルハンドル。
truncate handle|$, $length - ファイルハンドル handle もしくは式 $ で表されるファイルを $length バイト数に切り詰める。
warn @ - リスト @ を標準エラーに表示する。
write [handle|$] - ファイルハンドル handle もしくは式 $ で表されるファイルハンドルにピクチャ書式で出力。
format - write で使用されるピクチャ書式の宣言。

その他の関数

defined [$] - $ が undef 以外なら真を返す。$ を省略した場合 $_。
ref [$] - $ がリファレンスなら空でない文字列を返す。$ を省略した場合 $_。

これ以外にも、ファイル検査、ファイル操作、スコープ、制御フロー、プロセス、モジュール、オブジェクト指向、ソケット、System V プロセス間通信、ユーザ・グループ、時刻関連などの標準の組み込み関数がサポートされる。

例題

代表的な Unix コマンドに相当する Perl スクリプトを以下にあげる。

`cat`

	perl -pe ''

このように、cat と同じ perl スクリプトは「空」となるが、「perl -ne 'print'」でもよいし、「perl -ne 'print $_'」でもよいし、「perl -e 'print while (<>)'」でもよいし、「perl -e 'while (<>) { print }'」でもよい。

Perl basics - sed, Awk の発展系としての Perl

Contents

主な形式

sed, Awk 風な説明

sed, Awk 風な Perl スクリプトの概要

簡単な説明

Perl スクリプトの概要

型

制御構文

演算子

特殊変数

エスケープ文字

組み込み関数

算術関数

配列関数

リスト関数

ハッシュ関数

文字列関数

入出力関数

その他の関数

例題

`cat`

`head -n 1`

`tail -n 1`

`head -n 8`

`tail -n 8`

`wc -l`

`wc -c`

`wc -w`

`grep '^$'`

`grep -v '^$'`

`grep -E '^.+'`

`grep -E -v '^.+'`

`cut -d ':' -f 1,6`

`cut -d ':' -f 1,6 -s`

`fold -b`

`tee filename`

`tr 'A-Za-z' 'N-ZA-Mn-za-m'`

`cat -n`

`cat -b`

`uniq`, `uniq -d`, `uniq -u`

`expand`

`unexpand -a`

`rev`

`tac`, `tail -r`

`fold`

`fold -s`

`strings -a [-n 4] [-t d|o|x]`

`printenv`

`yes [expletive]`

`cmp [-l|-s] file1 file2`

`paste [-d delimiter] [-s] file ...`

`comm [-1] [-2] [-3] file1 file2`

`join [-a file_number|-v file_number] ... [-t char] [-1 field] [-2 field] file1 file2`

`split [-l line_count|-b number[k|m]] [-a suffix_length] [file [name]]`

`csplit [-k] [-s] [-f prefix] [-n number] file arg1 ...argn`

`seq [-f format] [-s separator] [low [increment]] hi`

`jot [-c|-n|-r] [-b word] [-w word] [-s string] [reps [begin [end [s]]]]`

`shuf [-r [-n times]] -e arg...`, `shuf [-r [-n times]] -i 1-6`, `shuf [-r [-n times]] [filename]`

`sort [-c|-m] [-u] [-r] [-d|-f|-i]`

`sort -c [-u] [-r] [-d|-f|-i]`

`sort -m [-u] [-r] [-d|-f|-i]`

`sort [-r] [-u] [-d|-f|-i]`

参考文献