読者です 読者をやめる 読者になる 読者になる

さわだのノート

書籍のお仕事に役立つかもしれない思いつきを記録しています。

RSS: 記事の更新情報 Rss Feed

Unicodeで正規表現検索

use utf8で挙動が変わるPerlの正規表現 言うまでもないかもしれませんが、Perlでは正規表現が利用できます。「\d」では半角数字が、「\w」で半角英数字が検索できるという便利な検索の仕組みのことです。 詳しいことは下記のサイトをご参照あれ。Perlの正規…

スクリプトの実行手順をおさらい

PythonやPerl、シェルスクリプトなどのスクリプトファイルは、シェバング行を書いておくとスクリプトファイルを直接実行することができるそうです。シェバング行というのは、 #!/usr/bin/perl みたいなのを書いている行のことですね。スクリプトファイルの1…

Web::Queryに任意のUserAgentを設定する

Web::ScraperとWeb::Query これまで、PerlでのスクレイピングにはWeb::Scraperを使ってきましたが、Web::Queryというモジュールもあるようです。Web::Query - jQuery風にスクレイピング - ”><xmp>TokuLog 改メ tokuhirom’s blog Webスクレイピング入門 - Perl Adv</xmp>…

Vimで選択範囲の文字数をカウントする

ライター/編集に必須の文字数チェック 原稿やブログの記事を書くときは、いつもVim(GVim)を使っています。 原稿をちょこちょこっと直したり、正規表現で文字列を修正したりといったことがスムーズにできるのがいいですね。しかし、ライティングになくては…

原稿を適当にXML化

原稿の整理・編集にはいつもVimを使っていますが、複数のテキストファイルに複雑な処理をかませたいときはPerlを使っています。 今週末はクリスマスなので、適当なフォーマットの原稿をXML化するためのスクリプトを書いてみました。 マジで暇だ。 #!/usr/bin…

Perlで日本語を扱うときの設定

PerlのスクリプトはいつもUTF-8で書いています。 Mac&Linux環境 MacやLinuxみたいな、ターミナルのデフォルトエンコーディングがUTF-8の環境ならこれでOK。 PerlのIOレイヤーと標準入出力(エラー出力含む)がUTF-8でエンコード/デコードされるようになり…