さわだのノート

書籍のお仕事に役立つかもしれない思いつきを記録しています。

RSS: 記事の更新情報 Rss Feed

Perl

Unicodeで正規表現検索

use utf8で挙動が変わるPerlの正規表現 言うまでもないかもしれませんが、Perlでは正規表現が利用できます。「\d」では半角数字が、「\w」で半角英数字が検索できるという便利な検索の仕組みのことです。 詳しいことは下記のサイトをご参照あれ。Perlの正規…

Web::Queryに任意のUserAgentを設定する

Web::ScraperとWeb::Query これまで、PerlでのスクレイピングにはWeb::Scraperを使ってきましたが、Web::Queryというモジュールもあるようです。Web::Query - jQuery風にスクレイピング - ”><xmp>TokuLog 改メ tokuhirom’s blog Webスクレイピング入門 - Perl Adv</xmp>…

Vimで選択範囲の文字数をカウントする

ライター/編集に必須の文字数チェック 原稿やブログの記事を書くときは、いつもVim(GVim)を使っています。 原稿をちょこちょこっと直したり、正規表現で文字列を修正したりといったことがスムーズにできるのがいいですね。しかし、ライティングになくては…

原稿を適当にXML化

原稿の整理・編集にはいつもVimを使っていますが、複数のテキストファイルに複雑な処理をかませたいときはPerlを使っています。 今週末はクリスマスなので、適当なフォーマットの原稿をXML化するためのスクリプトを書いてみました。 マジで暇だ。 #!/usr/bin…

Perlで日本語を扱うときの設定

PerlのスクリプトはいつもUTF-8で書いています。 Mac&Linux環境 MacやLinuxみたいな、ターミナルのデフォルトエンコーディングがUTF-8の環境ならこれでOK。 PerlのIOレイヤーと標準入出力(エラー出力含む)がUTF-8でエンコード/デコードされるようになり…