URLを抽出する正規表現はどう書くべきか

最終更新:2012/02/05
文字列の中からURLを抽出すうえで、なるべく簡単な正規表現
したいとき、僕は下記のように書くことにしました。


/(?:^|[\s ]+)((?:https?|ftp):\/\/[^\s ]+)/
空白文字と全角スペース以外の文字すべてを受け入れています。
ちょっとやり過ぎな気もしますが、『http://家庭教師.jp/』などの
日本語でのURLというものもあるようなので、こうなりました。


半角英数記号のみを受け入れるなら下記ですが。


【外部ページ】正規表現:正しいURLかどうか調べる - phpspot
http://bit.ly/wKrBmC