普段漢字の入力チェックはそれほど拘らないことが多いです。とりあえず Unicode の漢字ブロックにいればいいかなという具合で作ってしまいます。ただ、日本には常用漢字という名の文字セットがあり、この通りに正規表現でバリデーション組んだらどうなるのか気になったので作ってみました。
タグ: 正規表現
正規表現の $ は文字列の最後ではない場合がある
最近 ^
や $
より \A
や \z
を使った方がいいという話を聞いたり、いろいろな言語を触ったりして少し混乱してきたので、言語ごとの正規表現の違いについてまとめようと思います。
正規表現で CSV から SQL を作成する
更新1:Notepad++ で動かなかったので修正しました。
更新2:001 のような 0 埋めの数字が ‘ で囲まれない問題を修正しました
Excel のマクロで作っていたのですが、遅かったため正規表現を使って再現してみました。
区切り文字:,
引用符:”
の想定で。
正規表現で TSV から CSV に変換する
TSV を CSV に変換することが多々あるのですが、タブをカンマに変換すればいいんだろ?楽勝じゃん!とか思っていると、データに「,」が含まれていたりして困ったものです。ですので、正規表現でカンマが含まれている部分を””で囲ってあげようと思います。