2017年1月20日金曜日

朗報! Chrome 用テキストエンコーディング拡張機能が公開されていた!

【備忘録】Chrome 55 より、テキストエンコーディングメニューが削除された・・・ で呟いた通り、Chrome 55からテキストエンコーディングメニューが削除されました。しかーし、やはり使いたい人がいるのですね、拡張機能として開発されたものが公開されてました。

この拡張機能を Chromeにインストールすることで、コンテキストメニュー(右クリック | MacならCtrl+クリック)に「テキストエンコーディング」メニューが出て従来通りっぽい使い方ができます。

情報源


Chrome ヘルプフォーラムのエンコードの変更ができなくなりました にて、トピ主さんが探したものを情報共有してくださいました。Chrome 55が出た頃にないかなーと探してましたがなかったのですが、ようやく出てきてくれた!って感じですね!

検証


では早速検証してみます。ウェブサーバーは Apache 2.0系です。
UTF-8とEUC-JPの2つのエンコードが混じったHTML(実際はテキストのみ)を作成します。

左がUTF-8、文字化けしている右が EUC-JPです。
いずれも文字は「あああああ」です。つまり自動判別では、UTF-8と認識しているってことですね。

右クリックしてテキストエンコーディングをEUC-JPにしてみましょう。

左のUTF-8テキストが文字化けして、右のEUC−JPテキストが正しく表示されてますね!

なお、左右を逆(最初にEUC-JPの文字にして、右をUTF-8)にしても、自動判別は UTF-8と認識するようです。Shift-JISとUTF-8でもUTF-8が自動判定されますね。

他にも、UTF-8, EUC-JP, Shift-JIS, ISO-2022-JP (JIS) で自動判別でどれが優先されるかチェックしてみました。

UTF-8, EUC-JP => UTF-8
EUC-JP, UTF-8 => UTF-8
UTF-8, Shift-JIS => UTF-8
Shift-JIS, UTF-8 => UTF-8
UTF-8, ISO-2022-JP => UTF-8
ISO-2022-JP, UTF-8 => UTF-8
Shift-JIS, EUC-JP => Shift-JIS
EUC-JP, Shift-JIS => Shift-JIS
ISO-2022-JP, Shift-JIS => Shift-JIS
Shift-JIS, ISO-2022-JP => Shift-JIS
EUC-JP, ISO-2022-JP => EUC-JP
ISO-2022-JP, EUC-JP => EUC-JP

という結果から、同一テキスト内に複数のエンコーディングがあった場合
UTF-8 > Shift-JIS > EUC-JP > ISO-2022-JP の順に自動判別しているなってのがわかりますねぇ。

2017年1月20日 @kimipooh



0 件のコメント:

コメントを投稿