tb033  Unicodeへの変換



従来のバージョンではデータファイル中のラベル情報に限って日本語を入力することができました。これに対しStata14ではUnicodeサポートという形でより本格的な多言語サポート機能が組み込まれました。ただしこの枠組みに移行するためには拡張ASCIIコードをすべてUnicodeに変換するという操作が必要となります。

(1) コードの違い

Stata13で作成した次のようなデータファイルがあったとします。tb003 に記述されているような環境設定を施したStata13であれば日本語は正しく表示できていたはずです。

しかしこのデータファイルをStata14以降のデータエディタで表示させると文字化けが発生します(*1)。

これはStata14以降ではUnicodeが前提となっていることによるものです。

 *1 Windows環境では日本語がシフトJISコードで表現されているため、このような文字化けが発生します。これに対しMac環境では最初からUnicodeがサポートされているため、問題は発生しないはずです。

(2) Unicodeへの変換

Stata14以降で用意されているunicode系のコマンドでは多様なコードからの変換が可能ですが、入力となるのがシフトJISコードである場合には次のように操作してください。

この操作によって作業用ディレクトリ内のデータファイルはUnicode化されます(*2)。

 *2 作業用ディレクトリ内に生成されるbak.stunicodeというフォルダ中には変換前のオリジナルファイルが保存されています。

unicodeコマンドの詳細についてはデータ管理 [D] マニュアルを参照してください。


小技コーナー ページへ戻る

 = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =

© 2018 Math工房