NLS support J


#if defined(W32) || defined(LNX)

   .国際化サポート。

      内部エラーメッセージは日本語環境以外では英語です。
      この項の議論はファイルのエンコーディングとその画面表示についてです。

      日本語については"日本語入力、コード変換" を参照。

      0x80<-->0xff を使用するSBCS言語ではLinuxコンソール版の場合
      罫線文字にならないように "OPT LINECH OFF"としてください。(1度コマンド入力すればOK)

      (注)ファイル名についてはWindowsのシステムコードページに対して変換不能になる
          可能性があるので使用しないほうが良いでしょう。

      Windowsでシステムの言語設定と異なる言語を使用するには、
        コンソール版はDOS窓のコードページ変更が必要です。
        ドイツ語などヨーロッパ言語の特殊文字(A-umlautなど)入力は
        "chcp 28591" あるいは "chcp 1252" と設定します。
        ともにISO-8859-1 で、1252 は 0x80-0x9fも割り当てあり。

        GUI版(wxe) では /C パラメータで 文字セットを指定て立ち上げます。ex) /C1252。
        そして、Setup ダイアログの文字セットを Other から選択指定してください。
        ISO-8859-1の場合は文字セットはANSIを選択してください。

        前提として、Windowsコントロールパネルで言語の追加と、言語バーでの言語選択の切り替えも必要となります。

      Linuxでは
        コンソール版はDOS窓(gnome-terminalなど)のコードページ設定が必要です。
        DOS窓の文字セット設定とLANG環境変数のUTF8有無は一致させてください。
        違っていると正しく表示されません。
        例えば LANG が UTF8 のとき gnome-terminalの文字セットが各国語の場合"?"入力になります。
        LANG が UTF8 でないとき gnome-terminalの文字セットが UTF8 のとき画面が乱れます。

        日本語キーボードからドイツ語などヨーロッパ言語の特殊文字(A-umlautなど)入力は
        キーボードマップの変更が必要です。
        SCIMの設定をするか DOS窓から"setxkbmap de"などとします。
        SCIM 設定は FC5 では システム->設定->個人設定->SCIM設定です。

        gxe/wxeの場合、フォントの選択によってはLigatureが発生します。
        Ligature とは 例えば fi, ff など隣接する文字の組み合わせによっては2文字を1文字表示にすることです。
        SetupダイアログのLigatureチェックボックスをOffにしておけば分離したまま表示します。
        Ligature を On にすると。カーソル表示位置と文字とが不一致になりますが
        xe では カーソル位置の表示文字はバイト位置の文字を表示します。
        "OPT LIGATURE" コマンド ないしは LIG コマンド(A+";" キー)も使用できます。
          但し、コンソール版はUTF8ファイルのみが対象です。
          また、バイナリーモードで開いた時はリガチャー表示は行われません。
        言語によってはLigatureしないと意味がないそうで結合文字との組み合わせを試してください。
        結合文字の表示方法設定は "OPT UNICOMB" コマンドないしは CMB コマンド(A+":" キー)。

      Alt+u キー(効かない場合はUTF SWKBDコマンド)はキーボード入力の扱いを
      UTF8<-->各国語 切り替えます。
      UTF8文字の扱いはUTF8サポートを参照。

      -----------------------------------------------------------------------

      以下は中国語(簡体/繁体)、韓国語 DBCSサポートの話です。

      CN,KRの入力と表示を確認しましたが私は字を認識することは出来ても理解できません
      （特にハングル文字）使用経験報告をお待ちしています。
      テストはWindows版はXP日本語環境でしか出来ていません。
      Linux版はFC5で言語をスィッチしてテストしました。
      いまのところUTF8エンコードファイルは扱えません。ロケールコードで解釈します。
      ロケールコードはトップメニューに表示されています。
      表示桁数は各国語コードでのバイト数です。
      Linuxの場合、
        GB18030の4桁DBCS, EUC の 3バイト補助漢字はタブパディング文字つきになります。
        パディング文字は TAB コマンドで表示ON/OFF切り替えられます。
        gxeでパディングの印刷の有無は WWScrPrtチェックボックスに従って制御します。
        3ないし4バイト文字をHex入力モード(C+F11でトグル)で入力する時は
        Hex入力モードは2バイトで転送するので２回に分けて入力してください。
        1バイトを転送するには"x"キーを使用します。

      XP日本語環境でC/K入力設定は以下のようにします。
        コントロールパネル-->地域と言語-->言語タブの詳細ボタン で言語を追加します。
        IMEも追加してください。詳細は Web をサーチしてください。
          例えば　http://www2.yamanashi-ken.ac.jp/~yohnishi/pcinfo/windows_tips/international/win-cn-kr.html

        GUI版(wxe) では Setup ダイアログの CharSet で Other のところでコンボボックスから選択してください。
        コンボボックスになければテキストボックスに数字を入れてください。(wingdi.hを参照)
        FontStyleの変更も必要でしょう。

        コンソール版(xe)はコマンドプロンプトのプロパティを設定します。
        DOS窓左上のアイコンでなくデスクトップのアイコン状態のコマンドプロンプトを右クリック、
        オプションタブで現在のコードページを設定する。
        コードページを変更するとフォントも変わると思います。
        コードページを設定することで言語バーに追加したIMEが選択できるようになる。
        設定できない場合は CHCP コマンドを使用してください

        IME操作を若干。
           (コントロールパネル-->地域と言語-->言語タブの詳細ボタン-->キーの設定 で設定変更可能。)
           省略値は左Alt+Shiftで言語バーのIMEはスイッチする(GUI APPLはマウスで言語バー操作できます)
           韓国語 MS-IME2002     右Alt: 英数<-->ハングル。 Alt+^: 半角<-->全角英数
           簡体中国 PinYin       Shift: 変換<-->無変換。   Shift+Space: 半角<-->全角英数
                                 Ctrl+Space: 英数<-->漢字変換モード。
           繁体中国 Phonetic     同上

        Windows CodePage & Font
                 Charset on Setup dialog      CodePage     CmdPromptFont   IME
                 Japanese 128                 cp 932       MSGothic        MSIME 2002
                 hangul   129                 cp 949       GulimChe        MSIME 2002
                 GB2312   134                 cp 936       NSimSun         PinYin 2002
                 Big5     136                 cp 950       MingLiU         NewPhonetic

           Charsetはwingdi.hに以下の定義があります。
                #define ANSI_CHARSET            0
                #define DEFAULT_CHARSET         1
                #define SYMBOL_CHARSET          2
                #define SHIFTJIS_CHARSET        128
                #define HANGEUL_CHARSET         129
                #define HANGUL_CHARSET          129
                #define GB2312_CHARSET          134
                #define CHINESEBIG5_CHARSET     136
                #define OEM_CHARSET             255

                #define JOHAB_CHARSET           130
                #define HEBREW_CHARSET          177
                #define ARABIC_CHARSET          178
                #define GREEK_CHARSET           161
                #define TURKISH_CHARSET         162
                #define VIETNAMESE_CHARSET      163
                #define THAI_CHARSET            222
                #define EASTEUROPE_CHARSET      238
                #define RUSSIAN_CHARSET         204

                #define MAC_CHARSET             77
                #define BALTIC_CHARSET          186

      Linux(FedoraCore5の場合)では以下のようにします。(JP106キーボード)
        デスクトップ-->管理-->言語 で言語を選択し、ログアウト/ログインします。
        Korean            : 半角/全角キー:IME 呼び出し
        Chinese(簡体中文) : 半角/全角キー:IME 呼び出し
        Chinese(繁体中文) : 半角/全角キー:IME 呼び出し

        尚、ターミナルエミュレータ(gnome-terminal,konsoleなど)で
        UTF8<-->非UTF8 Encodeingを変更した時は"export LANG=xxxx"で
        ローケール環境も変更してください。

      コマンドラインパラメータの追加。
        -C   :環境から決定されるもの以外を使用したいとき指定する。

              Windosw : Codepage。   ex) -c949  -cGerman_Germany.1252
                利用可能な値はxcv コマンドで見て下さい("xcv -List)
                Windowsコンソール版ではDOS窓のプロパティーでフォントが限定されるので
                指定変更すると文字が見えなくなるかもしれません。
                wxeではSetupダイアログでCharsetも合わせる必要があります。

                Windows から Linux/390 に ssh したとき UTF8 文字により
                画面が乱れます。
                "xe -cUS-ASCII" とし >0x80 文字を "." で表示するようにしてください。

              Linux  :Charset        ex) -cGBK, -ciso88591 -czh_CN.GB18030
                利用可能な値はxcv コマンドか iconv --listでListup。

                省略値はLANG環境変数がUTF8でない時はそこに指定された文字セットを使用します。
       　       例えばLANG="de_DE.iso8859"なら iso88591
                LANGがUTF8のときは以下のように国コードから決めています。左から使用可能なものを選択します
                    zh_CN :GB18030,GBK,GB2312
                    ko_KR :UHC,EUC-KR
                    ja_JP :eucjp

                但し全画面コンソールの場合はiconvがサポートしていれば "ISO88591",
                いなければ "C" とします。

                これ以外の国の場合は国コードだけでsetlcaleしnl_langinfoで求めます。
                このsetlocaleが失敗したらiso88591を使います。

                Axe では ICU を使用します
                    zh_CN :"GB18030","GBK","GB2312"
                    ko_KR :"korean","EUC-KR"
                    ja_JP :"EUC-JP"
                    zh_TW :"Big5-HKSCS","Big5"
                    その他:"ISO-8859-1"

                gxeではGTKからの入力はutf8です、gxeはこの指定のCharsetにiconv変換し、
                表示もこのCharserからutf8変換します。
                xeコンソール版では入力はターミナルエミュレータが変換したものを受け取ります。
                xeはターミナルエミュレータのCharsetをsetlocale(LANG環境変数)で検知します。
                (それがUTF8の場合別の方法でロケールコードを判定します。)
                xeはsetlocaleのCharsetからこの指定のCharsetに変換します。
                表示もこのCharserからucs変換しncurseswで出力します。
                例。"あ" は EUC-JPでは 0xa4a2 で EUC-KR では 0xaaa2 です
                    IME窓で"a"キー,Enterキーを押した場合。

                                           IMEからの入力       表示
                   ----------------------  ----------------    ------
                   EUC-JP.UTF8 + -cEUC-KR  aaa2("A" by KR)     "あ"
                   EUC-JP      + -cEUC-KR  a4a2("A" by JP)     "xx"

                   "xx"はハングル文字(SJISでは表示できません),発音は "?k"らしい。
                   (xeコンソール版では空白で表示されることもあります。)

        -Nm  : A+u でUTF8入力モード(コマンド行が =u=> を表示)のとき
               (UTF8エンコーディングでない) ロケールコードファイルに
               UTF8入力をロケールコードマルチバイトに変換せずにUTF8コードをセットする


#endif // W32 || LNX