[Squeak-ja: 2729] Re: Squeak の文字コードの扱いについて

Tetsuya HAYASHI tetha @ st.rim.or.jp
2005年 11月 9日 (水) 21:15:08 JST


林です。どうも。
この件に関して別なお話があります。

その前に…

On 2005/11/09, at 18:47, Takashi Yamamiya wrote:

> 2) に関して、大島さんより情報を頂きましたので書いておきます。
>
> この件に関しては、sjis <-> unicode 変換に対して複数の可 
> 能性がある文字がある
> 事が理由だそうです。私も文字コードに詳しくないのでうまく書けま 
> せんが、
> 例えば ÷ に対する unicode の番号が二つあっ 
> て、それが 128-255 の文字を
> 変換していない原因との事でした。

う〜んと、Unicode としては一つかと思われます。
こういう言い方はあまり正しくないですが、他の文字コードに、半角の 
×÷と全角の×÷が存在しているということではないでしょうか。前者 
は ISO-8859-1 文字コード、後者は Shift_JIS などの日 
本の文字コードで、Shift_JIS では、前者の半角の×÷は半角カ 
タカナのコードと一部ぶつかってるので日頃、目にする事が無いという 
ことかと思います(間違っていましたらご指摘ください)。
Unicodeは、結構(というか、かなり)いい加減なので、全角半角を区 
別せずに各々、×(0xD7)、÷(0xF7) で扱ってしまいます。
今の Squeak は賢く、Shift_JISから持って来たことを判 
断して、区別して扱っている(leadingで識別。フォントをちゃ 
んと2種類用意している)という理解でいます。
なお、Shift_JIS から持って来れるのですから、 
Shift_JIS へ変換するところ(Unicode変換の箇所ではなく)で 
この2文字をピンポイント的に扱うことは出来ないのでしょう 
か?(ちょっと嫌らしいですが)

ところで、ここから本題なのですが…
今の MacOSX 版では、キー入力の段階で Unicode を用い 
ています。
ですので、半角の×÷と全角の×÷の区別がそもそもありません(この 
メール自体、今、見た目は半角の×÷です)。
その為に、今回の問題の件(クリップボード経由での文字化け)以前 
に、全角の×÷を入力することすら出来ない状態で、他のプラットホー 
ムでの動作と互換性が、崩れてしまっています。

この件については、キー入力時に Squeak の言語モードを識別 
し、無理矢理全角の×÷にしてしまうといった案が考えられますが、こ 
の他にもっといいアイデアやご意見ありましたら是非お願いいたします。

ちなみに…

>> 林さんによると、MacRomanコードは今やお荷物なので近い内 
>> にどうにかするの
>> でしょうが、いっぺんにVM込みでやる必要があるでしょう。 
>> VM のソースで言

これは、Windows 版にとって、お荷物(VM の中で  
MacRoman 変換し、さらにイメージ側でも MacRoman 変換し直し 
たりしてる)というお話で、決して、MacRoman の存在自体を指 
してるわけではございませんので、ご了解のほど (^^;

--
Tetsuya HAYASHI <tetha @ st.rim.or.jp>
PGP: 5C 7D 4C 07 DA 73 74 C4  1F 6D 87 EE FD 09 0D FE





Squeak-ja メーリングリストの案内