レベルエンター山本大のブログ

面白いプログラミング教育を若い人たちに

BLOCKVROCKリファレンス目次はこちら

Shift_JIS→UTF-8の変換で問題になることがら

現場で、Shift_jisUTF-8の変換時の懸案事項を調査していた。

以下の「Unicode標準入門」という本がとても良い!!
Web時代のエンジニアは必携と言っていい。

Unicode標準入門

Unicode標準入門

UNICODEについて調べて見ると知らないことばかり。

・CJK統合漢字(またはCJKV統合漢字)
 中国、日本、韓国の複数の漢字の規格を統合して作ったUnicodeの漢字ブロック群
 130,000以上の漢字を27,786の文字コードに統合している
 
・ユニフィケーション
 同じ意味・文字で字形の違う文字に1つのコードを割り当てること
 CJK統合漢字のブロックだけを考えても、
 130,000文字を27,786のコードに割り当てているため、
 同じコードが使われる字形の違う文字が存在していることが分かる。
 

◆CJK統合漢字
http://ja.wikipedia.org/wiki/CJK%E7%B5%B1%E5%90%88%E6%BC%A2%E5%AD%97
http://homepage1.nifty.com/~petronius/kana/kakutyaumozi.html
http://ew.hitachi-system.co.jp/w/CJKE7B5B1E59088E6BCA2E5AD97.html
http://homepage1.nifty.com/nomenclator/perl/ShiftJIS-Collate-j.html

◆ハンユニフィケーションとは
http://ew.hitachi-system.co.jp/w/E3838FE383B3E383A6E3838BE38395E382A3E382B1E
383BCE382B7E383A7E383B3.html

異体字 【異体文字】
http://ew.hitachi-system.co.jp/w/E795B0E4BD93E5AD97.html

◆漢字のそれぞれ
http://rtk.web.infoseek.co.jp/cjk/prns/

◆SHIFT - JIS と Unicode 間の変換問題
http://support.microsoft.com/kb/170559/ja

◆JIS補助漢字JIS X 0212)(全コード表)
http://www.asahi-net.or.jp/~AX2S-KMTN/ref/jisx0212/index.html

◆日本の文字コード
http://www.asahi-net.or.jp/~ax2s-kmtn/character/japan.html#machine_depend

◆部首検索/画数検索/読み検索/コード検索
http://rtk.web.infoseek.co.jp/cjk/

◆CJK
http://www.sungwh.freeserve.co.uk/uni/

◆シフト符号化表現
http://suika.fam.cx/~wakaba/-temp/wiki/wiki?%A5%B7%A5%D5%A5%C8%C9%E4%B9%E6%B
2%BD%C9%BD%B8%BD

◆漢字データベース計画
http://kanji-database.sourceforge.net/

補助漢字
http://ja.wikipedia.org/wiki/JIS%E8%A3%9C%E5%8A%A9%E6%BC%A2%E5%AD%97