kkamegawa's weblog

Visual Studio,TFS,ALM,VSTS,DevOps関係のことについていろいろと書いていきます。Google Analyticsで解析を行っています

たくさんの異体字

id:kkamegawa:20101013:p1にコメントをいただきました。ありがとうございます。
id:ufcpp wrote:

よその国の文字だと、古語にしかない文字も結構入ってますからねぇ。
といいつつ、そのエとゑの旧字は、そんな文字あったのかというレベル・・・

ですよねぇ。しかし古語にしかないといえば、変体仮名とかも入ってていいのではとか思います。見た限りなかったような?明治まで普通に教えていたそうですしいいんじゃない?という無駄知識はこの本で知りました。

とめはねっ! 鈴里高校書道部 7 (ヤングサンデーコミックス)

とめはねっ! 鈴里高校書道部 7 (ヤングサンデーコミックス)

YuO wrote:

U+2B795,JH-IBとあるので,日本提出ですね。
UAX #38によると,汎用電子情報交換環境整備プログラムが出典で,
http://www.unicode.org/reports/tr38/
戸籍等に使われている文字を抜き出したようです。
http://www.itscj.ipsj.or.jp/topics/mojidb0706.html
なので,本当に手が震えて,というのがありそうです (苗字は時々異体字がありますよね)。

こんなの包摂の範囲内だと思うので,異体字セレクタでやってほしかったところです。

補足ありがとうございます。戸籍の文字はほんとに困ったものですね…今はもう新しい戸籍を作るときはあまり新しい異体字作られないそうですが。
異体字で浮かんだネタを安岡先生が先に書かれていましたけど、まぁいいや。「わたなべ」という名字、パッと思い浮かぶだけでも異体字が多いと思っている人が多いと思いますが、どのくらいあるでしょう?まず安岡先生のページで紹介されていた住民基本台帳ネットワーク統一文字にある「邉」と「邊」の一覧。
住基コードの「邉」と「邊」 | yasuokaの日記 | スラッシュドット・ジャパン
なんというかもうここまで来るとあきれますね。しかしもっとあきれる一覧があります。株式会社イーストさんではこの手の人名外字フォントを製品化されています。最新版のV4でこの文字がどのくらい登録されているでしょう?実はこれだけあります。
「俗字・異体字」TrueTypeフォント人名外字1500V4 - 収録外字一覧
なんと65文字…確か以前のバージョンでは45文字だった記憶があるのですが、また増えたんですかね?このサイズではよくわからないですが、全然区別できない文字がすごく多いです。包摂の範囲内でまとめてほしいです。日本人は周りと一緒じゃないといやという国民性だと思っていたのですが、名字に関してはそうでもないようです。まぁ昔は傾奇者とかいたそうですしね。