漢字変換・清朝正字体(いはゆる旧漢字)及び伝統的書写体(風)へ

辻ノ匠(TUZINO Taqumi ; family personal)

清朝の正字体(いはゆる旧漢字,康煕字典体)や伝統的書体は一部の人にとって 美しい字体である.筆者にとっても然りである.
ここでは JIS漢字(ここでは8bit-2byteの83JIS,90JIS, 97JISを指す)を sed で変換するスクリプトを提示する.スクリプトは二段階にわけてゐる. 第一に,JIS漢字のうちJIS新字体を含む 新字体をJIS漢字(Unicode以外を不含)の範囲内で変換する方法を提示する. 第二に,JIS新字体を含む新字体をCID番号を参照することで, Adobe-Japan(1-6)の範囲内で変換する方法を提示する. 後者はTeXでの使用を想定しており,OTFパッケージを必要とする. それらがなにかはここでは説明しないのであしからず.

Unicodeでもいはゆる旧字体・康煕字典体を含む異体字が収録されてゐるが, ここでは取り扱はなかった.理由の一つは,Unicodeは康煕字典体を 完全には網羅してをらず,中途半端であるためである. 漢字を意思疎通の記号として捉えた場合,つまり字種だけを云々するならJISで十分(字種としてJISにある限り)だが, 形態の違いに厚探/*こだ*/はる場合つまり字形の違いに注目する場合はAdobe-Japanが最適である.Unicodeはそのどちらにも中途半端である(だからある種の用途には適当かもしれないが). ここで, もう一段,Unicodeの変換のステップを重ねるよりは, 汎用性の高いJISと拡張性の高いCIDの二本建てとした. (ところが,伝統的書体はAdobe-Japan(1-6)でも収容されてゐないものが 結構ある.たとえば「勅」は康煕字典体では敕であるが, 伝統的な書写体における正體では篇は「来」である[勅なんて字, 意味を知ってゐる者が間違へる筈がない].これは Adobe-Japanにはない.これらの字体はつまるところ, 康煕字典・戦後の文字改革・漢字の電子化の中で消滅してしまったといへる.残念)

注意:今のところ「同音の漢字による書き換へ」には 対応してゐない(現在リスト作成中)ため, 機械的に変換すると奇妙なことになる可能性がある.

清朝正字体(康煕字典体)への変換

康煕字典体はいはゆる旧漢字のことで, 戦後の国語改革まで使われてゐた活字体である. 常用漢字以外の漢字(表外字)の字体は, JIS拡張新字体のように,常用漢字の範囲を越えて略字化される場合もあるが, 現在では康煕字典体が望ましい字体とされる ここでは,厳密な康煕字典体ではなく,康煕字典体に準拠しつつ, 独自の判断で正體を認定したものを示す.というのは「既」「即」など康煕字典内部に 矛盾(内部要素としてもつ字と字形が異なる)があり, それらの矛盾を解決するにあたって独自の判断をしたためである. もちろん完全に盲目的に康煕字典(あるいはどれかの漢和字典)に準拠するのも 一つの方法である.

JIS漢字(Unicode以外を不含)の範囲内で変換

sed スクリプト(いはばテーブル):kanzi2qingchao_within_jis.sed
その見本(PDF)

それを動かすシェル(骨だけ): kanzi2qingchao-jis.sh
これは単なる見本で,動かすには調整が必要である.

JIS漢字の範囲でもけっかう`旧字'は出るものだが,いかんせん中途半端で,当用漢字的変形が随所に認められ,落着かない感がある.さういふ方は,基本的にPDF限定になるが次の項目で,完全な清朝正字体に変換することをお勧めする.

Adobe-Japan(1-6)の範囲内で変換

JIS漢字で変換できるものはここでは取り扱はない.上項目を参照. ここでの利用方法は TeXのOTFパッケージを想定してをり,pTeXおよびOTFパッケージを 導入してゐることが必要.

sed スクリプト(いはばテーブル):kanzi2qingchao-cid4tex.sed
その見本(PDF)

それを動かすシェル(骨だけ.単なる見本):kanzi2qingchao-cid4tex.sh
これは単なる見本で,動かすには調整が必要である.
また,このスクリプトはJIS漢字内での変換テーブルを必要としてをり,上項目のkanzi2qingchao_within_jis.sedが 必要.

適当にコメントアウトしたところを調整して,各自にとって最適な 「康煕字典体」を採用していただければ幸甚である.
# 康煕字典体というのもいろいろ細かい違いがある.

補足:ここでは清朝の正字ということで「清朝正字体」としたが, 厳密に清朝の正字どほりといふわけではない.清朝体といふ名称の 書体もあるが,これは伝統的な書写体の字体をした楷書体のことで 康煕字典に掲げられてゐる字体(明朝)とはまったく異にするので注意されたい.

伝統的書写体への変換

康煕字典では,日中の書家が伝統的に「正體(正体)」と認定してきたものと 違う字体を「正字」にしてゐるものがある.たとへば「高」は康煕字典 (および常用漢字)ではクチ高(今の高)が正字であるが, 伝統的にはハシゴ高のほうが通行字体であり,正體であった. ここでは,書家が伝統的に「正體」を認定してきた字体に近い字体 (明朝体で書写体・筆写体を表現することは無理なので)をJIS漢字 およびAdobe-Japan(1-6)の中から探してみた.

問題は,2つある.

1つは書写体における正體には時代により,地域により,いろいろ揺れがあり, どれを採用するかというところが むつかしいことにある. 五體字類,智永の千字文,字体データベース,木簡データベースなどを 参照することにするが,結局は,ここで提示されてゐるものは 辻埜匠個人の好みが強く強く反映されていると心得られたい. たとえば,示偏は書写体では「ネ」であるが 判読性から書写体では書かない字形である「示」を採用した.

2つ目は,そもそも書写体の字形に相似な明朝体がAdobe-Japanにはないことである (そもそも書写体を明朝体で書いてよいかといふ問題があるが). これは,明朝体と書写体とが活字と手書きとで棲み分けしてをり, 書写体を明朝体で起こすことはあまりなかったことが影響していると思はれる. 康煕字典体が広く活字の基礎になる前には,別の字体の活字が明朝体 あるいはそれ以前の活字体である宋朝体であったが,さういうものは 残念ながら,康煕字典体に駆逐されてAdobe-Japanまで傳世しなった,ということか.... というわけで, 書写体ではかなり一般的だったものでもここで収録できなかったものが多い.

書写体の字形については別途まとめがある.
書写体,および常用字体・康煕字典体との関係


本項目,以下,建設中...

JIS漢字(Unicode以外を不含)の範囲内で変換

sed スクリプト(いはばテーブル):kanzi2tuzitaste_within_jis.sed
その見本(PDF)

それを動かすシェル(骨だけ): kanzi2tuzitaste-jis.sh
これは単なる見本で,動かすには調整が必要である.

Adobe-Japan(1-6)の範囲内で変換

JIS漢字で変換できるものはここでは取り扱はない.上項目を参照. ここでの利用方法は TeXのOTFパッケージを想定してをり,pTeXおよびOTFパッケージを 導入してゐることが必要.

sed スクリプト(いはばテーブル):kanzi2tuzitaste-cid4tex.sed
その見本(PDF)

それを動かすシェル(骨だけ.単なる見本):kanzi2tuzitaste-cid4tex.sh
これは単なる見本で,動かすには調整が必要である.
また,このスクリプトはJIS漢字内での変換テーブルを必要としてをり,上項目のkanzi2tuzitaste_within_jis.sedが 必要.

適当にコメントアウトしたところを調整して,各自にとって最適な 伝統的書写体風字体を採用していただければ幸甚である.

補足:正字・正體・政字・整字

正字の定義はむつかしい.康煕字典の正字,清朝正字体は,政治的に正しいといふ意味になる. 漢字で文字れば「政字」とならうか.常用漢字についても,国語政策として採 用したという政策・政治的意味で用ゐられる.常用漢字下における正字とは 常用漢字の字体にほかならない(ただし,表外字は旧字が正字となる;笑). 通行字体といふのは,ある時間・地域で, 広く通行した字体といふ意味で用ゐてゐる.伝統的書体における正體は 政治的に「正字」と定義されてゐなくても,ちゃんとした書類にはこの字を使ふべ きだといふ慣例(歴史的にはそれを検証することは困難だが碑文は原則正體)があるものを指す. つまり,広い意味での「正字」(つまり,非政治的な字体を含む)を指す.この正 體についての定義は筆者独自のものである. 辻野匠個人は,規範としての字体を正字と呼ぶよりは,整字と呼ぶことを考へてゐる. 上述のやうに,正字には常に政字がついてまはるためである.ここにおいて 整字とは政治的にオーサライズされてゐることを意味しない.文化的なものである.

余談:規範としての能力・一貫性は康煕字典(といふか修正康煕字典体)が圧倒的に強い. 書写体の項目でも触れたが, 書写体にも異体字があり,通行字体は誰が決めたものでもない, 人々の手によりなんとなく決まっていったものなので(といいながら,その時々で 為政者は正字を決め,碑文などにしてゐた,が今日的視点では網羅的ではない), 各異体字間に規範的に優劣をつけがたいこと;及び,いざ使はうとしてもその字形がAdobe-Japanに収録されてゐないことから使えないこと.この2つの理由で, 書写体(正確には書写体風の活字)をデヂタル上での規範にすることはむつかしい. ひるがえって,康煕字典体は内部にいろいろ矛盾があったり, 伝統的書写体との著しい乖離がある.また今日的には字源的にも問題があるものもある.

余談2:まったくの想像でしかないが,康煕字典が伝統的書写体と著しく乖離してゐるのは, わざと考えることができる.理由は一世を風靡するためである. 伝統的書写体が成立したのは 六朝,晋や初唐のころだが,その頃には本来の字源というのはわからなくなってゐた(というか, 漢の許慎のころでも既に不明になってゐた). 気がついた時にはさういふ字体になってゐたのである. だから,伝統的書写体は 字源云々よりも,それ以前(といっても近過去)にどう書かれたか, そして形の美しさや書写の用により決まっているところがある. 康煕字典はそれを訓古学的に正すことに大義名分論的意義があったのかもしれない. 伝統的書写体をあえて否定することで清朝の偉大さを主張できるというわけである. 基準を作ることは天子の特権である.特権を行使することで 天下が清朝の治世にあることを示すわけである. (下世話な例えでは,キャリア組の新人上司が 前の上司がやってゐたことを否定して,あたらしい事業をはじめるのに似てゐるかも. あるいは,自分を基準として世界各地にその基準を押し付けてまわる, ありがちな超大国の姿かも) ただ,それは当時の水準での字源主義なので,今日的には学問的に, 字源の解釈が更新されてゐることもあるだらう.また,「既」の部品の不統一にあるやうに 康煕字典の内部に矛盾があるのは多数の人が関与したためかもしれない.


QET: Quod erat transmittendum. = EOT: End of Transmission.