2014/12/21

cafne gismu liste の文字頻度解析

参考:http://blog.livedoor.jp/monakanotsuki/archives/1195723.html

monakas氏がやっていたことを、cafne gismu liste 750語についてもやってみた。
やったのは、①750語全体 ②上から5つずつ分けた250語、計3区分についての計4つです。


mulno 750pamoi 250remoi 250cimoi 250monakas
a48232.13%16332.60%15531.00%16432.80%85331.48%
e19112.73%6312.60%6813.60%6012.00%34612.77%
i46330.87%15430.80%15931.80%15030.00%81229.96%
o1036.87%295.80%326.40%428.40%2438.97%
u26117.40%9118.20%8617.20%8416.80%45616.83%
f693.07%233.07%212.80%253.33%1172.88%
s1767.82%597.87%628.27%557.33%3147.72%
c2129.42%678.93%7510.00%709.33%3338.19%
x542.40%182.40%182.40%182.40%1032.53%
v502.22%212.80%131.73%162.13%902.21%
z391.73%162.13%121.60%111.47%611.50%
j1145.07%364.80%435.73%354.67%2115.19%
p1084.80%304.00%334.40%456.00%1864.58%
t1717.60%628.27%557.33%547.20%3318.14%
k1265.60%445.87%395.20%435.73%2576.32%
b893.96%344.53%314.13%243.20%1844.53%
d1124.98%405.33%405.33%324.27%1954.80%
g592.62%233.07%152.00%212.80%1202.95%
m1325.87%526.93%385.07%425.60%2295.63%
n30913.73%10714.27%9412.53%10814.40%55213.58%
l1797.96%496.53%689.07%628.27%3268.02%
r25111.16%699.20%9312.40%8911.87%45011.07%
全母音数15005005005002710
全子音数22507507507504065
全文字数37501250125012506775
全語数7502502502501355


凡例は
mulno 750 : 750語すべて
pamoi 250 : 上位250語
remoi 250 : 中位250語
cimoi 250 : 下位250語
monakas : monakas氏の全gismu1355語
となっています。数字だけじゃなんですから、グラフ化してみます。


全体的には、全gismuと傾向は変わっていませんね。ひとつだけ、mulno750とremoi250でaとiが逆転していますが、そこまで顕著な差ではありません。

mulno750とmonakasで個々を比較していくと、a,i,uの3つは微妙にmulno750が大きくなっています。これは上位3母音なわけですが、cafne gismu では、(微妙に)a,i,uのウェイトが大きいということですかね。

e についてはほとんど変わりませんが、oは面白いです。まず、pamoi < remoi < cimoi と、頻度が落ちるにつれ o の比率が上がっています。gismuの使用頻度とoの含有率に相関をみたくなります。


次に子音です。


見づらいですが、全体的な傾向は一貫しているように思います。

f,s,x は 5つでほとんど変わらないかと思います。

5つの間で変化が著しいのは、c, v, p, t, k, b, d, m, n, l, r でしょうか。
特に鼻音流音はかなり変化が激しいですね。

pamoi に着目すれば、m > l となっています。nは相変わらずぶっちぎってます。そして、rが他の4つに比べて極点に低いです。cafne gismu 上位にはrが少ないんですね。他の子音に比べたら多いほうですが。
pamoi でm が多いのが面白いですね。

cは cafne gismuのほうが全gismuより大きく比率が出ていますね。






2014/12/15

量系gismuについての草稿

14/12/14 ver1.0

参考:
veci'eとklani
BPFK sections - Quantity tag

ni'o

 この記事では、量系のgismu、たとえば、grake(Nグラムだ)や cacra(N時間だ)といったものついて、いくらか体系的な考察をしてみたい。量は NUの niとも密接に関わってくるものであるという点で重要な概念であるし、比較的語彙数も少ない(多様性が低い)ので、そういった考察に価値が見いだせそうだからである。


ni'o

 まず、おそらく量系gismuにおいてもっとも一般的なものであろう klani についてみていきたい。klaniのPSは、

klani
x_1 は x_2 によって x_3 (尺度)について測定された量
x_1 is a quantity quantified/measured/enumerated by x_2 (quantifier) on scale x_3 (si'o).

となっているが、これはBPFKコーパスや、BPFK sectionsの klani由来のタグ(la'u)の使われ方を見ていても若干違うような気もする。少なくとも、日本語定義のklani_2が少し奇妙に感じるような使われ方がなされている。

 そこで、次に、日本のロジバングーグルグループにあった、CLL日本語抄訳にも関連のあるものの中でなされたklaniの話について見てみる。そこでは、guskant氏がlojban定義のklaniから、

(1) klani_1 = klani_2 × [klani_3を測る単位]

が成り立つということを述べている。すなわち、たとえば、

1つのリンゴ = 300 × [重さを測る単位; グラム]

のようなことである。一応、ロジバン定義を載せておこう:

klani
(2) x_1 se parbi x_2 noi namcu ku'o lo gradu be x_3

これは、

(2)' x_2 noi namcu cu parbi x_1 lo gradu be x_3

であり、parbiは、

parbi
(3) x_1 namcu barda te ckini x_2 boi x_3 .i x_1 nu'a pa'i x_2 boi x_3
x_1 は x_2 と x_3 の間の数字の大きさの関係である。 x_1 = x_2 / x_3。

であるから、(2)'は

(2)'' x_2(数)= x_1 /  [x_3(概念)を尺度とする単位]

となる。これはguskant氏の言うことと一致している。

 ここで生じるひとつの疑問は、「リンゴを相応の単位(たとえばグラム)で割ったものは果たして数なのだろうか」ということである。実際、parbiの英語定義は、

parbi
(4) x_1 (me'o, fraction) is a ratio/rate of x_2 (quantity) with respect to x_3 (quantity), [x_2:x_3].

となっているが、今回の場合、x_2には「物」が入っており、それが "quantity" なのかは怪しい。

 しかしながら、BPFK コーパスを見る限りでは、klani_1 には「諸量をもつ物(対象)」が入ってある。lojban定義のほうはあまり本気にしないほうがいいのかもしれない…。

 いずれにせよ、現段階での使われ方を見るに、klaniのPSは

(5) x1 は x3(尺度;si'o)でいうところの x2(数)の量だけある。
(5)' x1の量は x3 でいうところの x2 だ。

くらいになるだろう。すなわち、klaniのPSにはあらわには量が出てこない。klaniは、量を持つ物、数値、尺度の三項関係である。

※ なお、「これは10メートルある」というのを、klaniを用いて表すには、ti klani li pano lo se gradu be lo mitre be lipa とすればよいと思う。すなわち、「1メートルを単位とするような尺度において、これは10の量をもつ」。


ni'o

 kilto のロジバン定義によれば、これはほとんど klani と同じである。違いは klani_2 が1000倍されることくらいである。つまり、数値が定数倍異なることを除いては、kilto (他の類似gimuにはロジバン定義がないが、おそらく同じような定義になるだろう)とklaniは同じPSをもつ。


ni'o

 grakeやmitreなどのSI単位系gismu、またnancaやdjediなどの時間系gismuに関しても同じような使われ方がなされている。すなわち、x1には何らかの量ではなく、しかじかの量をもつ対象がくる。

(6) mi grake li xareki'o / 私は62,000g (62kg)の量だけある。
(7) lo nu mi bajra cu mentu li pano / 私が走るという出来事は10分間の量だけある。

 しかしながら、これらのx3には「尺度」ではなく、「基準(by standard)」が入るという点でklaniと異なる。おそらく、この基準というのは端的にいって「その単位の定義」である。たとえば、「グラム」というのは今と昔とではその定義は(ほとんど数値は一致するだろうとはいえ)異なっている。時間系gismuについてはもっと顕著だろう。日や分はともかくとしても、「一週間」が私たちのいうところの「7日」とは限らないし、暦によっては「1ヶ月」は(私たちのいうところの)「30日(31日、28日)」とは異なるかもしれない。

 さて、しかし、grake は尺度の位置を持っていないわけだが、grakeにとって尺度はほぼ一意に定まるのだろうか?たとえば、SI単位を組み合わせ、[N・sec]としたときに、これは運動量(変化)の単位でもあれば、力積の単位でもある。リンゴが[N・sec]単位にして0.1の量をもっていたという記述は、リンゴがそのときにそれだけの運動量を持っていたのか、それともそのときにそれだけの力積を受けたのか、もしくは(これは受けた力積の量の言い換えに近いが)そのときにそれだけの運動量変化が起きたのかを区別できないように感じる。

 ここで、「変化量」は「その対象がもつ量」だろうか?と問うことで、さきほどの疑問は解決するかもしれない。はっきり言って、「変化量」はその対象がもつ量ではないだろう。これによって、先ほどのリンゴはおそらくそれだけの力積を受けたのだと一意に解釈されるであろう。

 しかしながら、このような状況は他の場合で起こるかもしれない。すなわち、SI単位(もしくはその組み合わせの単位)系gismuにとって、尺度は必要かもしれない。


ni'o

 いずれにせよ、これまで出てきたgismuはどれもあらわには「量」を取り扱っていないことに注意すべきである。すなわち、その語のとり結ぶ項の中に「量」はいないのである。いるのは尺度と、数値と、その量をもつ対象のみである。

 関連して、「1メートルは100センチメートルである」は何と何を比較しているのだろうか。これにはおそらく2つの解釈ができる。すなわち、単純には「すべての1メートルあるものは、100センチメートルでもある」という風にしかじかの量をもつ物に視点を向ける方法がまずある。そして、量と量の比較としてみるやり方もある。つまり、「1メートルという量と100センチメートルという量は同じである」という風にとらえる方法である。私たちは mitre を使うことで前者のようにものをいうことはできる。しかしながら、これらのgismuを以ってしても、それらは「量」をあらわに取り扱わないので、後者のような述べ方ができないのである。


ni'o

 そこで登場するのがniだと思われる。niはNUに属し、すなわち、抽象詞である。「抽象」詞なのであるから、ni句はおそらく抽象的な実体を表すはずである。思うに、これこそが「量」である。「量」は性質と同じくらい抽象的なものである。

(8) loni mitre li pa cu du loni centi mitre li panono
1メートルという量は100センチメートルという量に等しい

というわけで、あらわに量を取り扱いときは ni を用いる必要がある。

 さて、しかし、先ほどの文を概念の比較としてみることはできないか。つまり、言い換えれば、尺度の比較としてみることはできないだろうか:「1メートルという概念は、100センチメートルという概念と同種である」。さて、概念比較は少し難儀である。概念が同じであるとはどういうことだろうか。少なくとも「1メートル」と「100センチメートル」は同じものではない以上、同一の概念ではないはずであるから、duで結ばれるものではない。おそらく、mintuかdunliであろう。しかし、これ以上の追求はやめておこう。明らかに、niを用いるよりも難航するからである。


ni'o

 さて、niについてもう少し深くみてみよう。niはni節から相応の量を引き出す。その量がどんなものであるかはx2の尺度によって幾分規定される。

 おそらく、niはkaと同じように、ce'uを主に必要とする。これはさっき見てきたように、量をもつのは大体に置いて「物事」だからである。すなわち、 lo ni ce'u broda は、「broda_1 がもつような量」を意味(指示)する。

 しかし、それなら、はっきりいってわざわざ文を取り込む必要がないのではないかと一見思える。つまり、性質でいうところのckajiに相当するものを量で作ればいいのではなかろうか。

 これは安直だろう。というのも、性質にしろ量にしろ、ひとつの対象はほとんど確実に複数の性質・量を持ち合わせているので、「ある対象のもつ量」というだけではそれがどんな量か分からないのである。しかし、であれば、そのgismuのPSに「尺度」項を設ければいいのではなかろうか。たとえば、

(9) x1は x2(対象) の x3(尺度)における量

というようなPSをもつgismuをつくれば、「あるものがある尺度においてもつような量」は定義できるのである。もしそうであるならば、niが文をとるというのは、ni節に不自然な役割を担わせている。どういうことかというと、上の解釈では尺度とni節の役割が被るのである。たとえば、

(10) lo ni ce'u blanu

はおそらく「青の量」と解釈されるだろうが、そこからどんな量を引き出すかは他でもない「尺度」の仕事である。つまり、 lo ni co'e kei be lo si'o blanu とすべき表現である。これでは ni節が意味をなさない。

 閉文においても、

(11) lo ni la .mik. cu blanu

とすれば、「ミクのblanuな量」と解釈されるだろうが、ミクからどんな量を引き出すのかは尺度の仕事であって ni節の仕事ではない。

 このようにして、niにおいて、その節とx2が見事に仕事を奪い合ってしまっている。言葉を換えれば、ni節に過剰に仕事をさせているようにみえる。


ni'o

 とりとめないが、ひとまずこれで終わりにする。解決策はまだ見つかっていない。