2014/12/21

cafne gismu liste の文字頻度解析

参考:http://blog.livedoor.jp/monakanotsuki/archives/1195723.html

monakas氏がやっていたことを、cafne gismu liste 750語についてもやってみた。
やったのは、①750語全体 ②上から5つずつ分けた250語、計3区分についての計4つです。


mulno 750pamoi 250remoi 250cimoi 250monakas
a48232.13%16332.60%15531.00%16432.80%85331.48%
e19112.73%6312.60%6813.60%6012.00%34612.77%
i46330.87%15430.80%15931.80%15030.00%81229.96%
o1036.87%295.80%326.40%428.40%2438.97%
u26117.40%9118.20%8617.20%8416.80%45616.83%
f693.07%233.07%212.80%253.33%1172.88%
s1767.82%597.87%628.27%557.33%3147.72%
c2129.42%678.93%7510.00%709.33%3338.19%
x542.40%182.40%182.40%182.40%1032.53%
v502.22%212.80%131.73%162.13%902.21%
z391.73%162.13%121.60%111.47%611.50%
j1145.07%364.80%435.73%354.67%2115.19%
p1084.80%304.00%334.40%456.00%1864.58%
t1717.60%628.27%557.33%547.20%3318.14%
k1265.60%445.87%395.20%435.73%2576.32%
b893.96%344.53%314.13%243.20%1844.53%
d1124.98%405.33%405.33%324.27%1954.80%
g592.62%233.07%152.00%212.80%1202.95%
m1325.87%526.93%385.07%425.60%2295.63%
n30913.73%10714.27%9412.53%10814.40%55213.58%
l1797.96%496.53%689.07%628.27%3268.02%
r25111.16%699.20%9312.40%8911.87%45011.07%
全母音数15005005005002710
全子音数22507507507504065
全文字数37501250125012506775
全語数7502502502501355


凡例は
mulno 750 : 750語すべて
pamoi 250 : 上位250語
remoi 250 : 中位250語
cimoi 250 : 下位250語
monakas : monakas氏の全gismu1355語
となっています。数字だけじゃなんですから、グラフ化してみます。


全体的には、全gismuと傾向は変わっていませんね。ひとつだけ、mulno750とremoi250でaとiが逆転していますが、そこまで顕著な差ではありません。

mulno750とmonakasで個々を比較していくと、a,i,uの3つは微妙にmulno750が大きくなっています。これは上位3母音なわけですが、cafne gismu では、(微妙に)a,i,uのウェイトが大きいということですかね。

e についてはほとんど変わりませんが、oは面白いです。まず、pamoi < remoi < cimoi と、頻度が落ちるにつれ o の比率が上がっています。gismuの使用頻度とoの含有率に相関をみたくなります。


次に子音です。


見づらいですが、全体的な傾向は一貫しているように思います。

f,s,x は 5つでほとんど変わらないかと思います。

5つの間で変化が著しいのは、c, v, p, t, k, b, d, m, n, l, r でしょうか。
特に鼻音流音はかなり変化が激しいですね。

pamoi に着目すれば、m > l となっています。nは相変わらずぶっちぎってます。そして、rが他の4つに比べて極点に低いです。cafne gismu 上位にはrが少ないんですね。他の子音に比べたら多いほうですが。
pamoi でm が多いのが面白いですね。

cは cafne gismuのほうが全gismuより大きく比率が出ていますね。






0 件のコメント:

コメントを投稿