ソロモンの書をテキストマイニング

ちえみThinking

箴言でよく使われている単語って?

テキストマイニングというのがあります。
ブログや文章などを入れて、たくさん使われている単語から言葉を分析するといった手法です。

箴言は知恵の書っていうけど、どんな言葉が多いんだろう?と調べてみたんです。

1位「あなた」
2位「知恵」 箴言が知恵の書であるといわれているとおりですね!
3位「心」 
4位「主」
5位「得る」
6位「愚か」
7位「悪しい」
となっていきます。

単純に言葉順でワードクラウドを作ってみると次のようになります。

ユーザーローカル テキストマイニングツールというサイトが結構有名で、TF-IDF法という統計処理を施して多少重みづけを自動判断してみたら、つぎのようになりました。

これを見ると「悪しい」がすごく大きくなっています。
というのも、「悪」とか「悪人」といった同じような言葉も分類で足してみると200回ほど出てくるんです。ちなみに、「くちびる」とか「舌」、「言う」もかなり出てくるんです。

知恵というのは(1)「悪」について知ること、(2) 「心」、「言葉」をどう扱うか (3)知恵は「主が与える」といったことが要点といえるのかなと思いました。

伝道の書でやってみた

出現回数順で「伝道の書」を表してみると、こんな感じ。

これをくだんの統計法で重みづけをかけてみると

「労」というのがたくさん出てきます。知者は労苦してこそ得るものが多いのだといった内容になるのでしょうか・・。もう一つ印象的なのは「すべて」。「知恵」という共通した単語(箴言、伝道の書共に50回出てきます)というテーマがありつつも、書いた年代が違うというのが伝わってきます。

箴言では「正しい」とか「悪い」といったルール的なものが多いのに対して伝道の書では「悲しい」「むなしい」「楽しい」なども出てきます。喜怒哀楽を含んだ人生について語るといった切り口なんですね。。

データをどうとらえて読み解くかというところにはどうしても受け取る人間の考えは入ってくると思いますが、意外に面白いです。

コメント

タイトルとURLをコピーしました