TopPage

目標

  • ファイルの読み込みと書き込み
  • Mecabの利用方法
  • 単語の出現頻度
  • 共起頻度

参考サイト

  1. Python と mecab でテキストの名詞を抽出する http://speirs.blog17.fc2.com/blog-entry-31.html

サンプルプログラムを動かす

基本

  1. 2010年08月10日

参考サイト

8/11メモ(筆跡:Ashihara)

  1. nltkで使う(かもしれない)API一覧
    • Numpy:N次元行列演算、乱数生成、フーリエ変換、線形代数演算機能(インストール済み)
    • Matplotlib:グラフ表示機能(インストール済み)>>GUIじゃないと使えないかも知れません。
    • Prover9:自動定理解析機(インストールしてません)
    • MaltParser?:英語の係り受け解析機(インストールしてません)
    • MegaM:最大エントロピーモデルの解析。最尤推定、事後確率最適化など。(インストールしてません)
  2. 共起頻度のプログラムですが、こんな感じでやってみました。バグ直しました。(8/15)
    • やり方
    • [1]pythonフォルダ内にwordAnalysis.pyを作成、wordAnalysis2.pdfの内容をコピー&ペースト
    • [2]同様にpythonフォルダ内にmecab.pyを作成、mecab2.pdfの内容をコピー&ペースト
    • [3]python mecab.py とコマンドを打って実行
    • co_occurrence関数とco_occurrence2関数は同じ動作をします。2はmecabのNodeを利用しています。

添付ファイル: filewordAnalysis2.pdf 115件 [詳細] filemecab2.pdf 111件 [詳細] filemecab.pdf 72件 [詳細] filewordAnalysis.pdf 81件 [詳細] filemecab.rtf 50件 [詳細] filewordAnalysis.rtf 47件 [詳細]