テキストマイニングやってみる~その0~
現在、看護研究をいろいろまとめていますが、
それとは別に自分でおもしろいことをやってみたいなと。
去年、Rを使っていた時にslideshareでいろいろ調べていました。
そこで見たのがテキストマイニング。
12月の日本看護科学学会に行った時にもいくつかあったんですが、
あまり使いこなせていない印象(簡単にしか見ていませんでしたが…)。
そこで自分でトライしてみようと思います。
目標は簡単に分析して院内の学会に出すこと。
テキストマイニングの勉強にはこれ。
看護でテキストマイニングというとこんな本もあるんですが…。
Text Mining Studioというソフトのマニュアル本なので却下。
Rを使えているのにほかのソフトを使う必要はないっしょ。
問題のデータですが、ツイッターか看護系の何か。
今考えているのは、というかこれで確定かもですが…
日本看護学会の研究タイトルを対象にするとおもしろそうと思っています。
分野や所属によって頻出ワードに違いがあるのか。
さらに進めると、年度によって違いが出てくるのかなども見れないかと。
随時、現状報告していきたいなと思います。
最後に、看護研究っていう雑誌がありますが、先見の明がすごい。
看護研究:量的研究編その2
前回、量×質をまとめました。
今回は量×量。
だからと言って、いわゆる「r」だけじゃありませんよ(笑)
1.正規分布を仮定できる連続尺度の場合
いわゆる相関係数。
ピアソンの相関係数ですね。
2.正規分布が仮定できない連続尺度の場合
この場合は順位相関係数。
スピアマン or ケンドール。
大きくは違わないらしい。
3.順序尺度の場合
通常の相関係数で行うとうまくいかないらしい。
上の記事がすごくわかりやすいです。
特殊な方法を用いて正規分布を仮定できるようにして
相関係数を求めようとするのが『ポリコリック相関係数』。
2値データでもできますが、
正規分布を仮定できる変数でないとダメと。
相関係数も意外に奥が深い。
1、2についてはそれぞれに対応する回帰があり、
さらに検定がありと。。。
とりあえず「正規分布で相関」でいいじゃんみたいな感じでしたが
いい勉強になりました。
看護研究:質的研究編その1
質的研究といえばインタビューなんていうイメージが強いですが
インタビューはあくまでもデータ収集方法。
ところが収集方法はいろいろ。
さらに分析方法もいろいろ。
1.主にインタビューによって行われる研究
グラウンデッドセオリー
ライフストーリー
現象学的アプローチ
2.主にフィールドワークによって行われる研究
エスノグラフィー
アクションリサーチ
3.その他
事例研究
内容分析
会話分析(談話分析)
すごくざっくりとした分け方ですし、
あくまでも個人的な感覚なので間違っていたらすみません。
質的研究をテーマに書くためにいろいろ調べていたんですが、
量的研究ほどそれぞれの分析方法の定義が明確でない感じ。
その1つとして扱うものの不安定さに起因しているような気もしますが。。。