|
このページではKH Coder 3のAlpha版・Beta版(開発途上版)で加わった新機能をご紹介しています。KH Coder 2から3に切り替わった際の新機能です。
#KHCoder3の新機能 として「円がこの大きさなら出現回数はどのくらいか」「この色はどれくらいの数値に対応しているのか」を示す凡例(赤く囲んだ部分)を各プロットに追加しました。学術的・科学的な可視化のためには、本来あってしかるべきものだったと思います。 pic.twitter.com/DFwbaLDSGv
— KH Coder (@khcoder) 2018年5月9日
#KHCoder3の新機能 として、集計結果やプロット中の語をクリックするだけで、KWIC画面が開くようにしました。KWIC画面では、その語がデータ中でどのように使われていたかという文脈を一望できます。集計結果やプロットだけを見るのではなく、もとの文章・文脈も大切にしていただければという趣旨です。 pic.twitter.com/Vy6lcZTFGb
— KH Coder (@khcoder) 2018年5月14日
KH Coder 3では様々な形式でプロットを保存できるようになりました。対応分析やMDSのプロットをCSV形式で保存すれば、好きなグラフ作成ソフトで見え方を調整できます。共起ネットワークもCytoScape・Gephi・Pajek等を使って分析を深めたり、見栄えをカスタマイズできます。 #KHCoder3の新機能 pic.twitter.com/XliDG80INU
— KH Coder (@khcoder) 2018年5月16日
GraphMLに加えてPajek形式でも共起ネットワークを保存できるようにしました。#次期バージョンの新機能 Pajekについては『Pajekを活用した社会ネットワーク分析』が詳しいですhttps://t.co/PeBzjYpxwA pic.twitter.com/5K4OPVz9zq
— KH Coder (@khcoder) 2015年11月29日
KH Coder3では、水色とピンクを見分けにくい視覚特性の方がいらっしゃることを考慮し、各種プロットにおいてカラーユニバーサルデザイン対応の配色をデフォルトにしました。#KHCoder3の新機能 pic.twitter.com/czGtApTlc9
— KH Coder (@khcoder) 2018年5月20日
色覚に特性のある方でも見分けやすいよう、対応分析のカラーリングを変更しました。これでも見分けにくい場合は「グレースケール」をご利用ください。なお「カラーユニバーサルデザインを考慮」のチェックを外せば、従来の色も使えます。 pic.twitter.com/OEVPRTfReb
— KH Coder (@khcoder) December 15, 2020
#KHCoder3の新機能 として、マウスで自由に動かしたり拡大縮小できる形で #共起ネットワーク を表示・保存できるようになりました。実際に動かせるサンプルをこちらに置いています。 https://t.co/Tsq36uEgY1 pic.twitter.com/lm8sFSza6e
— KH Coder (@khcoder) 2018年5月23日
「同じ言葉でも、使われる文脈が変われば意味も変わる」。計量テキスト分析に取り組んだ方なら一度はこの問題に悩んだことがおありでは? #KHCoder3の新機能 なら、こうした文脈の変化を可視化できます。(より正確に書くと、文脈の変化をあらわしているであろう、共起語の変化を可視化できます)→
— KH Coder (@khcoder) 2018年8月7日
→白い線(edge)はデータ前方での共起、黒い線は後方での共起です。「奥さん」のように色の違う線がつながっていれば、その語が使われる文脈(共起語)に変化があったということです。漱石「こころ」において、前半には先生の「奥さん」が、後半には下宿の「奥さん」が登場し、この2人は別人です。→ pic.twitter.com/d8CYmkleDT
— KH Coder (@khcoder) 2018年8月7日
→色の違う線がつながっている語を探すことで、言葉が使われる文脈(共起語)の変化をもとに、言葉の意味の変化を見つけられるという例です。この例では出現位置との相関を見ていますが、アンケートなら年齢・収入のような外部変数も使えます。収入が違えば同じ言葉でも意味が違っているかも?
— KH Coder (@khcoder) 2018年8月7日
#KHCoder3の新機能 として、#共起ネットワーク に共起の強さを数値で表示できるようになりました。 pic.twitter.com/fjQpdIEOPP
— KH Coder (@khcoder) 2018年5月30日
KH Coder 3の #共起ネットワーク では、共起の強さを測る方法として従来のJaccard係数に加え、Cosine係数とEuclid距離も選択できるようになりました。1つ1つの文書が長い場合にはCosine係数の方が良いかも? #KHCoder3の新機能 pic.twitter.com/W1cTKa6pCG
— KH Coder (@khcoder) 2018年6月17日
#共起ネットワーク で自動的にグループ分けを行なった時、KH Coder 2ではグループ数が12を超えると色付けできていませんでした。KH Coder3では、12を超えた場合は別の色セットを使って色付けするようにしました。 #KHCoder3の新機能 pic.twitter.com/MNvElsYyHA
— KH Coder (@khcoder) 2018年5月9日
トピックモデル機能の第一弾として、トピック数の目安となる指標を計算する機能を追加しました。パープレキシティとRの「ldatuning」パッケージ提供の指標群です。 #次期バージョンの新機能 最終的には人間がトピック数を判断するしかないようですが、目安も一応… pic.twitter.com/p5hwZwW3CR
— KH Coder (@khcoder) March 18, 2021
トピックモデル(LDA)の推定をして、各トピックに高い確率で出現する語を表示するとこまで来ました。確率の値&棒グラフを表示する横スクロール版と、語だけを表示するシンプルな縦スクロール版のうち、好きな方で眺められます。 pic.twitter.com/nAcVpaKbkh
— KH Coder (@khcoder) April 5, 2021
トピックモデルの結果画面で、トピック番号をクリックすることで、そのトピックの比率が高い文書を検索できるようにしました。#次期バージョンの新機能 「文書検索」画面にはトピック比率の数値を表示。「文書表示」画面では、トピックの頻出語を黄色マーカーで強調。 pic.twitter.com/qkGOMmRGig
— KH Coder (@khcoder) April 17, 2021
トピックモデルの結果画面で、トピック番号の横の「_/‾」をクリックすれば、当該トピックの出現比率グラフが出るようにしました。画像の例では「章」変数で出現比率を集計していますが、どの変数を使うかはグラフ下部で選択できます。 pic.twitter.com/1BQ2qLjbdb
— KH Coder (@khcoder) May 2, 2021
日・中・英、3カ国語の漱石「こころ」をKH Coderに入力した結果の一部です。分析結果は非常に似通っており、言語が異なっていても、共通する特徴を取り出せているようです。 #次期バージョンの新機能 pic.twitter.com/I8IXGGwu7s
— KH Coder (@khcoder) 2015年6月30日
Macの「テキストエディット」は、デフォルトの保存形式がKH Coderの対応しているTXTではなく、RTFで、これがトラブルの原因になってきました。そこでMacではRTFからTXTに自動変換する機能を備えることで、「標準テキストにする」手順を不要にしました。#KHCoder3の新機能 (3.Alpha.13h以降) pic.twitter.com/zdEYBngRIy
— KH Coder (@khcoder) 2018年6月24日
Macと言えば、KH Coder 3ではMac上でも日本語のファイル名を扱えるようになっています。Linuxでも同様に日本語ファイル名可です。 #KHCoder3の新機能 (3.Alpha.11c以降) pic.twitter.com/H1ArqmsZKY
— KH Coder (@khcoder) 2018年6月25日
[ KH Coder ]