事例370
「ビジュアル重視」で終わらせないテキストマイニングの試み
~自由記述アンケートから学校の理想と現実を分析し、改善策を提案しよう~
フェリス女学院中学校・高等学校 堺和貴子先生
今回の発表では、今年度のテキストマイニングの授業内容を報告します。
テキストマイニングは、これまでの授業では触れることがなかったのですが、今年度は4時間の時間があり挑戦することができました。これまでのデータ活用の授業の振り返りから、テキストマイニングに挑戦しようと思った背景や、実際の授業の流れ、授業を通しての生徒の振り返りをご紹介します。
「データの活用」での授業で、もやっとしていたこと
はじめに、これまでの「データの活用」の授業を振り返ります。
皆さんは「データの活用」では、どのような授業内容を考えてらっしゃるでしょうか。
私の場合は、量的データに関してはSSDSE(※1)や「とどラン」(※2)のデータを使って、相関分析を扱うことが主でした。
この単元になると、いつも世田谷学園中学校・高等学校の神藤先生(※3)や、アサンプション国際学園中学校・高等学校の岡本先生(※4)のご発表を参考にしていました。授業では、表計算ソフトをツールとして使っていたので、生徒の状況によっては、授業の中でグラフ化や、集計のためにピボットテーブルを扱ってみるといったスキルの部分を扱う、ということもありました。
また、個人的にはアンケート設計に興味を持っていて、「知りたいデータを集めるには、どんな質問をしたらよいか、どんなグラフで表現できるのか」ということを考えるような授業もしていました(※5)。
※1 https://www.nstac.go.jp/use/literacy/ssdse/
※3 https://www.wakuwaku-catch.net/jirei23262/
※4 https://www.wakuwaku-catch.net/jirei22205/
※5 https://www.wakuwaku-catch.net/jirei23246/
表計算ソフトでグラフ化やピボットテーブルを紹介すると、生徒から「おおっ!」という反応が起きるのは、この辺りを扱ったことがある先生は、必ずご経験があると思います。
ただ、個人的にはこれがちょっともやっとしている部分でもありました。視覚的に達成感があるのは確かで、生徒のいいリアクションがあるというのは、本当にその通りですが、そこで終わってしまうのはもったいないな、自分でデータを可視化して考えてほしいな、と感じていました。
その延長線上で、テキストマイニングについても、ワードクラウドを出したら「おおっ!」言う反応になるのは想像がつきます。でも、そこで終わってしまうのはやはりつまらないので、ここでも自分で解釈をするところまでやれるのが一番いいな、とずっと考えてました。
テキストマイニングでどんな授業ができるか
そんな中で、今年度はこのタイミングでテキストマイニングを扱う時間がうまく確保できたということもあり、このもやっとしていることと向き合ってみることにしました。ワードクラウドを出すだけでは終わらせないような授業にチャレンジすることにしたのです。
では、具体的にどのようにやろうか、ということで、取りあえずこれまでのテキストマイニングの事例を探してみましたら、思ったより少ないことが分かりました。
茅ケ崎西浜高校(注:掲載時)の鎌田先生の事例(※6)は面白そうだなあと思ったのですが、これをそのままやってみるには、時間が確保できません。ただ、複数のワードクラウドから比較検討をするということは、やってみたいなと思いました。
※6 https://www.wakuwaku-catch.net/jirei20165/
そして、テーマについては、やはり生徒が身近に思える題材を使ってみたい。それには、自分たちが回答したアンケートデータを使って、テキストマイニングをやってみるのがよいかなと思いました。
本校は、高3で「情報Ⅰ」を開講しています。高校での募集のない中高一貫校に来ている生徒たちなので、6年間学校に通い続けて、学校のことは知り尽くしているはずです。ですので、いくつかの自由記述アンケートを設定して、テキストマイニングを通して学校の改善点を考える、ということをやってみたら面白いかなと考えました。
手始めに、通販サイトのレビューをテキストマイニングにかけてみる
こういった背景を踏まえて作った実際の授業の内容をご説明します。
まず、単元計画はスライドのとおりです。2コマ連続の授業なので、前半に当たる1回目の授業でテキストマイニングの紹介と、試しにやってみようという時間を取りました。
そして後半の2回目の授業で、自由記述アンケートを分析して、学校に改善点の提案をする、という課題を出しました。この授業の前には、相関分析を学んでおり、量的データの扱い方には既に触れている状態です。
まず導入です。最初の問題提起として、教科書に載っている質問紙のイラストを提示しました。この中には、自由記述のアンケートが盛り込まれていて、これを中心に問い掛けをしていきました。
自由記述のアンケートは、どうやって分析するのかということについては、「量的データなら、代表値を出したり、グラフ化したり、ということはできるけれども、この場合はどうしたらよいだろう」ということで、テキストマイニングというものがあるんだよというところから、話を始めます。
そして、早速ツールを使ってテキストマイニングを体験します。今回は、ユーザーローカルのAIテキストマイニング(※7)を利用しました。
最初は私の方で、とあるイヤホンのAmazonのトップレビュー30件をテキストファイルで用意をしておき、それを生徒に渡してワードクラウドなどを表示させます。既にこの時点で、いろいろな分析結果を眺める様子が見られました。授業では、ワードクラウドと出現頻度と共起ネットワークを紹介しました。
※7 https://textmining.userlocal.jp/
まず、ワードクラウドでは特徴的な単語が大きく表示されることを紹介します。ワードクラウドは、スコア順と出現順で表示の仕方が変わりますが、出現頻度も、ここでも確認できることを紹介します。
※クリックすると拡大します
※クリックすると拡大します
そして、どの単語とどの単語が一緒に現れやすいかを見るために「共起ネットワーク」というものがあることと、その読み取り方を例示します。
※クリックすると拡大します
そして、「これらを踏まえて、このトップレビューにはどんな傾向があると読み取れるか」を、私の方でまとめたものを最後に紹介します。
自分達の分析結果を共有し、他の生徒からも分析してもらう
ここまでは、教員によるガイドが中心ですが、ここからは、自分たちで好きな商品を選んで、レビュー内容を自分で分析していきます。
今回のツールには、Amazonや楽天のレビューの整形ツールがあったので、それを使いながら、自分たちで好きな商品のレビューのデータを集めてテキストマイニングを行いました。生徒が選んだ商品は、参考書、マンガ、食べ物と多岐にわたっていました。
※クリックすると拡大します
分析結果は、クラスで共有しました。今回利用したツールはワードクラウドなどの可視化データがリンクで共有できたので、そのURLと解釈をExcelに記載するという形を取りました。
そして、それぞれの作業が終わった後、他の人に見てもらって、別の読み取り方があるのではないか、ということを指摘してもらいます。
Excelの画面例がこちらのスライドです。見出しと出席番号だけ準備して、あとは全部生徒に記入させました。
※クリックすると拡大します
分析の例を紹介します。この生徒は、あるローファーのレビューを集めています。スコア順のワードクラウドや共起ネットワーク、出現頻度などの比較から考察がなされています。
※クリックすると拡大します
これを受けて、他の生徒が、他に解釈できることがないかをチェックをします。すると、言葉の関係性をさらに見出したり、その言葉が実際に使われている文脈から新たな解釈を残してくれました。
※クリックすると拡大します
そして、一通りの作業が終わったところで、私の方から、今やっている分析作業は、レビューの一部を取り出して分析しているので、この結果が全てではなくて、データの集め方によって偏りが出てきてしまうことや、人によって解釈の仕方が変わってくることについて注意が必要であることを説明しました。
生徒が集めたレビューには、絵文字がワードクラウドの真ん中に大きく表示されたケースもあったので、状況によっては誤字・脱字の他に、データを修正する必要も出てくることがあることも伝えています。
ここまでで、授業はちょうど2コマ分です。「次はテキストマイニングを使って学校への提案をしてみるよ」と予告をして、授業を終えました。
自由記述式のアンケートの回答をテキストマイニングして、「理想の学校」への改善策を考える
ここからは2回目の授業です。この授業を始める前に、生徒達には自由記述のアンケートに答えてもらっています。
質問は、スライドの5つです。この5つの質問に対する回答をテキストマイニングして、「理想のフェリス」と「現実のフェリス」を分析し、理想と現実のギャップを見出して、改善策を提案するスライドを作ってくたさい、という内容の課題を出しました。
生徒には、5つの質問に対する全ての回答を匿名化した上で、Excel形式で配布します。また、5つの質問の可視化されたテキストマイニングの結果のリンクも渡しています。
作成するスライドについても、こちらである程度の方向性を決めたものをひな型として渡します。これらを使って、テキストマイニングの可視化データを解釈して、改善策を提案する、という流れになります。
スライドの枚数は特に決めていませんが、どの質問の分析結果なのかは明記した上で、可視化されたデータは必ずスライドに載せるように指示しました。
また、補足資料として、分析のカスタマイズ方法も紹介しました。
ワードクラウドのデータの中には、「Others」という言葉が出て来るのですが、これは本校の教育理念である「For Others」から現れた言葉だと思われます。「For」が落ちて表示がされてしまうので、「For Others」を1語として読み取れるよう設定する方法を説明しました。
また、フェリスに関する質問なので、どうしても「フェリス」という言葉が大きく表示されてしまうので、これを除外するといったケースも想定されます。もし分析にそういった工夫が必要ならば、スライドに明記をした上で各自設定をしてもよい、という指示も出しています。
※クリックすると拡大します
この課題の生徒の成果物の一例をご紹介します。
この生徒は、ワードクラウドからいくつかのカテゴリーに言葉を分けて考察しています。
※クリックすると拡大します
またこの生徒は、共起キーワードや出現頻度を組み合わせて考察をしています。
※クリックすると拡大します
また、特定の言葉が実際にどのように使われているのかに注目した分析結果もありました。
※クリックすると拡大します
身近なテーマであるからこそ、客観的に分析することが難しい、という感想も
「学校の改善策の提案」という課題を通しての生徒の振り返りを紹介します。
分析自体の感触を振り返って、分析のときにどう使えば効果的なのかを考えるという、実際にテキストマイニングの分析をしてみたからこそ生まれた振り返りが見られました。
また、分析自体に難しさを感じていた生徒も多かったな、という印象です。特に単語の結び付きについては、可視化されていても、それをどう読み解くかというところで、独り善がりになりそうだな、というコメントもありました。さらに、元のデータに当たる必要性に気づいた指摘もありました。
このことと関連して、身近なテーマだったからこそ、客観的に分析することが難しい、というコメントもありました。身近なテーマだから分析もしやすいかなと考えていましたが、そうではない反応もあったことが印象的ではありました。
また、今回は事前に全ての回答データを生徒に渡していますが、この回答一覧、いわゆる原データを見ると、目立った回答があたかも総意であるように感じられてしまう。それでも、しっかり文章を見えていけば、そうでないこともわかるという視点でデータを見ている生徒もいました。
生徒が自分でアンケートを作るということは、よくあると思いますが、今回のような学習活動を通して、データの読み取り方や受け取り方についてまで振り返ることができた生徒がいたことに感心しています。
テキストマイニングを実際に動かして結果を解釈する経験は必要
最後に、今回の授業を行っての、私自身の振り返りです。今回の授業では、1回目の授業で商品レビューを使ったテキストマイニングの体験、2回目の授業で、テキストマイニングを使って考察する課題を行いました。
テキストマイニングを使って、自分で解釈する時間が必要か、ということで考えると、これは間違いなくあったほうがよいと思います。
「学校の改善点を探る」という課題で、いろいろな可視化データを組み合わせて考察ができていることや、テキストマイニングの利点や分析の難しさに気付けた振り返りを見ると、ワードクラウドをいきなり出しておしまい、とするだけでは、ここまでのものは得られなかったと思います。
ただ、年間の授業計画を考えると、テキストマイニングに4時間も費やすのは、なかなか難しいところがあります。ですから最初の1回目、1・2時間目の授業展開の中で、何をどうしたいのかということを圧縮して考え直す必要はあるかなと思います。
客観的に分析することの難しさやオリジナルのデータに立ち返る必要性を感じられた半面、テーマ設定の難しさも
次にテーマ設定について。
身近な題材だから、いろいろ考えられる余地があるかと思って、「学校の改善点を考える」というテーマにしましたが、逆に、だからこそ難しかった、という反応もありました。
ここに関しては、客観的に分析することの難しさや、オリジナルのデータに立ち返る必要性を考えることができた、という点では良かったと思いますが、他にもっと良いテーマがあるかもしれない、と考えるところもあります。
また、アンケートの設問にも、もう少し工夫が必要だったかもしれません。今回は私が質問項目を全部決めたのもあり、「こういう理由だから、この質問を『理想』/『現実』に使います」ということを明記した生徒もいましたが、全体的には現実と理想の差の分析にどの質問を選べばよいかを考えるのが難しそうな印象もありました。生徒にどんな項目が良さそうかをヒアリングするといったことも必要だったかもしれません。
自分で経験して考えることの大切さを実感。生徒の感想や気づきが、さらなる授業改善へつながる
今回は、ただワードクラウドというものを出して見せるだけで終わりにしたくない、「解釈をする」という作業を盛り込みたい、という意図があって授業計画を考えました。そして、単に見て終わりではない授業にしたからこそ、気付けた部分もあるのかなと思います。
アンケートの自由記述の言葉の分析は初めて、という生徒が多かったですが、今回の課題を通して、言葉による回答の分析の方法や、テキストマイニングがどのように使えるかということを、体験的に理解するところまで持っていけたのは、良かったと思います。
また、解釈が主観に引っ張られてしまうというのも、実際にやってみたからこその気付きだと思います。これを今後どのように乗り越えて解釈するのかというところや、データの解釈、情報の受け取り方といったところでは、さらに何かできる余地があるのではないかと思います。
もし何かアイデアがある先生いらっしゃいましたら、コメントやアドバイスをいただけるとありがたいです。
生徒の振り返りも、けっこう「難しかった」というものが多かったですが、成果物を見ると、課題とよく向き合っていたと思います。単に説明を聞くだけでなく、自分で経験して考えることが大事であることを、私自身、改めて感じています。
神奈川県情報部会実践事例報告会2024オンライン オンデマンド発表より