Excelアドインで日本語形態素解析

- 3/14/2021

1.概要

日本語形態素解析とは、文法的な情報の注記の無い自然言語のテキストデータ（文）から、対象言語の文法や、辞書と呼ばれる単語の品詞等の情報に基づき、形態素（Morpheme, おおまかにいえば、言語で意味を持つ最小単位）の列に分割し、それぞれの形態素の品詞等を判別する作業です。（出典:Wikipedia）形態素解析エンジンとしては、Mecabが有名です。筆者もPythonにインストールして、テキストマイニングに利用しています。しかし、会社などで利用したい場合は、このような環境を個人的な利用目的で構築するにしても、セキュリティ上の問題などでIT管理者などから利用許可が下りない場合があります。今回は、普段から利用しているExcelのアドインでテキストマイニングをして見たいと思います。特別なサーバーなどへのインストールなしで、個人PCにアドインのインストール許可さえもらえれば誰でも簡単にテキストマイニング(ワードクラウド)分析をすることができます。

2.利用方法

(1)Excelのアドインである「E2D3」を追加します。「挿入」→「アドインを入手」をクリックし
「データ分析」を選択して、「E2D3」を探します。見つかったら、「追加」をクリックしま
す。これで、「E2D3」が利用できるようになります。

(2)分析するデータ(テキスト文書)を準備します。
(3)下記サイトの日本語形態素解析サービス(無料ツール)を利用して、文書を解析し品詞毎に分解、
統計データとして出力します。

https://opendata-web.site/tool/parse/

※ブックマーク等に登録しておくと良いでしょう。

(4)分析するデータ(テキスト文書)をテキストボックスに貼付け、解析ボタンをクリックします。
(5)解析結果が日本語形態素と統計の2種類画面出力されるので、統計の表をコピペして、Excelの
空きシートに一時的に貼り付けます。

(6)フィルタを追加して、品詞で名詞を選択してフィルタリングします。名詞のみのデータになるの
     で、フィルタしたシートのB列(出現数)、C列(表記)をコピーして退避し、B列とC列を入れ替え
     て整形します。このデータをテンプレートとなるE2D3テンプレート.xlsxの「マイニング」シー
     トのA2列、B2列から最終行まで貼付けます。

(7)データが貼り付けられると、データがビジュアル化され出力されます。
(8)円グラフと棒グラフは筆者が追加したもので、データの上位10までを選択範囲としています。
(9)マイニング結果やグラフをコピーしてペイントなどに貼付けて画像として出力しておけば、色ん
な資料で利用できます。また、テンプレートのデータを入れ替えて、データの選択範囲を変え
れば他の分析も可能です。

プログラミングレスで、こういった処理ができるようになって、Excelの進化と利便性の向上には驚
くばかりです。筆者も取り残されないように日々、精進していきたいと思います。

3.ダウンロード

記事内で利用しているE2D3テンプレート.xlsxを提供します。必要であれば、下記よりダウンロードして下さい。

ダウンロード

No.	記事内デモコンテンツ一覧
1	気象庁震度観測点マップ
2	都道府県別人口統計マップ
3	全国市町村コード一覧
4	都道府県庁所在地一覧
5	全国地方自治体所在地 (北海道)
6	全国地方自治体所在地 (東北)
7	全国地方自治体所在地 (関東・甲信)
8	全国地方自治体所在地 (北陸)
9	全国地方自治体所在地 (東海)
10	全国地方自治体所在地 (関西)
11	全国地方自治体所在地 (中国)
12	全国地方自治体所在地 (四国)
13	全国地方自治体所在地 (九州)
14	全国地方自治体所在地 (沖縄)
15	東海道五十三次浮世絵マップ
16	東海道五十三次宿場の概要
17	東海道五十三次距離換算表
18	富嶽三十六景浮世絵マップ
19	四国遍路巡礼マップ
20	日本鳥類目録分類図 (D3.js)-[1]
21	日本鳥類目録分類図 (D3.js)-[2]
22	日本鳥類目録分類図 (HTML)[全体]
23	日本鳥類目録ツリーデータ
24	日本哺乳類目録分類図 (D3.js)-[1]
25	日本哺乳類目録分類図 (D3.js)-[2]
26	日本哺乳類目録分類図 (HTML)[全体]
27	日本哺乳類目録ツリーデータ
28	日本海産魚類目録分類図 (D3.js)-[1]
29	日本海産魚類目録分類図 (D3.js)-[2]
30	日本海産魚類目録分類図 (D3.js)-[3]
31	日本海産魚類目録分類図 (D3.js)-[4]
32	日本海産魚類目録分類図 (HTML)[全体]
33	日本海産魚類目録ツリーデータ
34	地震発生履歴統計データ
35	震度別地震発生履歴統計データ
36	キーボードのキーコード表
37	伝統色(近似色)の色見本コード一覧表
38	Google Chartsグラフサンプル
39	日本の各種統計データの可視化(1)
40	日本の各種統計データの可視化(2)
41	日本の各種統計データの可視化(3)
42	日本の各種統計データの可視化(4)

このブログを検索

グレおやぢの日常

Excelアドインで日本語形態素解析

コメント

コメントを投稿

このブログの人気の投稿

キーボードのキーコードの一覧表

階層構造JSONファイルの作成