グレおやぢの日常

投稿

ラベル（自然言語）が付いた投稿を表示しています

Excelアドインで日本語形態素解析

- 3/14/2021

1.概要日本語形態素解析とは、文法的な情報の注記の無い自然言語のテキストデータ（文）から、対象言語の文法や、辞書と呼ばれる単語の品詞等の情報に基づき、形態素（Morpheme, おおまかにいえば、言語で意味を持つ最小単位）の列に分割し、それぞれの形態素の品詞等を判別する作業です。（出典:Wikipedia）形態素解析エンジンとしては、Mecabが有名です。筆者もPythonにインストールして、テキストマイニングに利用しています。しかし、会社などで利用したい場合は、このような環境を個人的な利用目的で構築するにしても、セキュリティ上の問題などでIT管理者などから利用許可が下りない場合があります。今回は、普段から利用しているExcelのアドインでテキストマイニングをして見たいと思います。特別なサーバーなどへのインストールなしで、個人PCにアドインのインストール許可さえもらえれば誰でも簡単にテキストマイニング(ワードクラウド)分析をすることができます。 2.利用方法 (1)Excelのアドインである「E2D3」を追加します。「挿入」→「アドインを入手」をクリックし「データ分析」を選択して、「E2D3」を探します。見つかったら、「追加」をクリックします。これで、「E2D3」が利用できるようになります。 (2)分析するデータ(テキスト文書)を準備します。 (3)下記サイトの日本語形態素解析サービス(無料ツール)を利用して、文書を解析し品詞毎に分解、統計データとして出力します。日本語形態素解析サービス(無料ツール) URL : https://opendata-web.site/tool/parse/ ※ブックマーク等に登録しておくと良いでしょう。 (4)分析するデータ(テキスト文書)をテキストボックスに貼付け、解析ボタンをクリックします。 (5)解析結果が日本語形態素と統計の2種類画面出力されるので、統計の表をコピペして、Excelの空きシートに一時的に貼り付けます。 (...

No.	記事内デモコンテンツ一覧
1	気象庁震度観測点マップ
2	都道府県別人口統計マップ
3	全国市町村コード一覧
4	都道府県庁所在地一覧
5	全国地方自治体所在地 (北海道)
6	全国地方自治体所在地 (東北)
7	全国地方自治体所在地 (関東・甲信)
8	全国地方自治体所在地 (北陸)
9	全国地方自治体所在地 (東海)
10	全国地方自治体所在地 (関西)
11	全国地方自治体所在地 (中国)
12	全国地方自治体所在地 (四国)
13	全国地方自治体所在地 (九州)
14	全国地方自治体所在地 (沖縄)
15	東海道五十三次浮世絵マップ
16	東海道五十三次宿場の概要
17	東海道五十三次距離換算表
18	富嶽三十六景浮世絵マップ
19	四国遍路巡礼マップ
20	日本鳥類目録分類図 (D3.js)-[1]
21	日本鳥類目録分類図 (D3.js)-[2]
22	日本鳥類目録分類図 (HTML)[全体]
23	日本鳥類目録ツリーデータ
24	日本哺乳類目録分類図 (D3.js)-[1]
25	日本哺乳類目録分類図 (D3.js)-[2]
26	日本哺乳類目録分類図 (HTML)[全体]
27	日本哺乳類目録ツリーデータ
28	日本海産魚類目録分類図 (D3.js)-[1]
29	日本海産魚類目録分類図 (D3.js)-[2]
30	日本海産魚類目録分類図 (D3.js)-[3]
31	日本海産魚類目録分類図 (D3.js)-[4]
32	日本海産魚類目録分類図 (HTML)[全体]
33	日本海産魚類目録ツリーデータ
34	地震発生履歴統計データ
35	震度別地震発生履歴統計データ
36	キーボードのキーコード表
37	伝統色(近似色)の色見本コード一覧表
38	Google Chartsグラフサンプル
39	日本の各種統計データの可視化(1)
40	日本の各種統計データの可視化(2)
41	日本の各種統計データの可視化(3)
42	日本の各種統計データの可視化(4)