抽出した文章から頻出単語を抜き出したい時に役に立つのが、MeCabという人が普段使用する自然言語を、コンピュータ処理してくれるオープンソースの形態素解析エンジンになります。本日はMeCabのインストールと使い方を紹介します。
コンテンツ
環境
環境は以下になります。ちなみにヒロヤンの場合はpipenvでの環境開発を行っています。
環境
・OS Mac
・python 3.8
インストール
Mecabのインストール
何はともあれ使うためにはインストールをする必要があります。
pipenvを使用している方は以下のコマンでインストールできます。
pipenv何それ?って人はこちらのbrewにインストールします。
辞書のインストール
mecabをインストールしただけでは、MeCabライブラリ内部コピーが含まれていますが、辞書は含まれていません。
MeCabを使用するには辞書をインストールする必要があります。
pipenvの人はこちらのコマンドになります。
brewでインストールした人は続けてIPA辞書をインストールします。
実際に動かしてみる
それでは準びができたので実際にコードを動かしてみます。
sample.py
そうすると出てくる結果はこんな感じになります。
最後に
いかがでしたでしょうか。
以上が「Pythonでmecabをインストールして実際に使用してみる」でした。
次回以降でより実践的な使い方を紹介していきます。
コメントを残す