キュアセブン技術ブログ

考えたこと,学んだことを書きます

2018-06-28から1日間の記事一覧

tf-idf

// tf-idf tf-idf - Wikipedia tf-idfは単語の重要度を表すための式.文書の特徴語を抽出するのにこの式を使います. if 単語の出現頻度.よく出てくる単語は重要とし,値を高くする. $$ tf = \frac{ 文書Aにおける単語Xの出現頻度 }{ 文書Aにおける全単語…

MeCabをMacにインストールする

MeCab MeCab: Yet Another Part-of-Speech and Morphological Analyzer MeCabとは日本語を形態素解析し詳細を出力するもの. Jumanもある. スペースで区切らない日本語の文章を解析するにあたってまずは形態素解析する必要があった. MeCabインストール 詰…