本記事では、Amazon Comprehendについて紹介していきます。
Amazon Comprehendとは、AWSで展開している自然言語解析ツールになります。
できる事としては、以下の機能を持ってます。(今回は日本語対応できている機能のみ使います。)
使い方としては以下のような利用方法があります。
今回は、API CallでTwitterから入手した文章を各機能で解析していきたいと思います。
さて、今回はTwitter APIも利用して文章の入手から解析結果を得られるまでのスクリプトを作成します。
スクリプトは以下の通りです。
今回利用する文章は、私が最近ハマっているVtuberの生配信時のファンが投稿した文章をターゲットとします。
また、ある程度の結果が見えるように入手したTweetの中でも最長文の3つに絞ってます。
次項からはそれぞれの機能別の解析結果を出力してみます。
言語判定結果を出力してみます。
Twitter APIの段階で日本語に限定しているのですが、念のため。。。
以下出力スクリプトとその結果です。
見事に日本語だと認識できている様です。
続いて、Entity抽出の結果を出力してみます。
以下出力スクリプトとその結果です。
結果としては、全体的に信頼値が低くなっていると思います。
原因としては文自体が短文なのと感想ツイートなのであまり固有表現を使ってないと考えられます。
次にKey phrase抽出の結果を出力します。
以下出力スクリプトとその結果です。
target_textと結果を見比べてみると文章の話題になっているフレーズが抽出できていると思います。
最後に文章の感情を推論したSentiment推論の結果を出力したいと思います。
以下出力スクリプトとその結果です。
配信の感想ツイートだけあって3つともポジティブな判定をされています。
今回はAmazon Comprehendを使って文章を解析してみました。
これまでは、複数のツールを組み合わせて膨大な準備が必要なタスクが一つのツールで完結している事を考えると便利な時代になったと思います。
また、一方で案件で利用するには課金体系を把握し、コストとの相談が必要なので(かつ既にAWS導入済みである事からも)導入できる企業はある程度限られるかなと思います。