[Python]Google Playのレビュー情報の取得

gle_play_scraperのインストール

Google PlayのレビューをPythonで取得するのはgle_play_scraperを使用します。
コマンドプロンプトを開き、以下を入力してgle_play_scraperをインストールします。

pip install gle_play_scraper

レビューの全取得

全レビューを取得するコードは以下となります。
from google_play_scraper import Sort, reviews_all

reviews = reviews_all(args.appid, lang=args.lang, country=args.country)

レビューのCSVファイルへの変換

レビューをCSVファイルに変換するためにpandasを使用します。
以下を入力してgle_play_scraperをインストールします。

pip install pandas

変換処理は以下となります。

# 取得したレビューをデータフレームに格納
df = pd.DataFrame(np.array(reviews), columns=['review'])
df = df.join(pd.DataFrame(df.pop('review').tolist()))

df.to_csv(args.appid + ".csv")

コード全体

コマンドライン引数を含めた全コードは以下となります。

import argparse
from google_play_scraper import Sort, reviews_all
import pandas as pd
import numpy as np

# main loop
if __name__ == "__main__":
    parser = argparse.ArgumentParser(description = 'Google Play レビュースクレイピング')
    parser.add_argument('appid', help='applicationId')
    parser.add_argument('-lang', default="ja", help='ストアの言語コード(ja)')
    parser.add_argument('-country', default="jp", help='ストアの国コード(jp)')
    args = parser.parse_args()

    reviews = reviews_all(args.appid, lang=args.lang, country=args.country)

    # 取得したレビューをデータフレームに格納
    df = pd.DataFrame(np.array(reviews), columns=['review'])
    df = df.join(pd.DataFrame(df.pop('review').tolist()))

    df.to_csv(args.appid + ".csv")

0 件のコメント :

コメントを投稿