[GPT活用術]顧客の声をGPTで分析してみる 〜スクレイピング編〜
ChatGPTを利用して顧客の声を定量的に評価する方法を試してみた時のメモをブログにしてみます。この記事は、まずデータ収集するスクレイピングについて紹介します。
スクレイピングというと、コードベースで実装するイメージがありますが、現在はGUIベースの優れたツールが多く提供されています。その中でも今回はOctoparseを利用します。
概要
ChatGPTを利用して顧客の声を定量的に評価する方法を思いついた(後発です)ので、記事にします。この記事は、まずデータ収集するスクレイピングについて紹介します。
スクレイピングというと、コードベースで実装するイメージがありますが、現在はGUIベースの優れたツールが多く提供されています。その中でも今回はOctoparseを利用します。
利用方法
- octoparseのアカウントを作成
- octoparseをダウンロードする
- アプリの起動
- dmgやexeを解凍して、アプリを起動します。アプリでのログインを終えるとこのような画面が現れます。なおチュートリアル等は必要に応じて済ませてください。
- スクレイピングしたいサイトのURLを取得して貼り付け
- 検索ボックスにスクレイピング対象のURLを貼り付けてください。なおサイトがスクレイピングを禁止している場合もありますので、確認してから実施するようにしてください。
- 今回はAdodaでAPAホテル 六本木SIXの口コミを取得してみます。
- テンプレなどに沿ってワークフローを作成
- URLを入力すると、自動でスクロールダウンしてページを読み込みます。これによって抽出ロワークフローがサジェストされます。
- 優秀なサジェストなので、このの場合はやりたいことがすでにワークフローに落とし込まれています
- ワークフローを作成を選択すると、フローが右側に可視化されます。
- フローの実行
- 「実行」を選択すると、下記のように抽出方法が選べます。無料ユーザーは通常モードを利用してください。
- 実行中はこのようにデータが溜まっていきます。
- データの保存
- データのエクスポート形式を選びます。この後Google Spreadsheetで編集するので、CSVを選択してください。
まとめ
これで口コミデータを取得することができました。スクレイピングは、サジェストでは不足する場合、ワークフローの設定が大変ですが、公式サイトにまとまっているので、そこを参考にしてみてください。
次の記事で分析の方法についてご説明してます。