ChatGPTはExcelデータがやや苦手
Excelを開くとわかりますが、200項目以上の巨大な表です。
これをそのままChatGPTにアップロードしてもある程度は処理してもらえるのですが、分析の精度を上げるために不必要な項目は削除してからアップするのがコツです。
たとえばSSDSEコード、地域コードなど、今後のデータ分析に必要なさそうな列は削除してしまいます。
レイアウトのための列やコメントがある場合も削除したほうがよいです。そしてChatGPTは複雑なExcelファイルよりも、シンプルな形式のファイルのほうが、処理の精度が高くなります。
ここではExcelから必要項目だけをCSVファイルとして渡しました。
次に、
〈プロンプト〉
全項目においてトップの自治体名を表にしてください
全項目においてトップの自治体名を表にしてください
とリクエストします。すると、「了解しました」と言って、結果を表示します。表示された表を見ると、米は静岡市、食パンは神戸市、生うどん・そばは高松市といったように、それぞれの項目においてトップの自治体名が表示されていることがわかります。
整理したデータをCSV形式で保存できる
ここで私は、
〈プロンプト〉
このファイルをCSVとして保存してください
このファイルをCSVとして保存してください
とリクエストして、「各消費項目のトップ自治体一覧」のファイルをダウンロードし、内容を確認してみました。
たとえば、食糧(合計)の消費金額が最も高いのは東京都の区部、01 穀類(穀類全体)の消費が多いのは京都市、食パンの消費が最も多いのは兵庫県神戸市というように、消費金額が多い県庁所在地の自治体が抽出されました。
このデータには合計、全体のカテゴリーレベルの情報と、パンやうどんのような個別レベルの情報があることがわかります。