WEBスクレイピング(SUMO編)
Pythonを使って、SUMOサイトでかんたんにマンション物件一覧が取得できました。
使ったライブラリはrequests,Beautifulsoup,pandasです。
このデータとの相関性があるデータが不明なので利用用途が見つかってませんが、住宅分析かなにかには使えそうなものです。
リアルタイムに差分が取れれば新規登録物件探しなどに使えそうですね。
base_urlは検索条件設定を行い、設定します。
max_pageはbase_urlのページ数を設定します。
この例では名古屋市昭和区で取得することにしました。ページ数は66ページ。
pandasを使って表形式にします。
表形式にしたものをcsv形式で抽出することで、編集利用することもできます。