前回は競馬の予想をするにむけて、csvファイルを読み込んで、簡単なニューラルネットワークのモデルをつくり、馬のデータを打ち込んで予測させました。
結果として、データ数が少なすぎることが分かりました。(僕の独断と偏見で)
なので、競馬の過去データをたくさん用意したいと思います。ウェブサイトを見てエクセルに打ち込んでいく方法では、139件×11特徴のデータを取得するのに1時間ほどかかりました。
今回は、テーブルのデータを取得する方法をつかって、たくさんのデータを用意します。
テーブルのデータを取得するために
以前に書いた、スクレイピングの基本を学ぶ記事。そこで学んだことに、以下のコードを追加するだけでよかった。
合わせて読みたい
html = urlopen("URL") bsObj = BeautifulSoup(html, "html.parser") table = bsObj.findAll("table",{"class":"クラスのタグ"})[0] rows = table.findAll("tr")
加えて、whileを使うと効率よくスクレイピングできた。
おわりに
プログラミングを始めてから10日ほどなので、whileのような簡単な書き方しか分からない。なので、もっといい方法があるかも。
後日、データを増やして競馬の予測をやってみました。
合わせて読みたい
合わせて読みたい
おーわり