ディープラーニングで競馬予想をして遊んでいたのですが、なんとなく熱が冷めてしまいやめていました。
年度も変わり、元号も変わり、やる気もでてきたので、新しくやり直そうと思います。
やろうと思っていることは、
- データをできる限り増やす
- 様々なモデルを作って遊ぶ
まぁ、初めの目標はそれなりで、やっていくうちに次々とやるべきことが出てくるでしょう。
ということで
タイトルにもありますが、データを集めてみました。
さて、昨年度までは、16頭立てのレースを3,357レース分使って学習させていました。今度は気合を入れてスクレイピングしよう!と心に決め、16頭立てのレースを15,653レース分集めました。
これだけ集まれば、芝とダートのレースを、別々に学習させることが可能ですね。(今まではごちゃまぜにしていました…)
2020年6月7日追記
データを増やしてから、少しは検証していました。が、競馬開催日の土日に自由な時間がなく、ほとんど進んでいませんでした。
本業はコロナの影響は皆無で、時間もつくれるようになってきたので、再び開始しようと考えています。
まったくさぼっていたわけではなく、興味のあるところは追いかけていました。
具体的には、netkeibaでの予想販売についてです。このサイトでは、人工知能を用いて予想を販売している方がおられます。
的中率か回収率のどちらかを重視する形で、なぜか本年度は前者の回収率が高い現象がおきています。この記事をかいているときは、確か、前者回収率108%、後者回収率85%くらいだった気がします。これはめっちゃ面白いです。
なぜこんなことが起こるのか自分なりに考察しながら、自分の作業に注力したいと思います。