本项目是通过国际足球从年世界杯后到年世界杯前的比赛结果进行分析统计得出的结果。
项目说明:用机器学习模拟国际足联年世界杯比赛,以预测比赛的获胜者。
项目将问题建模为二元分类问题,模型预测了主队的胜率和客场的平局/胜率。然后,为了去除客场球队的优势,我预测了客场和主场球队的变化结果(因为世界杯没有主场优势),并使用两个预测的平均值作为概率。
特征工程
创建可能影响预测足球比赛的特征。根据直觉,我们认为具有影响的功能可能是:
之前的比赛积分
之前进球数和犯规数
比赛的重要性(是否友好)
球队排名
球队排名增速
Goalsmadeandsufferedbyrankingfaced
第一个特征是能够显示哪支球队获胜以及他们在比赛中中获得了多少分。
现在,我们有了一个可以创建预测特征的数据集:
世界杯球队的平均进球数
球队最近5场比赛的平均进球数
世界杯球队的平均犯规数
球队最近5场比赛的平均犯规数
球队在世界杯中FIFA平均排名
球队在最近5场比赛中FIFA平均排名
FIFA积分
最近5场FIFA积分
比赛得分
最近5场比赛积分
建模
现在我们已经有了数据集和具有预测能力的列,我们可以开始建模了。
测试两个模型:RandomForestandGradientBoosting。选召回最好的一个。
预测结果如下:
小组A-卡塔尔vs.厄瓜多尔:厄瓜多尔以60.0%概率获胜
小组A-塞内加尔vs.荷兰:荷兰以59.0%概率获胜
小组A-卡塔尔vs.塞内加尔:塞内加尔以58.0%概率获胜
小组A-荷兰vs.厄瓜多尔:荷兰以66.0%概率获胜
小组A-厄瓜多尔vs.塞内加尔:厄瓜多尔以5.0%概率获胜
小组A-荷兰vs.卡塔尔:荷兰以69.0%概率获胜
小组B-英格兰vs.伊朗:英格兰以60.0%概率获胜
小组B-美国vs.威尔士:平局
小组B-威尔士vs.伊朗:威尔士以54.0%概率获胜
小组B-英格兰vs.美国:英格兰以58.0%概率获胜
小组B-威尔士vs.英格兰:英格兰以60.0%概率获胜
小组B-伊朗vs.美国:美国以57.0%概率获胜
小组C-阿根廷vs.沙特阿拉伯:阿根廷以70.0%概率获胜
小组C-墨西哥vs.波兰:平局
小组C-波兰vs.沙特阿拉伯:波兰以64.0%概率获胜
小组C-阿根廷vs.墨西哥:阿根廷以62.0%概率获胜
小组C-波兰vs.阿根廷:阿根廷以64.0%概率获胜
小组C-沙特阿拉伯vs.墨西哥:墨西哥以64.0%概率获胜
小组D-丹麦vs.突尼斯:丹麦以6.0%概率获胜
小组D-法国vs.澳大利亚:法国以65.0%概率获胜
小组D-突尼斯vs.澳大利亚:平局
小组D-法国vs.丹麦:平局
小组D-澳大利亚vs.丹麦:丹麦以65.0%概率获胜
小组D-突尼斯vs.法国:法国以6.0%概率获胜
小组E-德国vs.日本:德国以59.0%概率获胜
小组E-西班牙vs.哥斯达黎加:西班牙以68.0%概率获胜
小组E-日本vs.哥斯达黎加:平局
小组E-西班牙vs.德国:平局
小组E-日本vs.西班牙:西班牙以62.0%概率获胜
小组E-哥斯达黎加vs.德国:德国以60.0%概率获胜
小组F-摩洛哥vs.克罗地亚:克罗地亚以58.0%概率获胜
小组F-比利时vs.加拿大:比利时以67.0%概率获胜
小组F-比利时vs.摩洛哥:比利时以6.0%概率获胜
小组F-克罗地亚vs.加拿大:克罗地亚以62.0%概率获胜
小组F-克罗地亚vs.比利时:比利时以60.0%概率获胜
小组F-加拿大vs.摩洛哥:平局
小组G-瑞士vs.喀麦隆:瑞士以62.0%概率获胜
小组G-巴西vs.塞尔维亚:巴西以6.0%概率获胜
小组G-喀麦隆vs.塞尔维亚:塞尔维亚以61.0%概率获胜
小组G-巴西vs.瑞士:平局
小组G-塞尔维亚vs.瑞士:瑞士以56.0%概率获胜
小组G-喀麦隆vs.巴西:巴西以71.0%概率获胜
小组H-乌拉圭vs.韩国:乌拉圭以60.0%概率获胜
小组H-葡萄牙vs.加纳:葡萄牙以71.0%概率获胜
小组H-韩国vs.加纳:韩国以69.0%概率获胜
小组H-葡萄牙vs.乌拉圭:平局
小组H-加纳vs.乌拉圭:乌拉圭以69.0%概率获胜
小组H-韩国vs.葡萄牙:葡萄牙以6.0%概率获胜
欢迎留言
转载请注明:http://www.shatealabo.com/sbjn/10824.html