LOTA实力差的构成以及英超第16轮数据

最近在忙开发和公司里的事都没有好好分析和复盘,只能在周末英超比赛前发一下实力差,实在抱歉。很多人问我的实力差表格是怎样来的、怎么看,就我个人的经验单凭公平赔率与初始欧赔对比来判断比赛胜负未免过于简单和理想化,胜率也不稳定。以下就介绍一下LOTA实力模型的建立方式,给对足球数据建模有兴趣的朋友一个参考。


LOTA球队实力模型以球队历史得失球数据建立的模型,它不包含球员伤病、教练、裁判、天气和战意等等不能量化成数据的因素,但机构在生成一场比赛的预测概率离不开双方实力差这个主要因素,LOTA模型首先从这里入手。


LOTA实力差的构成以及英超第16轮数据

LOTA模型中双方实力差主要由:交锋优势、联赛竞争优势、状态差、相对进球差等参数组成,这与很多人分析比赛基本面的模式有点类似,只不过LOTA模型用算法量化成数字。这里要说一下,表中的数字单位是“球”,但实际上球队不可能有进0.5球的存在,所以这里的数字只是一个理论值。与亚指的让球有类似的地方,但亚指让球是有带赔付。

计算比赛双方实力差后,根据双方的进球失球数据获得了本场比赛主客队的理论进球(为了方便理解我们一般以主队为准称之为等效进球和等效失球)。有了进球和失球的数值,那么运用泊松分布公式就可以计算出本场比赛胜平负的概率。

在网上搜到有关泊松分布在足球预测的应用文章中,都只是简单的用平均进球数代入或者加上相对联赛优势进球数等,没有考虑交锋、总进球和联赛等因素的影响,得出的结果往往有很大的偏差。举个简单的例子,英冠冠军球队升级到英超后,那它的得失球数是否能沿用英冠时候的数值呢,显然是不可能的,英超和英冠的比赛强度和竞争环境完全不同,需要做出一定的换算,这点在得失球模型建模上要注意。不得不承认,虽然LOTA球队得失球模型有很多项参数构成,但离菠菜机构的模型还是有很大的差距,从回测14/15至19/20赛季约2000场数据后LOTA预测的胜平负概率与欧平初赔的相关性只有95%左右,接近一半的比赛误差概率超过5%。

预期进球修正和预期失球模型是运用到另外一个模型。原理是球队每场比赛进球数97%位于[0-5]球的区间,进球数呈现不规则围绕进球均值上下波动。简单的说就是进球数多了,下场比赛会回归到进球数少的现象。利用这个进球数回归的特点,运用预测值与实际值的比较,获得进球偏离度来预测比赛进球数。以英超第16轮 埃弗顿vs切尔西 为例子。埃弗顿近5个主场都未能赢球,进球均值只有0.8、失球均值为1.6,相对于其长期得失球均值来说进球偏低、失球偏高,都有修正的预期。切尔西本近6个赛季5胜1负,进球均值3.17、失球均值1.67,相对于其长期均进球偏高、失球相差不大,进球有修正的预期。在本场比赛中埃弗顿的进球就是切尔西的失球,埃弗顿的失球就是切尔西的进球,所以在修正模型中埃弗顿的进球1.37会比切尔西的进球1.24要多,换句话说埃弗顿本场输的几率比预测值要低。这个预测值还在测试当中,胜率几何还没统计过,只能作为参考。

我始终觉得LOTA最优胜的地方就是走势图,可以从中看出机构在操作时候的蛛丝马迹,同时复盘也是非常方便。有了图形走势,以后用AI技术识别历史走势图来判断比赛并不是不可能的事(如东方财富上已经有相似K线识别的功能)。

展开阅读全文

页面更新:2024-05-07

标签:埃弗顿   英超   切尔西   实力   数据   失球   建模   数值   概率   联赛   球队   模型   简单   机构   数字   体育

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top