引言
本文計算實力相近的對手在特定的規則下產生平局的概率。
模型與計算
1. 背景與物理圖像
在特定賽制下(如小組第三亦可出線),若兩支實力相近且較弱的球隊 $A$ 與 $B$ 遭遇,且打平能確保雙方均以 $100%$ 概率晉級,則雙方缺乏爭奪名次的強烈動機。
定義狀態變量 $x(t)$ 為兩隊的比分差:
$$
x(t) = N_A(t) - N_B(t)
$$
初始條件:$x(0) = 0$。比賽截止時間為 $t = T$。
物理圖像: 平局狀態 $x = 0$ 是系統的穩定平衡點。
- 若 $x = 0$,雙方維持防守態勢,淨漂移為零。
- 若 $x > 0$($A$ 領先),$A$ 缺乏擴大戰果動機(傾向控球防守),而 $B$ 迫於淘汰壓力全線壓上,產生強烈的「扳平恢復力」,驅動系統向 $x = 0$ 回歸。
2. 線性化(Ornstein-Uhlenbeck 過程)的合理性
設系統的淨恢復力為未知函數 $F(x)$。因動力學在 $x=0$ 附近對稱,顯然 $F(0) = 0$。
將 $F(x)$ 在平衡點 $x=0$ 進行泰勒展開:
$$
F(x) = F(0) + F’(0)x + \frac{1}{2}F’’(0)x^2 + \mathcal{O}(x^3)
$$
由於對稱性,$F(x)$ 應為奇函數,高階偶次項係數 $F’’(0) = 0$。保留至最低階非零項(線性項):
$$
F(x) \approx -\theta x, \quad \theta = -F’(0) > 0
$$
在實際足球比賽中,總進球數極少,比分差 $x$ 的波動範圍通常局限在 ${ -1, 0, 1 }$ 內。在該局域空間中,高階非線性項 $\mathcal{O}(x^3)$ 尚未顯化,因此線性恢復力假設(即 $-\theta x$)是極佳的近似。
3. 情況一:連續近似(OU 過程與 Fokker-Planck 方程)
將比分差 $x_t$ 視為連續隨機變量,滿足伊藤隨機微分方程(SDE):
$$
dx_t = -\theta x_t dt + \sigma dW_t
$$
其中 $\theta$ 為恢復力係數,$\sigma$ 為隨機波動率(代表進球的偶然性),$W_t$ 為標準布朗運動。
3.1 福克-普朗克方程(Fokker-Planck Equation)
系統的概率密度函數 $P(x, t)$ 滿足如下偏微分方程:
$$
\frac{\partial P}{\partial t} = \theta \frac{\partial}{\partial x}(x P) + \frac{\sigma^2}{2} \frac{\partial^2 P}{\partial x^2}
$$
3.2 傅立葉變換求解
引入空間傅立葉變換(特徵函數):
$$
\tilde{P}(k, t) = \int_{-\infty}^{\infty} P(x, t) e^{ikx} dx
$$
對方程兩邊進行變換。注意算符關係:
$$
\int_{-\infty}^{\infty} \frac{\partial}{\partial x}(x P) e^{ikx} dx = -ik \int_{-\infty}^{\infty} x P e^{ikx} dx = -k \frac{\partial \tilde{P}}{\partial k}
$$
即
$$
\int_{-\infty}^{\infty} \frac{\partial^2 P}{\partial x^2} e^{ikx} dx = -k^2 \tilde{P}
$$
代入原方程,得一階線性偏微分方程:
$$
\frac{\partial \tilde{P}}{\partial t} + \theta k \frac{\partial \tilde{P}}{\partial k} = -\frac{\sigma^2}{2} k^2 \tilde{P}
$$
3.3 特徵線法(Method of Characteristics)
建立特徵方程軌跡:
$$
\frac{dt}{1} = \frac{dk}{\theta k} = \frac{d\tilde{P}}{-\frac{\sigma^2}{2} k^2 \tilde{P}}
$$
由第一等式:
$$
k(t) = k_0 e^{\theta t} \implies k(t)e^{-\theta t} = k_0
$$
將其代入 $\tilde{P}$ 的演化方程:
$$
\frac{d\tilde{P}}{dt} = -\frac{\sigma^2}{2} k_0^2 e^{2\theta t} \tilde{P}
$$
積分之:
$$
\ln \tilde{P}(t) = -\frac{\sigma^2}{4\theta} k_0^2 e^{2\theta t} + C = -\frac{\sigma^2}{4\theta} k^2(t) + C
$$
初始條件 $x(0)=0 \implies P(x,0) = \delta(x) \implies \tilde{P}(k,0) = 1$。
在 $t=0$ 時,$k(0)=k_0$,故 $1 = \exp\left(-\frac{\sigma^2}{4\theta} k_0^2\right) e^C \implies e^C = \exp\left(\frac{\sigma^2}{4\theta} k^2 e^{-2\theta t}\right)$。
最終得特徵函數解:
$$
\tilde{P}(k, t) = \exp\left( -\frac{\sigma^2}{4\theta} k^2 (1 - e^{-2\theta t}) \right)
$$
3.4 逆變換與終場打平概率
此形式為典型高斯分佈。定義時變方差:
$$
\Sigma^2(t) = \frac{\sigma^2}{2\theta} (1 - e^{-2\theta t})
$$
進行傅立葉逆變換,得概率密度:
$$
P(x, t) = \frac{1}{\sqrt{2\pi \Sigma^2(t)}} \exp\left( -\frac{x^2}{2\Sigma^2(t)} \right)
$$
在終場時間 $t=T$,實際比分打平對應連續變量落在區間 $[-0.5, 0.5]$ 內。定義誤差函數 $\text{erf}(z) = \frac{2}{\sqrt{\pi}}\int_0^z e^{-\eta^2} d\eta$,則打平概率為:
$$
P_{\text{draw}}^{\text{cont}} = \int_{-0.5}^{0.5} P(x, T) dx = \text{erf}\left( \frac{1}{2\sqrt{2}\Sigma(T)} \right)
$$
4. 情況二:嚴格離散模型(生滅過程與母函數)
比分差 $n \in \mathbb{Z}$ 為離散狀態。建立連續時間、離散狀態的 Ehrenfest 生滅模型。
定義轉移速率(進球率):
- $A$ 隊進球速率($n \to n+1$):$\lambda_n = \alpha - \beta n$
- $B$ 隊進球速率($n \to n-1$):$\mu_n = \alpha + \beta n$
其中 $\alpha$ 為基礎進球率,$\beta$ 為動機恢復強度。注意系統總事件速率 $\lambda_n + \mu_n = 2\alpha$ 為常數。
4.1 主方程(Master Equation)
狀態概率 $P_n(t)$ 的演化方程為:
$$
\frac{dP_n(t)}{dt} = \lambda_{n-1} P_{n-1}(t) + \mu_{n+1} P_{n+1}(t) - (\lambda_n + \mu_n) P_n(t)
$$
代入速率公式:
$$
\frac{dP_n}{dt} = [\alpha - \beta(n-1)] P_{n-1} + [\alpha + \beta(n+1)] P_{n+1} - 2\alpha P_n
$$
4.2 概率母函數(離散傅立葉/Z 變換)
定義母函數:
$$
G(z, t) = \sum_{n=-\infty}^{\infty} P_n(t) z^n
$$
將主方程兩邊乘以 $z^n$ 並對所有 $n$ 求和:
$$
\frac{\partial G}{\partial t} = \alpha \sum_n P_{n-1} z^n - \beta \sum_n (n-1) P_{n-1} z^n + \alpha \sum_n P_{n+1} z^n + \beta \sum_n (n+1) P_{n+1} z^n - 2\alpha G
$$
平移求和指標,並利用關係 $\sum_n n P_n z^n = z \frac{\partial G}{\partial z}$:
$$
\frac{\partial G}{\partial t} = \alpha z G - \beta z^2 \frac{\partial G}{\partial z} + \frac{\alpha}{z} G + \beta \frac{\partial G}{\partial z} - 2\alpha G
$$
整理得偏微分方程:
$$
\frac{\partial G}{\partial t} + \beta (z^2 - 1) \frac{\partial G}{\partial z} = \alpha \frac{(z-1)^2}{z} G
$$
4.3 特徵線法求解 PDE
特徵方程組為:
$$
\frac{dt}{1} = \frac{dz}{\beta(z^2 - 1)} = \frac{dG}{\alpha \frac{(z-1)^2}{z} G}
$$
由第一等式:
$$
\frac{dz}{z^2 - 1} = \beta dt \implies \frac{1}{2}\ln\left|\frac{z-1}{z+1}\right| = \beta t + \tilde{C} \implies \frac{z-1}{z+1}e^{-2\beta t} = C
$$
由第二等式(沿特徵線):
$$
\frac{d\ln G}{dz} = \frac{\alpha}{\beta} \frac{(z-1)^2}{z(z^2-1)} = \frac{\alpha}{\beta} \frac{z-1}{z(z+1)} = \frac{\alpha}{\beta} \left( -\frac{1}{z} + \frac{2}{z+1} \right)
$$
積分得:
$$
\ln G = \frac{\alpha}{\beta} \ln \frac{(z+1)^2}{z} + \ln \psi(C) \implies G(z, t) = \left[ \frac{(z+1)^2}{z} \right]^{\frac{\alpha}{\beta}} \psi\left( \frac{z-1}{z+1} e^{-2\beta t} \right)
$$
結合初始條件 $P_n(0) = \delta_{n,0} \implies G(z, 0) = 1$:
$$
1 = \left[ \frac{(z+1)^2}{z} \right]^{\frac{\alpha}{\beta}} \psi\left( \frac{z-1}{z+1} \right)
$$
令 $w = \frac{z-1}{z+1}$,則 $z = \frac{1+w}{1-w}$,代入得:
$$
\frac{(z+1)^2}{z} = \frac{4}{1-w^2} \implies \psi(w) = \left( \frac{1-w^2}{4} \right)^{\frac{\alpha}{\beta}}
$$
將特徵線代回 $\psi$,最終得到全時解:
$$
G(z, t) = \left[ \frac{(z+1)^2}{4z} \left( 1 - \left(\frac{z-1}{z+1}\right)^2 e^{-4\beta t} \right) \right]^{\frac{\alpha}{\beta}}
$$
展開括號內各項並化簡:
$$
G(z, t) = \left[ \frac{1-e^{-4\beta t}}{4} z + \frac{1+e^{-4\beta t}}{2} + \frac{1-e^{-4\beta t}}{4z} \right]^{\frac{\alpha}{\beta}}
$$
4.4 終場打平概率的精確展開
定義時變參數 $p(t) = \frac{1 - e^{-4\beta t}}{4}$ 以及無量綱參數 $\gamma = \frac{\alpha}{\beta}$。母函數寫為標準三項式形式:
$$
G(z, t) = \left[ p(t) z + (1 - 2p(t)) + \frac{p(t)}{z} \right]^{\gamma}
$$
利用廣義二項式定理展開:
$$
G(z, T) = \sum_{k=0}^{\infty} \binom{\gamma}{k} (1 - 2p(T))^{\gamma - k} p(T)^k \left( z + \frac{1}{z} \right)^k
$$
終場打平的概率 $P_0(T)$ 即為 $G(z, T)$ 中 $z^0$ 項的係數。只有當 $k = 2m$(偶數)時,$\left( z + z^{-1} \right)^{2m}$ 的二項式展開才會出現常數項 $\binom{2m}{m}$。
因此,精確的離散打平概率為:
$$
P_{\text{draw}}^{\text{discrete}} = \sum_{m=0}^{\infty} \binom{\gamma}{2m} \binom{2m}{m} (1 - 2p(T)) ^ {\gamma - 2m} p(T)^{2m}
$$
其中,廣義組合數定義為:
$$
\binom{\gamma}{2m} = \frac{\prod_{j=0}^{2m-1}(\gamma - j)}{(2m)!}
$$
漸近檢驗(物理自洽性):
當 $\beta \to 0$(無恢復力,退化為獨立隨機進球)時,$p(T) \approx \beta T$,$\gamma p(T) \to \alpha T$。
此時 $(1-2p)^{\gamma-2m} \to e^{-2\alpha T}$,且 $\binom{\gamma}{2m} p(T)^{2m} \to \frac{(\alpha T)^{2m}}{(2m)!}$。
代入上式得:
$$
P_0(T) \to e^{-2\alpha T} \sum_{m=0}^{\infty} \frac{(\alpha T)^{2m}}{(2m)!} \frac{(2m)!}{m!m!} = e^{-2\alpha T} \sum_{m=0}^{\infty} \frac{(\alpha T)^{2m}}{(m!)^2} = e^{-2\alpha T} I_0(2\alpha T) \approx \frac{1}{\sqrt{2\pi}}\frac{1}{\sqrt{2\alpha T}}
$$
此即為兩獨立泊松過程之差的 Skellam 分佈在零點的精確值($I_0$ 為第一類修正貝索函數),嚴格驗證了解的正確性。
連續與離散極限的等價性:
在大 $T$ 且無恢復力($\beta \to 0$)的極限下,A 隊與 B 隊的進球數退化為兩個獨立的泊松過程(Poisson process),其方差等於期望值,即 $\text{Var}(N_A) = \text{Var}(N_B) = \alpha T$。比分差 $x = N_A - N_B$ 的方差為兩者之和:
$$
\Sigma^2 = \text{Var}(N_A) + \text{Var}(N_B) = 2\alpha T \implies \Sigma = \sqrt{2\alpha T}
$$
將此標準差代入大 $T$ 近似解中,立得:
$$
P_{\text{draw}}^{\text{discrete}} \approx \frac{1}{\sqrt{2\pi}\sqrt{2\alpha T}} = \frac{1}{\sqrt{2\pi}\Sigma} \approx \frac{0.3989}{\Sigma}
$$
這證明了在宏觀極限下,離散的生滅過程嚴格退化為連續的擴散過程,兩者物理圖像完全統一。
5. 誤差函數的線性化與「方差坍縮」機制
在比賽時間 $T$ 充足的情況下($T \to \infty$),系統進入穩態,方差 $\Sigma^2(T)$ 中的指數衰減項 $e^{-2\theta T} \to 0$。穩態比分差方差簡化為:
$$
\Sigma^2 = \frac{\sigma^2}{2\theta}
$$
將其代入連續情況的打平概率公式:
$$
P_{\text{draw}} = \text{erf}\left( \frac{1}{2\sqrt{2}\Sigma} \right)
$$
常規比賽的線性化近似:
對於常規比賽,方差 $\Sigma \sim \mathcal{O}(1)$,可利用誤差函數在原點的泰勒展開 $\text{erf}(z) \approx \frac{2}{\sqrt{\pi}}z$ 進行線性化:
$$
P_{\text{draw}} \approx \frac{2}{\sqrt{\pi}} \frac{1}{2\sqrt{2}\Sigma} = \frac{1}{\sqrt{2\pi}\Sigma} \approx \frac{0.3989}{\Sigma}
$$
這導出一個優美的反比守恆律:常規比賽中 $P_{\text{draw}} \times \Sigma \approx 0.4$。
極端場景(默契球)的方差坍縮:
在本模型設定的邊界條件下(打平雙雙出線),領先方防守與落後方反撲導致系統向 $x=0$ 的「恢復力」係數 $\theta \to \infty$。
由方差公式可知,強阻尼導致系統發生方差坍縮(Variance Collapse),即 $\Sigma \to 0$。
當 $\Sigma \to 0$ 時,線性化失效,直接代入原式:
$$
\lim_{\Sigma \to 0} \text{erf}\left( \frac{1}{2\sqrt{2}\Sigma} \right) = \text{erf}(\infty) = 1
$$
這從動力學上嚴格證明了為何該場景下打平概率趨近於 $100%$。
6. 宏觀歷史數據驗證:歐冠小組賽
以下基於 21 個賽季的嚴格核實數據。理論檢驗常數(無強勢場干擾的自由擴散極限)應為 $1/\sqrt{2\pi} \approx 0.3989$。比分差標準差估計為 $\Sigma = \sqrt{\lambda}$。
| 賽季 | 總場次 | 場均進球 ($\lambda$) | 估計標準差 ($\Sigma = \sqrt{\lambda}$) | 實際平局率 ($P_{\text{draw}}$) | 檢驗常數 ($P_{\text{draw}} \times \Sigma$) |
| :— | :— | :— | :— | :— | :— |
| 2023/24 | 96 | 2.89 | 1.700 | 21.9% | 0.372 |
| 2022/23 | 96 | 3.23 | 1.797 | 21.9% | 0.394 |
| 2021/22 | 96 | 3.12 | 1.766 | 18.8% | 0.332 |
| 2020/21 | 96 | 2.92 | 1.709 | 19.8% | 0.338 |
| 2019/20 | 96 | 3.20 | 1.789 | 22.9% | 0.410 |
| 2018/19 | 96 | 2.84 | 1.685 | 25.0% | 0.421 |
| 2017/18 | 96 | 3.20 | 1.789 | 19.8% | 0.354 |
| 2016/17 | 96 | 2.90 | 1.703 | 30.2% | 0.514 |
| 2015/16 | 96 | 2.92 | 1.709 | 17.7% | 0.302 |
| 2014/15 | 96 | 2.91 | 1.706 | 21.9% | 0.374 |
| 2013/14 | 96 | 2.89 | 1.700 | 18.8% | 0.320 |
| 2012/13 | 96 | 2.96 | 1.720 | 20.8% | 0.358 |
| 2011/12 | 96 | 2.65 | 1.628 | 29.2% | 0.475 |
| 2010/11 | 96 | 2.88 | 1.697 | 17.7% | 0.300 |
| 2009/10 | 96 | 2.48 | 1.575 | 26.0% | 0.409 |
| 2008/09 | 96 | 2.57 | 1.603 | 29.2% | 0.468 |
| 2007/08 | 96 | 2.78 | 1.667 | 18.8% | 0.313 |
| 2006/07 | 96 | 2.51 | 1.584 | 26.0% | 0.412 |
| 2005/06 | 96 | 2.38 | 1.543 | 26.0% | 0.401 |
| 2004/05 | 96 | 2.61 | 1.616 | 21.9% | 0.354 |
| 2003/04 | 96 | 2.48 | 1.575 | 24.0% | 0.378 |
基於這 21 個賽季的統計,檢驗常數的均值與標準差可表示為 $0.381 \pm 0.058$。
7. 對稱性破缺與確定性漂移(Symmetry Breaking & Deterministic Drift)
在我們建立的基礎 OU 模型中,我們隱含了一個前提:雙方球隊實力相近。這意味著在 $x=0$ 處,雙方的進球期望對稱,系統沒有固有的方向性。
然而,極端的實力不對稱在動力學上表現為系統被引入了一個強烈的確定性漂移項(Deterministic Drift)。
7.1 引入漂移項的 SDE
設強隊與弱隊的固有實力差轉化為每單位時間的期望淨勝球速率 $v > 0$。此時的 Langevin 方程修改為:
$$
dx_t = (v - \theta x_t) dt + \sigma dW_t
$$
這可以被重寫為一個中心發生偏移的 OU 過程:
$$
dx_t = -\theta(x_t - \frac{v}{\theta}) dt + \sigma dW_t
$$
7.2 穩態分佈偏移與打平概率的嚴格展開
當系統存在確定性漂移(實力差 $v$)時,勢阱平衡點偏移至 $x_c = v/\theta$。此時連續變量的穩態分佈為非零均值的高斯密度:
$$P(x) = \frac{1}{\sqrt{2\pi\Sigma^2}} \exp\left( -\frac{(x - x_c)^2}{2\Sigma^2} \right)$$
在連續模型中,打平的精確概率對應於積分 $\int_{-0.5}^{0.5} P(x)dx$。利用誤差函數 $\text{erf}(z) = \frac{2}{\sqrt{\pi}}\int_0^z e^{-\eta^2} d\eta$,可嚴格寫為:
$$
P_{\text{draw}} = \frac{1}{2} \left[ \text{erf}\left( \frac{0.5 - x_c}{\sqrt{2}\Sigma} \right) - \text{erf}\left( \frac{-0.5 - x_c}{\sqrt{2}\Sigma} \right) \right]
$$
我們對上述誤差函數差值在中心點 $z_0 = -\frac{x_c}{\sqrt{2}\Sigma}$ 處進行一階泰勒展開。已知誤差函數的導數為 $\frac{d}{dz}\text{erf}(z) = \frac{2}{\sqrt{\pi}} e^{-z^2}$,變量差為 $\Delta z = \frac{1}{\sqrt{2}\Sigma}$:
$$
P_{\text{draw}} \approx \frac{1}{2} \left[ \left. \frac{d}{dz}\text{erf}(z) \right|_{z_0} \cdot \Delta z \right] = \frac{1}{2} \left[ \frac{2}{\sqrt{\pi}} \exp\left( -\frac{x_c^2}{2\Sigma^2} \right) \right] \cdot \frac{1}{\sqrt{2}\Sigma}
$$
化簡後,我們得到帶有漂移項的打平概率解析解:
$$
P_{\text{draw}} \approx \frac{1}{\sqrt{2\pi}\Sigma} \exp\left( -\frac{x_c^2}{2\Sigma^2} \right)
$$
7.3 對稱性破缺導致的指數衰減
將上式重排,我們得到修正後的檢驗常數:
$$
P_{\text{draw}} \times \Sigma \approx \frac{1}{\sqrt{2\pi}} \exp\left( -\frac{x_c^2}{2\Sigma^2} \right) \approx 0.3989 \exp\left( -\frac{x_c^2}{2\Sigma^2} \right)
$$
當實力完全對等($x_c = 0$)時,系統維持對稱性,衰減因子為 $1$,回到無阻尼常規守恆律 $0.3989$;而當強弱極度懸殊導致對稱性破缺時,勢阱中心遠離原點。由於高斯尾部的性質,打平概率會受到一個 $\exp(-x_c^2 / 2\Sigma^2)$ 的強烈指數阻尼(Exponential damping),這從數學上嚴格解釋了極端實力差下平局率斷崖式下跌的必然性。
結論:
當球隊實力極度懸殊時,漂移平衡點 $x_c$ 遠離原點。由於概率密度在偏離中心時呈高斯指數衰減,乘積常數會受到一個阻尼因子 $\exp(-\frac{x_c^2}{2\Sigma^2})$ 的強烈抑制。
後記
為了方便直觀理解,你可以把場均進球數解釋為球場對抗的激烈程度。那麼當場均進球數為零點二時,打平的概率大約是百分之九十;當場均進球數為零點六時,打平的概率大概是百分之五十;若場均進球數為二,那麼打平的概率不到百分之三十。這樣解釋了如果你想控分必須消極比賽的原因,激烈對抗產生平局的概率微乎其微。這就很像是你把硬幣拋向空中,某一面朝上和剛好立起的概率並不等同為三分之一。
我是在奧地利對阿爾及利亞的小組賽前產生了計算他們打平概率的想法,因為兩隊實力相近,打平攜手出線,失敗則必定出局。他們是否會打默契球,看場上的對抗程度便可知。我用歐冠的數據和理論預測做了對比,如此吻合也是出乎意料。