测度的延拓(ver. 概率论)
从两个礼拜前开始学概率论和测度论,翻了两本书,看了很多帖子,最后发现,我不知道测度论一开始的一堆定理到底在干什么。看到了像环,半环,代数,半代数, \sigma -代数,还有单调类, \pi -系, \lambda -系之类的一堆结构,而每个结构都对一些运算封闭。每次看了一个新的结构,就会忘记一个旧的结构。反正看了半天,除了 \sigma -代数以外,都不知道其他玩意到底有什么用。
在死磕书籍失败以后,开始听取友人的建议,转战网课。(数学太烂,自己啃啃不来)所幸碰到了一位叫Adam B Kashlak的教授的课程,看了前三节课,大概明白测度论引入各种结构,以及测度延拓的意义之所在,遂在此记录一下自己的理解,写得不会特别详细,不会把定义证明啥的全列出来。(这个教授好像The Flash里的博士啊。)
首先,在初等概率论里面,我们基本都知道概率是定义在全集 \Omega 的子集 A 上面的。也就是,在样本空间 \Omega 上,我们可以抽出一个子集(事件) A\subset \Omega ,然后计算这个子集(事件)的概率 P(A) 。在概率论里,我们需要考虑的一件很重要的事情就是,如何计算出样本空间 \Omega 中所有事件 A 的概率。样本空间上所有事件可以组成一个集合的集合 \mathcal F ,而计算事件之概率的这个东西就被称之为测度 \mathcal P ,也就是度量集合的大小的一个函数。三个东西在经过一定限制以后拼在一起,变成三元组 (\Omega, \mathcal F, \mathcal P) ,就变成了一个测度空间。
如果说我们对样本空间上的所有事件感兴趣,也就是对幂集 2^\Omega=\mathcal P(\Omega) 的所有元素都感兴趣,那我们就需要对幂集中所有的事件 A 求测度。在古典概型的情况下,这大概可以搞定,也就是算 2^{|\Omega|} 个测度的事儿。但是,如果我们要考虑的样本空间是实数系 \mathbb R 的话,这套办法就不顶用了,因为这样会有无穷多个测度需要去计算。但是,聪明的数学家引入了\sigma - 代数这一结构,将问题转换为了定义\sigma - 代数上的测度。至于为什么要定义在 \sigma - 代数上,我想大概是因为 \sigma - 代数满足的性质,包括对取补运算封闭,以及对可列并封闭,这些性质天然符合概率论公理的那三条,所以说就定义在这上面了。(此处不知道是先有\sigma -代数再有概率论公理,还是需要符合概率论公理才搬出 \sigma - 代数这个数学结构)
当然,光有 \sigma - 代数还不够,我们也很难直接在 \sigma - 代数上定义测度,因为 \sigma - 代数满足的性质很多,处理起来很麻烦。数学家的想法是,我们可以在一个比较简单的结构上定义好测度。然后,把测度给延拓到 \sigma - 代数上,这样就能很好的把概率论的地基给打实了。数学家的选择是在环上干这件事,环是一个对差集和并集运算封闭的结构。一个比较简单的例子就是: \mathcal A = \{所有左开右比区间的有限并集\} 。像在这个环上面,我们就可以很简单地定义出测度,假如有集合 A = (a,b]\cup (c,d],a<b<c<d ,其测度为 \mu(A)=d-c+b-a 。先整出一个环,然后整出环上的预测度,这个测度满足两点:1) \mu(\emptyset) = 0 ; 2) 对于 \{A_i\}^\infty_{\{i=1\}}, A_i\cup A_j=\emptyset , 有 \mu(\bigcup^\infty_{\{i=1\}}A_i)=\sum^\infty_{i=1}\mu(A_i) 。那有了环 \mathcal A ,还有定义在环上的预测度 \mu ,数学家 Caratheodory 证明了,预测度 \mu 能够从环 \mathcal A 延拓到最小的 \sigma - 代数 \sigma(\mathcal A) 上去。也就说明了延拓的存在性。(我要吐槽,这个定理证了整整3页纸....)
另外,还有测度的唯一性,我们希望延拓的这个测度是唯一的。此处又引入了俩新的结构 \pi - 系 和 \lambda - 系。\pi - 系 对于交集运算封闭的系统。(老师说这个结构最符合概率论的直觉,因为两个集合的交集还在系统之中)还有就是\lambda - 系,它对差集和可列不交并是封闭的。数学家 Dynkin 证明了,如果一个\pi - 系 \mathcal A 和一个\lambda - 系 \mathcal L ,有 \mathcal A\subset \mathcal L,就会有 \sigma(\mathcal A) \subset \mathcal L 。某位数学家又根据这个定理,证明了在同一个\pi - 系 上两个值相同的测度,在延拓到 \sigma(\mathcal A) 上以后,它俩还是一样的,也就是测度延拓的唯一性。
虽然乍一看两个定理证明的东西好像不一样,一个证明的是环上预测度进行延拓后的存在性,另一个则证明的是\pi - 系上测度延拓后的唯一性。但是,我们对环的这个结构进行验证,发现环其实也是对交集运算封闭的,\{A,B\in \mathcal A, A\cap B= (A\cup B)\backslash (A\triangle B)\in \mathcal A\} 。也就是说,环一定是\pi - 系。因此,如果唯一性证明中的\pi - 系 \mathcal A 替换成了环 \mathcal A ,证明也是成立的。所以,根据上面这两大定理就可以得到环 \mathcal A 上的预测度 \mu 可以唯一延拓到 \sigma(\mathcal A) 上的结论。也就是说,我们可以先在简单的结构上定义出测度,然后给他延拓到 \sigma - 代数上。这样就可以进行概率论后续的操作了。
大概总结的东西就是这些,后面的东西学完以后再总结了。果然,学一个东西,不仅得知道它是什么,还得知道它为什么是这样的,这样才能加深对于它的理解,费曼学习法好啊。
更自然的思路是先引入sigma代数和测度,顺便定义积分;之后引入半环和延拓定理,证明sigma-有限的情况下延拓唯一,并给出一维Lebesgue测度作为例子.
至于πλ/单调类定理,它只是推导乘积测度与Fubini定理的一个小工具而已.
答主你好,我搜的视频怎么看的是糊的,请问答主在哪看的视频~
这段是不是写错了?
请问:这个老师的视频的链接可以发一下吗?概率论为什么要求:“取补运算封闭,以及对可列并封闭”?
我不是说了吗,"无限个点"的长度问题,要用测度的定义(即外测度的极限)去理解,不要抱着"∞×0是不定式"这个想法不放。更别提严格意义上来说这句话也是错的,即便你去翻分析学的教材,遇到∞都是要按极限的理论去处理的,从来没有"∞×0"的说法。