题目:机器学习的数学原理
报告人:鄂维南院士(北京大学)
时间:6月29日,16:00-17:00
地点:腾讯会议,会议号:492 819 307
摘要:现代机器学习的核心问题是怎样有效地逼近一个高维空间的函数。传统的逼近论方法会导致维数灾难,这是对许多领域来说困惑了我们多年的问题。在这个演讲里,我们将介绍以下几方面的内容。
1. 怎样建立起一个数学理论?这里的问题本身跟传统的数值分析基本一样。不同的是机器学习需要处理的核心问题是维数灾难。所以我们需要建立起一个高维数值分析理论,包括逼近论,先验和后验误差估计,优化理论等。这个理论会帮助我们理解什么样的模型和算法没有维数灾难。
2. 怎样建立一个好的机器学习的数学模型?正确的方法是首先在连续的层面建立好的机器学习的模型,然后采用数值分析的想法,对这些连续模型作离散化而得到所需要的机器学习算法。我们发现许多神经网络模型,包括残差网络模型,都可以通过这种途径得到。因为有一个好的连续模型作为背景,这样得到的机器学习模型和算法自然就有比较好的性质。
3. 实际应用中有一些比较奇怪的现象,比方说double descent。怎样解释这些现象?实际应用中人们也没有按照前面所说的套路来做,那为什么其效果也还很好呢?
4. 哪些问题还有待解决?
报告链接:https://www.bilibili.com/video/BV1YL411p7ny