Lucius Blog

「适志于道 寄骸于迹 而无往不欣」

凸优化学习笔记(三):凸优化问题

三、凸优化问题 一般优化问题 $$ \begin{aligned} \text{minimize}\ (\min) \ & f_0(X) \\ \text{Subject}\ \text{to}(s.t.) \ & f_i(X)\leq 0, i=1,...,M \\ & h_i(x)=0,i=1,...,P \end{aligned} $$ ...

凸优化学习笔记(二):凸函数、函数共轭、拟凸函数

二、凸函数 基本概念 定义 1 — 基本 函数 $f:R^n\rightarrow R$ 是凸函数,当且仅当 $f$ 的定义域是凸集 $\forall x_1,x_2\in dom(f),\forall \theta\in [0,1],f(\theta x_1+(1-\theta)x_2)\leq \theta f(x_1)+(1-\thet...

凸优化学习笔记(一):仿射集、凸集、锥

一、介绍 习题建议 Chapter 2 2.1、2.2、2.5、2.7、2.10、2.16、2.18、2.19 Chapter 3 3.1、3.2、3.5、3.13、3.18、3.21、3.32、3.33、3.36、3.43 Chapter 4 4.3、4.9、4.22、4.24、4.59、4.62 Chapter 5 5.5、5.20、5.27 基本概念 凸优化:优化...

强化学习课程笔记:PPO、Q-Learning、Actor + Critic、Sparse Reward、IRL

Introduction Two Learning Modes 强化学习 (Reinforcement Learning): 机器与环境交互 机器从环境中获得奖励,从而知道其表现的好坏 示范学习 (Learning by demonstration): 也被称为模仿学习 (imitation learning) 和学徒式学...

PRML 学习笔记(附录)- 变分法 (Calculus of Variations)

一、泛函 我们最常接触的函数 $y(x)$ ,以数值 $x$ 为输入,以数值 $y(x)$ 为输出。 在此基础上,我们可将这个概念进行扩展,定义泛函(functional) $F[y]$ ,其输入为函数 $y(x)$ ,输出为数值 $F[y]$ 。 举个例子, $y(x)$ 表示二维平面中经过 $(x_1,y_1),(x_2,y_2)$ 两点的任意函数,而 $F[...

PRML 学习笔记(三)- 线性回归模型 (Linear Models for Regression)

三、线性回归模型 (Linear Models for Regression) 3.1 线性基函数模型 (Linear Basis Function Models) $$ y(\mathbf{x}, \mathbf{w})=w_{0}+\sum_{j=1}^{M-1} w_{j} \phi_{j}(\mathbf{x}) $$ 其中 $\phi_j(x)$ 是基函数 (basi...

PRML 学习笔记(二)- 概率分布 (Probability Distributions)

二、概率分布 (Probability Distributions) 参数方法 (Parametric method): 预先假设数据服从一个特定的分布 非参数方法 (Nonparametric method): 数据的分布依赖于数据集的大小,且仅有控制模型复杂度的参数 共轭先验 (Conjugate prior): 使后验分布具有与先验分布相同的函数形式,...

PRML 学习笔记(一)- 介绍 (Introduction)

一、介绍 (Introduction) 本章目的:介绍一些重要概念 模式识别的核心: 使用计算机算法,自动化地发现数据中的规律 (the automatic discovery of regularities in data) 利用这些规律去完成某些任务,例如数据分类 不同领域间关系: 泛化 (generalization):...

高等数学相关知识点整理

一、积分坐标变换 二、莱布尼兹积分法则 (Leibniz Integral Rule) 三、常见无穷级数 $\sum\limits_{n=1}^{\infty} \displaystyle\frac{1}{n}$ $\sum\limits_{n=1}^{\infty} \displaystyle\frac{1}{n^2}$ 四、泰勒展开式 $$ ...

概率论:高斯分布、中心极限定理、伯努利分布、二项分布

一、高斯分布 1.1 一元高斯分布 $x\in \mathbb{R}$ $p(x)=\displaystyle\frac{1}{\sqrt{2\pi}\sigma}exp[-\displaystyle\frac{1}{2}(\displaystyle\frac{x-\mu}{\sigma})^2]$ 1.2 多元高斯分布 $...