NeurIPS 2020 | 马尔科夫链上的矩阵Chernoff Bound和它在共现矩阵中应用

导读:在 NeurIPS 2020 上,清华大学,微软雷德蒙德研究院,腾讯量子实验室和佐治亚理工的团队证明了一个马尔科夫链上的矩阵 Chernoff Bound,并介绍了它在共现矩阵收敛速度分析中应用。这项研究为分析马尔科夫链上的随机矩阵均值的特征值提供了有力的工具,被收录为 NeurIPS2020 的 poster。

论文名称: A MatrixChernoff Bound for Markov Chains and Its Application to Co-occurrence Matrices

Chernoff Bound 是一个重要的概率论工具,它刻画了样本均值的尾数概率随着样本数量增加而指数衰减的现象,在计算机科学的各个领域都有应用。传统的 Chernoff Bound 只能处理独立的标量随机变量,如下所示:
Garg 等人在 STOC 18 的工作将 Chernoff Bound 扩展到了马尔科夫相关的矩阵随机变量上。受到这个工作的启发,我们开始研究马尔科夫链上随机矩阵的 Chernoff Bound。我们证明了,给定一个有限状态马尔科夫链和一个把马尔科夫链的状态映射到埃尔米特(Hermitian)矩阵的函数。当我们在这个马尔科夫链上进行采样,并且计算采样得到的矩阵的均值时。矩阵均值的最大最小特征值的尾数概率依然随着样本数量增加而指数衰减。
我们还发现,这个定理可以用来刻画机器学习中一个重要统计量——共现矩阵的收敛行为。假设我们从一个马尔科夫链中采样了一个序列,并且要在这个序列上通过一个滑动窗口来估计窗口内元素的共现(代表性的算法有 NLP 中的 Word2vec 和图学习中的 DeepWalk),我们想研究这一类统计量的采样复杂度。下图给出了一个计算序列 1-2-3-2-3-1 上的共现矩阵的例子:
我们发现这一类统计量的收敛行为可以完美地被上述马尔科夫链上的矩阵 Chernoff Bound 刻画。具体来说,我们证明了为了估计一个准确的马尔科夫链状态共现矩阵,需要在马尔科夫链上进行 O(t(logt + logn))步采样,其中 t 和 n 分别是马尔科夫链的混合时间(Mixing Time)和状态数量。我们还在三个人工数据和一个真实数据及上验证了这一理论。在 log-log scale 图中可以清楚的看到随着序列长度的增加误差指数收敛的现象。
(0)

相关推荐

  • 机器学习入门之隐马尔科夫模型

    一个生活中的例子 假设你想捉摸老板每天的心情是好是坏,以此选择一个合适的汇报时机.你每天中午都会和老板一起吃食堂,而食堂午餐只能从川菜.粤菜.东北菜和淮扬菜四种中选择一种.你感觉老板每天心情和午餐吃什 ...

  • 【NLP】用于语音识别、分词的隐马尔科夫模型HMM

    大家好,今天介绍自然语言处理中经典的隐马尔科夫模型(HMM).HMM早期在语音识别.分词等序列标注问题中有着广泛的应用. 了解HMM的基础原理以及应用,对于了解NLP处理问题的基本思想和技术发展脉络有 ...

  • 上海交通大学朱晨曦博士特稿:采用改进马尔科夫链蒙特卡洛法的风电功率序列建模

    武汉加油 风雨同行 共克时艰 点击下面标题,了解通知详情 第九届电工技术前沿问题学术论坛征文通知 团队介绍 朱晨曦 博士研究生,研究方向为可再生能源并网.主动配电网运行优化及配电网可靠性评估. 张焰 ...

  • 基于聚类算法的供水管网爆管识别技术

    爆管是一个困扰供水行业的典型问题,其往往伴随着短时的大水量漏失,不仅造成水资源的严重浪费,同时导致的压力下降也会影响正常供水.更有研究与实践经验表明,爆管能够造成水质恶化,城市中发生的严重爆管事故甚至 ...

  • 清晰易懂的马尔科夫链原理介绍

    马尔科夫链是一种非常常见且相对简单的统计随机过程,从文本生成到金融建模,它们在许多不同领域都得到了应用.马尔科夫链在概念上非常直观且易于实现,因为它们不需要使用任何高级的数学概念,是一种概率建模和数据 ...

  • MCMC(二):马尔科夫链原理小结

    作者:刘建平Pinard 链接:https://www.cnblogs.com/pinard/category/894690.html 编辑:石头 在MCMC(一)蒙特卡罗方法中,我们讲到了如何用蒙特 ...

  • R语言BUGS/JAGS贝叶斯分析: 马尔科夫链蒙特卡洛方法(MCMC)采样

    马尔科夫链蒙特卡洛方法 在许多情况下,我们没有足够的计算能力评估空间中所有n维像素的后验概率 .在这些情况下,我们倾向于利用称为Markov-Chain Monte Carlo 算法的程序 .此方法使 ...

  • 数学之美——隐含马尔科夫模型

    这是令人兴奋的一个章节. 因为科研中总是充满了马尔科夫. 隐含马尔科夫模型也是机器学习的主要工具之一. 引用这句话的目的也是为了证明这一章节的重要性. 引例: 在通信模型中,信息源发出信号s1,s2, ...

  • 初学者也能看懂的隐马尔科夫模型介绍

    隐马尔科夫模型是(hidden Markov model,HMM)是可用于标注问题的统计学习模型,描述由隐藏的马尔科夫链随机生成观测序列的过程. 隐马尔可夫模型(hidden Markov model ...

  • 俄裔美国女画家塔吉亚娜•马尔科夫采娃的极简画(二)|老小孩讲述

    [转载]俄裔美国女画家塔吉亚娜·马尔科夫采娃的极简画(二) 字体调整: 大 | 中 | 小 发表于2019年09月07号 10点 阅读 2321 评论5 点赞8举报文章 ©著作权归作者所有

  • 外国爱情诗赏析《在这个小城里》〔俄—苏〕 马尔科夫

    [俄-苏] 马尔科夫 在这个小城里,我是一个过客. 我离开这里整整十五年. 我把东西放在寄存处, 天刚蒙蒙亮,我就上了大街. 我勉强地认出了那些地方: 孩子们做骑兵游戏的 草丛繁茂的山谷, 如今已是人 ...

  • 外国爱情诗赏析《星》〔俄—苏〕 马尔科夫

    [俄-苏] 马尔科夫 高空中闪耀着一颗星, 尽管某些人看不见她, 就算任什么时候它也不会被发现, 但她并不为此而抱撼. 莫非她 冷漠地对待了 瞬间狂喜的 或者是冰冷的目光? 她燃烧着, 她生活着, 别 ...