温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
ADMM
迭代法
PageRank
问题
求解
吴文军
收稿日期:2022 09 26基金项目:国家自然科学基金青年基金(11901024);福建省自然科学基金面上资助项目(2020J01166,2021J01661)作者简介:吴文军(1998),男,江西省抚州市人,福建师范大学数学与统计学院硕士研究生,主要从事数值代数研究通信作者:唐嘉(1983),女,湖南省湘潭市人,理学博士,福建师范大学数学与统计学院副教授,硕士生导师,主要从事数值代数及其应用研究基于 ADMM 迭代法的 Pageank 问题的求解吴文军,唐嘉(福建师范大学 数学与统计学院,福建 福州 350007)摘要:针对 Pageank 问题导出的线性方程组,首先对方程组的系数矩阵进行了 LU 分解,提出了一种基于交替方向乘子法(ADMM)形式的迭代算法,用于求解该线性方程组的最小二乘解;然后,证明了所提出的算法的收敛性;最后,数值结果表明了该算法的可行性关键词:Pageank;ADMM;LU 分解中图分类号:O242 2文献标识码:A文章编号:1673 1670(2023)02 0008 060引言随着互联网及其技术的蓬勃发展,网络搜索引擎已经成为检索信息最受欢迎的工具 谷歌的 Pag-eank 算法成为该领域重要的网页排名算法,它通过网页的链接结构来量化每个页面的重要性,在最近几年引起了相当大的关注1 479由谷歌设计的 Pageank 算法2 是一个网页内容中立的排序函数,被应用于许多领域,如 Web 的超链接结构和用马尔可夫链建模的图,神经和社会网络分析等3 Pageank 问题就是求解 Google 矩阵 A 的首特征值 1 所对应的特征向量,即 Pageank 向量 x满足Ax=x(1)其中 A=P+(1 )veT,(0,1)是阻尼因子,v是元素和为 1 的向量,e=(1,1,1)T,P 是列随机矩阵x 是一个非负向量,满足x1=1 又因为x1=1,所以式(1)的 Pageank 问题可以改写为线性方程(I P)x=(1 )v(2)其中 In n是一个单位矩阵,且 eTx=1 对于求解线性系统(2),学者们提出了很多迭代方法 如内外迭代(inner-outer,IO)法4 353、幂内外(PIO)迭代法5 23、广义内外(GIO)迭代方法1 483和多步幂内外(MPIO)迭代方法6 91 近年来并没有出现矩阵分解来求解 Pageank 问题,对此笔者考虑利用LU 分解,之后将问题转化为最小二乘问题来求解,对最 小 二 乘 问 题 利 用 的 是 交 替 方 向 乘 子 法(ADMM)来求解本文的结构如下:在第 1 节中,阐述几个重要的定义;在第 2 节中,简要介绍交替方向乘子法(ADMM)和所提出的算法;第 3 节详细证明所提出算法的收敛性;最后,在第 4 节中给出几个数值例子来说明该方法的可行性1预备知识定义 17 51对任意的 x,yD,0,1,有x+(1 )yD,则称 D 为凸集定义 27 54对任意的 x,yn,有 f(y)f(x)+f(x),y x,则称连续可微函数 fn 为在 n上的凸函数定义 37 56对任意的 x,yn,0,有f(y)f(x)+f(x),y x)+2y x22,则称连续可微函数 fn 为在 n上的强凸函数注 18 设 fDn 是二次连续可微函数,f 是强凸函数当且仅当2f(x)I 是对称半正定的 其中 0,2f(x)是 f(x)的 Hessian 阵注 27 57设 fDn 是强凸函数,对任意的 x,yD,0,有以下两个不等式成立:第 38 卷第 2 期2023 年 4 月平顶山学院学报Journal of Pingdingshan UniversityVol 38 No 2Apr 2023f(x)f(y)f(x),xy+2x y22,f(x)f(y),x y x y222改进的交替方向乘子法2 1ADMM交替方向乘子法(ADMM)由 Gabay、Mercier、Glowinski 和 Marrocco 于 1970 年首次提出 该方法具有可分解性,与对偶分解法非常相似,并具有类似于乘子法的收敛性 ADMM 在分布式计算中的简单实现非常适合于大规模凸优化问题9 4 其最显著的优点是能够对变量进行分离处理,并且充分利用目标函数的可分离结构,求解收敛速度快,易于工程实现1983 年,Gabay、Glowinski 和 Tallec10 展示了ADMM 的全局收敛性 Yang Junfeng 和 Yuan Xi-aoming 在文献 11 中证明了 ADMM 收敛于两个迭代步的不精确解,因而适用于迭代方法 此外,最近还发现,当其中有一个函数是非凸时,文献 12 讨论了 ADMM 算法的收敛性 贾泽慧等13 证明了一类非凸优化问题 ADMM 算法的全局收敛性2 2算法将 Pageank 问题转化为方程组(2),对于其系数矩阵 I P 是非奇异的 M-矩阵的情形,可对I P 进行 LU 分解,之后将其转化为如下的最小二乘解问题:minx12LUx (1 )v22(3)令 Ux=y,则式(3)的等价形式如下:minx,y12Ly (1 )v22,s t Ux y=0(4)问题(4)的增广拉格朗日函数为L(x,y,)=12Ly (1 )v22T(Ux y)+2Ux y22(5)其中 n,0 是惩罚参数计算增广拉格朗日函数(5)的平稳点,可得xL(x,y,)=UT(Ux y)UT=0UTUx=UT(+y),(6)yL(x,y,)=LTLy (1 )LTv+y Ux=0(LTL+I)y=(1 )LTv +Ux (7)因为 0,所以矩阵 UTU 和 LTL+I 是对称正定的,故 x=(UTU)1UT(+y)和 y=(LTL+I)1(1 )LTv +Ux)是 L(x,y,)的稳定点 因此,利用 ADMM 算法求解问题(5),其 ADMM的迭代格式9 14为xk+1=arg min Lx(x,yk,k),(8)yk+1=arg min Ly(xk+1,y,k),(9)k+1=k(Uxk+1 yk+1)(10)根据式(6)和式(7),可以将 ADMM 的迭代更新为式(11):xk+1=(UTU)1UT(k+yk),yk+1=(LTL+I)1(1 )LTv k+Uxk+1),k+1=k(Uxk+1 yk+1)(11)算法 1(用于求解 Pageank 问题(2)的LUADMM 迭代法)步骤一给定初始的向量 v,x0,y0,矩阵 P,迭代收敛精度,参数,令 k=0步骤二对 I P 进行 LU 分解,得到 L 和 U矩阵步骤三计算xk+1=(UTU)1UT(k+yk),yk+1=(LTL+I)1(1 )LTv k+Uxk+1),k+1=k(Uxk+1 yk+1)步骤四若 Pxk+1+(1 )v xk+12,x*=xk+1xk+11,结束 否则,k=k+1,回到步骤三3算法的全局收敛性分析利用以下的引理和定理,讨论算法的收敛性引理 1增广拉格朗日函数(5)是关于 x 和 y的强凸函数,其参数为 min(UTU)和 min(LTL),同时满足L(x+x,y,)L(x,y,)xTxL(x,y,)+min(UTU)2x2,(12)L(x,y+y,)L(x,y,)yTyL(x,y,)+min(LTL)2y2(13)证明根据注 1 和 2,需证明增广拉格朗日函数的 Hessian 阵是关于 x 和 y 对称半正定的,xL(x,y,)=UT(Ux y)UT2xL(x,y,L)=UTU,(14)yL(x,y,)=LTLy (1 )LTv+y Ux2yL(x,y,)=LTL+I(15)由式(14)和式(15)可得2xL(x,y,)min(UTU)I=9第 2 期吴文军,唐嘉:基于 ADMM 迭代法的 Pageank 问题的求解(UTU min(UTU)I),(16)2yL(x,y,)min(LTL)I=LTL min(LTL)I+I(17)因为 I P 是非奇异的 M-矩阵,L 和 U 矩阵是经过 LU 分解得到的,所以 L 和 U 矩阵是可逆的,所以 UTU 是对称正定的,UTU min(UTU)I 是对称半正定矩阵 因此,对于 0,增广拉格朗日函数是关于 x 的强凸函数,其参数为 min(UTU)同样地,LTL 是对称正定的,LTL min(LTL)I 是对称半正定矩阵 显然,对于 0,LTL min(LTL)I+I 是对称半正定的,因此 L 是关于 y 的强凸函数,其参数为 min(LTL)定理 1若存在 x*,y*,*n使得 Ux*y*=0,并且对于任意的 x,yn,(x*,y*)是L(x,y,)上的最小点,则(x*,y*)是式(4)的最优解证明由约束条件 Ux y=0,可得 Ux y22=0,T(Ux y)=0 因此问题(4)可以看成min(x,y),Ux=y12Ly (1 )v22=min(x,y),Ux=y12Ly (1 )v22T(Ux y)+2Ux y2=min(x,y),Ux=yL(x,y,)(18)接下来,忽略约束条件 Ux=y 来扩大 L(x,y,*)最小值的集合,因此不等式(19)是成立的:min(x,y),Ux=yL(x,y,*)min(x,y)L(x,y,*)(19)此外,由于对于任意的 x,y,n,(x*,y*)是 L(x,y,)上的最小点,所以下面等式成立:min(x,y),Ux=yL(x,y,*)=12Ly*(1 )v22T(Ux y)+2Ux y22(20)最后,由 Ux*y*=0 和式(20),可知对任意的 x,yn,不等式(21)成立:min(x,y),Ux=y12Ly (1 )v2212Ly*(1 )v22(21)由于 Ux*y*=0,(x*,y*)是问题(4)的可行解,因此不等式(21)表明(x*,y*)是问题(4)的最优解此外,还需要考虑问题(4)和它的拉格朗日对偶问题(22):maxminx,yL(x,y,)(22)假设(x*,y*)是一个最优解,*是一个最优对偶解 现需要找到问题(5)的充分必要的最优性KKT 条件 显然,这两个问题的互补松弛和对偶可行性条件是需要同时满足的 此外,初始可行性和稳定条件如下初始可行性:Ux*y*=0;稳定条件:x12Ly (1 )v()22(x*,y*)=0=UT*,y12Ly (1 )()v(x*,y*)=LT(Ly*(1 )v)=*(23)因此 KKT 条件如下:UT*=0(24)引理 2若 Un n,x,y,n,0,则有2Ux y 1221222=2Ux y22 T(Ux y)证明2Ux y 1221222=2y Ux+1221222=2y Ux22+T(y Ux)+12221222=2Ux y22 T(Ux y)定理 2若 k 是有界序列,而且k=0k+1 k22,(25)则由算法生成的序列(xk,yk,k)的极限点满足KKT 最优性条件(24)证明由引理 1 可得,L 是关于 x 和 y 的强凸函数 令 1=min(UTU),2=min(LTL),可得L(xk,yk,k)L(xk+1,yk,k)(xk xk+1)T(xL(xk+1,yk,k)+12xk xk+1I22(26)由于 xk+1使得xL(x,y,)xk+1=0,可得L(xk,yk,k)L(xk+1,yk,k)12xk xk+122,(27)同理可得L(xk+1,yk,k)L(xk+1,yk+1,k)01平顶山学院学报2023 年22yk yk+122,(28)由式(11)可得 Uxk+1 yk+1=1(k+1k),所以L(xk+1,yk+1,k)L(xk+1,yk+1,k+1)=(k+1)T(Uxk+1 yk+1)(k)T(Uxk+1 yk+1)=1(k+1 k)22(29)通过式(27)、式(28)、式(29),可以得到L(xk,yk,k)L(xk+1,yk+1,k+1)=L(xk,yk,k)L(xk+1,yk,k)+L(xk+1,yk,k)L(xk+1,yk+1,k)+L(xk+1,yk+1,k)L(xk+1,yk+1,k+1)12xk xk+122