您好,欢迎访问这里是您的网站名称官网!
常见问答
联系我们
大发-大发娱乐空调设备工厂站
邮箱:admin@youweb.com
电话:400-123-4567
地址:广东省广州市天河区88号
当前位置: 首页 > 新闻动态 > 常见问答

常见问答

多目标优化,目标之间必须矛盾么?
发布时间:2024-04-15 12:38:32浏览次数:

ヾ(●′?`●)?哇~终于有人问这个问题了。我曾经也思考了很久。

首先给出结论: 对于一个多目标问题,其实并不强调多目标必须矛盾。

但是,一个多目标问题,如果目标之间不矛盾,那么可以非常简单地通过分解、转化等操作变成对一组单目标问题的求解。显然失去了研究价值。因此在当前,学术研究方面方面,都是默认需要求解的多目标问题是可不可分解的,彼此矛盾的(即存在非支配前沿,而不是单独的最优解。)

(时间晚了,要睡了,有时间再展开解释。)

从工程的角度出发,如果多目标之间任意两个目标存在很强的正相关性,那我们都会只取一个以简化问题,目标太多会导致Pareto前沿解集指数级增大而极大影响多目标优化算法的寻优效果。

不需要,多目标的目标主要看业务需要。

对推荐场景来说,好的生态,需要具备准确性、多样性、新颖性、惊喜性等多方面效果。(如何衡量一个推荐系统的好坏在《婷播播:什么是好的推荐,重新理解AUC》也提到过一些。)要让推荐系统同时具备上述的多种效果,单目标很难做到。

在单目标的情况下,很可能出现某一方面效果还可以,而其它方面效果很差,实际情况往往是某一方面的效果也很难做好。比如以点击率为单目标建模进行推荐,则往往容易准确性有一定保证,而多样性、新颖性等效果差,甚至准确性也难以做好,因为点击率高的内容,存在标题党或者封面党的问题,这样的内容用户很可能会点击,但点击后会很快退出,因为内容并不是用户真正感兴趣的。

推荐系统要达到推荐准确的效果,推荐用户真正感兴趣的内容,单目标也很难做到。用户不同的行为背后有不同的动机,代表了不同维度的兴趣出发点。用户点击表示有意愿消费,用户停留一定时长表示有兴趣,用户评论表示愿意和内容生产者产生联系等,一项内容如果能引发用户的正向行为越多,那用户对这项内容的兴趣也越高。但大多数用户的正向行为项数量是一两项,不会很多,因此当只使用单目标时,则很容易导致触发用户某种行为的内容占主导,而忽略了用户背后真实的兴趣,也不利于推荐的生态建设。

在具体场景中,用户的正向行为丰富多样,而一些正向行为之间存在一定的此消彼长的关系,比如当用户点关注后页面会进入到作者主页,则关注后用户则停止了对内容的时长消费,因此关注行为和时长之间存在拉扯。这时如果以其中一个为单目标进行推荐,则会对另一个目标有损,但推荐追求的是“既要又要”,只有多方面都兼顾到了,推荐系统才可能向一个好的生态方向发展,因此需要多目标来进行建模,从而尽可能地综合用户的多种兴趣维度,达到好的推荐效果。

多目标的应用,主要解决单目标的几个问题:(1) 单目标存在无法识别用户多维度兴趣问题,有误导风险;(2) 不同单目标之间存在“此消彼长”的关系,难以兼顾。在业务迭代过程中,多目标可以帮助推荐系统不断完善。

深度学习涉及的应用领域有多个multi相关的概念,除了多目标multi-task,还包括多域multi-domain,多标签multi-label,多类别multi-class等,虽然都包含multi,但具体含义区别很大。

multi-task

多目标multi-task是我们这个主题聚焦的问题,顾名思义,multi-task是学习多个任务,有多个分类或回归目标。不同任务可以有不同的样本或特征输入,也可以基于相同的样本和特征。例如对一个样本,可以有是否点击、是否评论、是否关注、停留时长等多个建模目标,根据不同的目标定义,既可以是分类任务,也可以是回归任务。

multi-domain

多域muti-domain表示对不同域的样本进行建模,在推荐领域往往对应不同场景的样本。例如在热门内容中会插入广告,那么内容和广告就形成了两个域,而用户在消费的时候,由于广告是接到某个内容后出的,两者存在一定的上下文关联,因此在不同域进行建模时,可能会使用其它域的数据来更好捕捉用户兴趣。再比比如app不同的入口,也是不同的域,如图1左边所示的推荐、关注、直播等多个tab,就是多个域。

图1左边表示的是multi-domain,task是是相同的,右边表示的是一个domain中进行不同task的建模,也就是multi-task。

图1 multi-domain和multi-task

multi-label

多标签multi-label表示对样本进行多个维度的分类,是multi-task的一种,但区别在于,multi-label是基于相同的样本和特征进行建模,multi-task可以每个任务对应一个模型,每个模型有各自的样本和特征,最后对不同task预估进行融合,得到最终结果。同样以推荐场景为例,可以有是否点击、是否评论、是否关注等多个label,当建模过程是基于同样的样本和特征得到多种label时,这时候既可以认为是multi-label,也可以认为是multi-task,如图2(b)所示;而当建模过程不同label对应不同的样本或特征进行建模的,则是multi-task而不是multi-label,如图2(a)所示。

图2 multi-label和multi-task

multi-class

多分类multi-class表示分类结果有多种选项,不同于二分类只有两种可能。比如对一个人的年龄进行多分类问题,则分类结果可以是[少年、青年、中年、老年]几种类别中的一种。

多目标的建模和单目标大体类似,两者本质都是在解空间里找最优解,只是多目标需要考虑的目标更多,比单目标找最优解更复杂。多目标基于自身的特点,在模型结构、损失函数等方向上发展出一些方法。

3.2.1 task融合

多目标中每个task具体定义,需要根据业务需要来制定。对一个推荐场景来说,除了考虑ctr,还会考虑用户消费时长,用户和内容生产者的互动行为,包括点赞、评论、转发等。

multi-task建模后一般需要task融合,对不同的task预估综合考虑,得到最终结果。task融合依赖于融合公式,对融合公式中的参数调整可以直接影响不同任务对最终结果影响的重要程度。在实际落地时,需要根据具体业务的特点和需要对融合公式设计和调整。

3.2.2 模型设计思路

multi-task的模型设计不断被改进,其核心在于平衡多种任务的共性和特性。

早期的多目标采用的是多个目标单独建模的方法,也就是图2(a)的方法,这种方法简单,但存在以下问题:(1) 计算量大,每个task的网络结构基本相同,都需要经过一遍网络计算,重复性操作多;(2) 有的目标样本稀疏,模型预估准确性低;(3) 不同task基于不同的表征计算,相当于在不同标准进行预估,增加后续多task预估的融合难度。因此衍生出基于同一个特征空间的模型结构设计,如图3所示,所有目标的预估是在相同的特征空间下进行。

图3(a)所示的模型结构为hard参数共享,即所有任务共享隐藏层,最大程度地保留了任务之间的共性,而各个任务的特性则没有得到重视。soft参数共享的网络结构如图3(b)所示,每个任务有自己对应的参数,不同任务之间的参数通过一些约束,使其在训练阶段受到一些限制,这种方法突出了每个任务的特性,而减小了任务之间的共性的重要度,同时参数量也比较大。

后续multi-task的模型结构的改进思路,是结合hard参数共享和soft参数共享这两种结构的优点,使模型在学到所有task的共性的同时也学到其特性,从而提高推荐准确性。

图3 multi-task模型结构设计

多目标的实现包括模型结构、损失函数等一些方向,下一篇将介绍多目标的一些典型模型结构。




推荐系列文章:

推荐模型结构-特征交叉

推荐基础知识点

工具

工作相关的内容会更新在【播播笔记】公众号,欢迎关注

生活的思考和记录会更新在【吾之】公众号,欢迎关注

吾之系列文章:

金豺优化算法(Golden jackal optimization,GJO)由Nitish Chopra 和 Muhammad Mohsin Ansari 于2022年提出,该算法模拟了金豺狩猎行为,算法新颖,快速高效。

金豺是一种中型的体型偏瘦的豺狼,体长60-132厘米,站立时高约38-50厘米,尾巴长约20-30厘米,体重8-10千克,肩高约40厘米。头部,耳朵,两侧及四肢具有红褐色的色调,有长而尖的口吻和相对较短的尾巴,蓬松的尾巴上毛比较长。通常身体的皮毛颜色是黄色至淡金色、近乎白色的淡黄或者棕色,随着分布环境和季节的不同而不同。一般雨季颜色深,旱季颜色浅。也有个体是黑色的,但很稀少。共有13个亚种。金豺是适应性极强的社会性高度发达的动物,合作狩猎是它们最重要的工作,成功率大约是个体狩猎的三倍。群落中的金豺会用把半消化的肉块放到胃里然后呕出来给小金豺食用。领土范围由尿液来标志,大约2-3公里,群体成员共同保卫领土。虽然金豺是出色的猎人,但是不会捕猎体型较大的动物。金豺会尾随狮子,捡食它们的剩饭。胡狼还有储存食物的习惯。群落中互助行为的存在对整个群落,尤其是小金豺的生存至关重要。

金豺的食物来源广泛,也是腐肉和垃圾清道夫,修长的身体和长长的腿,让这种豺狼在长途旅行中很容易寻找食物,它们通常迅速吞噬食物,并运回窝中吐出来喂食伴侣或幼狼,为减少其他食肉动物盗窃的风险。会以家族为单位合作捕猎,有时剩余的食物会找地方被掩埋。

金豺优化算法包含两个阶段:

由于豺狼的本性,它们知道如何感知和跟踪猎物,但偶尔猎物不能轻易被抓住并逃脱。因此,豺狼等待并寻找其他猎物。狩猎由雄性豺领。母豺跟随雄豺。

当猎物被豺狼骚扰时,它的闪避能量会减少,然后豺狼对会包围前一阶段检测到的猎物。封闭后,它们扑向猎物并吞噬它。雄性和雌性豺狼一起狩猎的行为在数学上建模如下:

金豺位置更新:

多目标金豺优化算法(Multiple Objective Golden jackal optimization,MOGJO)由金豺优化算法的优良策略与多目标优化思想融合而成。为了验证所提的MOGJO的有效性,将其在46个多目标测试函数(ZDT1、ZDT2、ZDT3、ZDT4、ZDT6、DTLZ1-DTLZ7、WFG1-WFG10、UF1-UF10、CF1-CF10、Kursawe、Poloni、Viennet2、Viennet3)以及1个工程应用(盘式制动器设计)上实验,并采用IGD、GD、HV、SP进行指标评价。

部分实验结果如下:

wfg3:

wfg4:

wfg5:

wfg6:

wfg7:

DTLZ5:

Viennet2:

盘式制动器设计:



平台注册入口