百川瑜伽培训机构学校网站建设 - 专业的瑜伽培训机构学校网站建设

资讯热点
影响推荐系统效果5因素

发布时间:2023-1-31 分类: 电商动态

影响推荐系统的因素有哪些?文章总结了五个要素并进行了总结。

在网站或应用程序中,推荐系统通常与整个大型系统的多个方面交互。推荐系统本身有许多组件。与整个系统的整体环境一起,有许多因素会影响整合。推荐系统的最终效果是好还是坏。这里的效果是指整体效果,包括准确性,回忆,多样性等指标,没有特别的区别。在这里,我们尝试讨论一些主要因素。应该指出的是,并非所有这些因素都可以控制,但了解它们对我们开发和优化系统的作用非常有用。

首先,用户因素

与需要面向用户和广告商的广告系统不同,推荐系统只有一个服务对象,即用户,因此用户的因素将极大地影响系统的效果。具体而言,系统中新用户与旧用户的比率可以说是对效果影响最大的因素之一。大家都知道推荐系统高度依赖于用户行为,对于没有行为或行为很少的新用户来说,效果肯定不太好,所以新用户在整个系统中的比例越高,整体性能越好系统会更糟。

这是一个典型的推荐系统,不能自行控制,但需要整个系统协同工作才能解决。这个问题有两种解决方案:一种是尝试优化推荐系统的冷启动算法,这种方法肯定会有效,但上限也很低;另一种方法是在平台上尝试新用户将用户转换为旧用户,这意味着尝试让他们与平台进行交互并生成超出冷启动阶段的行为。与这两种方法相比,第二种效果可能更好。这主要是因为冷启动算法的优化空间有限,并且变为“热”。在用户之后,可以使用各种优化策略。它派上了用场。这也是一个可以在各种场景中借用的想法:将未知问题转化为已知问题而不是创建新问题。

二,产品设计因素

所谓的产品设计因素是指要向用户显示的推荐项目的位置和形式。如果推荐算法是一个人的内在,那么产品设计就是一个人的面孔。在当前看脸的时代,它看起来是否好看将极大地影响算法能量的释放。影响效果的最常见外部因素包括但不限于:

图片的质量。互联网已进入阅读图片的时代。无论商品,信息等任何项目的推荐如何,图片的吸引力必须大于没有图片的吸引力。在图像的情况下,图像的大小和清晰度将对用户的兴趣产生重大影响。除了尺寸和清晰度的基本质量之外,图像本身传达的信息质量也很关键。例如,对于产品的图片,如果产品的主要信息和用户关注的内容不能在图片中显示,则用户点击的概率将大大降低。毕竟,每个人都很忙,付出代价。因此,C2C市场专注于用户自己拍摄的照片尤为重要。指导用户拍摄高质量的产品图片尤为重要。 Airbnb向房东自拍照片的故事足以证明其重要性和重要性。 。

主题的吸引力程度。除了图片,以文本形式描述的主题也非常重要。毕竟,文本仍然是人们获取信息的主要方式。在转移平台上,会有一些懒惰的用户只在文字描述中写出类似的信息,比如“图片,私聊”,可以想象这种描述相对较弱,也会让人觉得卖家不是非常关注这个产品,所以除非你的商品在其他方面很有竞争力,否则很难转换。

重要的是吸引人们的主题,但它太“头重脚轻”,只关注主题的质量,但忽略了项目本身的质量,但它会适得其反,导致用户不喜欢。最典型的例子是现在充斥着屏幕的各种标题性派对文章。为了吸引用户的点击次数,他们对标题大做文章,但在用户点击后,他们发现文章质量低或文字不正确。这将对平台的可信度产生很大的负面影响。这是杀鸡和取蛋的做法。

因此,在文字描述方面,我们应该尽力提供信息,但我们不能偏离事实,为简单的点击率牺牲平台的长期发展。

是否公开了关键信息。所谓的关键信息是指可能影响或影响用户点击和转化的信息。除了上述图片和文字描述之外,还有一些具有特征的关键信息,例如销售量,评论数量等。部分原因是信息本身会影响用户的转化。另一方面,推荐算法可以在召回或排序期间使用该信息。然后,在一定程度上呈现信息作为推荐解释的函数。

有干扰信息吗?这指的是模块周围是否存在影响用户注意力的其他内容,以及用户是否可以专注于浏览推荐模块。放置在推荐位置旁边的典型的诸如明亮广告或促销/活动横幅等将对用户的注意力产生不同程度的影响,这将影响转换。如果推荐系统是您业务的重要组成部分,那么您应该给它足够的空间和位置以供专用,并尽量不要将其与其他内容混合使用。在这个复杂的世界中,很多时候,少即是多。

三,数据因素

推荐系统是典型的算法驱动系统,如果算法是系统的骨架,那么数据就是系统的血液。如果数据的质量和数量不够,任何算法的效果都会受到影响。数据量不足易于理解,数据量充足。它通常与整个网站或APP的发展有关。这不是我们可以控制的东西,但数据的质量是不同的。它可以通过人类的努力得到加强。 。因此,这里简要讨论数据质量中常见的可能问题。

缺少关键信息。缺少信息是数据质量中最大的问题之一,尤其是影响算法策略或测序模型的关键信息。例如,曝光数据中没有特定的曝光位置信息,并且没有诸如用户留在日志中的持续时间等信息,这直接导致算法效果的降低,从而影响最终效果。这些问题的出现通常是由于在初始数据系统构建期间没有与算法相关的人员参与,导致这种相关信息的设计。但是,只要在缺少发现后尽快添加这些问题,这些问题就能得到很好的解决。

数据设计很差且使用起来很复杂。还有一种情况是关键信息存在,没有严重缺失,但数据结构或表结构设计不够合理,以便获取一条信息来连接多个表,或者通过复杂的算术逻辑。在这种情况下,尽管可以获得关键信息,但由于采购成本高,很可能工程实现会受到不同程度的损害,导致数据质量受损并影响最终结果。这个问题的解决方案,从最大的想法,是做与算法相关的数据仓库/数据集市建设,使数据的获取,变更和维护尽可能简单,降低数据建设的成本,从而改善数据。使用效率。

推荐系统使用的数据通常是整个网站数据系统的子集,因此控制这部分数据质量需要推荐系统的开发人员和数据系统的开发人员共同努力,以确保数据的可用性和易用性。使用性。

四,算法策略因素

话虽如此,我终于谈到了推荐系统的核心算法策略部分。算法策略对效果的影响是毋庸置疑的,但其影响也是多方面的。具体地,该算法可以从以下方面影响效果。

算法复杂度影响准确性算法的复杂性越高,整体精度越高,无论使用何种特定算法,这种总体趋势总体上都是正确的。例如,简单的排序模型可能不是非线性模型。在非线性特征之后,连续值特征可能无法离散化。关于计时问题,vanilla rnn不做LSTM。在确保数据质量的前提下,使用高复杂度的模型是提高效益的一种方法。当然,前提是该算法应该与业务兼容,并且复杂性不会复杂。

算法的稳定性会影响效果的稳定性。我们知道机器学习模型中有一类模型具有低偏差和高方差。这里的高方差指的是训练的模型,不同数据集的性能差异将更大。还有另一个名称过于贴合。如果数据量足够大,加上合理的正则化,则过度拟合更容易避免。因此,在数据不足的情况下更容易出现问题。在这种情况下,应选择简单的模型,如线性模型,以确保结果的稳定性,甚至可以考虑基于规则的算法以确保稳定性。

为什么要注意结果的稳定性?这里的原因类似于学习算法设计分析时我们注意的算法的平均复杂度。虽然我们希望得到一个非常准确的模型,但我们希望这个模型在网上运行时能够保持稳定。预计今天不会有效,明天效果会很差。在实际使用中,无论精度如何,都能保证稳定性。

五,工程结构因素

最后,让我们简要谈谈工程架构。无论哪种数据,什么样的算法,最终需要在具体项目登陆前提交给用户,那么在此登陆过程中选择的具体工程结构也会对效果产生影响。

效果耗时的效果。界面的响应速度无疑是工程架构对用户最直接的体现。缓慢的反应肯定会导致用户的不耐烦,并可能直接丢失。为了提高速度,通常有几种类型的方法,一种是优化算法并减少不必要的计算;二是选择一种简单的算法;第三种是使用缓存的想法,只在在线部分执行尽可能少的计算,其余的计算在离线或近线水平完成,减少了实时计算的负担。

建筑设计对故障排除的影响。老司机知道只能修理的汽车不能上路。同样,推荐系统的整体架构设计应该对问题友好,并且当出现问题或需要验证猜测时可以快速定位在系统中,而不是当前的调试信息在线,导致要拖动的故障排除过程。长。一个优秀的工程师在设计系统时会为自己留下一条好路,而不是在出现问题时拥抱。

建筑设计对迭代速度的影响。除了响应速度更为肤浅的影响之外,整个架构支持快速策略迭代的能力对影响产生了重大影响。如果整体架构膨胀,模块分离不明确,底层逻辑缺乏适当的抽象,数据和策略的迭代无法快速执行。每次迭代都必须经历一个非常复杂的过程,并且无法保证正确性。这些问题将减缓系统的发展并最终影响效果。

总结

除了上面提到的因素之外,还有许多细节会影响推荐系统的最终效果。因此,当我们改善推荐系统的效果时,眼睛不仅应该盯着一个地方,而且必须具有一定的整体视野,并且能够在角度找到当前对效果最有影响的效果,然后执行目标优化。对于那些暂时无法改变的因素,我们也必须了解它们并在适当的时候进行干预。

端。

作者:张相对

« 损失财报:新东方在线曲折的中盘战 | 年终奖首选:人人,铜福克,陆金锁,艾千金 »