承接国内外服务器租用托管、定制开发、网站代运营、网站seo优化托管接单、网站代更新,新老站点皆可!!咨询QQ:3787320601

app上架市场后应考虑哪些问题?

管理员 2023-04-11 09:51:16 移动开发 57 ℃ 0 评论 4935字 收藏

app上架市场后应考虑哪些问题?

内容兴趣偏好标签是甚么?

简单来讲,就是分析用户喜欢看的文章类型,取得用户的兴趣偏好。在此基础上,个性化推荐用户内容,push推动,有效增进app活跃并延长用户生命周期。

简单地说,这件事实际上是两步:

一是对文章进行分类,俗称给文章贴标签。

其次,给用户贴上标签,即用户浏览了哪些类型的文章,相应地会得到自己的兴趣偏好标签。

那末在实际操作中真的那末简单吗?这两个看似简单的环节是怎么实现的?

一般有三种获得样本的方式:

一是人工标注文章,优点是准确,缺点是效力低,算法需要大量样本,本钱很高。

另外一种方法是通过一些开源网站提供的关键词进行模型训练,比如从搜狗词库获得。优点是本钱低,但缺点明显。由于区别的分类系统对部份分类的理解不一致,分类不够准确,后期需要大量的人力进行改正。

第三种方法是和一些信息类型的信息类型app合作,获得他们的文章和分类作为样本,比如今天的头条,uc等等都是不错的选择。我们当时都试过了(一把苦涩的眼泪)。

取得样本后,是对算法模型的训练和测试。算法模型的训练原理是通过对样本文章进行分词,提取实体,建立特点工程,以每一个特点词为向量,拟合函数。这样,当有新文章时,文章就会通过分词和模型来计算结果。但是模型不能一次性用样本准确,模型需要测试和校订。

通过测试的模型不是一劳永逸的,后期仍可能出现一些分类不准确的问题,多是样本或算法模型酿成的。这就要求我们找出这些异常的文章及其分类,纠正分类,再次作为训练样本喂给模型进行模型改正。一方面,我们可以对转化率较低的分类文章进行人工抽样,肯定问题会不会属于算法。另外,在这里,由于每篇文章的标签都被赋予了一个值,我们可以为这些值设置一个阈值。当最高值低于某个阈值时,这些文章及其标签将被召回,并手动标记和纠正,并放入样本库中。

文章标签的计算,由于文章有各种标签的可能性,而不是一些二级分类的结果,所以我们使用的方法是通过类似性算法,模型计算文章的标签,并分配值,值越高,越接近这些标签,并标记相应的标签。

到目前为止,文章标签的部份已完成。

如何给用户贴上标签

其实给用户贴标签的方式有两种,统计标签和算法标签。

统计类相对简单粗鲁,以用户一段时间浏览的文章类型作为用户的兴趣偏好。

算法会增加更多的影响因素,包括文章浏览的数量、浏览的时间间隔、文章与当前热门事件的关系、用户属性等。

前者可以在算法资源不足、运营需求大的情况下领先,后者可以在前者的基础上划分部份流量,验证和调剂算法模型,不断优化。

但在第一种方式中,我们发现用户在一段时间内浏览文章类型不稳定,大多数用户会有一个或几个主要的兴趣偏好,这些类型会浏览更多的文章,但同时,用户或多或少会浏览其他类型的文章,乃至有些用户会看到哪里,甚么会看到。

基于这类情况,我们需要对用户的兴趣偏好进行排名,即对用户在一段时间内浏览的每种文章类型的文章数量进行排名,并取用户的数量top10个标签清楚地告知操作用户喜欢甚么类型的文章,在这些类型中,用户喜欢甚么类型的优先级,方便操作学生推送选择。

因此,用户标签也需要更灵活,可让操作学生根据事件产生的时间和次数灵活组合选择用户群。

由于目前push很大一部份推送是手动进行的,从文章的选择,到用户的选择,到文章和用户的匹配,通常在正式推送之前进行大量的推送A/Btest,信息文章种类繁多,仅一级标签就到达30+种类,二级标签从100到几百不等,整体标签极可能有不计其数的标签,单靠操作学生推,是绝对不可能完成的。

因此,在运营资源有限、没法实现自动化的情况下,一般运营学生会对标签进行测试,选择覆盖用户数量大、转化率高的标签。但与此同时,这类情况会致使一些利益偏好相对较小的用户被排除在外。

针对这类情况,我们取用户top10个二级标签及其相应的一级标签作为用户的一级和二级标签。这样就解决了用户覆盖的问题,运营商也能够集中精力推送主标签和人群。


文章来源:丸子建站

文章标题:app上架市场后应考虑哪些问题?

https://www.wanzijz.com/view/7826.html

TAG: 上架
X

截屏,微信识别二维码

微信号:weimawl

(点击微信号复制,添加好友)

打开微信