联系我们

新闻投稿:jingjing@enec.net

商务合作:coco@enec.net

搜索
下载亿恩app

亚马逊A9算法很神秘,围观机器学习怎么测试它

本文来自:亿恩网原创

作者:洪敏斯

2019-11-08 11:25

引言 亚马逊A9算法变了,但是亚马逊一直都没有披露影响算法的因素。

亚马逊A9算法变了,但是亚马逊一直都没有披露影响算法的因素。


10月开始,卖家受算法的影响越来越大,除了中国卖家感受到这一变化之外,外国卖家也切身体会到,因此,有外国测试者专门使用机器学习来预测影响搜索排位的因素。


据数据情报公司Jumpshot的报告发现,亚马逊上的消费者在亚马逊上进行产品搜索比在谷歌的更多。此外,亚马逊90%的产品浏览量来自该公司的有机网站搜索,而不是广告或外部渠道。


亚马逊搜索引擎的目标是根据销售潜力对产品进行排名。许多因素可以影响销售,如价格、评论和产品页面的复制。想必在这些领域表现出色的产品会获得更好的排名。


但是,很难确定这些因素的相对重要性,尤其是在亚马逊没有披露这些因素的情况下。


预测产品的销售潜力


在浏览亚马逊的各种产品畅销榜时,测试者注意到在许多关键类别中,比如“电子产品”和“汽车”,最畅销的产品通常拥有最多的评论。


消费者在写评论之前购买了产品,令人产生疑问的是,评论的数量是否可以代表产品的销售和排名?于是,测试者使用了机器学习进行测试。机器学习不仅仅能产生预测,机器学习的一个鲜为人知的用途是创建一个模型,然后测试哪些特征对预测最为重要。


测试者根据了以下操作进行测试:

1、准备一个机器学习源文件,包括评论;

2、使用谷歌的自然语言API通过审查情感分析来扩充这个源文件;  

3、将此文件上传到BigML,BigML是一个易于使用的机器学习工具;  

4、生成深度神经网络模型(即,模拟人脑识别模式)来预测数据集中评论的数量;

5、回顾对模型预测影响最大的特性。这些是获得更多评论和代理销售最重要的因素。

 

源文件

测试者在亚马逊智能工具JungleScout上找到了2017年第四季度的畅销产品的名单。这份名单包括了大约10000种不同类别的产品,测试者关注的是“Automotive”。

数据集包含15列,比如Amazon标准标识号(ASIN)、产品子类别和产品名称,以下是完整列表:


gl_product_group_desc  

Subcategory  

asin  

upc1   

item_name   

merchant_brand_name

customer_average_review_rating   

customer_review_count   

has_fba_offer   

has_retail_offer

otal_offers   

min_price   

max_price   

min_3p_price   

max_3p_price

 

测试者还想提取产品评论文本,并使用它来计算评论的情绪,以防它们具有预测性。有相关的计算机专业人士编写了亚马逊评论文本。测试者从他的网站上下载了汽车评论以供测试。


该数据集有9列:

asin

helpful

overall

reviewText

reviewTime

reviewerID

reviewerName

summary

unixReviewTime

 

测试者合并了这两个数据集,它们提供了许多潜在的预测因素,如下所示:

 

eviewerID

asin

reviewerName

helpful

reviewText

overall

summary

unixReviewTime

reviewTime

gl_product_group_desc

Subcategory

upc1

item_name

merchant_brand_name

customer_average_review_rating

customer_review_count

has_fba_offer

has_retail_offer

total_offers

min_price

max_price

min_3p_price

max_3p_price


接下来,测试者想捕捉评论的情绪。


评论的情绪


谷歌的自然语言处理API可以为捕捉评论的情绪提供帮助,处理了评论文本后,捕获了四个额外的字段:明显积极的、明显消极的、中性的和混合的情绪。每个字段都包含一个“文档得分”、“每个文档的大小”和“得分最高的句子”。

使用BigML进行机器学习


测试者选择将customer_reviews_count作为预测目标,选择深度神经网络作为要构建的机器学习模型类型。


BigML搜索了128个模型组合,以找到最佳性能。

以下是按顺序排列的结果——销售的首要预测指标。


1、Subcategory(子类别)——86.73%  

2、Field1 (产品编码)——9.6%  

3、Item_name(产品名称)——3.49%

4、Total_offers(总价格)——0.06%

5、Upc1——0.04%

6、Customer_average_review_rating(客户评级)——0.03%

7、Max_price(最高价格)——0.02%

8、Min_price(最低价格)——0.01%


令测试者惊讶的是,评论的情绪没有任何影响,客户评级(Customer_average_review_rating)和价格(Max-price和Min-price)几乎没有预测效果。

现在可以看到,产品类别和产品名称的选择可能会产生重大影响,因为一些产品和类别本来就很受欢迎,有很强的需求。同样,产品的数量也预示着整体的销售。


最后,从这位测试者所测试的结果可见,搜索排名竟然和评论的好坏没有太大的影响,不知道各位卖家对这测试结果有啥看法呢?

更多精彩内容,请关注亿恩网微信公众号: (ENECNEWS

扫码关注二维码

) 每天为您推送最新,最热干货!
声明:亿恩网原创稿件,未经授权不得以任何方式转发。转载请联系:jingjing@enec.net
分享:
6.72w 0 0
网友评论 文明上网理性发言,请遵守评论服务协议
(0) 条评论
评论
热门词条

服务商

申诉

关联

产品侵权

千禧一代

国产

反垄断

父亲节

多平台

易佰网络

GBC

货代

跨境物流

上市

PayPal

网易考拉

库存

家电

DHL

英国电商

社群

扫码加入社群

公众号

扫一扫
关注亿恩公众号

顶部