本节将介绍几种常用的商品分析模型,包括商品价格敏感度模型、新产品市场定位模型、销售预测模型、商品相关销售模型、异常订单检测模型、商品规划的最优组合。
1商品价格敏感
本节将介绍几种常用的商品分析模型,包括商品价格敏感度模型、新产品市场定位模型、销售预测模型、商品相关销售模型、异常订单检测模型、商品规划的最优组合。
1
商品价格敏感度模型
商品价格敏感模型是指通过研究,找出用户对价格是否敏感以及敏感程度的价格杠杆。价格敏感度模型可以作为销售定价、促销活动折扣方式、参考价格、价格浮动区间等的参考。
例如:
M2商品是否应包括在促销活动中;当商品M3涨价100元,订货量会有怎样的变化;商品详情页上的参考价格应该定在多少,才能让顾客觉得降价了,触发订购动作;有哪些方法最适合M4产品,如满减、全额退款、跨品类优惠券等?
商品价格敏感性分析可以通过两种方式实现:
1。问卷调查法通过调查问卷的方式对所关注的类别或商品进行研究和分析是一种常用的方法。这种方法可以得到品类明细,通过问卷可以设置不同的信息点,所以收集到的信息更符合实际需要。
但是,当面对新的价格敏感性分析要求时,通常需要重新开展研究和分析工作。这种方法需要很长的时间来实现,并且反馈结果很慢。另外,当需要收集的商品信息很多时,可能很难获得完整的数据。
2。数据建模方法通过数据建模建立商品价格与销售量的关系模型,是研究价格敏感性的有效方法。
这个方法实现起来相对简单:
首先,
收集不同价格的销售数据
。价格敏感度模型需要根据不同价格下的销售数据生成,因此商品运营部门需要进行有针对性的价格调整。这种价格调整可能是长期的,也可能是短期的,视需求而定。
长期调价是一种
“自然状态”
,因为在很长一段时间内,商品会经历生命周期的不同阶段,结合商品促销、打折等操作,会产生各种价格和销售数据;短期调价更多是为了
数据收集
。
其次,
数据建模与分析
。商品价格敏感度模型关注的是
价格与销量之间的关系,可以用回归的方法求解。
在回归方法中,除了价格之外,自变量
还需要包含另外两种信息:
商品信息,商品品类、上市时间、同期竞争对手价格、是否参与促销活动、促销方式、折扣力度、通用属性等。客户信息,客户性别、年龄、收入、学历、会员级别、历史订单量、品类偏好度、活跃度、价值度等。
之所以要在回归模型中加入大量的商品信息和客户信息,是因为如果只对价格和商品销量进行回归,那么价格本身所解释的商品销量的变化可能是非常有限的,而销量的变化也可能受到很多其他因素的影响。所以要在
控制这些干扰因素
的前提下做出
回归模型
。
2
新产品市场定位模型
新产品的市场定位分析用于企业新生产或计划生产一种产品时。需要
根据市场上现有竞争对手的产品做
定位分析
。
这种分析的目的是评估新产品与哪些产品可以形成竞争产品的关系,找出与竞争产品的差异和优势,如功能特性、使用寿命、产品质量等。,从而将其应用于产品定价、市场营销和渠道推广。
新产品的市场定位分析可以通过基于相似度的方法来实现。
例如:使用无监督KNN(K近邻),模型的核心是通过比较新产品的数据和已有数据,找到与新产品相似的其他产品。
通过KNN实现新产品市场定位分析的步骤如下:
步骤1:数据准备。
先准备好要训练的数据集,由于这不是一个分类应用,因此数据集中只包含不同竞品的特征变量即可,无需目标变量。
步骤2:数据预处理。
预处理过程根据数据集情况可能包括二值化标志转换、缺失值处理、异常值处理、数据标准化等。需要注意的是, 由于是基于距离的计算,分类和顺序变量需要做二值化转换,异常值(包括量纲和值的异常)都会对相似度产生重大影响。
步骤3:
建立KNN模型并训练模型。直接使用NearestNeighbors方法建立模型后使用fit方法做训练。
步骤4:
找到新产品最近的K个相似产品。使用KNN模型的 kneighbors方法获得指定数量的K个近邻。
下面是一个简单的核心步骤示例:
from?sklearn.neighbors?import?NearestNeighbors?#导入NearestNeighbors库?X = [[0.,?0.1,?0.6], [0.,?1.5,?0.3], [1.2,?1.6,?0.5]]?#定义训练集,训练集包含3 条记录,每个记录包含3个特征变量?neigh = NearestNeighbors(n_neighbors=1)?#建立非监督式的KNN模型对象 neigh.fit(X) # 训练模型对象?new_X = [[1.,?1.,?1.]]?#要预测的新产品数据 print(neigh.kneighbors(new_X)) #打印输出新产品最相似的训练集产品
结果:
(array([[ 0.80622577]]), array([[2]]))第一个数字是与新产品数据最相似的产品的距离第二个数字是对应最相似产品记录的索引值(注意索引值从0开始,2表达第三个)
3
销售预测模型
销售预测模型根据历史销售数据预测未来可能的销售额。该模型常用于支持费用申请、目标设定、活动策略等。促销活动前。
销售预测模型的结果通常是未来会产生多少销量、收入、订货量,可以通过时间序列、回归、分类来实现。
基于
时间序列
做销售预测。使用时间序列做销售预测的方法常用于没有太多可用的自变量的场景下,只能基于
历史的销售数据做预测性分析。
有关时间序列的更多话题,后面再讲。基于
回归
做销售预测。基于
可控的特征变量建立回归模型来预测未来的销售情况
是更常用的方法,有关回归模型的更多内容,后面再讲。基于
分类
做销售预测。分类方法是
针对每个销售客户产生的是否购买的预测分类,然后再基于能产生购买的预测分类做客单价、订单量和收入的分析。
这是一种对于具体数值的变通实现思路。有关分类分析的更多内容,后面再讲。
4
商品相关销售模式
商品关联销售模式主要用于解决哪些商品可以一起销售,哪些商品不能打包组合在一起销售的问题。加盟销售是商品销售的常态,也是促进单笔销售收入,增加复购效果的有效手段。
商品相关销售模型的实现是相关类算法,包括Apriori、FP-Growth、PrefixSpan、SPADE、AprioriAll、AprioriSome等。,主要实现基于一个订单的交叉销售和基于时间序列的关联销售。
关联算法的实现步骤与普通的监督算法和监督算法略有不同,因为关联分析对数据集的要求不同。一般包括三种数据源格式:
第一种是
事务型交易数据
,典型的数据格式是每个数据行以订单 ID或客户ID作为关联分析的参照维度,如果同一个订单内有多少个商品,那么将会有多个数据行记录,
如下图:
第二种是合并后的交易数据,数据格式是每个数据行以订单ID或客户ID作为分析的参照维度,如果同一个订单内有多个商品,那么多个商品会被合并到一条记录中,如下图:
第三种是真值表格数据,每个数据行是每个订单ID或客户ID,列是每个要关联项目的是否购买值,通常以T或F来表示,如下图:
以上三种数据格式中,第一种和第二种常见于企业内部的源数据环境或数据仓库,第三种需要经过ETL处理得到,很多第三方工具也可以提供这种数据形式。如果企业内不具备能够直接做关联分析的数据,则需要做对应处理。第二个是合并后的交易数据,数据格式是每一行数据都以订单ID或客户ID为参考维度进行分析。如果同一个订单中有多种商品,那么多种商品将合并为一条记录。如下图:以上三种数据格式中,第一种和第二种常见于如果企业中没有可以直接用于关联分析的数据,则需要进行相应的处理。
5
异常订单检测
异常订单检测
用于识别订单中的异常状态(尤其是促销活动中的异常状态)。目标
查找非普通用户
的订单记录,如黄牛订单、恶意订单、商家账单等。
黄牛订单
会大量削减促销对普通用户的吸引程度,使得
促销权益和利益被一小部分人获取,
而非给到目标会员。
恶意订单
则更加危险,很多竞争对手间会通常这种方式在促销活动中,将大量的商品库存通过订单的方式锁定,然后再活动结束后通过取消、退货等方式释放库存。这种方式将使促销活动由于无法真正卖出商品而
无法实现促销的目的,同时还会消耗公司大量的人力、物力,
是各个公司都非常反感的恶意竞争方式。
商家刷单
是一种常见的用于提升商家排名的方式,通常
由商家来安排内部或关联人员大量购买商品,
以形成商家流量和销售提升的目的。异常订单检测主要基于两种方法实现:
基于监督式的分类算法
:将历史已经识别出来的真实异常订单数据
通过分类模型
(例如SVM、随机森林等)做训练,然后应用新数据做分类预测,看预测结果是否属于异常订单。
基于非监督式的算法
:通过非监督式算法(例如OneClassSVM)
基于历史的数据
做训练,然后针对新的数据做判别,找到存在异常可能性标签的订单列表。6
商品计划的最佳组合
企业在做商品促销或广告宣传时,通常会面临
多种组合策略
,即考虑在一定的限制条件下,采用哪种组合策略来达到最大或最小的目标。此时,可以考虑使用
线性规划法
。
线性规划
(LP)是运筹学中较早的研究领域,方法比较成熟,实用性很强。主要用于辅助人们进行科学管理,目标是
合理利用有限的人力、物力和财力做出最佳决策。
解决简单线性规划问题最直接的方法是
图解法
,即通过直线与平面面积的交点来求解直线在Y轴上的最大或最小截距。
线性规划涉及到几个概念:
未知数:
影响决策主要变量或因素。
约束条件:
解决线性规划问题时已知的并须遵守的前提条件。
目标函数:
用来表示未知数与目标变量关系的函数,线性规划中一般是线性函数。
可行域:
满足优化问题约束条件的解叫作可行解,由所有可行解组成的集合叫作可行域。
最优解:
满足目标函数最大化或最小化目标的最优的解。实现线性规划的基本步骤如下:
步骤1:
找到影响目标的主要因素,它们是规划中的未知数。
步骤2:
基于未知数确定线性约束条件。
步骤3:
由未知数和目标之间的关系确定目标函数。
步骤4:
找到直角坐标系中的可行域。
步骤5:
在可行域内求目标函数的最优解及最优值。为了清楚地表达上述概念和步骤,用一个简单的例子来演示这个过程。
假设公司有两种产品,P1和P2。推广P1产品时,每次费用为60元。推广P2产品时,每次费用为30元。现在,公司有1800元的预算,可以用来推广P1和P2的产品。受限于两款产品的规模和品类,P1产品最多只能上架20次,P2产品最多只能上架40次,两款产品合计不能超过45次。据了解,P1和P2产品每推广一次,单个产品的毛利可分别达到40元和30元。
问:
如何安排P1和P2的产品投放数量,以达到毛利最大化的目标?
为解决问题,我们假设P1和P2产品的投放次数分别为X1和X2,此时最大销售毛利为z .
:
因为这是一个简单的二维变量,所以可以先画出直角坐标图和可行域
,然后根据目标函数找到最优解位置。
从图中可以发现,最优解是目标函数与X1+X2=45和60X1+30X2=1800的交点。用九年义务教育的基础数学知识来解两个函数。
第一步:转换等式1: X1=45-X2然后将转换后的X1代入等式2,依次求解:第二步:60(45-x2)+30 x2 = 1800第三步:2700-60 x2+30 x2 = 1800第四步:[ X2=30第七步:[/S2/]X1 = 1800