拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条正文

企业数据模型在业务应用上的实践

WeBranding Global,品牌全球化服务运营商,拥有广泛的全球专家顾问网络和跨国人才资源,为渴望开拓海外市场的中小企业,提供商业研究、品牌战略、整合营销、销售支持等一站式品牌出海解决方案和落地营销服务。
549
2022-12-11 09:01

数智化建模

WBG的数据分析底层逻辑

现在大家频繁提及的“数智化”一词最早是2015年北京大学“知本财团”课题组提出的对“数字智商”(Digital Intelligence Quotient)的阐释,最初的定义是:数字智慧化与智慧数字化的合成。它有三层含义:一是“数字智慧化”,相当于云计算的“算法”,即在大数据中加入人的智慧,使数据增值增进,提高大数据的效用;二是“智慧数字化”,即运用数字技术,把人的智慧管理起来,相当于从“人工”到“智能”的提升,把人从繁杂的劳动中解脱出来;三是把这两个过程结合起来,构成人机的深度对话,使机器继承人的某些逻辑,实现深度学习,甚至能启智于人,即以智慧为纽带,人在机器中,机器在人中,形成人机一体的新生态。

图片

因此, 数智化是大数据应用的核心价值,需要经过商业理解、数据收集、数据处理、模型计算,模型评估和模型部署六个阶段,最终目的是将大数据应用延伸到具体的业务场景的每一个环节中,让数据说话,让管理可见。本文将从整体流程的角度剖析WBG的数据应用场景,详细介绍数据模型底层逻辑。
首先,数据来源主要包含第一方数据、第二方数据和第三方数据,其中,第一方数据是指企业内部数据,第二方数据指公网数据,第三方数据是合作方或友商提供的外部数据。
第一方数据,包含对个性化推荐起决定性作用的用户数据、商品或服务数据,物流配送、仓储库存和起辅助的作用的客服数据。举个例子,比如,用户数据包含但不限于用户属性、注册行为、活动参与、订单行为、支付行为、评价行为和售后行为等;商品或服务数据包含商品或服务的分类、品牌、参数、功能说明和生命周期等。

图片

第二方数据,通常是根据实际业务需求,通过网络爬虫的方式,获取互联网的相关数据信息,例如,竞争对手商品/服务分类数据、参数数据、功能说明和价格数据等,这一类的数据主要是用于完善用户行为偏好、自有商品或服务属性、与竞争对手对比优势、制定差异化营销策略及个性化推荐的辅助参考等。社交媒体类的数据主要是用于了解用户对企业、品牌和商品等各方面的舆情分析,及时抑制负面信息,同时挖掘用户的社交关系以及对商品或服务的真实需求,以此改善商品功能,完善服务流程,提升用户体验。
第三方数据,包括以合法方式通过合作伙伴获取处理后的用户标签数据,通过用户的标签数据可以了解用户的基本信息匹配度、用户的网络行为、兴趣偏好、上网习惯偏好和模糊地理信息等,通过这些信息,再结合第一方数据和第二方数据,有策略地进行个性化商品或服务的推荐。除此之外,还可以根据用户的综合消费系数、稳定系数、风险系数、多方面监控系数,以及对用户的综合信用分数评定等内容,针对用户的信用分数评级,为用户提供相应的优惠或特殊权益,增加用户的黏性。

图片

数据采集完成后, 才是大数据工作的重头戏——数智化数据分析的开始。数智化的数据分析工作需要用到模型的方法来做预测或者分类,建模分析的基本流程是:

1、了解数据
在拿到数据后,不能着急立刻开始清洗数据或者模型训练,而是要先了解数据(除建模分析外,其他的数据开发也要做这一步),这样才能避免后期的踩坑,否则十有八九是要复工的。
那“了解数据”这一环节,具体要了解哪些内容呢?

  • 了解各个特征的业务含义和计算逻辑;
  • 各个特征的分布是否符合预期?
  • 特征之间的相关性如何,是否符合基本逻辑?
  • 特征和目标值的相关性如何,是否符合基本逻辑?

在相关性分析这里,数值型变量之间可通过计算相关系数或者画图呈现;数值型变量和分类变量可通过箱线图呈现关系。
2 、补充信息
在初步了解数据后,需要做一些数据预处理的行为。
第一步就是对缺失值处理,一般根据样本量多少以及缺失比例,来判断是讲“宁缺毋滥”的删除,还是缺失值填充。
具体处理的思路可以是这样的:
统计计算样本量n,各个特征数据缺失率y,各样本数据特征缺失率x;
特征缺失率x比较高的样本一般都建议删除;因为多个特征都缺失,填补也比较困难,即使填补信息偏差也会比较大。
如果某特征缺失率y比较大,则删除此特征;如果特征缺失率低且样本量比较大的话,可删除特征缺失的样本;如果样本量少不可删除,则对缺失值做填充。
缺失值填充的方法有:

  • 根据特征的众数、中位数或者平均值来填充;

  • 也可以对样本做分类,根据所在类的平均值众数等填充;

  • 通过回归法来做样本填充,缺失值作为因变量,其他特征做自变量去预测;

  • 还可通过比较复杂的方法,如多重插补法。

图片
3、数据清洗
处理完缺失值后,需要做异常数据处理。
异常数据识别是数据分析和数据挖掘在正式分析前的数据处理,识别异常数据后,删除或者修正异常数据,避免异常数据影响分析结论;可以用于异常数据识别的方法有:时间序列数据异常识别、单变量数据异常识别、多变量数据异常识别。
其中,时间序列数据异常识别包括:设置恒定阈值、设定动态阈值-移动平均法、STL数据拆解法。

单变量数据异常识别方法包括:简单统计量分析、三倍标准差、箱线图;多变量数据异常识别是指,不只从一个特征去判读数据异常,而是在多个特征下来判断其是否异常。多变量异常数据识别的方法很多,比如聚类模型、孤立森林模型、one-class svm模型等。

4、数据标准化

对于很多模型,如线性回归、逻辑回归、Kmeans聚类等,需要计算不同特征的系数,或者计算样本距离。

这种情况下,如果不同特征的数值量级差别很大,会严重影响系数和距离的计算,甚至这种计算都会失去意义;所以在建模前必须要做的就是要去量纲,做标准化处理。当然有些模型是不需要做数据标准化处理的,如决策树、随机森林、朴素贝叶斯等。

当前最常用的数据标准化处理方法有:

1)最小—最大规范化

(x-min)/(max-min),将其规范到[0,1]之间

2)z值规范化

(x-均值)/标准差,将其规范为均值为0,标准差为1;
如果这种情况,受离群点影响比较大的话,可以用中位数代替均值,用绝对标准差代替标准差。还需要注意的是,如果样本分布偏差严重,可以先做box-cox变换,将其往正态分布变换后再标准化。

完成以上这四点工作后, 才能正式结合业务场景开始数据建模。

图片

业务场景-人群细分:

在产品极其丰富的今天,很难找出一种产品适用于所有人。即便是品牌能够吸引大多数人,如可口可乐,也不得不推出“零糖”可乐以满足一部分消费者的需求。因此,营销人员要清楚目标客户有哪些。通常情况下,品牌会应用客户细分来为特定的目标客户提供服务,有效利用渠道、推广等资源来吸引潜在客户。

传统的细分策略,通常以年龄、性别、住址、职业等为依据。然而,互联网时代让社群成为消费者沟通的主要渠道,消费者惊奇地发现,潜藏在他们内心的偏好、特质居然在各个社群中得到了呼应,因而这些偏好、特质被激发了出来。他们主动给自己贴上标签,如一个上班时间不苟言笑的CEO可能是“萌宠”的爱好者,穿Prada的“女王”却是个“猫奴”。消费者身上的标签数量剧增,这进一步促成了对消费者的细分。

毫无疑问,市场细分和消费者角色建设都依赖于各种各样的数据,包括第一方调查数据、定性焦点小组数据、购买数据、行为数据、在线跟踪数据等。随着Martech和大数据的出现,通过整合、分析各种来源不同的数据,企业能够获得的不是对消费者的简单解读,而是详尽的市场细分和消费者角色建设。

我们的CIS系统, 通过几百个数据增强源, 获得用户1700+的属性信息, 做完基本的数据清洗后, 需要做特征变换和特征选择。需要考虑特征的多重共线性和特征复杂度。先建立一组基础模型, 然后再选择基础模型进行组合, 得到更高维度的数据模型, 经过几次这样的迭代, 最终形成可用于展示呈现模型, 比如下图的『细分人群』:
图片
业务场景-自动人货匹配DM推送:
通常匹配由三个要素组成:匹配算法、人群、候选推荐项目。简单来说,一次匹配过程就是匹配算法从候选推荐项目中挑出某些项目给特定用户人群。

匹配模型就是要实现让系统作为导购(像向导一样引导购买),而不是推销员。不是无脑地推送信息和商品, 而是能够『察言观色』洞察用户的需求, 并且给他推荐最适合的商品。当然,不同商品,提升匹配成功率的手段也不同。比如, 场景式匹配,体验式匹配,陈列式匹配和价格式匹配等,综合这些要素,可以推导出导购型匹配的分析模型(如下):

图片

今天分享的内容是博鼎国际数据模型在业务场景上的流程和体现,模型训练前的数据分析、数据清洗以及特征选择非常重要,甚至他们是决定建模是否成功的关键因素,也就是数智化的底层逻辑。欢迎关注我们的公众号,了解更多行业和技术的信息。


AMZ123跨境卖家导航旗下公众号【AMZ123跨境电商】深耕跨境行业,专注热点报道。
扫描右边二维码,关注后回复【加群】,加入优质卖家交流群~
目前30W+卖家关注我们
二维码
免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签问答
旺季资金周转难?福建大卖靠这一融资方案决胜大促!
5月 23 日,备受期待的“美元融资革命一汇星计划1.0发布会”在深圳·深业上城成功举办。 本次发布会由Dowsure 豆沙包(以下简称“Dowsure”主办),汇丰银行(以下简称“HSBC”)协办,汇集了来自跨境的生态合作伙伴、卖家代表及媒体代表,共同见证了这一历史性的时刻。
【TRO 24-cv-4266】速看避雷!Keith代理一幅海龟水母版权画发案维权,未经授权不能擅自使用!
1案件明细原告品牌:David Bryan Wentworth原告公司:David Bryan Wentworth案件编号:24-cv-4266起诉类型:版权原告律所:Keith起诉时间:2024/5/23品牌官网:https://www.davidwentworthart.com/2品牌介绍 原告David Bryan Wentworth是一位多才多艺的艺术家,以其独特的插画技巧、故事
登上亚马逊BSR,这家保温杯大卖年销过亿!
小小的保温杯,能被品牌们能玩出什么花样?前有Yeti 、Hydromate等网红水杯大热,后有“车烧没了保温杯里的冰块都不化”的Stanley水杯一夜蹿红。2023,北美市场的“喝水文化”彻底火了,从保温到保冷,从室内到户外,从通勤到工作,一个水杯的使用场景被无限延伸,成为“出行必备单品”。尤其是在去年冬天爆火的Stanley水杯,无论是在社交媒体上,还是在各大电商平台上,该产品的热度都达到了现象
亏一整年!亚马逊类目头牌回血净赚过亿
亚马逊头部大卖今年一季度开始盈利了。亚马逊园林电器龙头大卖格力博,去年经历了“上市即亏损”的尴尬。不过,这家类目头部品牌,今年已经开始“回血”,单季度利润回正,净赚过亿。业绩总览格力博是新能源园林机械的领军出海企业之一,集研发、设计、生产及销售于一体,以自有品牌销售为主,产品按用途可分为割草机、打草机、清洗机、吹风机、修枝机、链锯、智能割草机器人、智能坐骑式割草车、多功能全地形车等。2023年2月
AI赋能跨境电商,铸就非凡生意增长!
在数字化浪潮席卷全球的今天,AI人工智能正成为提高生产力的强大引擎。特别是在跨境电商领域,一系列AI人工智能服务不仅帮助商家简化日常运营操作,更提升了决策能力,推动销售增长驶入快车道。如今,商家朋友如何借助AI这股东风顺势而为?本期将一起来看看藏在Lazada跨境电商中的各种AI工具吧!当前,AI人工智能已经逐渐贯穿电商生意活动的全流程,成功帮助更多商家朋友在电商领域获得令人惊喜的经济增长。于商家
这款园艺产品后劲太大了,月销百万美金!
园艺品牌 VEVOR 在 TikTok 月销百万随着 2021 年美国园艺爱好者在庭院用品上耗资高达 478 亿美元,相当于平均每个家庭在家居园艺用品上花费 503 美元。全球家居园艺市场规模排名前三的国家分别为美国、德国和英国,其中美国的相对市场规模最大,占比 20.3% 。特别是在美国,草坪产业非常发达,年产值超过 500 亿美元,就业人数超过 50 万。绿化私人住宅花园至关重要,不仅是为美好
2023年土耳其电商交易额猛增115%!达575亿美元
AMZ123获悉,5月27日,据外媒报道,2023年土耳其电商交易额较上年增长一倍以上,继疫情期间显著增长后,该国的电商市场依然火热。根据贸易部的数据,2023年土耳其电商交易总额同比增长115.15%,达到1.85万亿土耳其里拉(约575亿美元)。订单数量同比增长22.25%,达到58.7亿笔。受促销活动和教师节的影响,11月是交易量高峰期,该月交易量较全年月均交易量高出50%。数据显示,电商交
独立站如何利用私域社群流量增强用户粘性、提升转化率
在当今数字时代,海外社交媒体平台已成为独立站品牌推广的重要渠道之一。然而,单纯依靠广告宣传往往难以吸引用户的长期关注和参与。为了增强用户粘性并提高用户转化率,品牌需要通过构建独特的私域社群文化来建立与用户的深层连接。本文小编将和大家探讨如何在海外社交媒体平台上通过私域社群文化的构建,实现独立站品牌社群的形成,并分析社群文化对独立站品牌传播和用户转化的积极作用。一、私域社群文化的重要性 私域社群文
2024.05.27亚马逊选品推荐(仅供参考):手拿包
2024.05.27亚马逊选品推荐(仅供参考):手拿包站 点:北美站,加拿大产品名:手拿包采购:国内1688工厂价12.5元1个售价:亚马逊加拿大售价37.56加币重量:约150g运费:FBM40人民币左右抽佣:37.56*15%=5.6加币FBM净利润:110元左右,FBA净利润:110-150元左右;模式:适合FBM和FBA,(所有价格都是建议参考价格)单量:在卖家精灵中显示上架时间是20
每月爆单1600万美元?深圳跨境大卖,霸榜亚马逊Best Seller榜单!
深圳大卖月销量1600万美元?出品 | 电商123 作者 | 老柴深圳大卖成亚马逊Best Seller常客电商123获悉,深圳凭借跨境电商发展的得天独厚优势,不仅诞生了华南城四少和坂田五虎,这几年越来越多的跨境电商新秀不断涌现,以创立于2018年隶属于深圳市路特创新科技有限公司的Momcozy品牌为例,目前该该深圳大卖凭借领先的可穿戴吸奶器技术已经拿下了近15%的市场份额。▲图源Momcoz
大家具在亚马逊又火了?黄金运营法则加持2400亿赛道
提到大件家具,一些卖家可能会心生犹豫:物流会不会太麻烦?消费者会线上选购吗?然而事实证明,已经有众多中国家具卖家通过亚马逊成功拓展海外市场,布局品牌全球化。比如:成立二十多年的工厂佛山爱意家具转型跨境,创立了床垫品牌Molblly,曾一度在亚马逊床垫类目中位居第二,品牌全渠道年收入更达到了13.7亿元!这个案例展现了家具品类的巨大潜力,现在就跟小编一起了解家具品类的热门机会以及运营中的黄金法则吧。
亚马逊日记之什么是白帽
最近有个卖家找我诉苦:自己一直秉持坚守白帽运营的理念,从未做出或做过亚马逊认为的违规操作,但是店铺却被封了,亚马逊还能作为一个长期事业吗?店铺被封,肯定先看绩效通知,截图如下您的亚马逊卖家账户已根据亚马逊服务商业解决方案协议第3条和不适当库存调查政策被停用为什么会发生这种情况?我们采取这些措施是因为我们认为您的帐户正在提供不合适的商品,并且可能已被用来从事欺骗或非法活动,从而损害我们的客户、其他销
Prime Day成功策略参考:10%折扣+额外10%广告曝光
Sorftime NEWS亚马逊新闻 在竞争激烈的Prime Day,品牌如何脱颖而出,实现销售和品牌知名度的双重提升?根据对数千个品牌的深入分析,我们发现了一个成功的策略:结合超过10%的折扣与额外10%的付费可见度。这种策略不仅在Prime Day期间带来显著的销售增长,而且在活动结束后的三个月内,也能持续推动品牌的长期成功。研究表明,那些在Prime Day期间仅依靠打折或仅增加广告曝光的
重磅!亚马逊推出三大新功能,退货率再也不用愁!
在上个月,亚马逊宣布推出一项名为“退货处理费”的新收费项目,这一消息在亚马逊卖家圈子里引起了轩然大波。卖家们纷纷吐槽亚马逊收费项目多且频繁,尤其是退货已经让卖家承担了不小的成本,如今超过类目阈值的退货还要支付高额的退货处理费,这无疑加重了卖家的负担。面对这样的新政策,虽然我们可以吐槽,但事实是,吐槽并不能改变什么。新政策已经实施,作为卖家,我们需要做的是研究如何降低退货率,尽量将退货率控制在亚马逊
靠246个SKU赚10亿!跨境大卖谈爆品心得
作者|林熹近几年,铺货盛行、极度内卷的服饰赛道却黑马频出,LovelyWholesale是其中之一。LovelyWholesale是一家专注北美拉丁裔及黑人族裔的快时尚服饰品牌,2011年出海,2022年从独立站转型多平台卖家。截至2024年初,LovelyWholesale的社媒矩阵已积累近450万粉丝,TikTok Shop在售SKU达246个,年总营收超10亿元。关于LovelyWholes
百思买、亚马逊占据超50%在线消费电子产品支出!
AMZ123获悉,日前,据外媒报道,百思买、亚马逊在消费电子产品市场占据了主导地位。根据Numerator的数据,百思买和亚马逊在过去一年中分别占特定消费电子产品类别总销售额的31%和27%。沃尔玛位居第三,占比14.3%。数据显示,亚马逊在夏季和秋季的PrimeDay活动期间销售额激增,7月份和10月份的销售额占比分别达到39.2%和31.4%,这两个月份的表现均超过百思买,并导致所有主要竞争零
《2024全球户外家居电商市场分析报告》PDF下载
随着全球数字化浪潮的涌现,⼾外家居电商市场正成为中国企业在国际舞台上崭露头⻆的新战场。在这个充满活⼒和机遇的时刻,我们荣幸地为您呈上2024年全球⼾外家居电商市场的深度分析报告。
《2024宠物行业全球贸易趋势分析》PDF下载
美国常年占据中国出口目的地的第一位,但从2020年以来,份额一直在下降。美国近几年主动脱钩,试图重组全球产业链,减少对中国依赖,高端产业迁回北美,低端产业选择在东南亚、南亚及墨西哥等市场寻找替代。
《2024年智能家居出海洞察研究报告》PDF下载
全球智能家居市场预计将在 2021 年至 2030 年的预测期内出现市场增长。Verified Market Research 分析称,在 2021 年至 2030 年的预测期内,市场将以 23.6% 的复合年均增长率增长,预计将达到8678.87亿美元。到 2030 年。智能手机使用量的增加正在推动市场的增长。
《2023-2024全球及中国家电市场&渠道发展分析》PDF下载
房地产市场的不确定性将影响家庭财富和消费者信心,波及全球经济的风险。预计2024年通胀将继续稳定下降,尤其是在发达经济体,但几乎所有经济体的通胀率仍高于央行的目标。预计到2025年年中将实现整体通胀目标。
《市场报告-隐形文胸(胸贴)》PDF下载
隐形文胸(又称粘性文胸,后简称胸贴),一种特殊设计的内衣,没有肩带和紧身设计,通过胶粘剂或胶水在胸部周围粘附,提供支撑和提升效果。材质主要有医用胶、连体服胶和硅胶三类
《2024年第1季度全球宏观经济季度报告》PDF下载
1季度,中国外部经济综合CEEM-PMMI指数季度低于荣枯线。美国经济继续扩张,美国经济继续扩张,欧洲经济双速复苏,日本经济运行大势稳定。印度经济继续强劲增长,巴西经济继续缓慢复苏,南非复苏态势疲弱,俄罗斯经济延续短期韧性。东盟六国和韩国金融市场呈现汇率相对较弱、股票市场整体表现较强的格局。
《2023年东南亚经贸简报-增长放缓旅游回升,汽车和资源贸易活跃》PDF下载
2023 年东南亚六国的宏观经济增速较上年有所放缓。菲律宾经济增长最为强劲,印度尼西亚制造业景气上升,越南消费表现强劲,马来西亚消费增长区域内第一,新加坡经济增长表现不错,泰国经济增长最为疲弱。
《跨境电商行业深度研究报告:短跑至长跑,跨境出海提速》PDF下载
海外头部跨境电商平台实力犹在,频频发力新兴市场。国际 B2C 跨境电商平台主要有 Amazon、eBay、Wish等。据Statista数据,在多位玩家集聚的美国市场,亚马逊以37.6%的绝对优势稳居市场份额第一,领先其他平台。
AMZ123选品观察员
选品推荐及选品技巧分享。
亚马逊全球开店
亚马逊全球开店官方公众号,致力于为中国跨境卖家提供最新,最全亚马逊全球开店资讯,运营干货分享及开店支持。
跨境电商干货集结
跨境电商干货集结,是结合亚马逊跨境电商卖家交流群内大家在交流过程中最常遇到的问题,进行收集整理,汇总解答,将会持续更新大家当前最常遇见的问题。欢迎大家加入跨境电商干货集结卖家交流群一起探讨。
AMZ123跨境电商
专注跨境行业热点事件报道,每日坚持推送原创深度热文
跨境电商赢商荟
跨境电商行业唯一一家一年365天不断更的媒体!
AMZ123卖家导航
这个人很懒,还没有自我介绍
亚马逊资讯
AMZ123旗下亚马逊资讯发布平台,专注亚马逊全球热点事件,为广大卖家提供亚马逊最新动态、最热新闻。
欧洲电商资讯
AMZ123旗下欧洲跨境电商新闻栏目,专注欧洲跨境电商热点资讯,为广大卖家提供欧洲跨境电商最新动态、最热新闻。
品类交流群
跨境资料
官方社区
宠物品类交流群
加入
玩具品类交流群
加入
运动户外交流群
加入
立即扫码咨询
立即扫码咨询
立即咨询
官方微信群
官方客服

扫码添加,立即咨询

扫码加群
官方微信群
官方微信群

扫码添加,拉你进群

更多内容
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯