AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

揭秘递四方实时数仓,双11实时物流订单的最佳实践

3231
2021-12-01 19:23
2021-12-01 19:23
3231


随着双11的开启,物流业也迎来了年度大考。2021年双11期间,递四方作为物流仓储服务方,布局仓库和分拣点超40+个,50w+平米作业场地,单日订单峰值达千万级别,海量购物订单由递四方配送到家,消费者由尾款人秒变收货人。

图片


01
双十一的业务挑战


为了应对双11单日峰值达到千万级别订单的状况,递四方运用大数据合理优化资源,提前做好全球仓储人力、物力、运力配置,保障仓储各流程高效、有序进行。从今年10月中下旬开始,上海转运中心和东莞转运中心相继启动。截至目前,递四方陆续在华东、华北、华南新建、扩建超级枢纽、揽收仓至40余个,继续加大在全国的布局;在国内拥有40个+分公司/分拨服务网点,全国50万+平方米办公/作业场地面积。


在业务方面,递四方借助自主研发分拣系统和云技术,快速进行条码识别,按指令分拣,实现称重分拣一体化全面覆盖,保证每一票货物都可自动识别、精准分拣出库。称重及分拣,已从传统人工模式升级为100%人工管控模式。此外,递四方信息科技的黑科技硬件——红光在此次“双11”首次亮相。在分拣效率不变的情况下,递四方信息科技用光幕等技术手段,对分拣机落格包裹进行核验,将库内错分率降低至万分之三,达到业界领先水平。尤其针对仓库环节,不断加大对库内的自动化、数字化、智能化建设,结合大数据、AI算法、云计算等手段进行系统的研发升级,引进高科技设备来提升产能、保障时效。


随着双11期间订单量剧增、应用的复杂度提升,我们的业务系统也经受着严峻的挑战,原来的实时数仓架构已经不能满足业务当前的需求。在寻找新的解决方案时,我们对比了业界常用的开源大数据实时查询数据库,在千亿级别数据多表连接查询时都遇到了瓶颈,无法满足业务实时性、服务稳定性的要求。


实时数仓在递四方的应用场景应用主要有以下几个方面:揽收、库内操作、仓间调拨、清关交邮预警监控,这里面包含着单票运转操作的每一个步骤。这些场景都需要做到实时监控,并且实时做出决策来提高物流的的整体时效。尤其是在双十一高峰期的情况下,如果人力或资源分配不足,很容易使某一环节堵塞,进而影响整体物流的时效。在技术的层面,我们有很多个业务系统,这些系统之间既有一致性也有独立性,一个复杂指标涉及到多个系统多张表,因此我们实时数仓对表连接查询能力非常强,而且对数据的更新插入速度也有着很高的要求。


今年双11,递四方对支撑业务的实时数仓系统进行了升级,通过新一代基于flink+hologres的实时数仓系统,在物流订单量相较于去年增加多倍的情况下,仍然能够实时监控每一票订单的物流情况、每一个仓库的作业情况,并且实时数仓整体成本下降50%,真正做到了“多、快、好、省”。


那么,递四方实时数仓的升级演进之路又是怎样的呢?我们一起来听听递四方资深数据架构师的介绍吧~


02
递四方实时数仓之路


1

实时数仓1.0


在刚开始做第一版实时数仓的时候,时间窗口比较紧,我们要把有限的精力放到数据建模以及业务开发中,所以在对比了数据库的吞吐性以及处理能力后,我们选择了ADB。ADB行列混存,全字段索引,在数量大很大的情况下,查询速度、插入速度都很快,而且支持DTS、OTTER等数据同步接入,同步性能很好。


图片


数据源是阿里云的PolarDB、MySQL、RDS等数据库,采用阿里云的DataWork数据同步,把增量数据实时同步到ADB中,然后在ADB中做数据实时的计算,数据的任务调度在DataWork中完成。


我们所有部门都在使用该架构的时候,遇到了一些瓶颈,该架构不满足我们的实时数仓,后来我们的实时数仓选择了另外一个方案。


2

实时数仓2.0


经历了第一个版本的实时数仓后,我们总结了实时数仓的两个重要特性,一是实时,二是服务的稳定性。


第一个版本的实时数仓不能很好地满足稳定性,我们决定对新的实时数仓进行一个深入的研究和探索,在阿里云上看到了很多关于Hologres的应用,其性能表现极其出色,带来了不错的效果。在对比了业界不同的实时数仓架构后,我们最终选择了Flink+Hologres组合作为实时数仓。


图片


这里一共有2条路径:


· 第一条路径,是通过DTS把Binlog数据同步到DataHub,然后使用Flink从DataHub中消费数据,把计算结果存储在Hologres中,这条路径主要是用于计算一些访问频率高且数据量大的数据,比如待揽收单量、入库单量、待完成单量等。


· 第二条路径,是业务系统的Binlog数据通过DataWorks同步到Hologres中。Hologres中分了3层,ODS层用于存放原始数据,直接加载原始日志、数据,数据保持原貌不做处理。一般情况下,以增量的方式从业务系统导入到ODS层,数据模型和粒度都与业务系统保持一致。DWD层数据明细层,对ODS层数据进行清洗。DWS为汇总层,主要存放宽表。这里主要是考虑到粒度的不一样,在Hologres中多表连接查询能够发挥其最大的作用。整个架构的任务调度依赖于DataWorks。


本次采用的批流一体即席计算查询混合模式,既发挥了Flink流计算的能力,也充分利用了Hologres强大的连表查询能力。互联网普遍运用的开源的实时查询数据库,但我们的业务复杂度是互联网的若干倍,这些实时数据库并不能完全满足我们的需求,架构互有优劣,但我们的架构是未来五六年内业务高速增长的最佳选择


03
递四方与实时数仓Hologres


1

为什么选择Hologres


那么为什么会选择Hologres呢?通过调研发现它有几个特点,比较适合实际情况。


· 第一是Hologres的实时能力,满足目前递四方的实时数仓需求,支持百亿级表与亿级表之间的JOIN,秒级查询响应,还支持实时写入、批量数据导入,拥有超高导入性能,且并发能力极强。


· 第二是Hologres 采用存储计算分离架构,数据存储在阿里云分布式文件系统pangu中(类比开源HDFS),方便按需单独扩展计算或者存储。对快速行业来说,大促和日常所需要资源不一样,能够快速扩缩容,满足业务的动态需求。同时Hologres支持异构数据源交互分析以及离线数据和实时数据的联邦查询,Hologres已经和MaxCompute无缝打通,能够直接在Hologres中加速查询MaxCompute离线表。


· 第三是维护成本低、运行稳定,Hologres作为实时数仓存储成本大约是ADB的1/3。资源灵活性高,可以像MaxCompute一样灵活的升降配置,与阿里云大数据组件兼容性高,能降低运维成本和提高研发效能,不会对技术架构带来很大负担。


2

Hologres应用场景


在面向分析OLAP系统里面,Hologres承担了实时和离线数据的查询,由于Hologres既支持高并发写入,又能够满足及时查询,同时还能够支持OLAP分析,在我们的不同粒度的表进行连接的时候,能够充分发挥其优势。下面列举2个不同的场景对其做一个详细的说明。


· 场景一:库内操作场景


实时的数据从Binlog解析到ODS层,同时微批任务将分钟级别(范围可调)的统计数据计算到DWS宽表,同时跟离线的数据进行插入更新,就可以得到实时的全量数据表,调度采取DataWorks的调度,每5分钟调度1次。


·场景二:仓间调拨场景


对于一些数据量小的表,依赖于Hologres强大的Join能力,通过视图来构建DWS中间层,如下图所示:


图片


DWD是对ODS层过滤的视图,DWS层是DWD层聚合层的宽表,每次查询DWS层的时候,就相当于所有表重新查询了一次。这种查询语句是非常复杂的,对于关系型数据库来说,可能有性能瓶颈会非常缓慢。但是对于Hologres来说,毫秒级别查询完成毫无压力,做到了实时响应,并且节省了调度资源,同时也提升了查询的灵活性。


3

Hologres目前的不足


在使用Hologres期间也发现的一些不满足实际需求的地方:一是非空列不能建立索引,多个亿级别表连接在没有索引的情况下,查询速度下降。二是Hologres兼容Postgre生态,但支持的函数不多,在开发上与MaxCompute相比有一定的难度。


04

物流“智能化”



整个双11期间,递四方通过升级实时数仓技术,基于Flink+Hologres搭建的实时数仓支撑了实时大屏的高频刷新访问,实时监控物流动态,促进了业务高效运行,让消费者的快递更快到家。


整个架构升级给业务带来的价值有以下几个方面:


· 稳定:基于Hologres持续高稳定的输出,整体双11期间不论是实时数据写入、还是数据的读取都表现出了极强的稳定性。整个双11期间,真正做到了0故障率。


· 实时:实时的揽收、库内操作、中转调拨等实时大屏,对我们的运营提供了非常强有力的实时数据支撑,整体时效比去年提高了不少,给用户带来良好的物流体验,提高了公司的服务水平。


· 云原生:除了上面两个核心价值之外,由于双11期间是流量高峰期,比日常流量高出上千倍,通过Hologres可以实现动态扩缩容,满足我们对资源的不同需求,从而也降低了运维成本


这是递四方参与的第7个双11狂欢节,递四方在这次的物流大考中交出了满意的答卷。随着业务迅猛增长,递四方也在不断演进背后的实时数仓技术来支撑更丰富的仓储物流场景,让物流从“手工化”逐渐转变为“智能化”。



免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
英国3月电商销售额同比增长10.6%,节日带动市场回暖
AMZ123获悉,近日,根据NielsenIQ发布的最新数据,截至2026年3月21日的过去四周,英国主要超市的总销售额同比增长4.3%,高于2月份的3.3%。这一增长主要受到母亲节提前两周以及消费者提前进行复活节采购的推动,带动整体消费回暖。在截至3月14日、母亲节前一周,英国迎来短暂的温暖春季天气,消费者在这一阶段集中购买礼品,促进了短期销售增长,英国主要超市销售额同比增长9.3%,额外带来1700万英镑的消费支出。从消费行为来看,到店购物频次已连续第二个月下降,同比减少1.1%。与此同时,线上渠道持续成为增长最快的板块,电商销售额同比增长10.6%,市场份额提升至13.9%。节日因素也带动多个品类销售增长。
Tokopedia与TikTok Shop印尼斋月交易量暴涨15倍
AMZ123获悉,近日,Tokopedia与TikTok Shop联合开展的“Ramadan Extra Exciting 2026”活动显示,在伊斯兰教斋月期间,每天天亮前吃sahur(封斋前用餐)的时间段里,平台交易量同比激增15倍。TikTok表示,这一增长主要受到TikTok内容生态的带动,尤其是直播带来的流量转化。在整个斋月期间,共有38亿人次观看了来自卖家及带货创作者的直播内容。从品类表现来看,穆斯林服装成为增长最快的核心品类之一。在TikTok Shop上,该品类交易量较平日增长3倍;与此同时,Tokopedia在斋月大促首日的第一个小时,整体交易量较去年同期活动同样实现3倍增长。
因产品数据质量不佳,印度电商每年损失五百亿卢比
AMZ123获悉,近日,据外媒报道,印度电商与快消行业正因产品数据质量不佳而蒙受巨额损失。据GS1印度公司的最新研究,不一致、不完整或不准确的产品信息每年导致约500亿卢比的资金流失。其中,约200亿卢比表现为毛利率下降,原因包括转化率降低、商品上架受限以及销售速度放缓;另有190亿卢比直接用于退货相关成本,涵盖逆向物流、处理与加工等环节。尤其在时尚服装领域,退货问题更为突出。因尺码不合、款式偏好或实物与描述不符,顾客主动退货率通常占总订单的20%至25%。Unicommerce指出,逆向物流会使订单价值额外增加5%至7%,而这还不含原始运费。放眼全球,时尚与鞋类退货率甚至可达30%至40%。
存火灾风险!美国CPSC紧急召回八款插头延长线
AMZ123获悉,近日,美国消费者产品安全委员会(CPSC)发布紧急召回警告,要求消费者立即停止使用“插头延长线”,并已与沃尔玛、eBay和AliExpress等电商平台达成协议,下架相关危险商品。CPSC指出,这类延长线两端均为公头插头,插入电源后裸露插脚可能带电,存在严重触电和火灾风险,因此在任何情况下都不应使用。为防止危险商品继续流入市场,CPSC已推动相关电商平台删除商品链接,同时平台方面承诺将主动识别并下架类似产品。根据CPSC的公告,多家来自中国的卖家和企业涉及销售该类产品,但大多数未回应CPSC关于召回或产品信息的要求。
韩国电商竞争转向:会员权益与AI成新焦点
AMZ123获悉,近日,据外媒报道,随着配送速度不再是唯一竞争壁垒,韩国电商平台正集体转向会员权益、免运费门槛和人工智能体验的比拼。业内人士认为,当行业整体配送能力趋于均衡,消费者能否获得实实在在的优惠和便捷的购物体验,才是决定复购的关键。近期,在会员权益方面,多家平台密集推出新举措。Gmarket将于4月23日推出名为“Kkok”的积分制会员计划,会员根据累计消费金额最高可获5%的“Smile Cash”平台积分;若当月积分低于2900韩元的月费,次月平台会自动补足差额。
万事达卡在拉美完成首批AI代理支付交易
Fin123获悉,近日,万事达卡(Mastercard)宣布,已在拉丁美洲和加勒比地区完成多笔由AI代理发起的真实支付交易,标志着“代理式支付”(agentic payments)从概念阶段进入实际应用阶段。这些交易在受控环境中通过万事达卡Agent Pay基础设施完成,全部基于现有银行卡支付网络执行,且均获得持卡人授权,覆盖从商品搜索到支付完成的全流程。
824个品牌中招?疑WOOT封号名单曝光
AMZ123在此前文章中提到,自3月初起,业内陆续有卖家反映收到亚马逊扫号邮件,而这轮扫号的矛头,大多都指向“WOOT刷单”。随后,卖家圈接连传出小号被封、主账号受牵连、资金被冻结等消息。到了4月,这场风波仍未平息,反而有越查越深的迹象。风声渐紧之下,卖家圈最关心的话题也随之变了——这次到底扫到了谁?就在这样的追问声中,AMZ123了解到,一份疑似与此次WOOT封号潮相关的品牌名单,近日开始在卖家圈流传。从目前流出的截图来看,这份名单共列出824个品牌,PUKAOCK、KUKALY、ITSNGBY、TAOOLP、MYTHSIGHT、HOOROLA、DR.FRESH、CYBERBLAZE等多个品牌名均在其中。
靠“穿搭”火遍全网,有线耳机在TikTok Shop销量暴涨
重回“顶流”,这个千禧年“赛博配饰”在TikTok爆火
百亿营收难掩利润“雪崩”,傲基怎么了
在新一轮的财报季中,这位头顶“百亿大卖”、“华南城四少之一”两大光环的跨境大卖,交出了一份“冰火两重天”的成绩单。AMZ123获悉,3月27日,傲基股份发布了2025年业绩公告。报告期内,傲基实现营业收入136.99亿元,同比增长27.9%,继2024年突破百亿营收后再度创下新高。在宏观经济承压、市场充满不确定性的背景下,这无疑是一份亮眼的营收答卷。从业务结构来看,支撑傲基维持百亿营收的,仍是来自商品销售板块的持续增长。财报显示,傲基商品销售全年实现收入95.82亿元,同比增长15.9%,占总收入的69.9%。
亚马逊告别运通,联手美国银行和万事达推出新卡
AMZ123获悉,据外媒报道,3月31日,亚马逊宣布,将终止与美国运通在小企业信用卡领域的八年合作,转而联合美国银行和万事达卡推出两款全新的商务信用卡。新产品计划于今年春季上线,8月14日正式完成过渡。此次推出的两款信用卡分别为“Prime商务卡”和“亚马逊商务卡”,均由美国银行发行,属于万事达网络体系,均不收取年费。Prime会员使用前者在亚马逊购物可获得5%返现,后者则为非Prime会员提供3%返现。两类卡片在亚马逊以外的消费场景同样可获得奖励,并配有灵活的信用条款。更多权益细节预计在未来几个月内陆续公布。亚马逊方面表示,此次调整旨在回应小企业客户对奖励获取能力和现金流管理工具的需求。
印尼Q1快消品电商销售超400万亿印尼盾,Tokopedia增长最快
AMZ123获悉,近日,根据Compas.co.id最新发布的报告,2026年第一季度印尼快速消费品(FMCG)电商销售额创下新高,总额超过400万亿印尼盾,高于2025年第四季度的396万亿印尼盾。报告显示,美妆类依然是销售主力,季度销售额达到186万亿印尼盾,同比增长33%。食品饮料(F&B)类受益于斋月与开斋节消费热潮,实现103万亿印尼盾的销售额,同比激增88%,成为增长最快的核心品类之一。家居清洁用品类表现亮眼,销售额达到20万亿印尼盾,同比大幅增长96%,其中包括纸巾、杀虫剂及家用清洁用品等深受消费者欢迎的商品。
男装区跑出黑马!TikTok一条“万能5分裤”卖了近150万
根据fortunebusinessinsights,2026年,全球男装市场规模约为7234亿美元,预计到2034年将增至1.24万亿美元,预测期内年复合增长率为6.92%。愈发多元的男士着装需求,拉动市场规模一路狂飙,在TikTok美区一款表面看起来平平无奇的男士裤衩,7天时间销量环比暴涨了12573.85%,成为类目的绝对黑马。01TikTok男士裤衩,销量暴走TT123观察到,3.23-29期间,在TikTok美区运动与户外类目,一款男士5分裤的周销量环比跳涨了120倍,在售价相差无几的情况下,销售额已反超类目“资深”的爆款女装。
Stripe与Meta合作,FB广告可完成一键结账
Fin123获悉,近日,Stripe宣布,为Facebook广告商推出全新结账体验,使消费者无需离开应用即可完成购买。通过这项功能,使用Stripe的卖家可以将Facebook广告与支付系统直接连接,买家点击广告中的“立即购买”按钮后,可使用Meta钱包中保存的支付凭证完成一键结账。该流程基于《智能体商务协议》,未来将扩展到包括Instagram广告在内的更多Meta平台。卖家可在Stripe管理平台中通过开关选择启用此功能,并关联其Meta广告账户。启用后,购买过程将完全嵌入广告体验,消除了用户在传统跳转浏览器或应用完成交易时的中断,从而提升购买转化率。
824个品牌中招?疑WOOT封号名单曝光
AMZ123在此前文章中提到,自3月初起,业内陆续有卖家反映收到亚马逊扫号邮件,而这轮扫号的矛头,大多都指向“WOOT刷单”。随后,卖家圈接连传出小号被封、主账号受牵连、资金被冻结等消息。到了4月,这场风波仍未平息,反而有越查越深的迹象。风声渐紧之下,卖家圈最关心的话题也随之变了——这次到底扫到了谁?就在这样的追问声中,AMZ123了解到,一份疑似与此次WOOT封号潮相关的品牌名单,近日开始在卖家圈流传。从目前流出的截图来看,这份名单共列出824个品牌,PUKAOCK、KUKALY、ITSNGBY、TAOOLP、MYTHSIGHT、HOOROLA、DR.FRESH、CYBERBLAZE等多个品牌名均在其中。
复活节消费成本将上涨4.42%,购物行为发生分化
AMZ123获悉,随着2026年复活节的临近,欧洲市场呈现出消费成本上升与物流需求激增并行的态势,购物行为也发生分化。根据ASM SFA发布的《2026年购物篮报告》,波兰市场复活节期间30种常用节日食材的平均价格为209.43波兰兹罗提,较上年同期上涨4.42%。尽管通胀趋于稳定,但基本商品价格仍处于高位,节日期间消费者对价格变动感受尤为明显。报告显示,不同零售渠道之间的价格差异显著。在12家接受调查的主要连锁超市中,最便宜与最贵的复活节购物篮价格相差近19%。其中,欧尚超市以184.93波兰兹罗提的均价成为价格最优选择,麦德龙现购自运和迪诺超市分别以194.51波兰兹罗提和201.84波兰兹罗提紧随其后。
《TikTok Shop 2025年度报告》PDF下载
2025年,TikTok Shop进一步加快扩张步伐,在巩固欧美成熟市场的同时,积极开拓新兴市场,先后上线德国、意大利、法国、日本等站点。此举不仅为平台带来新增量,也体现出其多元化市场战略的初步成效,以分散地缘政治风险。
《Shopee2025印尼站点X 汽车摩托品类专题》PDF下载
印尼当地汽车保有量并不高,每一千人的机动车保有量仅96人,未来可提升的空间仍大。空间参照系可以看泰国和马来,2024年泰国汽车保有量为322辆/千人,马来西亚为531辆/千人。
《2026年Shopee运动户外类目自行车爆品分享》PDF下载
巴西骑行爱好群体广泛,但平台上热销品呈现出的国际大牌极少,推测可能原因是国际品牌可能主要通过线下经销或自行渠道销售,未深度参与Shopee等本土电商。因此巴西用户在平台上几乎接触不到这些高端品牌产品。平台上巴西用户更倾向购买本土品牌的自行车,可能出于价格实惠和售后便利考虑。
《2025年TikTok生态发展白皮书》PDF下载
2025年,全球内容电商迈入深度跃迁的新周期。TikTokShop正以前所未有的速度拓展市场版图,完成从高速增长向高质量增长的跃迁。在这一进程中,生态结构重构、参与者多元化、全球政策协同等因素叠加,构成内容电商演进的核心变量。
《2026美妆健康与保健创新报告》PDF下载
每年,我们都会分析美妆与个护以及健康与家居类目的动态变化。但2026 年呈现了一个意外的新现象:这两个类目不再孤立运营。美妆和健康正与食品杂货融合,形成由配方创新、成分病毒式传播和消费者行为演变所驱动的强大三方生态系统。
《中国宠物食品行业出海国别机会洞察报告》PDF下载
本报告旨在深入分析中国宠物食品的全球出口机遇与国别差异,通过对行业发展现状、出口趋势及各国政策环境的研究,揭示中国宠物食品企业在国际市场中的竞争优势与面临的潜在挑战。
《市场洞察:2025中国汽车出海英国市场动态追踪》PDF下载
根据英国汽车制造商与贸易商协会数据显示,2025年1-9月中国汽车出海英国累计销量142,684辆,同比增长91%,远超英国整体市场4.2%增速。中国汽车出海英国市场份额从年初5%升至9月12.4%,成为英国第二大汽车来源国,仅次于德国。
《2026取暖电器行业简析报告》PDF下载
系统梳理了行业发展脉络、市场格局与未来趋势。取暖电器按能源类型与产品形态可分为电取暖、燃气取暖、辅助本报告为 2026 年中国取暖电器行业专业简析,集成类三大核心品类,行业发展历经萌芽起步、快速成长、加速升级、高质量发展四大阶段,完成了从单一功能向智能化、节能化、场景化的全面演进。
AMZ123卖家导航
这个人很懒,还没有自我介绍
跨境学院
跨境电商大小事,尽在跨境学院。
跨境电商赢商荟
跨境电商行业唯一一家一年365天不断更的媒体!
AMZ123会员
「AMZ123会员」为出海者推出的一站式私享服务
跨境科普达人
科普各种跨境小知识,科普那些你不知道的事...
北美电商资讯
AMZ123旗下北美跨境电商新闻栏目,专注北美跨境电商热点资讯,为广大卖家提供北美跨境电商最新动态、最热新闻。
亚马逊全球开店
亚马逊全球开店官方公众号,致力于为中国跨境卖家提供最新,最全亚马逊全球开店资讯,运营干货分享及开店支持。
亿邦动力网
消除一切电商知识鸿沟,每日发布独家重磅新闻。
首页
跨境头条
文章详情
揭秘递四方实时数仓,双11实时物流订单的最佳实践
4PX递四方
2021-12-01 19:23
3231


随着双11的开启,物流业也迎来了年度大考。2021年双11期间,递四方作为物流仓储服务方,布局仓库和分拣点超40+个,50w+平米作业场地,单日订单峰值达千万级别,海量购物订单由递四方配送到家,消费者由尾款人秒变收货人。

图片


01
双十一的业务挑战


为了应对双11单日峰值达到千万级别订单的状况,递四方运用大数据合理优化资源,提前做好全球仓储人力、物力、运力配置,保障仓储各流程高效、有序进行。从今年10月中下旬开始,上海转运中心和东莞转运中心相继启动。截至目前,递四方陆续在华东、华北、华南新建、扩建超级枢纽、揽收仓至40余个,继续加大在全国的布局;在国内拥有40个+分公司/分拨服务网点,全国50万+平方米办公/作业场地面积。


在业务方面,递四方借助自主研发分拣系统和云技术,快速进行条码识别,按指令分拣,实现称重分拣一体化全面覆盖,保证每一票货物都可自动识别、精准分拣出库。称重及分拣,已从传统人工模式升级为100%人工管控模式。此外,递四方信息科技的黑科技硬件——红光在此次“双11”首次亮相。在分拣效率不变的情况下,递四方信息科技用光幕等技术手段,对分拣机落格包裹进行核验,将库内错分率降低至万分之三,达到业界领先水平。尤其针对仓库环节,不断加大对库内的自动化、数字化、智能化建设,结合大数据、AI算法、云计算等手段进行系统的研发升级,引进高科技设备来提升产能、保障时效。


随着双11期间订单量剧增、应用的复杂度提升,我们的业务系统也经受着严峻的挑战,原来的实时数仓架构已经不能满足业务当前的需求。在寻找新的解决方案时,我们对比了业界常用的开源大数据实时查询数据库,在千亿级别数据多表连接查询时都遇到了瓶颈,无法满足业务实时性、服务稳定性的要求。


实时数仓在递四方的应用场景应用主要有以下几个方面:揽收、库内操作、仓间调拨、清关交邮预警监控,这里面包含着单票运转操作的每一个步骤。这些场景都需要做到实时监控,并且实时做出决策来提高物流的的整体时效。尤其是在双十一高峰期的情况下,如果人力或资源分配不足,很容易使某一环节堵塞,进而影响整体物流的时效。在技术的层面,我们有很多个业务系统,这些系统之间既有一致性也有独立性,一个复杂指标涉及到多个系统多张表,因此我们实时数仓对表连接查询能力非常强,而且对数据的更新插入速度也有着很高的要求。


今年双11,递四方对支撑业务的实时数仓系统进行了升级,通过新一代基于flink+hologres的实时数仓系统,在物流订单量相较于去年增加多倍的情况下,仍然能够实时监控每一票订单的物流情况、每一个仓库的作业情况,并且实时数仓整体成本下降50%,真正做到了“多、快、好、省”。


那么,递四方实时数仓的升级演进之路又是怎样的呢?我们一起来听听递四方资深数据架构师的介绍吧~


02
递四方实时数仓之路


1

实时数仓1.0


在刚开始做第一版实时数仓的时候,时间窗口比较紧,我们要把有限的精力放到数据建模以及业务开发中,所以在对比了数据库的吞吐性以及处理能力后,我们选择了ADB。ADB行列混存,全字段索引,在数量大很大的情况下,查询速度、插入速度都很快,而且支持DTS、OTTER等数据同步接入,同步性能很好。


图片


数据源是阿里云的PolarDB、MySQL、RDS等数据库,采用阿里云的DataWork数据同步,把增量数据实时同步到ADB中,然后在ADB中做数据实时的计算,数据的任务调度在DataWork中完成。


我们所有部门都在使用该架构的时候,遇到了一些瓶颈,该架构不满足我们的实时数仓,后来我们的实时数仓选择了另外一个方案。


2

实时数仓2.0


经历了第一个版本的实时数仓后,我们总结了实时数仓的两个重要特性,一是实时,二是服务的稳定性。


第一个版本的实时数仓不能很好地满足稳定性,我们决定对新的实时数仓进行一个深入的研究和探索,在阿里云上看到了很多关于Hologres的应用,其性能表现极其出色,带来了不错的效果。在对比了业界不同的实时数仓架构后,我们最终选择了Flink+Hologres组合作为实时数仓。


图片


这里一共有2条路径:


· 第一条路径,是通过DTS把Binlog数据同步到DataHub,然后使用Flink从DataHub中消费数据,把计算结果存储在Hologres中,这条路径主要是用于计算一些访问频率高且数据量大的数据,比如待揽收单量、入库单量、待完成单量等。


· 第二条路径,是业务系统的Binlog数据通过DataWorks同步到Hologres中。Hologres中分了3层,ODS层用于存放原始数据,直接加载原始日志、数据,数据保持原貌不做处理。一般情况下,以增量的方式从业务系统导入到ODS层,数据模型和粒度都与业务系统保持一致。DWD层数据明细层,对ODS层数据进行清洗。DWS为汇总层,主要存放宽表。这里主要是考虑到粒度的不一样,在Hologres中多表连接查询能够发挥其最大的作用。整个架构的任务调度依赖于DataWorks。


本次采用的批流一体即席计算查询混合模式,既发挥了Flink流计算的能力,也充分利用了Hologres强大的连表查询能力。互联网普遍运用的开源的实时查询数据库,但我们的业务复杂度是互联网的若干倍,这些实时数据库并不能完全满足我们的需求,架构互有优劣,但我们的架构是未来五六年内业务高速增长的最佳选择


03
递四方与实时数仓Hologres


1

为什么选择Hologres


那么为什么会选择Hologres呢?通过调研发现它有几个特点,比较适合实际情况。


· 第一是Hologres的实时能力,满足目前递四方的实时数仓需求,支持百亿级表与亿级表之间的JOIN,秒级查询响应,还支持实时写入、批量数据导入,拥有超高导入性能,且并发能力极强。


· 第二是Hologres 采用存储计算分离架构,数据存储在阿里云分布式文件系统pangu中(类比开源HDFS),方便按需单独扩展计算或者存储。对快速行业来说,大促和日常所需要资源不一样,能够快速扩缩容,满足业务的动态需求。同时Hologres支持异构数据源交互分析以及离线数据和实时数据的联邦查询,Hologres已经和MaxCompute无缝打通,能够直接在Hologres中加速查询MaxCompute离线表。


· 第三是维护成本低、运行稳定,Hologres作为实时数仓存储成本大约是ADB的1/3。资源灵活性高,可以像MaxCompute一样灵活的升降配置,与阿里云大数据组件兼容性高,能降低运维成本和提高研发效能,不会对技术架构带来很大负担。


2

Hologres应用场景


在面向分析OLAP系统里面,Hologres承担了实时和离线数据的查询,由于Hologres既支持高并发写入,又能够满足及时查询,同时还能够支持OLAP分析,在我们的不同粒度的表进行连接的时候,能够充分发挥其优势。下面列举2个不同的场景对其做一个详细的说明。


· 场景一:库内操作场景


实时的数据从Binlog解析到ODS层,同时微批任务将分钟级别(范围可调)的统计数据计算到DWS宽表,同时跟离线的数据进行插入更新,就可以得到实时的全量数据表,调度采取DataWorks的调度,每5分钟调度1次。


·场景二:仓间调拨场景


对于一些数据量小的表,依赖于Hologres强大的Join能力,通过视图来构建DWS中间层,如下图所示:


图片


DWD是对ODS层过滤的视图,DWS层是DWD层聚合层的宽表,每次查询DWS层的时候,就相当于所有表重新查询了一次。这种查询语句是非常复杂的,对于关系型数据库来说,可能有性能瓶颈会非常缓慢。但是对于Hologres来说,毫秒级别查询完成毫无压力,做到了实时响应,并且节省了调度资源,同时也提升了查询的灵活性。


3

Hologres目前的不足


在使用Hologres期间也发现的一些不满足实际需求的地方:一是非空列不能建立索引,多个亿级别表连接在没有索引的情况下,查询速度下降。二是Hologres兼容Postgre生态,但支持的函数不多,在开发上与MaxCompute相比有一定的难度。


04

物流“智能化”



整个双11期间,递四方通过升级实时数仓技术,基于Flink+Hologres搭建的实时数仓支撑了实时大屏的高频刷新访问,实时监控物流动态,促进了业务高效运行,让消费者的快递更快到家。


整个架构升级给业务带来的价值有以下几个方面:


· 稳定:基于Hologres持续高稳定的输出,整体双11期间不论是实时数据写入、还是数据的读取都表现出了极强的稳定性。整个双11期间,真正做到了0故障率。


· 实时:实时的揽收、库内操作、中转调拨等实时大屏,对我们的运营提供了非常强有力的实时数据支撑,整体时效比去年提高了不少,给用户带来良好的物流体验,提高了公司的服务水平。


· 云原生:除了上面两个核心价值之外,由于双11期间是流量高峰期,比日常流量高出上千倍,通过Hologres可以实现动态扩缩容,满足我们对资源的不同需求,从而也降低了运维成本


这是递四方参与的第7个双11狂欢节,递四方在这次的物流大考中交出了满意的答卷。随着业务迅猛增长,递四方也在不断演进背后的实时数仓技术来支撑更丰富的仓储物流场景,让物流从“手工化”逐渐转变为“智能化”。



咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部