AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

揭秘递四方实时数仓,双11实时物流订单的最佳实践

2700
2021-12-01 19:23
2021-12-01 19:23
2700


随着双11的开启,物流业也迎来了年度大考。2021年双11期间,递四方作为物流仓储服务方,布局仓库和分拣点超40+个,50w+平米作业场地,单日订单峰值达千万级别,海量购物订单由递四方配送到家,消费者由尾款人秒变收货人。

图片


01
双十一的业务挑战


为了应对双11单日峰值达到千万级别订单的状况,递四方运用大数据合理优化资源,提前做好全球仓储人力、物力、运力配置,保障仓储各流程高效、有序进行。从今年10月中下旬开始,上海转运中心和东莞转运中心相继启动。截至目前,递四方陆续在华东、华北、华南新建、扩建超级枢纽、揽收仓至40余个,继续加大在全国的布局;在国内拥有40个+分公司/分拨服务网点,全国50万+平方米办公/作业场地面积。


在业务方面,递四方借助自主研发分拣系统和云技术,快速进行条码识别,按指令分拣,实现称重分拣一体化全面覆盖,保证每一票货物都可自动识别、精准分拣出库。称重及分拣,已从传统人工模式升级为100%人工管控模式。此外,递四方信息科技的黑科技硬件——红光在此次“双11”首次亮相。在分拣效率不变的情况下,递四方信息科技用光幕等技术手段,对分拣机落格包裹进行核验,将库内错分率降低至万分之三,达到业界领先水平。尤其针对仓库环节,不断加大对库内的自动化、数字化、智能化建设,结合大数据、AI算法、云计算等手段进行系统的研发升级,引进高科技设备来提升产能、保障时效。


随着双11期间订单量剧增、应用的复杂度提升,我们的业务系统也经受着严峻的挑战,原来的实时数仓架构已经不能满足业务当前的需求。在寻找新的解决方案时,我们对比了业界常用的开源大数据实时查询数据库,在千亿级别数据多表连接查询时都遇到了瓶颈,无法满足业务实时性、服务稳定性的要求。


实时数仓在递四方的应用场景应用主要有以下几个方面:揽收、库内操作、仓间调拨、清关交邮预警监控,这里面包含着单票运转操作的每一个步骤。这些场景都需要做到实时监控,并且实时做出决策来提高物流的的整体时效。尤其是在双十一高峰期的情况下,如果人力或资源分配不足,很容易使某一环节堵塞,进而影响整体物流的时效。在技术的层面,我们有很多个业务系统,这些系统之间既有一致性也有独立性,一个复杂指标涉及到多个系统多张表,因此我们实时数仓对表连接查询能力非常强,而且对数据的更新插入速度也有着很高的要求。


今年双11,递四方对支撑业务的实时数仓系统进行了升级,通过新一代基于flink+hologres的实时数仓系统,在物流订单量相较于去年增加多倍的情况下,仍然能够实时监控每一票订单的物流情况、每一个仓库的作业情况,并且实时数仓整体成本下降50%,真正做到了“多、快、好、省”。


那么,递四方实时数仓的升级演进之路又是怎样的呢?我们一起来听听递四方资深数据架构师的介绍吧~


02
递四方实时数仓之路


1

实时数仓1.0


在刚开始做第一版实时数仓的时候,时间窗口比较紧,我们要把有限的精力放到数据建模以及业务开发中,所以在对比了数据库的吞吐性以及处理能力后,我们选择了ADB。ADB行列混存,全字段索引,在数量大很大的情况下,查询速度、插入速度都很快,而且支持DTS、OTTER等数据同步接入,同步性能很好。


图片


数据源是阿里云的PolarDB、MySQL、RDS等数据库,采用阿里云的DataWork数据同步,把增量数据实时同步到ADB中,然后在ADB中做数据实时的计算,数据的任务调度在DataWork中完成。


我们所有部门都在使用该架构的时候,遇到了一些瓶颈,该架构不满足我们的实时数仓,后来我们的实时数仓选择了另外一个方案。


2

实时数仓2.0


经历了第一个版本的实时数仓后,我们总结了实时数仓的两个重要特性,一是实时,二是服务的稳定性。


第一个版本的实时数仓不能很好地满足稳定性,我们决定对新的实时数仓进行一个深入的研究和探索,在阿里云上看到了很多关于Hologres的应用,其性能表现极其出色,带来了不错的效果。在对比了业界不同的实时数仓架构后,我们最终选择了Flink+Hologres组合作为实时数仓。


图片


这里一共有2条路径:


· 第一条路径,是通过DTS把Binlog数据同步到DataHub,然后使用Flink从DataHub中消费数据,把计算结果存储在Hologres中,这条路径主要是用于计算一些访问频率高且数据量大的数据,比如待揽收单量、入库单量、待完成单量等。


· 第二条路径,是业务系统的Binlog数据通过DataWorks同步到Hologres中。Hologres中分了3层,ODS层用于存放原始数据,直接加载原始日志、数据,数据保持原貌不做处理。一般情况下,以增量的方式从业务系统导入到ODS层,数据模型和粒度都与业务系统保持一致。DWD层数据明细层,对ODS层数据进行清洗。DWS为汇总层,主要存放宽表。这里主要是考虑到粒度的不一样,在Hologres中多表连接查询能够发挥其最大的作用。整个架构的任务调度依赖于DataWorks。


本次采用的批流一体即席计算查询混合模式,既发挥了Flink流计算的能力,也充分利用了Hologres强大的连表查询能力。互联网普遍运用的开源的实时查询数据库,但我们的业务复杂度是互联网的若干倍,这些实时数据库并不能完全满足我们的需求,架构互有优劣,但我们的架构是未来五六年内业务高速增长的最佳选择


03
递四方与实时数仓Hologres


1

为什么选择Hologres


那么为什么会选择Hologres呢?通过调研发现它有几个特点,比较适合实际情况。


· 第一是Hologres的实时能力,满足目前递四方的实时数仓需求,支持百亿级表与亿级表之间的JOIN,秒级查询响应,还支持实时写入、批量数据导入,拥有超高导入性能,且并发能力极强。


· 第二是Hologres 采用存储计算分离架构,数据存储在阿里云分布式文件系统pangu中(类比开源HDFS),方便按需单独扩展计算或者存储。对快速行业来说,大促和日常所需要资源不一样,能够快速扩缩容,满足业务的动态需求。同时Hologres支持异构数据源交互分析以及离线数据和实时数据的联邦查询,Hologres已经和MaxCompute无缝打通,能够直接在Hologres中加速查询MaxCompute离线表。


· 第三是维护成本低、运行稳定,Hologres作为实时数仓存储成本大约是ADB的1/3。资源灵活性高,可以像MaxCompute一样灵活的升降配置,与阿里云大数据组件兼容性高,能降低运维成本和提高研发效能,不会对技术架构带来很大负担。


2

Hologres应用场景


在面向分析OLAP系统里面,Hologres承担了实时和离线数据的查询,由于Hologres既支持高并发写入,又能够满足及时查询,同时还能够支持OLAP分析,在我们的不同粒度的表进行连接的时候,能够充分发挥其优势。下面列举2个不同的场景对其做一个详细的说明。


· 场景一:库内操作场景


实时的数据从Binlog解析到ODS层,同时微批任务将分钟级别(范围可调)的统计数据计算到DWS宽表,同时跟离线的数据进行插入更新,就可以得到实时的全量数据表,调度采取DataWorks的调度,每5分钟调度1次。


·场景二:仓间调拨场景


对于一些数据量小的表,依赖于Hologres强大的Join能力,通过视图来构建DWS中间层,如下图所示:


图片


DWD是对ODS层过滤的视图,DWS层是DWD层聚合层的宽表,每次查询DWS层的时候,就相当于所有表重新查询了一次。这种查询语句是非常复杂的,对于关系型数据库来说,可能有性能瓶颈会非常缓慢。但是对于Hologres来说,毫秒级别查询完成毫无压力,做到了实时响应,并且节省了调度资源,同时也提升了查询的灵活性。


3

Hologres目前的不足


在使用Hologres期间也发现的一些不满足实际需求的地方:一是非空列不能建立索引,多个亿级别表连接在没有索引的情况下,查询速度下降。二是Hologres兼容Postgre生态,但支持的函数不多,在开发上与MaxCompute相比有一定的难度。


04

物流“智能化”



整个双11期间,递四方通过升级实时数仓技术,基于Flink+Hologres搭建的实时数仓支撑了实时大屏的高频刷新访问,实时监控物流动态,促进了业务高效运行,让消费者的快递更快到家。


整个架构升级给业务带来的价值有以下几个方面:


· 稳定:基于Hologres持续高稳定的输出,整体双11期间不论是实时数据写入、还是数据的读取都表现出了极强的稳定性。整个双11期间,真正做到了0故障率。


· 实时:实时的揽收、库内操作、中转调拨等实时大屏,对我们的运营提供了非常强有力的实时数据支撑,整体时效比去年提高了不少,给用户带来良好的物流体验,提高了公司的服务水平。


· 云原生:除了上面两个核心价值之外,由于双11期间是流量高峰期,比日常流量高出上千倍,通过Hologres可以实现动态扩缩容,满足我们对资源的不同需求,从而也降低了运维成本


这是递四方参与的第7个双11狂欢节,递四方在这次的物流大考中交出了满意的答卷。随着业务迅猛增长,递四方也在不断演进背后的实时数仓技术来支撑更丰富的仓储物流场景,让物流从“手工化”逐渐转变为“智能化”。



免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
25年亚太电商报告:新兴与成熟市场差异显著
AMZ123获悉,近日,PCMI发布了《2025年亚太电商消费者趋势报告》。随着电商持续渗透全球消费市场,支付方式的变化正成为影响电商增长结构和区域差异的重要因素。在亚太地区,电商市场快速增长,同时支付方式也呈现出高度多样化特征。此次报告通过图表和数据分析,系统呈现亚太地区(不含中国)11个国家消费者的支付习惯、电商市场规模变化以及潜在增长空间,为卖家和品牌判断市场机会、投资方向提供参考。一、亚太市场规模报告显示,亚太地区电商整体呈现高增长趋势。2025年亚太地区电商规模将首次突破1.1万亿美元,预计在2025至2027年间保持12%的年复合增长率,到2027年市场规模将超过1.5万亿美元。
Shopee越南双十二用户活跃度提升,直播售出超5000万件商品
AMZ123获悉,近日,2025年12月,Shopee在越南结束了12.12生日超级促销活动。作为Shopee成立10周年的重要节点,本次大促期间平台用户活跃度和转化表现显著提升,直播与短视频内容成为推动成交的重要渠道。数据显示,仅在12月12日当天,Shopee在越南的访问量就超过1200万次;为期两周的活动期间,用户累计节省金额超过4万亿越南盾。在促销活动之外,Shopee在本次12.12期间大幅强化内容与娱乐元素,通过音乐演出、综艺衍生内容和直播互动等形式提升用户参与度。
关税压顶、税单敲门!2025跨境电商十大事件回顾
专栏介绍2025年,跨境电商行业经历了一场深刻的范式转换。旧增长秩序已被改写,行业竞争已从流量争夺,升维为供应韧性、成本控制与合规运营的系统性较量。周期更迭,潮起潮落。行业的巨轮缓缓驶入深水区,有人在调整中登上新高,也有人就此转身离场。作为深度参与的行业观察者,AMZ123特此发起 【2025年度跨境专题报道】系列专栏。本专栏将不止记录赛道的高光与暗礁,更致力于解构穿越周期的密码,为从业者提供一份关于生存与进化的真实笔记。本文为专栏的第一篇报道,旨在通过回顾过去一年的行业大事,以此看清行业新秩序与未来破局方向。2025年,美国对华关税政策经历了从紧张升级到逐步缓和的过程。
25年美国社交电商市场将达870亿美元,TikTok推动增长
AMZ123获悉,近日,研究机构Emarketer的最新报告显示,TikTok正持续推动社交电商市场增长,其中TikTok Shop已成为该领域的重要组成部分。2025年,TikTok Shop的销售额占全球社交电商总量的近20%。按照预测,TikTok Shop的销售规模将在2026年超过200亿美元,并在2028年突破300亿美元。与此同时,2026年预计将有一半的美国社交购物用户在TikTok平台完成购买。从整体市场来看,社交电商目前仍仅占美国电商总规模的一小部分,但占比正在稳步提升。
双十二期间,印尼消费者更偏好本地品牌与高品质商品
AMZ123获悉,近日,电商平台Shopee与Lazada的数据均显示,印尼消费者的线上购物行为在 12.12 全国网购日(Harbolnas)活动期间呈现出明显变化。消费者在年终促销节点的购物重点正在发生转移,从单纯追求低价,逐步转向对本地产品和高质量商品的关注。Shopee 的数据显示,2025 年 12.12 活动期间,印尼消费者对本地产品的兴趣显著上升。平台观察到,用户通过多种活动和功能,更积极地寻找并支持本地中小微企业(UMKM)及本土品牌。该趋势不仅体现在购物热度上,也反映出 12.12 已从单一的促销活动,逐渐演变为消费者了解和选择本地产品的重要窗口。
每日低价跨境包裹数高达5万,希腊呼吁加强监管
AMZ123获悉,近日,随着Shein、Temu等电商平台在欧洲快速扩张,大量单价不超过150欧元的跨境包裹每天通过免税政策进入希腊市场,希腊相关行业组织正呼吁欧盟建立统一的监管措施。希腊商贸与企业联合会(ESEE)的数据显示,欧盟范围内,91%以上的低于150欧元的跨境包裹来自中国。2024年,欧盟市场共进口约46亿件单价不超过150欧元的包裹,预计2025年将增至约60亿件。在希腊,每天进入市场的低价跨境订单数量最高可达5万单,且仍在增长。相关研究估算,希腊消费者在电商平台上的支出中,每5欧元就有1欧元流向中国,年交易规模约为5.29亿至6.27亿欧元。
AMZ123星球专享丨12月第三周资讯汇总
亚马逊亚马逊于12月16日上午9点启动了“圣诞限时特卖”活动,此次促销将持续到12月25日23点59分,可能成为平台年内的最后一场大型促销。亚马逊宣布自2026年3月31日起将全面终止共享库存(混仓)模式,并更新制造商条码的使用标准。根据新规,完成品牌备案的品牌所有者将可以直接使用UPC等制造商条码进行入库,而无需粘贴亚马逊条码。亚马逊正在与人工智能公司OpenAI就一笔潜在投资展开磋商,投资规模约为100亿美元。亚马逊向美国华盛顿州提交了一份新的通报,将在当地裁减84个岗位。亚马逊说明,这一调整属于各业务部门在日常运营中进行的人员结构优化,并不涉及其在今年10月宣布的全球性裁员计划。
新入口曝光!亚马逊广告后台新增 Prompts(提示词)功能
今日分享「结合数据高效优化老品广告」
美国圣诞节后预计迎来退货高峰,退货率或将高出35%
AMZ123获悉,近日,Adobe最新发布的假日购物数据分析显示,2025年假日季至今,美国消费者的退货行为较去年同期有所放缓,但整体趋势仍需谨慎看待。11月1日至12月12日,线上购物退货量同比下降2.5%;而在黑五周(Cyber Week)结束后的7天内,退货量仅同比下降0.1%,降幅明显收窄。Adobe指出,当前的退货下降并不意味着假日季整体退货压力减轻。按照历史规律,圣诞节后将迎来集中退货高峰。预计12月26日至12月31日期间,退货量将较11月1日至12月12日这一阶段高出25%至35%。根据2024年假日季数据,每8笔退货中就有1笔发生在这一6天内,Adobe预计这一趋势将在今年延续。
扎心了,超7成跨境人今年无年终奖
年终奖取消,公司岌岌可危,跨境人:今年太难了
亚马逊走9810退税模式的灵魂拷问!
亚马逊走9810退税模式的灵魂拷问!
跨境电商的入场券,变了
2025年,跨境电商仍在增长,但增长的方式已悄然改写——它不再均匀洒向每一个卖家,而是像一场“定向灌溉”,愈发向头部与合规能力强的卖家集中。平台数据揭示出这一分化:2025年1—9月,亚马逊中国卖家上新数量同比提升近25%;销售额达到200万、500万、800万美元的卖家数量增幅均超过20%;而销售额超过1000万美元的头部卖家,增幅接近30%。这不是简单的强弱分化,而是一次行业的深层迁移:平台正在亲手改写规则,把“可控”定为第一要义。随之而来的,是三条谁都绕不开的趋势——它们共同把跨境电商,从过去的“流量快跑”,推向了如今的“系统耐力赛”。
冬季需求拉动增长,10款汽配产品在亚马逊月销过万
AMZ123获悉,近日,亚马逊各类产品搜索量增长显著,以下10款产品在亚马逊上销量表现突出,深受消费者欢迎。1. 便携轮胎充气泵预计销售额:679.99万美元/月销量:100,000+星级评分:4.3好评数量:23,615+图源:亚马逊产品介绍:这款便携式轮胎充气泵采用电池供电设计,体积小巧,可放置于手套箱或后备箱,适用于汽车、SUV、摩托车、自行车及球类等。支持最高 120 PSI 的精准充气,内置数字胎压显示屏,可在 PSI、kPa、Bar 等多种单位间切换,并通过按键设定目标胎压,到达设定值后自动停止,降低过度充气风险。配套多种充气接口和LED照明灯,满足日常补气和应急使用需求。
亚马逊拟投资OpenAI 100亿美元
AMZ123获悉,近日,据外媒报道,亚马逊正在与人工智能公司OpenAI就一笔潜在投资展开磋商,投资规模约为100亿美元。知情人士透露,相关谈判仍处于高度不确定状态,但若交易达成,OpenAI的整体估值可能超过5000亿美元。大型科技公司在生成式人工智能领域的竞争正在加速。近年来,OpenAI已与多家基础设施和芯片厂商达成数十亿美元级别的合作协议,包括今年与英伟达和甲骨文签署的多项AI相关交易。2025年11月,OpenAI还与亚马逊签署了一份规模约380亿美元的云服务采购协议,进一步强化其算力布局。市场同时也对高强度资本投入保持审慎态度。
《亚马逊生活日用品类攻略手册》PDF下载
作为日常生活不可或缺的重要组成,生活百货品类覆盖范围广泛,包括家居用品、家具、车用配件、户外装备、园艺 工具、运动器材、家装用品、厨房、玩具以及宠物用品等众多领域。这类产品不仅是满足基本生活所需,更体现了人们对美好生活的向往和追求。
《掘金泰国-市场洞察与战略机遇报告2025》PDF下载
随着全球经济一体化的加速,泰国作为东盟的核心枢纽,凭借其独特的地缘优势庞大的消费市场以及持续优化的营商环境,成为众多企业战略布局的重要目标。本报告深入剖析泰国市场的政策红利、消费趋势、产业机遇以及合规挑战,旨在为有志于开拓泰国市场的中国企业提供行动指南,助力企业在东盟这片充满活力的土地上把握机遇、应对挑战、!实现可持续发展。
《2025欧美假日购物季营销指南》PDF下载
2025年美国假日购物季零售额预计同比仅增长1.2%,总销售额约1.359万亿美元,虽仍保持正增长,但为2009年以来最低增速,市场正在步入低增长的新常态。
《2025年跨境电商东南亚市场进入战略白皮书》PDF下载
东南亚电商,正以惊人的速度复刻中国电商高速增长的黄金时代。2024年东南亚电商GMV达到1284亿美元,短短5年涨幅超过3倍。全球电商2024年GMV增幅最快的十大市场中,东南亚独占四席。东南亚是拥有约6.7亿人口的广阔市场,在现今全球关税的不确定性大格局下,因其电商基建完善,利好的贸易政策,和更高的年轻人口占比,成为跨境卖家生意拓张焦点之一。
《2025年TikTok Shop玩具品类行业报告(欧美站)》PDF下载
分析TikTok Shop美国市场、英国市场、西班牙市场、墨西哥市场等主流市场点短视频及直播电商数据,选取TikTok与玩具爱好品类相关的内容进行分析报告。
《2025 洗护品类趋势与创新洞察》PDF下载
本报告独特价值:将消费者的“行为结果”据),揭示消费者深层心理动机、并能精准预判未来增长机会
《亚马逊双轨增长指南》PDF下载
亚马逊以“以客户为中心”为核心理念,通过整合B2B与B2C的全渠道服务,帮助卖家实现“一店双拓”-- 一次上架,同步触达个人消费者与企业买家,获得双重收益。同时,基于Direct to Buyer(直接触达买家)的模式,更能有效减少中间环节,提升利润空间与品牌掌控力。
《亚马逊全球线上商采趋势与区域洞察》PDF下载
随着全球企业数字化转型的深入推进,B2B商采有望成为下一个万亿级别的蓝海市场然而,中国卖家在开拓海外企业商采市场时往往面临着一个关键挑战:难以准确把握海外企业买家的商采行为和决策模式。这种认知偏差不仅影响了产品开发方向,也制约了市场拓展策略的制定。
跨境数据中心
聚合海量跨境数据,输出跨境研究智慧。
跨境平台资讯
AMZ123旗下跨境电商平台新闻栏目,专注全球跨境电商平台热点事件,为广大卖家提供跨境电商平台最新动态、最热新闻。
AMZ123卖家导航
这个人很懒,还没有自我介绍
AMZ123选品观察员
选品推荐及选品技巧分享。
亚马逊全球开店
亚马逊全球开店官方公众号,致力于为中国跨境卖家提供最新,最全亚马逊全球开店资讯,运营干货分享及开店支持。
跨境学院
跨境电商大小事,尽在跨境学院。
北美电商资讯
AMZ123旗下北美跨境电商新闻栏目,专注北美跨境电商热点资讯,为广大卖家提供北美跨境电商最新动态、最热新闻。
欧洲电商资讯
AMZ123旗下欧洲跨境电商新闻栏目,专注欧洲跨境电商热点资讯,为广大卖家提供欧洲跨境电商最新动态、最热新闻。
首页
跨境头条
文章详情
揭秘递四方实时数仓,双11实时物流订单的最佳实践
4PX递四方
2021-12-01 19:23
2700


随着双11的开启,物流业也迎来了年度大考。2021年双11期间,递四方作为物流仓储服务方,布局仓库和分拣点超40+个,50w+平米作业场地,单日订单峰值达千万级别,海量购物订单由递四方配送到家,消费者由尾款人秒变收货人。

图片


01
双十一的业务挑战


为了应对双11单日峰值达到千万级别订单的状况,递四方运用大数据合理优化资源,提前做好全球仓储人力、物力、运力配置,保障仓储各流程高效、有序进行。从今年10月中下旬开始,上海转运中心和东莞转运中心相继启动。截至目前,递四方陆续在华东、华北、华南新建、扩建超级枢纽、揽收仓至40余个,继续加大在全国的布局;在国内拥有40个+分公司/分拨服务网点,全国50万+平方米办公/作业场地面积。


在业务方面,递四方借助自主研发分拣系统和云技术,快速进行条码识别,按指令分拣,实现称重分拣一体化全面覆盖,保证每一票货物都可自动识别、精准分拣出库。称重及分拣,已从传统人工模式升级为100%人工管控模式。此外,递四方信息科技的黑科技硬件——红光在此次“双11”首次亮相。在分拣效率不变的情况下,递四方信息科技用光幕等技术手段,对分拣机落格包裹进行核验,将库内错分率降低至万分之三,达到业界领先水平。尤其针对仓库环节,不断加大对库内的自动化、数字化、智能化建设,结合大数据、AI算法、云计算等手段进行系统的研发升级,引进高科技设备来提升产能、保障时效。


随着双11期间订单量剧增、应用的复杂度提升,我们的业务系统也经受着严峻的挑战,原来的实时数仓架构已经不能满足业务当前的需求。在寻找新的解决方案时,我们对比了业界常用的开源大数据实时查询数据库,在千亿级别数据多表连接查询时都遇到了瓶颈,无法满足业务实时性、服务稳定性的要求。


实时数仓在递四方的应用场景应用主要有以下几个方面:揽收、库内操作、仓间调拨、清关交邮预警监控,这里面包含着单票运转操作的每一个步骤。这些场景都需要做到实时监控,并且实时做出决策来提高物流的的整体时效。尤其是在双十一高峰期的情况下,如果人力或资源分配不足,很容易使某一环节堵塞,进而影响整体物流的时效。在技术的层面,我们有很多个业务系统,这些系统之间既有一致性也有独立性,一个复杂指标涉及到多个系统多张表,因此我们实时数仓对表连接查询能力非常强,而且对数据的更新插入速度也有着很高的要求。


今年双11,递四方对支撑业务的实时数仓系统进行了升级,通过新一代基于flink+hologres的实时数仓系统,在物流订单量相较于去年增加多倍的情况下,仍然能够实时监控每一票订单的物流情况、每一个仓库的作业情况,并且实时数仓整体成本下降50%,真正做到了“多、快、好、省”。


那么,递四方实时数仓的升级演进之路又是怎样的呢?我们一起来听听递四方资深数据架构师的介绍吧~


02
递四方实时数仓之路


1

实时数仓1.0


在刚开始做第一版实时数仓的时候,时间窗口比较紧,我们要把有限的精力放到数据建模以及业务开发中,所以在对比了数据库的吞吐性以及处理能力后,我们选择了ADB。ADB行列混存,全字段索引,在数量大很大的情况下,查询速度、插入速度都很快,而且支持DTS、OTTER等数据同步接入,同步性能很好。


图片


数据源是阿里云的PolarDB、MySQL、RDS等数据库,采用阿里云的DataWork数据同步,把增量数据实时同步到ADB中,然后在ADB中做数据实时的计算,数据的任务调度在DataWork中完成。


我们所有部门都在使用该架构的时候,遇到了一些瓶颈,该架构不满足我们的实时数仓,后来我们的实时数仓选择了另外一个方案。


2

实时数仓2.0


经历了第一个版本的实时数仓后,我们总结了实时数仓的两个重要特性,一是实时,二是服务的稳定性。


第一个版本的实时数仓不能很好地满足稳定性,我们决定对新的实时数仓进行一个深入的研究和探索,在阿里云上看到了很多关于Hologres的应用,其性能表现极其出色,带来了不错的效果。在对比了业界不同的实时数仓架构后,我们最终选择了Flink+Hologres组合作为实时数仓。


图片


这里一共有2条路径:


· 第一条路径,是通过DTS把Binlog数据同步到DataHub,然后使用Flink从DataHub中消费数据,把计算结果存储在Hologres中,这条路径主要是用于计算一些访问频率高且数据量大的数据,比如待揽收单量、入库单量、待完成单量等。


· 第二条路径,是业务系统的Binlog数据通过DataWorks同步到Hologres中。Hologres中分了3层,ODS层用于存放原始数据,直接加载原始日志、数据,数据保持原貌不做处理。一般情况下,以增量的方式从业务系统导入到ODS层,数据模型和粒度都与业务系统保持一致。DWD层数据明细层,对ODS层数据进行清洗。DWS为汇总层,主要存放宽表。这里主要是考虑到粒度的不一样,在Hologres中多表连接查询能够发挥其最大的作用。整个架构的任务调度依赖于DataWorks。


本次采用的批流一体即席计算查询混合模式,既发挥了Flink流计算的能力,也充分利用了Hologres强大的连表查询能力。互联网普遍运用的开源的实时查询数据库,但我们的业务复杂度是互联网的若干倍,这些实时数据库并不能完全满足我们的需求,架构互有优劣,但我们的架构是未来五六年内业务高速增长的最佳选择


03
递四方与实时数仓Hologres


1

为什么选择Hologres


那么为什么会选择Hologres呢?通过调研发现它有几个特点,比较适合实际情况。


· 第一是Hologres的实时能力,满足目前递四方的实时数仓需求,支持百亿级表与亿级表之间的JOIN,秒级查询响应,还支持实时写入、批量数据导入,拥有超高导入性能,且并发能力极强。


· 第二是Hologres 采用存储计算分离架构,数据存储在阿里云分布式文件系统pangu中(类比开源HDFS),方便按需单独扩展计算或者存储。对快速行业来说,大促和日常所需要资源不一样,能够快速扩缩容,满足业务的动态需求。同时Hologres支持异构数据源交互分析以及离线数据和实时数据的联邦查询,Hologres已经和MaxCompute无缝打通,能够直接在Hologres中加速查询MaxCompute离线表。


· 第三是维护成本低、运行稳定,Hologres作为实时数仓存储成本大约是ADB的1/3。资源灵活性高,可以像MaxCompute一样灵活的升降配置,与阿里云大数据组件兼容性高,能降低运维成本和提高研发效能,不会对技术架构带来很大负担。


2

Hologres应用场景


在面向分析OLAP系统里面,Hologres承担了实时和离线数据的查询,由于Hologres既支持高并发写入,又能够满足及时查询,同时还能够支持OLAP分析,在我们的不同粒度的表进行连接的时候,能够充分发挥其优势。下面列举2个不同的场景对其做一个详细的说明。


· 场景一:库内操作场景


实时的数据从Binlog解析到ODS层,同时微批任务将分钟级别(范围可调)的统计数据计算到DWS宽表,同时跟离线的数据进行插入更新,就可以得到实时的全量数据表,调度采取DataWorks的调度,每5分钟调度1次。


·场景二:仓间调拨场景


对于一些数据量小的表,依赖于Hologres强大的Join能力,通过视图来构建DWS中间层,如下图所示:


图片


DWD是对ODS层过滤的视图,DWS层是DWD层聚合层的宽表,每次查询DWS层的时候,就相当于所有表重新查询了一次。这种查询语句是非常复杂的,对于关系型数据库来说,可能有性能瓶颈会非常缓慢。但是对于Hologres来说,毫秒级别查询完成毫无压力,做到了实时响应,并且节省了调度资源,同时也提升了查询的灵活性。


3

Hologres目前的不足


在使用Hologres期间也发现的一些不满足实际需求的地方:一是非空列不能建立索引,多个亿级别表连接在没有索引的情况下,查询速度下降。二是Hologres兼容Postgre生态,但支持的函数不多,在开发上与MaxCompute相比有一定的难度。


04

物流“智能化”



整个双11期间,递四方通过升级实时数仓技术,基于Flink+Hologres搭建的实时数仓支撑了实时大屏的高频刷新访问,实时监控物流动态,促进了业务高效运行,让消费者的快递更快到家。


整个架构升级给业务带来的价值有以下几个方面:


· 稳定:基于Hologres持续高稳定的输出,整体双11期间不论是实时数据写入、还是数据的读取都表现出了极强的稳定性。整个双11期间,真正做到了0故障率。


· 实时:实时的揽收、库内操作、中转调拨等实时大屏,对我们的运营提供了非常强有力的实时数据支撑,整体时效比去年提高了不少,给用户带来良好的物流体验,提高了公司的服务水平。


· 云原生:除了上面两个核心价值之外,由于双11期间是流量高峰期,比日常流量高出上千倍,通过Hologres可以实现动态扩缩容,满足我们对资源的不同需求,从而也降低了运维成本


这是递四方参与的第7个双11狂欢节,递四方在这次的物流大考中交出了满意的答卷。随着业务迅猛增长,递四方也在不断演进背后的实时数仓技术来支撑更丰富的仓储物流场景,让物流从“手工化”逐渐转变为“智能化”。



咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部