AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

RTC+AI双剑合璧,解锁移动应用出海增长新密码|WAVE2025

霞光社
霞光社
474
2025-12-01 15:14
2025-12-01 15:14
474

11月20日,由全球化媒体智库——霞光社ShineGlobal&霞光智库联合阿里云举办的「模型应用·编码新未来|WAVE2025泛互联网全球大会」在上海成功举办。

在本次大会的主论坛上,即构科技副总裁陈今今以《RTC+AI双剑合璧,解锁移动应用出海增长新密码》为题,进行了精彩演讲。

以下为详细内容,霞光社经整理发布。

陈今今:大家好,我是即构科技的陈今今。我们和霞光社是老朋友了,很荣幸第三次我们公司站上领航者大会的舞台,我们也一直在见证整个平台是如何驱动整个行业进行深度思考和前行的,再次感谢霞光社的邀请。

即构科技副总裁陈今今

我先自我介绍一下,我整个职业生涯里面,前16年都在国内一家电信设备提供商工作,一直负责网络相关建设,我在海外也很多年,从欧洲到南美最后到南太地区,去过不少地方。在整个过程中,我一直在负责基础网络、底层架构的设计和构建的工作中,也深切体会到海外网络环境,包括监管,包括海外的组织有非常复杂的关系和很难控制的一些难点。

现在我任职于即构科技,也超过6年时间了,我现在主要负责解决方案与服务相关的部分,希望利用我们的这种经验能够给我们的客户带来商业上更加成功的体验。

即构科技是一家提供实时音视频云通讯的服务商,实时音视频从技术上有一定的技术门槛,涉及到很多编解码的算法,模拟信号的处理,以及网络调优诸多方面的工程化和前沿技术积累。即构科技一直聚焦实时音视频云通讯,持续投入研发,我们希望把复杂留给自己,让客户聚焦于自身业务发展,实现商业成功。

这十几年来,即构服务了行业大概70%的互联网头部客户,他们其中有很大部分都成长为出色的出海标杆企业。即构也持续地跟客户进行共创,无论是在质量上,还是在体验上也在不断的进化成长,交了很多的朋友,现在也形成了很紧密和信任的伙伴关系。目前,即构服务的客户日均互动时长超过30亿分钟,覆盖了全球超过200个国家和地区的客户。

讲一下整个出海的痛点,这些痛点其实最突出的就是网络环境:

一方面,海外网络环境发展不均衡,不同国家的基础设施差异、运营商策略不同导致部分区域弱网问题突出。这种情况就会导致从丢包、高时延、抖动上会造成音视频体验极大的降低。

另一方面,海外用户复杂的使用环境和使用习惯不可控,容易影响实时音视频通话的整体效果。比如说国内的主播一般装备会比较好,直播间的布置有很多标准化以及很精细化的运营。在海外,这种主播的专业性、直播环境,对整个直播的效果以及体验也会带来非常大的影响。

此外,海外用户的终端设备性能也存在参差不齐的情况,部分区域用户的设备中低端机型占比大,也会影响体验效果……

我们怎么去解决呢?如果用传统的技术方式去解决,也可以达到一定的水平。但是,传统的技术存在一些比较固定的模式,需要设定几个模式,这几个模式去适应全球各种各样不同复杂的网络,其实是有一点捉襟见肘的。当AI技术爆发起来以后,模型模式适应性会有一个质的飞跃,所以我们就利用好AI再赋能到整个RTC,这样会产生一个协同效益,会有更好体验的提升。

在弱网应对上面,我们底层采用即构自研的海量有序数据网络MSDN,定义了一张虚拟网络。物理网络有卡顿、断网,或者某些地方的带宽比较小的情况,我们在物理上比较差一点的网络上面,构建了一个软件定义的虚拟网络,除了传统的根据时延、丢包、抖动、卡顿率这些指标进行持续监控,还会参考历史的数据,通过大数据、AI识别,模式识别去选择最优最佳的路径,以及在网络故障的情况下可以进行快速的切换。

不同国家都存在网络的流量控制,经常出海的朋友应该都有比较深刻的体验,这种弱网环境不只是说当地网络建设投资的问题,还有很多监管方面的因素,以及运营商本身的网络流量策略,都会对整个网络环境造成很大的影响。怎么在合规的情况下能够尽可能的把我们音视频的数据送达需要的用户,还不影响用户体验,也是通过这样的一个网络来完成的。即构AI MSDN网络具备精细路径规划能力,通过AI算法在协议选择、资源选择、内容选择方面精细规划,采取灵活智能的调度策略,帮助客户解决网络问题。

随着AI技术的发展,也为实时音视频技术提供了更多可以想象的空间,即构Express SDK采用了AI技术,在噪声抑制、回声消除、自动增益AGC等方面也有了更显著的提升,传统方式去不掉的噪声,现在已经完全不是问题,可以给客户提供更纯净、更自然、更舒适的音质体验。

除了AI算法对实时音频声音的处理之外,对于实时视频画质效果的提升也是非常大的。比如说在主播端,如果主播把控直播间的能力有限,设备可能也不太好,灯光也有限制,就会导致整个画面画质不佳,现在可以通过AI算法精准的对环境进行识别。比如说灯光是不是太暗等等,以及人脸有些是皮肤肤色偏黑的人,我怎么通过这种自动的暗光增强,HDR的技术进行画质的调整。现在我们也实现了智能滤镜的能力,也可以自动识别不同的场景,基于这些场景去对这些滤镜进行锐化的效果,让码率和分辨率不变的情况下,甚至更低的情况下可以提供更好的清晰度,极大程度还原画质效果。

用户端我们也会有很多画质提升的方案,主播没有变化的情况下,用户可以通过低码高清的方式、超分的方式,尽可能弥补设备网络带宽的不足,设备的缺陷,原始素材客观条件导致的限制,做更好的画质和图像的处理。

当前,泛互联网的应用呈现出来三大发展主线:社交泛化,内容IP化,应用+AI。

社交与音视频、游戏的结合,诞生了直播、语聊房、在线K歌,游戏社交等多种玩法。随着AI在泛娱乐领域中的广泛应用,创造出全新的社交互动场景和内容生产模式。此外,随着短剧的快速发展,IP化趋势将贯穿内容消费进行延展。

根据Sensor Tower的数据,在 2025 年上半年 ,在媒体娱乐、健康保健、 工作教育、生活服务和金融服务等领域 ,有超过 200 款应用新 增或内置了 AI 相关功能。AI逐渐成为泛互联网产品应用的技术新基建,渗透到各个决策领域。

从出海的移动应用来讲,AI涌现出很多新的互动场景,比如说视频通话上面有AI实时的字幕、翻译,AI摘要、AI美颜,都已经也是得到了很好的使用。

在泛娱乐+AI上,在线KTV是即构一个很大的优势,我们是行业里面第一家提供实时合唱能力的公司。实时合唱对网络的要求以及音视频的技术要求非常高。因为人的对时延感知的敏感性,技术达不到一定的标准整个体验效果就没有办法商用。实时在线KTV里面也提供了很多音乐识别,通过识别音乐场景、音乐的歌声进行声音的优化处理,以及对于一些唱歌效果的打分,都应用在整个AI的场景里面,我们也提供了丰富的套件,让开发者更快速的集成和上线。

2025年是对话式AI快速增长的一年,随着多模态大模型的持续发展,对话式AI和应用成为可能。对话式AI是新的人机交互的界面,也是最原始的诉求。要建立一种和真人互动一样沉浸感的实时体验。

对话式AI现在也面临很大的挑战,简单来讲,对时效的要求,响应速度的要求。整个处理链路很长,从发出声音到这个声音被设备采集走,再经过网络传输到云端,我们需要用ASR把声音转成文字,把文字又送到大模型,送到大模型得到回应以后又要转成语音,再通过网络又送到另外一端设备上,整个周期链路和处理的pipeline非常复杂非常长。怎么在这么长的工作流里面极致的压缩时延,这个是非常挑战的一件事情。

周边的环境很复杂,有嘈杂的声音或者有回声,也会干扰智能体的判断,你的回声被智能体听到以后就会进行应答,这样整个对话的效果和质量就乱套了。真实对话场景里面还会经常出现打断行为,怎么能够快速打断,该打断的时候打断,不该打断的时候不打断,包括语速、声音、语调怎么做到匹配场景。比如说直播需要很激昂的场景,怎么对情绪和情感融入到这个声音里面等等,这里面有很多的挑战。

对话式AI能带来的前景、效率的提升其实是很有吸引力的。这样也不断推动我们这些开发者和各个企业都在关注和采取大量的应用实践。为了匹配这样的客户的诉求,即构科技推出了实时互动AI Agen方案。通过这个方案不仅可以提供文字的互动,也可以提供语音的互动,甚至是数字人视频的互动。前面说到的问题,更低时延,更自然的打断能力,声音情绪等这些也解决了大部分的问题。

我们从去年开始就一直在打磨AI Agent方案,看似好像没有特别高深的一些技术,但是从工程化的过程来讲是有很大工作量的,我们跟合作伙伴打磨了很长时间,对各种参数进行调整,也踩过很多坑,目前已达到可商用的水平。

针对AI陪伴场景,即构实时互动AI Agent高达99%的识别准确率、95%的打断准确率、90%的断句准确率、对话延迟约1.5s、可播放带人声BGM等特性,充分适配该场景下用户的使用习惯,能够智能识别并给予用户及时的情感陪伴和互动交流。还支持包括真人图片数字人、赛博风图片数字人、多角色语音群聊等能力,大大丰富了AI的形象和互动形式。

在线课堂场景下,即构AI伴学在线课堂方案让真人老师在直播课中可以灵活控制启用自己的AI分身,与学生进行1V1互动,AI老师根据学生的回复给出个性化引导和反馈。方案采用万级并发架构,稳定支撑超大型直播课;支持灵活定制AI老师形象、音色、对话风格,并可结合老师讲课实时内容、白板等课件自然展示;采用“时长+并发包”的灵活计费模式,按实际用量收费。

直播、语聊房等场景下,依托即构云端实时语音识别服务打造的AI观众/AI助理,具备四大优势:600ms低延迟、语音识别准确、较传统模式节省50%以上成本、支持多语言与多厂商,能够有效提升主播开播时长、用户活跃度和留存率,全面提升直播生态体验。

在智能硬件业务中,即构方案适配主流芯片、功耗低,识别准确率达95%,延迟低至1s,采用License计费模式,有效控制成本。不论是AI玩具、机器人玩具、AI翻译机还是宠物陪伴设备等智能硬件产品,都能通过实现自然化、场景化的智能交互。

实时互动AI Agent还有更多场景,比如AI男友/女友、AI剧本杀、AI陪玩游戏等。我们有客户做了剧本杀,这里面有多人AI互动的能力,不只是单人点对点的对话。很多人编排在一起,营造一个有真人玩家,其他三五个是智能体玩家,跟你一起玩游戏。

RTC让泛互联网应用连接世界,AI让这种连接更智能。未来的实时互动,是更沉浸、更自然、更有想象力的。我们期待与在座的各位开发者、伙伴们携手一起去打磨技术,创造未来,一起共创实时互动的新篇章!谢谢大家!

3.26 宁波wayfair沙龙-文章页底部
免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
沃尔玛投资超3.3亿美元,推动配送中心全面自动化
AMZ123获悉,近日,沃尔玛宣布,将在其区域配送中心自动化计划的最新阶段投入超过3.3亿美元,对位于美国路易斯安那州欧佩卢萨斯(Opelousas)的区域配送中心进行现代化升级。这一分阶段、跨多年的投资项目,是沃尔玛在全美范围内推进区域配送中心自动化战略的一部分,目标是对全国42个区域配送中心进行全面升级。为支持该项目,路易斯安那州政府向沃尔玛提供了一揽子具有竞争力的激励政策,其中包括一项与设备投资挂钩的1000万美元绩效型补助。项目完成后,欧佩卢萨斯配送中心的出货能力预计将接近传统配送中心的两倍,从而提升沃尔玛在该地区门店的整体供应链效率。
Allegro与Meta合作,二手商品将在FB平台销售
AMZ123获悉,近日,波兰电商平台Allegro与Meta宣布达成合作,双方希望通过这一合作,提高个人用户在线销售二手商品的可见度,扩大二手商品的流通范围。根据合作安排,部分发布在Allegro Lokalnie平台上的个人卖家商品信息,将被额外展示在Facebook Marketplace上。目前,该服务仍处于测试阶段,在测试期间对Allegro Lokalnie用户免费开放。通过这一新功能,卖家可以接触到更多使用Facebook的潜在买家。当用户在Facebook Marketplace上看到相关商品信息并点击后,将被直接跳转至Allegro Lokalnie平台。
Coupang新增16.5万账号的个人信息被泄露
AMZ123获悉,近日,据外媒报道,韩国电商巨头Coupang在去年11月发生的大规模个人信息泄露事件中,新增约16.5万用户账号的个人信息被泄露。Coupang已向新增泄露用户发送短信通知,并说明事件处置情况。Coupang表示,当时已经立即封堵了异常访问路径,并完成相关措施。此次新增泄露的个人信息主要为用户填写的收货地址信息,包括姓名、电话和地址,但支付信息、登录信息、邮箱、订单明细及公用门禁号未受到影响。Coupang表示,将向每位新增泄露用户提供价值约5万韩元的购物券作为补偿,同时提醒用户不要点击来源不明的链接,并及时删除或举报相关信息。
又来了!亚马逊第四季度税务警告短信
收到短信后,一次比一次平静了...
营收微降至540亿美元,马士基发布25财年财报
AMZ123获悉,近日,马士基发布了截至2025年12月31日的2025财年全年及第四季度经营与财务情况。整体来看,马士基在全球航运与物流环境波动加剧的背景下,凭借稳健的运量增长、运营执行力和主动的成本控制,全年业绩达到此前指引区间的上限,但同时也对2026年运价与盈利承压给出了谨慎预期。以下为2025年全年财务亮点:①全年营收为540亿美元,相比2024年的555亿美元下降2.7%,但仍达到马士基财务指引上限。②全年EBITDA为95亿美元,低于2024年的121亿美元。③全年EBIT为35亿美元,较2024年的65亿美元有所回落,但符合年度指引。
AMZ123会员专享丨2月第1周资讯汇总
亚马逊亚马逊宣布,将调整其对 FBA(Fulfillment by Amazon)库存移除和销毁费用的计费方式,但相关费用标准本身不会发生变化。该调整将于 2026 年 2 月 15 日起正式生效,适用于当日及之后创建的所有新移除或销毁订单。亚马逊调整了针对FBA仓库存货移除与处置的收费方式,新规将于2026年2月15日生效。核心变化在于:费用将按每件商品实际处理时逐笔计费,而非此前整批订单完成后统一扣款。亚马逊公布了2025年Prime快速配送方面的最新数据。亚马逊表示,截至 2025 年年底,Prime 会员使用当日达和次日达服务配送的商品数量在全球范围内超过 130 亿件,创下新纪录。
全球电商周报:地中海21港罢工、亚马逊改收费、Lazada调佣金......
严选跨境物流供应商丨 可视化物流跟踪丨 高品质跨境电商物流服务平台
开年第一步:先做内容还是先做广告?顺序错了,可能浪费一年预算
本质不是选择题,而是先后题。这是我几乎每年开年都会被卖家问到的问题:“老师,我现在是应该赶紧把广告预算打出去抢流量,还是先慢慢做内容?”答案其实很简单:先做内容,再做广告。但为什么这个简单的答案,很多卖家却难以执行,甚至总想跳过第一步?因为他们没有真正理解,在跨境电商的盈利公式里,顺序本身就是一种核心杠杆。做对了,四两拨千斤;做反了,事倍功半。01重新理解广告:它不是“起点”,而是“放大器”我们必须建立一个基础认知:广告的本质,是把已经被验证有效的东西,以付费的方式放大曝光。它就像一支扩音器。如果你面前空无一人,或者你说的话本身毫无价值,那么即使用上最贵的扩音器,结果也只是让更多人听到一段噪音,然后更快地走开。
东莞过亿大卖遭TRO,400万资金被冻结!
跨境圈里,TRO最狠的地方不在“官司输赢”,而在“先把生意按停”。TRO落到谁头上,体验其实都差不多:链接出状态、回款受限、运营动作被迫停一停。区别在于承受力:小卖家是“伤筋动骨”,一年白干;头部卖家更像“主引擎熄火”,一旦头部链接和资金链同时被卡,损失会按天放大。近期AMZ123从业内听闻,东莞亿级大卖赵先生就经历了这样一次“被按停”,险些一夜之间破产后起死回生的两个月。为还原事件的关键节点,AMZ123随后联系并采访了当事人赵先生及其代理律师团队。赵先生在采访中回忆称,这次“被按停”的经历,几乎让他第一次真正体会到:跨境卖家对TRO/PI的恐惧,很多时候来自后台,而不是法庭。赵先生的遭遇始于2025年10月。
26年美国情人节宠物消费创新高,支出将达21亿美元
AMZ123获悉,近日,NRF(美国全国零售联合会)的数据显示,2026年消费者在情人节为宠物购买礼物的支出预计将达到创纪录的21亿美元。相比朋友或同事,人们更有可能为自己的宠物购买情人节礼物。今年,计划在情人节为宠物购买礼物的人群比例已超过三分之一,而十年前这一比例仅为19%,人均相关支出在此期间增长了三倍以上。围绕宠物情人节消费,市场提供了丰富的选择,从宠物巧克力造型玩具、心形毛绒玩具,到面向小型宠物的主题活动盒、鸟类玩具等,覆盖不同宠物类型。同时,一些消费者还会为宠物选择节日造型用品,例如粉色宠物指甲油或临时毛发染色产品,让宠物更具节日氛围。情人节并非个例,宠物正被越来越多地纳入各类节日和纪念日中。
亚马逊向美国用户全面开放AI助手Alexa+
AMZ123获悉,近日,亚马逊宣布,已在美国向所有用户开放升级版人工智能语音助手Alexa+。Alexa+自去年3月起便处于“早期访问”阶段,用户需要加入等待名单或购买较新的设备才能使用。此次全面开放,标志着亚马逊对Alexa的AI改造进入新阶段。Alexa+是对已有11年历史的Alexa进行的重要升级。亚马逊表示,新版本引入生成式人工智能能力,可同时处理多个请求,并作为“智能代理”为用户执行操作,例如代为预约维修服务或叫车。亚马逊称,这是Alexa自推出以来规模最大的一次功能升级。从2月5日起,Alexa+将以每月19.99美元的价格向用户收费,但年费为139美元的Prime会员可免费使用。
全球电商平台占比将达36%,澳洲市场竞争加剧
AMZ123获悉,近日,根据 Shippit 发布的《2026年电商配送报告》,随着亚马逊、Temu 和 Shein 等全球电商平台加速扩张,澳大利亚本土品牌正面临日益加剧的竞争压力,配送速度、履约效率以及退货体验方面的运营差距正在被不断放大。报告指出,预计到 2026 年,全球电商平台将占据澳大利亚电商市场 36% 的份额。这一变化与消费者对配送速度、稳定性以及售后服务便捷性的期望密切相关。报告显示,澳大利亚整体市场的配送速度已有明显提升,当前包裹平均送达时间为 1.7 天,但品牌在结账页面向消费者承诺的平均配送时间仍为 5.2 天,两者之间存在 3.5 天的差距。
50%消费者使用AI网购,AI正重塑英国品牌运营方式
AMZ123获悉,近日,智能配送平台Metapack 联合 Retail Economics 发布《2026年电商配送基准报告》。报告显示,英国品牌普遍预计2026年线上销售增速将进一步加快,人工智能(AI)在购物体验和配送环节的广泛应用,被视为推动转化率提升、履约效率改善以及客户忠诚度增强的关键动力。本次研究基于对超过 8,000 名消费者和 400 家品牌的调研结果,系统分析了 AI 如何重塑消费者购物路径,以及品牌如何将 AI 投资直接与转化率、配送表现和线上销售增长挂钩,并将其视为 2026 年及以后增长的重要驱动因素。报告指出,消费者行为正在快速变化。
沃尔玛计划推出跨境发货,美国商品可直达墨西哥和加拿大
AMZ123获悉,近日,据外媒报道,沃尔玛正准备在2026年初推出一项名为“Walmart Exports”的跨境发货计划,以进一步吸引使用其第三方履约服务的卖家。根据沃尔玛发给卖家的邮件信息,该项目将允许符合条件的商品从美国直接配送给墨西哥和加拿大的消费者,并计划在后续逐步拓展至更多国家。按照安排,符合条件的沃尔玛履约服务(Walmart Fulfillment Services,WFS)商品将自动加入该计划,卖家无需额外操作。与现有履约服务一致,商品的拣货、包装和运输将由沃尔玛负责完成。
好市多1月营收达213亿美元,电商收入同比增长34%
AMZ123获悉,近日,好市多(Costco)发布了截至2026年2月1日的2026财年1月销售业绩报告。在宏观环境仍具挑战的背景下,好市多整体销售保持稳健增长,美国、加拿大及国际市场均实现正向增长,数字化相关销售表现尤为突出。以下为1月财务亮点:①净销售额为213.3亿美元,同比增长9.3%,去年同期为195.1亿美元。②美国同店销售增长5.8%。③加拿大同店销售增长11.4%。④其他国际市场同店销售增长9.5%。⑤公司整体同店销售增长7.1%。⑥电商销售增长34.4%。以下为2026财年前22周财务亮点:①前22周净销售额为1231.6亿美元,同比增长8.5%,去年同期为1135.5亿美元。
美客多在墨西哥启用新物流中心,包裹日处理量达60万
AMZ123获悉,近日,阿根廷电商平台美客多(Mercado Libre)宣布,在墨西哥州正式启用其在拉丁美洲规模最大的Cross-Dock(交叉转运模式)物流中心。该项目于2026年2月4日对外公布,旨在进一步强化公司在墨西哥及整个拉美地区的物流能力,加快配送效率,并为参与电商业务的中小企业提供更有力的支持。新物流中心位于墨西哥州夸乌蒂特兰-伊斯卡利(Cuautitlán Izcalli),总建筑面积超过8万平方米,是美客多目前在该地区最大的同类设施。新物流中心投运后,每日可处理多达60万个包裹,并计划在2026年逐步提升自动化水平,在未来数月内分阶段扩展产能。
《2026独立站卖家日历》PDF下载
2026 独立站卖家日历 2026 全年营销节奏
《2025中东北非消费者数字经济报告》PDF下载
2025年的报告不仅持续跟踪数字经济的同比增长,也更深入:我们探讨了新兴技术对下一波数字化转型的影响力,还首次将中东北非国家及地区的消费者行为偏好与全球其他市场进行对比。
《2025年终大促旺季AI消费趋势报告》PDF下载
随着人工智能 AI的爆发式增长,如 ChatGPT、Perplexity 和Llama等交互式聊天机器人正在渐渐成为大众研究和推荐的首选工具。根据 AI智能体功能的更新迭代,目前已经可以完成网购下单、预订服务、及交易支付,现已被统称为 AI智能体电商Agentic Commerce,且其采用率正呈现出滚雪球式的增长。
《2025年全球二手奢侈品行业消费者洞察报告》PDF下载
当今,二手奢侈品时尚行业的商业格局不可忽视!从贝雷帽到高跟鞋,二手奢侈品正在改变消费者对奢侈品及自身购买力的看法。未来 10 年内,二手奢侈品市场预计将达到952亿美元。您的公司或品牌是否已做好充分准备,应对市场的变化?
《2025海外消费者数字经济报告》PDF下载
这份报告基于 YouGov 对全球 16 个市场18,000 名消费者的调研,探讨了信任如何影响电商经济中的消费行为(这是一个庞大的全球生态系统,每天通过数十亿次线上支付购买商品和服务)。该报告还参考了Checkout.com 自身的网络数据--数十亿个反映了资金如何在全球范围内 24 小时流动的数据点所展示的支付趋势。
《TikTok2026年趋势报告》PDF下载
在这份报告中,TikTok将这些变化提炼为三大关键趋势——真实(Reali-TEA)、探索(Curiosity Detours)与情绪回报(Emotional ROI),它们正共同推动用户增长方式与品牌营销逻辑的转变。
《2025 TikTok Shop 年度调研报告》PDF下载
在2025年,TikTok Shop“一站式卖全球”的愿景,正以内容场为战略支点,依托品牌托管等营运模式、AI驱动、达人带货和内容激励机制,系统性建构起一套全球化增长范式。基于此,TT123制作了这份《2025 TikTok Shop 年度调研报告》,旨在通过对2025年的深度复盘,帮助卖家把握短期波动的机会,锁定2026年的确定性方向。
《中国通用机械出海国别机会洞察报告》PDF下载
在全球制造业向智能化、绿色化深度转型与国内产业升级加速共振背景下,通用机械作为工业体系基础支撑,其技术创新与产业生态演化研究对强化产业链韧性、推动经济高质量发展具有重要战略意义。
跨境电商干货集结
跨境电商干货集结,是结合亚马逊跨境电商卖家交流群内大家在交流过程中最常遇到的问题,进行收集整理,汇总解答,将会持续更新大家当前最常遇见的问题。欢迎大家加入跨境电商干货集结卖家交流群一起探讨。
北美电商资讯
AMZ123旗下北美跨境电商新闻栏目,专注北美跨境电商热点资讯,为广大卖家提供北美跨境电商最新动态、最热新闻。
AMZ123卖家导航
这个人很懒,还没有自我介绍
跨境学院
跨境电商大小事,尽在跨境学院。
AMZ123跨境电商
专注跨境行业热点事件报道,每日坚持推送原创深度热文
跨境电商赢商荟
跨境电商行业唯一一家一年365天不断更的媒体!
亿邦动力网
消除一切电商知识鸿沟,每日发布独家重磅新闻。
跨境科普达人
科普各种跨境小知识,科普那些你不知道的事...
首页
跨境头条
文章详情
RTC+AI双剑合璧,解锁移动应用出海增长新密码|WAVE2025
霞光社
2025-12-01 15:14
473

11月20日,由全球化媒体智库——霞光社ShineGlobal&霞光智库联合阿里云举办的「模型应用·编码新未来|WAVE2025泛互联网全球大会」在上海成功举办。

在本次大会的主论坛上,即构科技副总裁陈今今以《RTC+AI双剑合璧,解锁移动应用出海增长新密码》为题,进行了精彩演讲。

以下为详细内容,霞光社经整理发布。

陈今今:大家好,我是即构科技的陈今今。我们和霞光社是老朋友了,很荣幸第三次我们公司站上领航者大会的舞台,我们也一直在见证整个平台是如何驱动整个行业进行深度思考和前行的,再次感谢霞光社的邀请。

即构科技副总裁陈今今

我先自我介绍一下,我整个职业生涯里面,前16年都在国内一家电信设备提供商工作,一直负责网络相关建设,我在海外也很多年,从欧洲到南美最后到南太地区,去过不少地方。在整个过程中,我一直在负责基础网络、底层架构的设计和构建的工作中,也深切体会到海外网络环境,包括监管,包括海外的组织有非常复杂的关系和很难控制的一些难点。

现在我任职于即构科技,也超过6年时间了,我现在主要负责解决方案与服务相关的部分,希望利用我们的这种经验能够给我们的客户带来商业上更加成功的体验。

即构科技是一家提供实时音视频云通讯的服务商,实时音视频从技术上有一定的技术门槛,涉及到很多编解码的算法,模拟信号的处理,以及网络调优诸多方面的工程化和前沿技术积累。即构科技一直聚焦实时音视频云通讯,持续投入研发,我们希望把复杂留给自己,让客户聚焦于自身业务发展,实现商业成功。

这十几年来,即构服务了行业大概70%的互联网头部客户,他们其中有很大部分都成长为出色的出海标杆企业。即构也持续地跟客户进行共创,无论是在质量上,还是在体验上也在不断的进化成长,交了很多的朋友,现在也形成了很紧密和信任的伙伴关系。目前,即构服务的客户日均互动时长超过30亿分钟,覆盖了全球超过200个国家和地区的客户。

讲一下整个出海的痛点,这些痛点其实最突出的就是网络环境:

一方面,海外网络环境发展不均衡,不同国家的基础设施差异、运营商策略不同导致部分区域弱网问题突出。这种情况就会导致从丢包、高时延、抖动上会造成音视频体验极大的降低。

另一方面,海外用户复杂的使用环境和使用习惯不可控,容易影响实时音视频通话的整体效果。比如说国内的主播一般装备会比较好,直播间的布置有很多标准化以及很精细化的运营。在海外,这种主播的专业性、直播环境,对整个直播的效果以及体验也会带来非常大的影响。

此外,海外用户的终端设备性能也存在参差不齐的情况,部分区域用户的设备中低端机型占比大,也会影响体验效果……

我们怎么去解决呢?如果用传统的技术方式去解决,也可以达到一定的水平。但是,传统的技术存在一些比较固定的模式,需要设定几个模式,这几个模式去适应全球各种各样不同复杂的网络,其实是有一点捉襟见肘的。当AI技术爆发起来以后,模型模式适应性会有一个质的飞跃,所以我们就利用好AI再赋能到整个RTC,这样会产生一个协同效益,会有更好体验的提升。

在弱网应对上面,我们底层采用即构自研的海量有序数据网络MSDN,定义了一张虚拟网络。物理网络有卡顿、断网,或者某些地方的带宽比较小的情况,我们在物理上比较差一点的网络上面,构建了一个软件定义的虚拟网络,除了传统的根据时延、丢包、抖动、卡顿率这些指标进行持续监控,还会参考历史的数据,通过大数据、AI识别,模式识别去选择最优最佳的路径,以及在网络故障的情况下可以进行快速的切换。

不同国家都存在网络的流量控制,经常出海的朋友应该都有比较深刻的体验,这种弱网环境不只是说当地网络建设投资的问题,还有很多监管方面的因素,以及运营商本身的网络流量策略,都会对整个网络环境造成很大的影响。怎么在合规的情况下能够尽可能的把我们音视频的数据送达需要的用户,还不影响用户体验,也是通过这样的一个网络来完成的。即构AI MSDN网络具备精细路径规划能力,通过AI算法在协议选择、资源选择、内容选择方面精细规划,采取灵活智能的调度策略,帮助客户解决网络问题。

随着AI技术的发展,也为实时音视频技术提供了更多可以想象的空间,即构Express SDK采用了AI技术,在噪声抑制、回声消除、自动增益AGC等方面也有了更显著的提升,传统方式去不掉的噪声,现在已经完全不是问题,可以给客户提供更纯净、更自然、更舒适的音质体验。

除了AI算法对实时音频声音的处理之外,对于实时视频画质效果的提升也是非常大的。比如说在主播端,如果主播把控直播间的能力有限,设备可能也不太好,灯光也有限制,就会导致整个画面画质不佳,现在可以通过AI算法精准的对环境进行识别。比如说灯光是不是太暗等等,以及人脸有些是皮肤肤色偏黑的人,我怎么通过这种自动的暗光增强,HDR的技术进行画质的调整。现在我们也实现了智能滤镜的能力,也可以自动识别不同的场景,基于这些场景去对这些滤镜进行锐化的效果,让码率和分辨率不变的情况下,甚至更低的情况下可以提供更好的清晰度,极大程度还原画质效果。

用户端我们也会有很多画质提升的方案,主播没有变化的情况下,用户可以通过低码高清的方式、超分的方式,尽可能弥补设备网络带宽的不足,设备的缺陷,原始素材客观条件导致的限制,做更好的画质和图像的处理。

当前,泛互联网的应用呈现出来三大发展主线:社交泛化,内容IP化,应用+AI。

社交与音视频、游戏的结合,诞生了直播、语聊房、在线K歌,游戏社交等多种玩法。随着AI在泛娱乐领域中的广泛应用,创造出全新的社交互动场景和内容生产模式。此外,随着短剧的快速发展,IP化趋势将贯穿内容消费进行延展。

根据Sensor Tower的数据,在 2025 年上半年 ,在媒体娱乐、健康保健、 工作教育、生活服务和金融服务等领域 ,有超过 200 款应用新 增或内置了 AI 相关功能。AI逐渐成为泛互联网产品应用的技术新基建,渗透到各个决策领域。

从出海的移动应用来讲,AI涌现出很多新的互动场景,比如说视频通话上面有AI实时的字幕、翻译,AI摘要、AI美颜,都已经也是得到了很好的使用。

在泛娱乐+AI上,在线KTV是即构一个很大的优势,我们是行业里面第一家提供实时合唱能力的公司。实时合唱对网络的要求以及音视频的技术要求非常高。因为人的对时延感知的敏感性,技术达不到一定的标准整个体验效果就没有办法商用。实时在线KTV里面也提供了很多音乐识别,通过识别音乐场景、音乐的歌声进行声音的优化处理,以及对于一些唱歌效果的打分,都应用在整个AI的场景里面,我们也提供了丰富的套件,让开发者更快速的集成和上线。

2025年是对话式AI快速增长的一年,随着多模态大模型的持续发展,对话式AI和应用成为可能。对话式AI是新的人机交互的界面,也是最原始的诉求。要建立一种和真人互动一样沉浸感的实时体验。

对话式AI现在也面临很大的挑战,简单来讲,对时效的要求,响应速度的要求。整个处理链路很长,从发出声音到这个声音被设备采集走,再经过网络传输到云端,我们需要用ASR把声音转成文字,把文字又送到大模型,送到大模型得到回应以后又要转成语音,再通过网络又送到另外一端设备上,整个周期链路和处理的pipeline非常复杂非常长。怎么在这么长的工作流里面极致的压缩时延,这个是非常挑战的一件事情。

周边的环境很复杂,有嘈杂的声音或者有回声,也会干扰智能体的判断,你的回声被智能体听到以后就会进行应答,这样整个对话的效果和质量就乱套了。真实对话场景里面还会经常出现打断行为,怎么能够快速打断,该打断的时候打断,不该打断的时候不打断,包括语速、声音、语调怎么做到匹配场景。比如说直播需要很激昂的场景,怎么对情绪和情感融入到这个声音里面等等,这里面有很多的挑战。

对话式AI能带来的前景、效率的提升其实是很有吸引力的。这样也不断推动我们这些开发者和各个企业都在关注和采取大量的应用实践。为了匹配这样的客户的诉求,即构科技推出了实时互动AI Agen方案。通过这个方案不仅可以提供文字的互动,也可以提供语音的互动,甚至是数字人视频的互动。前面说到的问题,更低时延,更自然的打断能力,声音情绪等这些也解决了大部分的问题。

我们从去年开始就一直在打磨AI Agent方案,看似好像没有特别高深的一些技术,但是从工程化的过程来讲是有很大工作量的,我们跟合作伙伴打磨了很长时间,对各种参数进行调整,也踩过很多坑,目前已达到可商用的水平。

针对AI陪伴场景,即构实时互动AI Agent高达99%的识别准确率、95%的打断准确率、90%的断句准确率、对话延迟约1.5s、可播放带人声BGM等特性,充分适配该场景下用户的使用习惯,能够智能识别并给予用户及时的情感陪伴和互动交流。还支持包括真人图片数字人、赛博风图片数字人、多角色语音群聊等能力,大大丰富了AI的形象和互动形式。

在线课堂场景下,即构AI伴学在线课堂方案让真人老师在直播课中可以灵活控制启用自己的AI分身,与学生进行1V1互动,AI老师根据学生的回复给出个性化引导和反馈。方案采用万级并发架构,稳定支撑超大型直播课;支持灵活定制AI老师形象、音色、对话风格,并可结合老师讲课实时内容、白板等课件自然展示;采用“时长+并发包”的灵活计费模式,按实际用量收费。

直播、语聊房等场景下,依托即构云端实时语音识别服务打造的AI观众/AI助理,具备四大优势:600ms低延迟、语音识别准确、较传统模式节省50%以上成本、支持多语言与多厂商,能够有效提升主播开播时长、用户活跃度和留存率,全面提升直播生态体验。

在智能硬件业务中,即构方案适配主流芯片、功耗低,识别准确率达95%,延迟低至1s,采用License计费模式,有效控制成本。不论是AI玩具、机器人玩具、AI翻译机还是宠物陪伴设备等智能硬件产品,都能通过实现自然化、场景化的智能交互。

实时互动AI Agent还有更多场景,比如AI男友/女友、AI剧本杀、AI陪玩游戏等。我们有客户做了剧本杀,这里面有多人AI互动的能力,不只是单人点对点的对话。很多人编排在一起,营造一个有真人玩家,其他三五个是智能体玩家,跟你一起玩游戏。

RTC让泛互联网应用连接世界,AI让这种连接更智能。未来的实时互动,是更沉浸、更自然、更有想象力的。我们期待与在座的各位开发者、伙伴们携手一起去打磨技术,创造未来,一起共创实时互动的新篇章!谢谢大家!

咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部