Item 1 of 1

火山引擎发布豆包音频生成模型1.0 | AI日报

Claw123导航

588

2026-06-24 17:45

588

Claw123导航

Sky Computing Lab发布FastWan-QAD，单卡5090上1.8秒生成5秒视频

Sky Computing Lab日前发布FastWan-QAD视频生成模型系列，基于FastVideo的量化感知蒸馏（QAD）方案训练。在单张NVIDIA GeForce RTX 5090显卡上，端到端生成一段5秒480P视频仅需1.8秒，推理速度显著领先同类方案。

据介绍，该模型在保持视频质量的同时大幅降低了计算开销，使得高质量视频生成在消费级硬件上成为可能。目前，模型、代码及博客均已开源，开发者可基于此进行进一步研究与二次开发。

网易有道发布Confucius4-TTS：14语种跨语种无口音语音克隆开源模型

网易有道正式推出“子曰4.0”TTS引擎Confucius4-TTS，声称是业内首个支持14种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型。用户仅需3秒音频即可实现零样本音色克隆，克隆音色与原声相似度超85%，任务准确度达97%。

该模型支持中文、英语等14种语言，首创音频Prompt情感克隆迁移能力。底层采用GPT式语义大模型、SSL预训练特征与ECAPA-TDNN说话人编码器、FlowMatching框架。目前模型已全量开源（Apache协议），并提供54GB资源包供本地部署。

火山引擎发布豆包音频生成模型1.0，支持多角色对白与情绪编排

火山引擎正式发布豆包音频生成模型1.0（Doubao-Seed-Audio1.0），支持文本与音频参考生成，端到端输出目标音频。单条Prompt可编排多角色对白、情绪语气、背景音乐及环境氛围，长时生成中保持多角色音色一致性，无需后期多轨混音。

该模型支持0样本多模态输入，无需额外训练即可生成；实现音色与风格解耦控制及“一声多角”能力。一次支持2分钟音频创作，多次延长可保持音色统一。目前该模型已开启火山方舟API邀测，个人用户享30分钟创作额度，即将上线剪映、即梦、番茄等产品。

Mistral AI发布OCR 4：支持170种语言与全自托管部署，OlmOCRBench得分85.20

Mistral AI日前正式发布OCR 4，新增边界框、块分类（标题、表格、方程式、签名等）及逐页逐词置信度分数。该模型支持170种语言、10个语系，可单容器全自托管部署。

在OlmOCRBench基准测试中，OCR 4得分85.20，独立标注者偏好率平均达72%。定价方面，每1000页收费4美元，Batch API可享50%折扣。用户可通过API或Mistral Studio的Document AI调用该服务。

IBM开源CUGA轻量级智能体框架

IBM正式开源CUGA（Configurable Generalist Agent），一个处理规划、执行循环、工具调用和状态管理的轻量级智能体框架。开发者只需提供工具列表和提示词即可构建CugaAgent，大幅降低智能体开发门槛。

该框架内置计划-执行-反思循环，在AppWorld（2025年7月—2026年2月）和WebArena（2025年2月—9月）基准上排名第一。

Runway推出Seedance 4K等三款新模型

Runway日前推出三款新模型：Seedance 4K、Seedance Mini及Kling 3.0 Turbo，官方宣称“全球最佳模型，汇聚一处”。三款新品已同步上线。

其中Seedance 4K主打超高清视频生成，Seedance Mini面向轻量高效场景，Kling 3.0 Turbo则在生成速度与质量之间实现新平衡。Runway同步推出限时优惠，使用优惠码30RUNWAY可享前三个月七折。随着视频生成赛道竞争日趋激烈，Runway通过多产品线布局覆盖从专业创作到快速原型的不同需求层级。

“无限制OCR”开源项目上线，实现单次长时域解析能力

Unlimited OCR项目日前在GitHub上线，主打“单次长时域解析”（One-Shot Long-Horizon Parsing）能力，旨在一次性处理长时间跨度的OCR任务。

该项目突破传统OCR逐帧或分段处理的局限，通过端到端方式一次性解析长序列内容，在处理长文档、长视频字幕提取等场景中具有潜在应用价值。

Claude Code v2.1.187发布：增强沙箱凭证安全，修复多项稳定性问题

Claude Code v2.1.187正式发布，新增sandbox.credentials设置，可阻止沙箱化命令读取凭证和秘密环境变量，进一步增强代码执行安全性。模型选择器及相关参数现已支持组织配置的模型限制，选中受限模型时显示“受组织设置限制”提示。全屏模式下选择菜单新增鼠标点击支持。

修复方面，本次更新解决了--resume在-p无模型回合时失败、--json-schema和工作流智能体结构化输出循环、远程MCP工具调用5分钟无响应后阻塞、Remote会话启动延迟约2.7秒、转文/中日韩文本粘贴乱码、子智能体深度追踪不准确、被杀智能体工作树注册残留未清理等多个问题，整体稳定性和用户体验显著提升。

Anthropic推出Claude Tag：在Slack中通过@Claude实现AI协作

Anthropic日前推出Claude Tag，一种在Slack频道中通过@Claude委托任务的全新协作方式。Claude可记住频道上下文，支持多用户交互，经授权后可自动学习其他频道和数据源。开启“环境”行为后，能主动更新未解决的线程或任务，支持异步工作，可自主推进项目数小时甚至数天。

即日起，Claude Tag面向Claude Enterprise和Team客户提供Beta版。管理员可精细控制工具和渠道访问权限，设置Token消耗限额，并查看所有操作日志。

字节跳动内部已大规模落地AI Coding，业务持续收缩聚焦大模型

火山引擎总裁谭待表示，AI Coding（人工智能辅助编程）已成为大模型泛化能力的核心体现，具备产业逻辑支撑，市场给予高估值是合理的。

谭待透露，字节新推出的豆包2.1Pro模型已正式跨过“生产级生产力”质变点，多项评测指标稳定超越Anthropic旗下标杆模型，部分指标与海外高阶版本持平，已能落地芯片RTL开发等真实工业级代码迭代任务。目前，字节跳动内部已大规模落地AI Coding生产流程。

OpenAI 推出「修补地球」计划，用 AI助力开源社区提升网络安全

6月23日，OpenAI宣布推出一项名为「修补地球」（Patch the Planet）的全新计划，旨在借助人工智能技术帮助开源社区提升网络安全防护能力、防范代码漏洞。该计划名称化用了1995年经典影片《黑客》中的标志性台词「入侵地球」（Hack the Planet）。

OpenAI将与知名网络安全公司Trail of Bits展开合作，由Trail of Bits的安全技术人员直接对接开源项目维护者，排查代码中的潜在风险，同时搭配OpenAI自研的Codex Security等安全工具开展辅助检测工作。

Groq获6.5亿美元融资转型AI推理云服务商，此前以200亿美元向英伟达授权LPU技术

当地时间6月22日，AI初创企业Groq宣布完成新一轮6.5亿美元融资，并将正式转型为AI推理云服务供应商（CSP）。约六个月前，Groq曾与英伟达签署了一份非独家授权协议，以200亿美元总价向后者授权其LPU（语言处理单元）推理技术，部分团队人员随之加入英伟达。

Oracle因AI应用裁员21000人，债务驱动云基础设施投资

据Ars Technica报道，Oracle（甲骨文）因AI应用战略调整裁员21,000人。此次裁员与公司通过债务融资大规模投资云基础设施的举措密切相关。

分析指出，Oracle正加速向AI和云计算领域转型，通过大规模基础设施投资争夺AI算力市场份额，但同时也面临人力成本优化和组织架构调整的压力。此次大规模裁员反映出传统企业软件巨头在AI浪潮下转型的阵痛，即在重金投入云与AI基建的同时，必须对传统业务线进行结构性收缩。

五眼联盟联合警告：AI驱动网络威胁数月内将影响普通用户

6月22日，五眼联盟（美国、英国、加拿大、澳大利亚、新西兰）网络安全部门联合发布警告，称即将到来的新一代AI模型将显著降低编写复杂攻击代码的门槛，自动化智能体可全天候扫描互联网漏洞，大幅缩短安全窗口期。

警告指出，AI驱动的超个性化钓鱼诈骗已在亚太地区蔓延，印度2026年初勒索软件事件激增165%。五眼联盟建议企业部署自动化防御AI，个人用户开启多因素认证、删除闲置账户以降低风险敞口。

GitHub联合开源联盟呼吁修改加州AI透明度法案，保护开源许可证永久性

GitHub联合Black Forest Labs、Hugging Face与Mozilla Corporation组成开源联盟，呼吁对加州AI透明度法案（SB 942，拟由SB 1000修正）进行针对性修改。联盟认为，当前草案要求开发者在下游用户未履行透明度义务时撤销开源许可证，这与开源许可证“永久不可撤销”的核心性质相冲突。

OpenAI携手Appia Foundation推动先进AI共享标准建设

OpenAI日前宣布，将通过Appia Foundation支持制定先进AI领域的共享标准，涵盖评估框架、安全实践与全球合作等关键方向。

此举是OpenAI在AI治理与安全领域持续布局的一部分。通过参与标准化建设，OpenAI旨在推动行业在模型评估、安全实践和跨国协作方面形成共识，以应对AI技术快速发展带来的治理挑战。

AI OpenAI Tag

TikTok、Facebook、谷歌、Twitter广告服务，0门槛抢占全球流量！

极速开户+优化投流+风险保障+效果跟踪，仅需4步，轻松撬动亿万海外流量，让品牌销量翻倍增长！

已成功开通5000+账户

免责声明

本文链接:

本文经作者许可发布在AMZ123跨境头条，如有疑问，请联系客服。

冲进万亿收纳市场，TikTok一款双面胶7天爆卖60万！

HappyHorse 1.1刚掀桌子，Seedance 2.5就来了

最新热门报告作者标签

26年加拿大Prime Day总消费将达54亿加元，购物意愿提升

根据Omnisend的最新调查，2026年亚马逊Prime Day活动期间，加拿大和美国消费者的购物意愿均明显提升，西班牙市场也展现出更加理性的购物趋势。

HappyHorse 1.1刚掀桌子，Seedance 2.5就来了

视频生成赛道的两种打法

火山引擎发布豆包音频生成模型1.0 | AI日报

6月24日，AI圈发生了什么？

冲进万亿收纳市场，TikTok一款双面胶7天爆卖60万！

重新定义美国人的收纳，TikTok一款“高能”双面胶成类目顶流

FedEx 26财年财报发布，年营收增至947亿美元

FedEx公布2026财年第四季度及全年业绩。第四季度和全年收入、利润均实现同比增长，FedEx完成FedEx Freight分拆，并预计2027财年将延续收入和盈利增长势头。

印尼规范电商平台收费机制，费用上涨需提前通知

根据印尼中小微企业部发布的《2026年第3号中小微企业部长条例》，电商平台如果计划提高向微型和小型企业收取的服务费用，必须至少提前3个月进行通知。

Prime Day混战，亚马逊卖家单量冰火两重天！

在关税预期上调、年中旺季前置的压力下，今年跨境卖家们在备货端进行了一番“极限冲刺”。根据FreightWaves及SONAR的行业监测数据，6月上半月，中国至美国的集装箱货运量出现了明显反弹，环比涨幅约26%，创下了春节结束后单半月最高增幅。然而在度过紧张的备货周期后，多数卖家却没能在Prime Day迎来预期的流量高峰。昨日，亚马逊北美站、欧洲站等多个站点的2026年Prime Day活动已正式启幕。

Flipkart计划26年新建500个前置仓，扩张快速配送服务

随着快速电商成为印度电商行业新的竞争焦点，Flipkart的即时配送业务Flipkart Minutes上线不到两年，已经建成1000个微型履约中心，公司计划在2026年底前将微型履约中心数量扩大至1500个。

26年美国Prime Day销售额将达263亿美元，创历史新高

Adobe最新发布的分析显示，2026年Prime Day期间，美国零售商预计将实现263亿美元在线销售额，较2025年的242亿美元增长9%，创下历史新高。

爆了！亚马逊Prime Day首日战报流出，有卖家已经断货

祝各位卖家：有策略地冲，有底气地赢。加油，大卖！

亚马逊开始在ChatGPT投放广告

据电商分析师Juozas Kaziukėnas透露，亚马逊已开始在OpenAI的ChatGPT上投放广告。

杀入亚马逊腹地！速卖通美国招商"赛亚计划"曝光

调研报告显示，87%的亚马逊卖家已计划将速卖通作为品牌出海的第二增长曲线。在此背景下，速卖通面向美国市场，正式推出品牌招商"赛亚计划"：针对年销千万美金级别的品牌卖家，推出定向扶持政策——3天极速开店、限时$1000广告激励金、入仓即预付供货价60%……业内人士直言：这是速卖通向亚马逊核心腹地——美国市场发起的正面攻势，也是近年来对品牌卖家诚意最足的一次招商。"赛亚计划"的推出并非孤立动作。2025年9月速卖通上线Brand+超级品牌出海计划，核心主张就是让品牌用亚马逊一半的成本实现全新增量，打造品牌出海新主场，目前已汇聚超1500个认证品牌。

亚马逊紧急通知：欧盟3欧元关税来了！FBA自动加价、FBM须换指定物流！

“免税直邮”时代进入最后倒计时！

月销230万，这一女装小众品类在TikTok美区卖爆了

淘宝40块一条的裙子，在TikTok美区卖出上千万

亚马逊不再奖励“会做事的人”

做亚马逊这几年，很多人最深的感受不是“忙”，而是一种越来越难形容的失重感。你明明还在努力，明明也学会了更多打法，明明比刚入行时更懂广告、更懂Listing、更懂库存节奏，可结果却越来越不受控。问题可能根本不在运营后台。它在产品成本里，在供应链里，在老板的扩张节奏里，在平台流量分配里，也在这个行业悄悄进入成熟期之后，普通人越来越小的容错空间里。这才是很多亚马逊从业者真正的迷茫：不是我不会做了，而是这个行业好像不再像过去那样奖励一个“会做事的人”。PART 1为什么一个能做出结果的人，也会开始怀疑自己很多亚马逊运营最初建立职业信心，往往都来自某一次“逆风翻盘”。

Shopee正式接入ChatGPT，覆盖东南亚及巴西市场

Shopee母公司Sea宣布，与OpenAI达成新的战略合作协议，双方将共同推动人工智能在东南亚和巴西市场的应用，重点聚焦AI驱动的电商体验升级，并进一步扩大用户、卖家和开发者使用人工智能工具的渠道。

《美客多趋势报告-巴西站》PDF下载

根据Kantar《Media Reactions 2024》数据，86%的巴西网民使用美客多进行购物、寻找优惠信息或比价。同时，拉美地区每10个人中就有8个在美客多进行搜索，充分体现了电商在该地区的主导地位。

《TikTok Shop 墨西哥市场分析报告》PDF下载

在全球社交电商高速发展的时代浪潮中，TikTok已然崛起为品牌与消费者深度互动的重要阵地。TikTok不仅重塑了用户的消费习惯，更开创了"发现式购物"的新模式，为品牌营销带来了前所未有的机遇与挑战。

《2026全球AI眼镜行业战略洞察报告》PDF下载

过去三年，全球 AI 眼镜市场经历了爆发式增长：出货量从 2023 年的 34 万台激增至2025 年的 870 万台，三年增长超过 25 倍。2026 年，这一数字有望突破 1000 万台。苹果、谷歌、三星等科技巨头纷纷入局，资本市场反应同样迅猛。

《2026年世界杯营销白皮书》PDF下载

世界杯是全球数十亿球迷四年一次的集体狂欢，这种强烈的情绪共鸣转化为巨大的消费动力。从球衣、围巾到旗帜、喇叭，每一件商品都承载着球迷对球队的支持与热爱。

《2025中国宠物行业出海蓝皮书》PDF下载

随着全球养宠人群结构持续优化、宠物人性化与高端化趋势深化，以及新兴市场养宠渗透率的不断提升，未来五年全球宠物市场预计将以 5.1% 的年均复合增长率持续增长，呈现出更为健康、可持续的增长态势。