字节跳动发布豆包大模型2.1 Pro | AI日报
一键完成百千笔付款,超低费率+极速到账,一年轻松帮你省下数十万。


字节跳动发布豆包大模型2.1 Pro
6月23日,在2026火山引擎FORCE原动力大会上,字节跳动正式发布豆包大模型最新旗舰版本 Doubao-Seed-2.1 Pro。据介绍,豆包大模型2.1 Pro面向Coding和Agent时代打造,在代码交付、长程Agent任务、多模态理解及企业级稳定运行四个维度实现突破。
京东开源JoyAI-VL-Interaction,让大模型从“一问一答”走向“边看边说”
6月22日,京东宣布开源实时视频视觉语言交互模型JoyAI-VL-Interaction。据介绍,这是全球首个全栈开源的interaction模型和系统,并获得vLLM-Omni的day-0原生支持。
该模型突破了传统多模态大模型“上传视频—等待提问—给出回答”的回合制模式,让AI能够像人一样持续“在场”:边看、边记、边判断,并在关键时刻主动回应。
PaddleOCR发布PP-OCRv6模型族,登顶Hugging Face提供50语言OCR能力
6月23日,百度飞桨PaddleOCR团队宣布最新一代通用OCR模型族PP-OCRv6正式登录Hugging Face平台。该模型族提供tiny(1.5M)、small(7.7M)和medium(34.5M)三级参数规模,其中medium和small版本支持简体/繁体中文、英文、日文及46种拉丁语系共50种语言的文字识别。
Sakana AI推出多智能体编排系统Sakana Fugu,将复杂Agent工程变为开箱即用API
6月23日消息,东京AI公司Sakana AI推出多智能体编排系统Sakana Fugu。Sakana Fugu将多智能体系统封装为单个API调用,内部自动拆解任务、调度全球模型并验证结果。其旗舰版本Fugu Ultra在工程、科学、推理等基准上对标Fable/Mythos级别模型表现,通过动态编排多模型天然绕开单一供应商出口管制风险。
该系统被视为将多智能体从复杂工程转变为开箱即用的产品形态,开发者只需一次API调用即可获得多模型协同的推理能力。
Oak开源发布:专为AI智能体设计的Git替代方案,速度远超传统版本控制
6月23日消息,开源版本控制系统Oak正式发布公开测试版v0.99.0,专为Claude Code、Codex、Cursor等AI智能体设计。该系统采用BLAKE3内容哈希、内容定义分块及Blob/Manifest/Commit/Tree数据模型,可选SQLite和git后端。
Oak以分支-会话为基本工作单元,用分支描述替代逐次提交,通过内容寻址懒加载使智能体在数秒内编辑任意仓库,速度远超传统git。目前已支持macOS(Apple Silicon)、Linux(x86_64)及Windows平台,可通过curl或cargo安装,基于Apache-2.0协议开源。
Claude Code v2.1.186发布:新增MCP CLI认证、/workflows状态过滤及teammateMode设置
6月23日,Anthropic发布Claude Code v2.1.186版本。新增claude mcp login/logout命令,支持从CLI认证MCP服务器并完成SSH无浏览器重定向。新增/workflows状态过滤、/plugin Skills部分及teammateMode: "item2"设置。! bash命令改为自动触发Claude响应,可通过respondToDashCommands恢复原行为。修复了机器唤醒后流请求失败、子agent滚动错位、后台预览闪烁、Chrome标签组隔离、重复会话摘要、权限提示编号错位等问题,改进了服务器名称输入提示和记忆压缩提醒。

豆包App灰测打车功能,由曹操出行提供运力支持
字节跳动旗下AI助手豆包App正式开启即时出行服务的灰度测试,部分获得灰测资格的用户可直接在豆包App内使用一键打车服务,由曹操出行提供运力支持。
用户无需切换至其他打车软件,只需在豆包对话框内口述出行需求,系统即可自动识别起止地点、出行人数及用车偏好,匹配曹操出行车辆后,用户核对路线、车型和价格一键确认即可完成派单。目前,北京、杭州两座城市的部分用户已获得灰测资格。
xAI推出GrokBuild /goal模式:一行命令设定目标,Agent自主完成全程任务
6月23日,xAI在GrokBuild中引入/goal新模式。用户只需用一行命令设定目标,Agent便会自动规划方案、将任务分解为进度清单并持续执行,直至目标完成且通过验证。执行期间用户可额外下达指令,支持监控与引导命令,任务完成时清单全部勾选。
Runway Aleph 2.0正式集成至Figma Weave
6月23日消息,Runway宣布Aleph 2.0现已正式集成到Figma Weave中。此前Runway在Figma Weave发布时已预告该功能,此次集成将Aleph 2.0的设计智能能力引入Figma协作生态,为设计师提供更强大的AI辅助设计体验。具体功能细节尚未披露。
OpenAI发布Daybreak安全工具:Codex Security与GPT-5.5-Cyber助力大规模漏洞修复
OpenAI正式推出Daybreak系列安全工具,包括Codex Security代码安全插件和GPT-5.5-Cyber网络安全专用模型,旨在帮助组织大规模发现、验证并修补安全漏洞。这是OpenAI扩展Daybreak网络安全计划的核心举措之一,标志着AI在网络安全领域的应用从漏洞发现向全链路自动化防御延伸。
Claude Desktop完整版登陆AWS、Google Cloud和Microsoft Foundry,企业可在云环境中保留推理数据
6月23日,Anthropic宣布,通过AWS、Google Cloud和Microsoft Foundry使用Claude Desktop的组织现已获得Chat、Claude Cowork和Claude Code集成的完整桌面体验。IT团队可将推理保留在自有云环境中,对话历史本地存储,支持IAM Identity Center、Workforce Identity Federation、Microsoft Entra ID及Okta等多种登录方式。策略模板可导出至Intune、GPO或Jamf,并提供离线安装器。Chat、Claude Cowork和Claude Code各自拥有独立策略链,支持精细访问控制。

SpaceX与Reflection AI签署63亿美元算力协议,出租Colossus 2数据中心芯片
6月23日消息,SpaceX与AI初创公司Reflection AI签署了一项最高价值63亿美元的算力供应协议。Reflection将从今年7月1日起至2029年,每月向SpaceX支付1.5亿美元,以使用SpaceX位于田纳西州孟菲斯的Colossus 2数据中心的英伟达GB300芯片算力资源。
Meta暂停AI监控项目:因数据泄露,员工键盘鼠标记录意外公开
6月23日,据Business Insider报道,Meta已暂停一项名为“模型能力计划(MCI)”的AI训练项目。该项目原用于记录员工键盘敲击和鼠标操作轨迹以训练AI,但因收集的敏感数据(包括私人对话、绩效记录及语音转文字内容)被意外开放给全体员工查阅,引发内部数据泄露。Meta发言人回应称,项目设计时已配备隐私防护机制,目前无证据表明数据遭违规调取,但为配合全面调查,已暂停项目运行。此次暂停并非因员工对持续监控的不满或隐私法规争议,而是直接由泄露事故导致。
亚马逊在ChatGPT投广告引流
6月23日消息,电商分析师尤奥扎斯·卡济乌凯纳斯透露,亚马逊已开始在ChatGPT投放广告,成为入驻OpenAI新兴广告业务最知名的零售企业之一。这类广告会引导用户跳转至亚马逊店铺页面,所有用户体验与交易流程均由亚马逊全权把控。
智谱GLM-5.5将升级万亿参数
6月22日消息,摩根大通在研报中预测,智谱将于8月发布下一代旗舰模型GLM-5.5,参数量可能突破万亿(>1T)级别。今年6月中旬,智谱刚刚开源了总参数7440亿、激活参数约400亿的GLM-5.2模型,该模型在CodeArena评估系统中以1595分排名总榜第二,在全球可用模型中位列第一。从7440亿提升至万亿参数,意味着约50%的规模跃升。
OpenAI扩展Daybreak网络安全计划,推出四项核心举措
6月23日消息,OpenAI宣布正式扩展旗下“黎明(Daybreak)”网络安全计划,推出四项核心举措:升级Codex Security插件、发布更新版网络安全专用模型GPT-5.5-Cyber、上线Daybreak网络合作伙伴计划、联合发起开源漏洞修复行动“修复地球计划(Patch the Planet)”。
此次扩展的核心逻辑在于,AI发现漏洞的速度已超过防御团队修复的速度,安全团队正被大量报告淹没。OpenAI表示,当前的新瓶颈在于补丁修复环节,而非漏洞发现。
Sand.ai完成超1亿美元融资,将于三季度开源新一代MoE视频生成模型
6月22日,视频生成初创公司Sand.ai宣布完成新一轮融资,3个月内两轮融资金额合计超1亿美元。投资方包括快手创始人宿华、Lollapalooza Capital(王慧文家族办公室)、九坤创投、经纬创投、和玉资本、创新工场、襄禾资本、源码资本、中科创星、洪泰基金、今日资本、IDG、百度风投等近20家一线机构。
Google DeepMind投资7500万美元携手A24,合作开发电影制作AI工具
Google DeepMind宣布向独立电影制片厂A24投资7500万美元,双方将合作开发电影制作AI工具。A24曾出品《瞬息全宇宙》《过往人生》等知名影片。Google DeepMind CEO Demis Hassabis表示,希望通过与艺术家直接合作,打造真正支持创意表达的AI功能。
Google Labs提出“洞察策略”评估AI编码智能体主动性,而非仅看任务完成度
6月23日,Google Labs在Google Developers Blog上发布一项新研究,提出用“洞察策略”评估AI编码智能体的主动性,而非仅按任务完成度打分。研究团队基于Google内部代码库中705个bug(对应1178个CL),通过时空近邻与语义相似度聚类,还原开发者实际的高层级目标。
















