AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

斯坦福:2024年人工智能指数报告(中文详解-1)

Shulex
Shulex
数智化VOC聆听,引领产品创新,驱动品牌增长。
4238
2024-05-06 16:48
2024-05-06 16:48
4238
Shulex
数智化VOC聆听,引领产品创新,驱动品牌增长。

【Jumia首届招商大会】官方&平台大卖全明星阵容拆解0-1入门难题,利好政策大放送>>>


由华裔女科学家、“人工智能教母”李飞飞联合领导的斯坦福大学以人为本人工智能研究所(Stanford HAI)近日发布了:《2024年人工智能指数报告》(Artificial Intelligence Index Report 2024)。


斯坦福大学HAI介绍称,人工智能指数报告跟踪、整理、提取和可视化与人工智能相关的数据。该研究所的使命是提供不带偏见的、经过严格审查的、来源广泛的数据,以便政策制定者、研究人员、高管、记者和公众对复杂的人工智能领域有更深入细致的了解。人工智能指数是全球公认的最可信和最权威的人工智能数据和见解来源之一。

Shulex 将此报告的 10 个重点议题分为 10 次内容为您进行翻译和更新,以下为此次报告的基础介绍及第一章 :研究与发展部分的具体内容!

如果您希望尽快学习整篇内容,您可以扫码咨询Shulex小助手领取《2024年人工智能指数报告》(Artificial Intelligence Index Report 2024)英文版原版PDF文件,谢谢!

2024年AI指数报告介绍

欢迎来到第七版AI指数报告。2024年指数是我们迄今为止最全面的指数,在AI对社会的影响从未如此明显的重要时刻到来。今年,我们扩大了研究范围,更广泛地涵盖了AI的技术进步、公众对该技术的看法以及围绕其发展的地缘政治动态等基本趋势。该版本提供了比以往更多的原始数据,介绍了对AI培训成本的新估计,对负责任的AI前景的详细分析,以及专门介绍AI对科学和医学影响的全新章节。

AI指数报告跟踪、整理、提炼和可视化与人工智能(AI)相关的数据。我们的使命是提供公正、严格审查、来源广泛的数据,以便政策制定者、研究人员、高管、记者和公众对复杂的AI领域有更全面、更细致的了解。

AI指数是全球公认的最可信、最权威的人工智能数据和见解来源之一。之前的版本曾被《纽约时报》、《彭博社》、《卫报》等主要报纸引用,积累了数百次学术引用,并被美国、英国、欧盟等地的高层决策者引用。今年的版本在规模、规模和范围上都超过了以往的所有版本,反映了AI在我们生活中越来越重要。

联合致辞:

十年前,世界上最好的AI系统还无法像人类一样对图像中的物体进行分类。AI难以理解语言,也无法解决数学问题。如今,AI系统在标准基准上的表现经常超过人类。

2023年,这一进程加速。像GPT-4、Gemini和Claude 3这样最先进的新系统是令人印象深刻的多模态:它们可以生成数十种语言的流畅文本,处理音频,甚至解释模因。随着AI的进步,它越来越多地进入我们的生活。公司正在竞相开发基于人工智能的产品,AI越来越多地被公众使用。但目前的AI技术仍然存在重大问题。它不能可靠地处理事实,执行复杂的推理,或者解释它的结论。

AI面临两个相互关联的未来。首先,技术不断改进并被越来越多地使用,对生产力和就业产生重大影响。它可以有好的用途,也可以有坏的用途。在第二个未来,AI的采用受到技术局限性的限制。无论未来如何展开,各国政府都越来越关注。他们正在介入以鼓励有利的一面,例如资助大学研发和激励私人投资。政府也致力于管理潜在的负面影响,例如对就业、隐私问题、错误信息和知识产权的影响。

随着AI的迅速发展,AI指数旨在帮助AI社区、政策制定者、商业领袖、记者和公众应对这一复杂的局面。它提供了持续、客观的快照,跟踪几个关键领域:AI能力的技术进步,推动AI开发和部署的社区和投资,对当前和潜在未来影响的公众舆论,以及为刺激AI创新而采取的政策措施,同时管理其风险和挑战。通过全面监测AI生态系统,该指数是了解这一变革性技术力量的重要资源。

在技术方面,今年的AI指数报告称,2023年全球发布的新型大型语言模型的数量比前一年翻了一番。其中三分之二是开源的,但表现最好的模型来自拥有封闭系统的行业参与者。Gemini Ultra成为第一个在大规模多任务语言理解(MMLU)基准上达到人类水平的LLM;自去年以来,在基准测试上的性能提升了15个百分点。此外,GPT-4在语言模型综合整体评估(HELM)基准上取得了令人印象深刻的0.96平均胜率得分,其中包括MMLU和其他评估。

虽然全球对AI的私人投资连续第二年减少,但对生成式AI的投资却飙升。财富500强公司的财报电话会议中提到AI的次数比以往任何时候都多,新的研究表明,AI确实提高了员工的生产率。在政策制定方面,全球立法程序中对AI的提及从未如此之高。美国监管机构在2023年通过的人工智能相关法规比以往任何时候都多。尽管如此,许多人对AI制造深度造假和影响选举的能力表示担忧。公众对AI的意识越来越强,研究表明,他们的反应是紧张。Ray Perrault and Jack ClarkCo-directors, AI Index

十大启示:

1. A人工智能在某些任务上胜过人类,但并非在所有任务上。在一些基准测试中,人工智能的表现已经超过了人类,包括在图像分类、视觉推理和英语理解方面。然而,在竞赛级数学、视觉常识推理和规划等更复杂的任务上,人工智能却落后于人类。 

2. 工业界继续主导人工智能前沿研究。2023 年,产业界产生了 51 个著名的机器学习模型,而学术界只贡献了 15 个。2023 年,产学合作还产生了 21 个著名模型,创下新高。2023年,工业界产生了51个值得注意的机器学习模型,而学术界仅贡献了15个。 

3. 前沿模型越来越昂贵。据 AI Index 估计,最先进的人工智能模型的训练成本已经达到了前所未有的水平。例如,OpenAI 的 GPT-4 估计使用了价值 7800 万美元的计算资源进行训练,而谷歌的 Gemini Ultra 则耗费了 1.91 亿美元的计算资源。 根据AI指数的估计,最先进的AI模型的培训成本已经达到了前所未有的水平。 

4. 美国领先于中国、欧盟和英国,成为顶级人工智能模型的主要来源国。2023 年,61 个著名的人工智能模型源自美国的机构,远远超过欧盟的 21 个和中国的 15 个。2023年,61个著名的AI模型来自美国的机构,远远超过欧盟的21个和中国的15个。

5.目前严重缺乏对 LLM 责任的可靠和标准化评估。 包括 OpenAI、谷歌和 Anthropic 在内的领先开发者主要根据不同的责任人工智能基准来测试自己的模型。这种做法使得系统地比较顶级人工智能模型的风险和局限性的工作变得更加复杂。   

6.  生成式人工智能投资激增。尽管去年整体人工智能私人投资有所下降,但用于生成式人工智能的资金却激增,比2022年增长了近八倍,达到252亿美元。生成式人工智能领域的主要参与者,包括 OpenAI、Anthropic、Hugging Face 和 Inflection,都报告了一轮可观的融资。生成式AI领域的主要参与者,包括OpenAI、Anthropic、hugs Face和Inflection,都报告了大量融资。

7. 数据显示人工智能让工人更有生产力,工作质量更高。2023 年,几项研究评估了人工智能对劳动力的影响,表明人工智能使工人能够更快地完成任务,并提高产出质量。这些研究还表明,人工智能有可能缩小低技能和高技能工人之间的技能差距。不过,其他研究也提醒说,在没有适当监督的情况下使用人工智能可能会导致绩效下降。 

8.  得益于人工智能,科学进步进一步加速。2022 年,人工智能开始推动科学发现。然而,2023 年,与科学相关的更重要的人工智能应用相继问世--从提高算法排序效率的 AlphaDev,到促进材料发现过程的 GNoME。 然而,2023年,我们看到了更重要的与科学相关的AI应用程序的推出——从提高算法排序效率的AlphaDev,到促进材料发现过程的GNoME。

9.  美国人工智能法规数量急剧增加。美国人工智能相关法规的数量在过去一年和过去五年中大幅增加。2023 年,人工智能相关法规将从 2016 年的 1 项增加到 25 项。仅去年一年,人工智能相关法规的总数就增长了 56.3%。到2023年,有25项人工智能相关法规,而2016年只有一项。 

10. 益普索的一项调查显示,在过去的一年里,认为AI将在未来三到五年内极大地影响他们生活的人的比例从60%上升到66%。此外,52%的人对AI产品和服务表示紧张,比2022年上升了13个百分点。在美国,皮尤研究中心的数据显示,52%的美国人对AI感到担忧甚于兴奋,而2022年这一比例为37%。

以下为报告相关贡献者及组织:(此处不做翻译)

本篇内容主要为您分享,第一章:研究与发展!

第 一 章 :研究与发展

概述

本章研究了AI研究与发展的趋势。它首先检查趋势出版物和专利,然后检查著名的AI系统和基础模型的趋势。最后分析了AI会议出席情况和开源AI软件项目。

第 一 章 :研究与发展

1. 工业界继续主导前沿人工智能研究

2023年,工业界产生了51 个值得注意的机器学习模型,而学术界只贡献了15个。2023年产学合作产生的值得注意的模型也有21个,再创新高。

2. 更多的基金会模型和更开放的基金会模型。

2023年,共有149个基金会发布了款型,比2022年发布的数量增加了一倍多。在这些新发布的机型中,开源机型占65.7%,而2022年和2021年这一比例分别仅为44.4%和33.3%。

3. 前沿机型的价格要贵得多

根据人工智能指数的估计,最先进的人工智能模型的培训成本已经达到了前所未有的水平。例如,OpenAI的GPT-4使用了价值约7800万美元的计算进行训练,而谷歌的Gemini Ultra则花费了1.91亿美元的计算成本。

4. 美国领先中国、欧盟和英国,成为顶级人工智能模型的主要来源。

2023年,61个著名的人工智能模型来自美国的机构,远远超过欧盟的21个和中国的15个。

5. 人工智能专利数量激增。

从2021年到2022年,全球人工智能专利授权大幅增长62.7%。自2010年以来,获得授权的人工智能专利数量增长了31倍以上。

6. 中国主导着人工智能专利。

2022年,中国以61.1%的比例领先全球人工智能专利起源,显著超过美国的20.9%。自2010年以来,美国在人工智能专利中的份额从54.1%下降。

7. 开源人工智能研究爆发。 

自2011年以来,GitHub上的人工智能相关项目数量持续增长,从2011年的845个增长到2023年的180万个。值得注意的是,仅在2023年,GitHub人工智能项目总数就急剧增长了59.3%。GitHub上人工智能相关项目的星级总数在2023年也大幅增加,从2022年的400万增加到1220万,增加了两倍多。

8. 人工智能出版物的数量持续上升。

2010年至2022年间,人工智能出版物的总数几乎增加了两倍,从2010年的约8.8万篇增加到2022年的24万多篇。与去年相比,这一增幅仅为1.1%。



part1

1.1 出版物

概 述

以下数字显示了2010年至2022年全球英语和中文人工智能出版物的数量,按隶属关系类型和跨部门合作分类。此外,本节还详细介绍了人工智能期刊文章和会议论文的出版数据。

人工智能出版物总数

图1.1.1显示了人工智能出版物的全局计数。2010年至2022年间,人工智能出版物的总数几乎增加了两倍,从2010年的约8.8万篇增加到2022年的24万多篇。与去年相比,这一增幅仅为1.1%

按出版类型划分

图1.1.2显示了全球AI发布类型随时间的分布情况。2022年,大约有23万篇AI期刊文章,而大约有4.2万篇会议论文。自2015年以来,ai期刊和会议出版物以可比的速度增长。2022年,会议出版物和期刊出版物的数量分别是2015年的2.6倍和2.4倍。

按研究领域划分

图1.1.3显示了自2010年以来按研究领域划分的AI出版物总数。机器学习出版物在过去十年中增长最快,自2015年以来增长了近7倍。继机器学习之后,2022年发表最多的AI领域是计算机视觉(21,309篇)、模式识别(19,841篇)和流程管理(12,052篇)。


部门

本节介绍了AI出版物在全球范围内的分布情况,包括教育、政府、行业、非营利组织和其他部门,以及具体在美国、中国、欧洲联盟加联合王国的分布情况。2022年,学术部门贡献了大部分人工智能出版物(81.1%),在过去十年中保持了其在所有地区AI研究全球领先来源的地位(图1.1.4和图1.1.5)。工业参与在美国最为显著,其次是欧洲联盟加联合王国和中国(图1.1.5)。

AI期刊

图1.1.6显示了2010 - 2022年AI期刊发表总数。从2010年到2015年,AI期刊出版物的数量略有增长,但自2015年以来增长了约2.4倍。在2021年至2022年期间,AI期刊出版物增长了4.5%。

AI会议出版物

图1.1.7显示了自2010年以来AI会议出版物的总数。在过去的两年里,AI会议出版物的数量有了显著的增长,从2020年的22727篇上升到2021年的31629篇,到2022年达到41174篇。仅去年一年,AI会议出版物就增加了30.2%。自2010年以来,AI会议出版物的数量增加了一倍多。


part2


本节研究了全球AI专利的长期趋势,这可以揭示AI创新、研究和开发演变的重要见解。此外,分析AI专利可以揭示这些进步是如何在全球分布的。与出版物数据类似,AI专利数据的可用性也有明显的延迟,2022年是可访问数据的最近一年。本节数据来自CSET。

1.2 专利

AI专利

概述:

图1.2.1考察了2010年至2022年全球AI专利授权的增长情况。在过去十年中,AI专利数量显著增加,近年来增长尤为迅猛。例如,2010年至2014年间,AI专利授权总量增长了56.1%。然而,仅从2021年到2022年,AI专利数量就增长了62.7%。

按归档状态和地区划分

以下部分按AI专利的申请状态(是否授予)以及其发表的地区进行了分类。

图1.2.2按申请状态对全球AI专利进行比较。2022年,未授权的AI专利数量(128952件)是授权数量(62264件)的两倍多。随着时间的推移,AI专利审批的格局发生了显著变化。直到2015年,申请的AI专利中获得授权的比例更大。然而,从那以后,大多数AI专利申请都没有获得批准,差距显著扩大。例如,2015年,42.2%的AI专利申请未获批准。到2022年,这一数字已上升至67.4%。

在包括中国、欧盟和英国以及美国在内的所有主要专利起源地理区域,授权和未授权AI专利之间的差距都很明显

(图1.2.3)。近年来,这三个地理区域的AI专利申请总数和专利授权数量都有所增加。

图1.2.4展示了授权AI专利的区域细分。截至2022年,世界上大部分已授予的AI专利(75.2%)来自东亚和太平洋地区,北美是第二大贡献者,占21.2%。截至2011年,北美在全球AI专利数量方面处于领先地位。然而,从那时起,发生了重大转变,来自东亚和太平洋地区的AI专利比例不断增加。

按地理区域划分,世界上大多数授予的AI专利来自中国(61.1%)和美国(20.9%)(图1.2.5)。来自美国的AI专利份额从2010年的54.1%下降。

图1.2.6和图1.2.7显示了哪些国家在人均AI专利方面领先。2022年,每10万居民中获得AI专利最多的国家是韩国(10.3),其次是卢森堡(8.8)和美国(4.2)。

(图)相对于1.2.6。图1.2.7显示了2012年至2022年人均AI专利授权的变化。在此期间,新加坡、韩国和中国的人均AI专利申请量增幅最大。

2012年 与 2022年各国每 10万居民获批人工智能专利的百分比变化

part3

本节探讨AI研究的前沿。虽然每年都会推出许多新的AI模型,但只有一小部分样本代表了最先进的研究。诚然,什么是先进或前沿研究多少有些主观。前沿研究可以反映一个模型在基准上发布一个新的最先进的结果,引入一个有意义的新架构,或者行使一些令人印象深刻的新功能。

人工智能指数研究两类前沿人工智能模型的趋势:“显著模型”和基础模型人工智能指数数据提供商Epoch使用“著名的机器学习模型”一词来指定精心挑选的在人工智能/机器学习生态系统中特别有影响力的值得注意的模型。相比之下,基础模型是在大量数据集上训练的非常大的人工智能模型,能够执行大量的下游任务。基础模型的例子包括GPT-4、Claude 3和Gemini。虽然很多粉底模特可能有资格成为知名模特,但并非所有知名模特都是粉底模特。


在本节中,人工智能指数从不同的角度探讨了著名模型和基础模型的趋势,包括原始组织、原产国、参数计数和计算使用情况。分析最后对机器学习培训成本进行了考察。

1.3 前 沿 人 工 智 能 研 究

通用机器学习模型

概述

Epoch人工智能是一组致力于研究和预测先进人工智能进化的研究人员。他们维护着一个自20世纪50年代以来发布的人工智能和机器学习模型数据库,根据最先进的技术进步、历史意义或高引用率等标准选择条目。通过分析这些模型,可以全面概述近年来和过去几十年机器学习领域的演变数据集中可能缺少一些模型;然而,数据集可以相对地揭示趋势。

行 业 分 析

直到2014年,学术界主导了机器学习模型的发布。从那以后,工业界就走在了前面。2023年,工业界产生了51个值得注意的机器学习模型,而学术界只有15个(图1.3.1)。值得注意的是,2023年有21个值得注意的模型是由行业/学术合作产生的,创历史新高。

创建尖端的人工智能模型现在需要大量的数据、计算能力和财政资源,而这些在学术界是无法获得的。在去年的人工智能指数报告中,首次强调了这种向领先人工智能模型增加行业主导地位的转变。尽管今年差距略有缩小,但这一趋势在很大程度上仍然存在。

国家关系

为了说明不断变化的人工智能地缘政治格局,人工智能指数研究团队分析了著名模型的原产国。

图1.3.2显示了归因于研究人员附属机构位置的显著机器学习模型的总数

2023年,美国以61个著名机器学习模型领跑,中国以15个紧随其后,法国以8个紧随其后。自2019年以来,欧盟和英国生产的著名人工智能模型数量首次超过中国(图1.3.3)。自2003年以来,美国比英国、中国和加拿大等其他主要地理区域生产了更多的模型(图1.3.4)。


2003-23年按地理区域划分的著名机器学习模型数量 (sum)

参数的趋势

机器学习模型中的参数是在训练过程中学习到的数值,它决定了模型如何解释输入数据并进行预测。

在更多数据上训练的模型通常会比在更少数据上训练的模型有更多的参数。同样,具有更多参数的模型通常优于具有更少参数的模型。

图1.3.5展示了Epoch数据集中机器学习模型的参数计数,按模型起源的部门进行分类。自2010年代初以来,参数数量急剧上升,反映了AI模型设计任务的日益复杂、数据的可用性、硬件的改进以及更大模型的有效性。高参数模型在工业领域尤其引人注目,这凸显了OpenAI、Anthropic和Google等公司承担海量数据训练的计算成本的能力。

计算趋势

AI模型中的术语“计算”是指训练和操作机器学习模型所需的计算资源。一般是指模型的复杂程度和训练数据集的大小直接影响所需的计算量。模型越复杂,底层训练数据越大,训练所需的计算量就越大。

图1.3.6可视化了过去20年著名机器学习模型所需的训练计算量。最近,著名的AI模型的计算使用量呈指数级增长这一趋势在过去五年中尤为明显。计算需求的快速增长具有至关重要的意义。例如,需要更多计算的模型通常具有更大的环境足迹,公司通常比学术机构拥有更多的计算资源。

图1.3.7突出显示了2012年以来著名机器学习模型的训练计算。例如,AlexNet是推广使用gpu改进AI模型的标准做法的论文之一,该论文估计需要470千万亿次浮点运算来进行训练。

最初的Transformer于2017年发布,需要大约7400千万亿次浮点运算。谷歌的Gemini Ultra是目前最先进的基础模型之一,需要500亿次千万亿次浮点运算。

亮 点 :

模型会耗尽数据吗 ?

如上所示,最近很大一部分算法进步,包括强大的llm背后的进步,都是通过在越来越大的数据量上训练模型来实现的。正如Anthropic联合创始人兼AI指数指导委员会成员杰克·克拉克(Jack Clark)最近指出的那样,基金会模型已经在互联网上存在的所有数据中进行了有意义的训练。

AI模型对数据的依赖性越来越大,这引发了人们的担忧,即未来几代计算机科学家将耗尽数据,无法进一步扩展和改进他们的系统。

Epoch的研究表明,这些担忧在某种程度上是有道理的。Epoch的研究人员已经对AI研究人员可能会在何时耗尽数据进行了历史和基于计算的预测。历史预测是基于观察到的用于训练基础模型的数据规模的增长率。计算预测根据计算可用性的预测来调整历史增长率。

例如,研究人员估计,到2024年,计算机科学家可能会耗尽高质量语言数据的库存,在20年内耗尽低质量语言数据,并在2030年代末至2040年代中期耗尽图像数据(图1.3.8)。

从理论上讲,数据可用性有限的挑战可以通过使用合成来解决

类型对ML数据耗尽的预测:中位数和90% CI日期来源:Epoch2023 |表:2024 AIIndex报告


数据,这是AI模型本身产生的数据。例如,可以使用一个LLM生成的文本来训练另一个LLM。使用合成数据训练AI系统特别有吸引力,不仅因为它是潜在数据耗尽的解决方案,而且因为生成式AI系统原则上可以在自然发生的数据稀少的情况下生成数据,例如,罕见疾病或代表性不足的人口的数据。直到最近,使用合成数据训练生成式AI系统的可行性和有效性还没有得到很好的理解。然而,今年的研究表明,在合成数据上训练模型存在局限性。

例如,一个由英国和加拿大研究人员组成的团队发现,模型主要是在合成数据经验模型上训练的

崩溃,一种现象,随着时间的推移,他们失去了记住真实底层数据分布的能力,并开始产生一个狭窄的输出。图1.3.9展示了变分自编码器(VAE)模型的模型崩溃过程,变分自编码器是一种广泛使用的生成式AI架构。随着后续每一代的训练额外的合成数据,模型产生的输出越来越有限。如图1.3.10所示,从统计学角度来看,随着合成代数的增加,分布的尾部消失,代密度向均值偏移这种模式意味着,随着时间的推移,主要在合成数据上训练的模型的世代变化越来越小,分布也不那么广泛。

作者证明,这种现象发生在各种模型类型中,包括高斯混合模型和法学硕士。这项研究强调了人工生成数据对训练有能力的法学硕士的持续重要性,这些数据可以产生各种各样的内容。

在2023年发表的类似研究中使用

对于生成成像模型中的合成数据,研究人员发现,仅在合成数据周期上训练的生成图像模型——或者在真实人类数据不足的情况下训练的生成图像模型,输出质量会显著下降。作者将这种现象标记为模型自噬障碍(MAD),参考疯牛病。

该研究检查了两种类型的训练过程:完全合成,即模型完全根据合成数据进行训练,以及合成增强,其中,模型在合成数据和真实数据的混合上进行训练。在这两种场景中,随着训练代数的增加,图1.3.1

生成的图像下降。图1.3.11突出显示了使用合成数据增强的模型的退化图像世代;例如,第7步和第9步生成的人脸越来越多地显示出奇怪的hash标记。来自统计数据合成数据和合成增强循环生成的图像具有较高的FID分数(表明与真实图像的相似性较低),较低的精度分数(表明真实感或质量降低)和较低的召回分数(表明多样性降低)(图1.3.12)。而合成增强循环,其中包含了一些真实的数据显示出比完全合成环路更少的退化,但随着进一步的训练,这两种方法的收益都会递减。


基础模型

基础模型代表了一个快速发展和流行的AI模型类别。它们在庞大的数据集上训练,用途广泛,适用于众多下游应用。诸如GPT-4、Claude 3和羊驼2等基础模型展示了非凡的能力,并且越来越多地部署在现实场景中。

生态系统图于2023年推出,是斯坦福大学的一个新的社区资源,用于跟踪基础模型生态系统,包括数据集、模型和应用程序。本节使用来自生态系统图的数据来研究基础模型随时间的趋势

Model Release

基础模型可以通过不同的方式访问。无访问模型,比如谷歌的PaLM-E,只有开发者可以访问。有限访问模型,如OpenAI的GPT-4,通常通过公共API提供对模型的有限访问。开放模型,如Meta的羊驼2,完全释放模型的重量,这意味着模型可以修改和自由使用。

图1.3.13可视化了2019年以来按接入类型划分的基础模型总数。近年来,基础模型数量急剧上升,自2022年以来增长了一倍多,自2019年以来增长了近38倍。在2023年发布的149款基础款中,98款是开放的,23款是受限的,28款是不可访问的。

2023年,大多数基础模型都是开放获取的(65.8%),18.8%的模型没有访问权限,15.4%的模型有限制访问权限(图1.3.14)。从2021年开始,以开放获取方式发布的模型比例有了明显的提升。

人事关系

图1.3.15绘制了自2019年以来基金会模型的起源部门。2023年,大部分基础模型(72.5%)

来源于工业。2023年只有18.8%的基础模型来源于学术界。自2019年以来,越来越多的基础模型来自工业界。

图1.3.16突出显示了2023年发布的各种基础模型的来源 。Google推出的模型最多 (18个 ),其次是 Meta(11图1.3.16突出显示了2023年发布的各种基础模型的来源。Google推出的模型最多(18个),其次是Meta(11个)和微软(9个)。2023年发布最多基础模型的学术机构是加州大学伯克利分校(3个)。

2019年以来,Google发布的基础模型最多,共40个,其次是OpenAI, 20个(图1.3.17)。清华大学在非西方机构中脱颖而出,发布了7个基础模型,而斯坦福大学则是美国领先的学术机构,发布了5个。

国家关系

鉴于基础模型在前沿AI研究中具有相当的代表性,从地缘政治的角度来看,了解它们的国家归属是很重要的。图1.3.18、1.3.19和1.3.20可视化了各种基础模型的国家隶属关系。与本章前面提出的值得注意的模型分析一样,

如果为该模型作出贡献的研究人员隶属于总部设在该国的机构,则该模型被视为隶属于该国。

2023年,世界上大部分的基础模型都来自美国(109个),其次是中国(20个)和英国(图1.3.18)。自2019年以来,美国一直领先于大多数基础模型的起源

(图1.3.19)。

图1.3.20描绘了自2019年以来发布并归属于各自国家的基础模型的累计计数。2019年以来发布的基础模型数量最多的国家是美国(182个),其次是中国(30个)和英国(21个)。

训练费用

在关于基础模型的讨论中,一个突出的话题是它们的推测成本。虽然AI公司很少披露训练模型所涉及的费用,但人们普遍认为,这些成本高达数百万美元,而且还在上升。例如,OpenAI的首席执行官萨姆·奥特曼(Sam Altman)提到,GPT-4的培训成本超过1亿美元。培训费用的上涨实际上排除了传统的AI研究中心大学开发自己的前沿基础模型的可能性。作为回应,政策倡议,如拜登总统关于AI的行政命令,试图通过创建国家AI,在产业界和学术界之间创造公平的竞争环境研究资源,这将为非工业参与者提供进行更高级别人工智能研究所需的计算和数据。

了解训练AI模型的成本很重要,但关于这些成本的详细信息仍然很少。在去年的出版物中,人工智能指数是首批提供基础模型培训成本估算的机构之一。今年,人工智能指数与AI研究机构Epoch AI合作,大幅提高和巩固其AI培训成本估算的稳健性为了估算尖端模型的成本,Epoch团队利用与模型相关的出版物、新闻稿或技术报告中的信息,分析了训练持续时间,以及训练硬件的类型、数量和利用率

图1.3.21显示了基于云计算租赁价格的与选定AI模型相关的估计培训成本。人工智能指数的估计证实了近年来模型培训成本显著增加的怀疑。例如,2017年,最初的Transformer模型引入了支撑几乎所有现代LLM的架构,其培训成本约为900美元112019年发布的RoBERTa Large在SQuAD和GLUE等许多规范理解基准上取得了最先进的结果,其训练成本约为16万美元。时间快进到2023年,OpenAI的GPT-4和谷歌的Gemini Ultra的培训成本估计分别在7800万美元和1.91亿美元左右。

图1.3.22可视化了AI指数估算的所有AI模型的训练成本。如图所示,随着时间的推移,模型训练成本急剧增加。

正如之前的AI指数报告所述,AI模型的训练成本与其计算需求之间存在直接关联。如图1.3.23所示,具有更大计算训练需求的模型的训练成本要高得多。


part4

AI会议是研究人员展示他们的发现并与同行和合作者建立联系的重要平台。在过去的二十年里,这些会议在规模、数量和声望上都有所扩大。本节探讨出席主要AI会议的趋势。

1.4 AI会议

参加会议

图1.4.1自2010年以来AI会议的出席情况。AI指数报告称,在出席率下降(可能是由于转向完全面对面的形式)之后,从2022年到2023.12年,会议出席率有所增加,具体而言,去年总出席率增长了6.7%。自2015年以来,每年的与会者人数增加了约5万人,这不仅反映了人们对AI研究的兴趣日益浓厚,也反映了新的AI会议的出现。


神经信息处理系统(NeurIPS)仍然是参加人数最多的AI会议之一,在2023年吸引了大约16,380名参与者(图1.4.2和图1.4.3)。在主要的人工智能会议中,NeurIPS、ICML、ICCV和AAAI的出席人数逐年增加。然而,在过去的一年里,CVPR、ICRA、ICLR和IROS的出席人数略有下降。

part5

GitHub是一个基于web的平台,使个人和团队能够托管,审查和协作代码库。GitHub被软件开发人员广泛使用,有助于代码管理、项目协作和开源软件支持。本节利用来自GitHub的数据,提供了对学术出版数据中未反映的开源人工智能软件开发的更广泛趋势的见解。

1.5 开源人工智能软件

GitHub项目由一组文件组成,包括源代码、文档、配置文件和图像,这些文件共同构成了一个软件项目。图1.5.1显示了github 人工智能项目随时间变化的总数。自2011年以来,与人工智能相关的GitHub项目数量持续增长,从2011年的845个增长到2023年的180万个。值得注意的是,仅去年一年,GitHub人工智能项目总数就急剧增长了59.3%。

图1.5.2报告了2011年以来按地理区域划分的GitHub人工智能项目。截至2023年,GitHub人工智能项目的很大一部分位于美国,占贡献的22.9%。印度是第二大贡献者,占19.0%,紧随其后的是欧洲联盟和英国,占17.9%。值得注意的是,自2016年以来,美国开发者在GitHub上的人工智能项目比例一直在稳步下降。

明星

GitHub用户可以通过“点赞”来表达他们对某个存储库的兴趣,这一功能类似于在社交媒体上给帖子点赞,表示对开源项目的支持。其中最受欢迎的库是TensorFlow、OpenCV、Keras和PyTorch等库,它们在人工智能编码社区的软件开发人员中广受欢迎。例如,TensorFlow是一个用于构建和部署机器学习模型的流行库。OpenCV是一个为计算机视觉提供各种工具的平台,例如对象检测和特征提取。

GitHub上人工智能相关项目的星级总数在去年大幅增加,从2022年的400万增加到2023年的1220万,增加了两倍多(图1.5.3)。GitHub明星数量的急剧增加,以及此前报道的项目数量的增加,突显了开源人工智能软件开发的加速增长。

2023年,美国是获得GitHub星级最多的国家,共计1050万颗(图1.5.4)。包括欧盟和英国、中国和印度在内的所有主要地理区域,授予其所在国家的项目的GitHub星级总数都在逐年增加。


以上为报告简介及第一章翻译全部内容,部分翻译存在不准确之处,敬请谅解。后9期内容我们将每周为您发布。谢谢!


6.27 亚马逊厦门-文章页底部
AMZ123跨境卖家导航旗下公众号【AMZ123跨境电商】深耕跨境行业,专注热点报道。
扫描右边二维码,关注后回复【加群】,加入优质卖家交流群~
目前30W+卖家关注我们
二维码
免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
亚马逊整合全食超市组织架构,提高运营效率并推动业务增长
AMZ123获悉,近日,据外媒报道,亚马逊正在对旗下的Whole Foods(全食超市)进行重大整合,将其更深入地纳入亚马逊核心业务架构,此次调整被视为自2017年收购全食超市以来,亚马逊在杂货业务上最大规模的变革之一。全食超市首席执行官兼亚马逊全球杂货副总裁Jason Buechel在内部备忘录中表示,这次重组将使两家公司更加紧密协作,旨在提高运营效率并推动业务增长。此次整合计划包括建立新的领导团队,并将全食超市的企业员工纳入亚马逊的员工体系,涵盖绩效考核和薪酬结构。预计该调整将在未来12个月内逐步完成,但不会影响全食超市门店和仓库一线员工。
亚马逊新出的王炸功能,很多卖家没发现!
做广告投放的你,是否还在死盯曝光、点击和转化率?其实亚马逊已经悄悄上线了一个杀伤力极强的隐藏功能——Demographics(消费者画像)。这个功能能看到什么?一句话说完:谁在买你的产品,他们多大年纪、挣多少钱、学历如何,甚至是单身还是已婚,通通一清二楚。亚马逊Demographics到底是啥?这是亚马逊在品牌分析中提供的一个用户画像数据入口,从单个ASIN的维度,展示购买你产品的消费者长啥样,背后是哪个群体在为你买单。
沃尔玛卖家数量突破20万大关!五个月内爆发式增长30%
AMZ123获悉,6月12日,据外媒报道,最新数据显示,沃尔玛平台活跃卖家数量首次突破20万,或将实现其历史上最快的卖家增长速度。根据Marketplace Pulse的数据,沃尔玛在2025年前五个月内新增了44,000名卖家,而2024年全年新增卖家为59,000名,这使沃尔玛有望迎来史上增长最快的一年。这一增长意味着,2025年前五个月的卖家数量增幅达30%。若保持当前速度,沃尔玛今年新增卖家数量可能超过10万,几乎是2024年增幅(60%)的两倍,而2024年平台活跃卖家已增长至近16万。图源:Marketplace Pulse这一迅猛扩张标志着这家美国最大传统零售商的重大转型。
2025年6月13日TT123早报|Tokopedia与TikTok Shop联合在印尼上线卖家中心
1、Tokopedia与TikTok Shop联合在印尼上线卖家中心,通过统一仪表板整合管理流程,提供店铺与商品同步管理、创新营销工具、直播购物接入及联盟生态系统支持等功能,助力本地卖家高效运营并拓展客户覆盖范围。2、TikTok Shop东南亚跨境自助广告功能正式开放,商家可通过商家中心实现一键开户、自助充值和灵活投放,支持外卡支付,单店铺可管理多账户,并提供智能投放和精准广告功能,大幅降低投流门槛。3、2025年5月美国线上杂货销售额环比下降12%,但同比2024年5月增长27%,整体跌幅小于预期且低于前两年同期降幅,主要受配送方式订单增长推动。
最新!Shopee新增平台基础设施费;下月执行,Shopee、Lazada等将代卖家纳税;起草新规!泰国加强对电商等大型平台管控
01 最新Shopee越南站点新增平台基础设施费据 Shopee 消息,为了持续提供优质的服务与资源,更好地支持多元化卖家群体,Shopee 将对部分费用进行调整,以保障生态的健康发展。具体如下:2025 年 7 月 1 日(当地时间)起,Shopee 越南站点新增平台基础设施费,按照 3000VND/单进行收取。
亚马逊大动作!数亿条Listing面临下架,卖家该如何应对?
正文近期亚马逊正在推进一项代号为 “Bend the Curve” 的重大改革计划...亚马逊改革计划:数亿条低效Listing或将被清除亚马逊计划将平台的活跃 ASIN 数量从 740 亿减少到 500 亿以下,这意味着近三分之一的 Listing 将被清理。此次改革的核心在于移除那些无用的数据,包括不准确、不完整或者未能满足要求的 Listing,如缺货多年、存在缺陷或者从未售出的 “僵尸链接”。这一计划的实施源于多个因素:一方面,亚马逊商品目录的不断扩大导致重复链接、僵尸链接数量上升,影响了平台的产品选择口碑。
按照这个方法,亚马逊店铺越做越好
年末复盘时翻看数据,发现一个有趣现象。那些表现最好的产品链接,往往不是我投入精力最多的,反而是按照某套逻辑默默运作的。这让我开始反思,到底什么才是让亚马逊店铺真正出单的核心?经过几个月的实践验证,我总结出了一套相对完整的运营逻辑。不是什么高深理论,就是把基础动作做扎实,然后让数据说话。01产品选择的反常识思维大部分卖家选品时都在追热门,我却反其道而行。2024年下半年开始,我专门挑那些竞争度中等、利润空间合理的产品。热门产品竞争太激烈,冷门产品市场太小,中间地带反而机会最大。具体怎么判断?我主要看几个维度:搜索量要有一定基础但不能过于火爆,首页要有足够多的非大品牌产品,利润空间要能覆盖各种成本还有合理盈余。
亚马逊上山寨Labubu将被团灭?
Labubu在全球范围内的热潮持续发酵,正品市场呈现供需失衡的态势,部分热门款式的转售价格甚至飙升至原价的10倍。在此背景下山寨商品市场迅速扩张。我在亚马逊平台上看到大量Labubu仿品及衍生商品,用卖家精灵看相关关键词如“Labubu玩偶服装”“Labubu配件”等也搜索量激增,带动了多个类目的热度上涨。我认为这类销售行为已构成侵权。目前亚马逊正开展大规模侵权整治行动,不少销售相关仿品及周边商品的卖家面临店铺封禁的风险。尽管部分卖家试图通过"for Labubu"标注、产品图片打码等方式规避平台监管,但仍未能逃过算法筛查,部分商品链接被强制下架,更有店铺被永久封停。
从户外到居家必备:10款亚马逊夏季热销产品推荐
AMZ123获悉,近日,亚马逊各类产品搜索量增长显著,以下10款产品在亚马逊上销量表现突出,深受消费者欢迎。1. 防水收纳袋预计销售额:441,503美元/月销量:14,000+星级评分:4.6好评数量:32,735图源:亚马逊产品描述:HEETA防水收纳袋采用专业无缝压胶技术,具备出色的防水性能,能够有效保护随身物品在划船、漂流、皮划艇等水上活动中不被浸湿。袋体由耐磨PVC材料制成,底部厚度达0.6mm,侧边为0.3mm,适应各类户外环境。产品配有可调节肩带与手提把手,支持肩背与斜挎,便于携带;透明材质设计让内部物品一目了然,查找无需翻找。
28天捞金百万,TikTok这款产品成美国独立日爆款
国产咖啡杯靠“美国元素”成TikTok销量黑马
连夜下架!亚马逊“Labubu”产品遭殃
特朗普还真是想一出是一出。当地时间6月11日,特朗普在社交媒体上称:“美方得到55%关税,中国则是10%。”他的这则发言,瞬间引起各界的讨论,特朗普这是又要搞什么幺蛾子?对此白宫紧急澄清,这并不是新的关税升级,这55%中有25%是特朗普此届任期前就存在的,另外的部分则是20%的芬太尼的关税和10%的基准关税。所以这一次,特朗普就是给我们玩了一次数字游戏,目的可能就是想营造美方在伦敦会谈中是主导者,甚至是“胜利者”的假象,以便向其他贸易伙伴施压。当然除了外部环境的动荡之外,市场的爆火趋势,也是卖家们需要实时关注的。
亚马逊新功能:基于Asin级别深入了解买家画像
亚马逊最近在品牌分析中的的 Demographics(人口统计) 板块推出了新功能,支持按 ASIN 级别搜索和查看买家特征在保证数据真实的情况下为什么这么说,因为这些数据是用户自愿分享的,如果用户随便填的话数据就失真,至于这部分数据的获取亚马逊是如何进行的、具体的情况怎么样的,不得而知当然在其他地方我们也无法获取到这些信息,所以目前这些数据还是有意义在的从品牌维度到Asin维度的细化,个人认为这个功能真正让卖家可以了解具体产品的用户画像,甚至可以说是精细化运营的一个里程碑式的更新但是功能的使用有点小门槛第1点和第2点门槛基本过滤掉了铺货型FBM卖家对功能的使用1. 店铺需要注册Brand Registry,这个
亚马逊Labubu侵权店铺!赚完一波赶紧跑!
说起那只长着九颗牙的小怪兽Labubu,估计做电商的没人不知道。靠着“丑萌+反叛”造型火遍全球,它的正版盲盒定价27.99美元,转售市场上价格能炒到十倍,一盒难求。这样的流量密码,自然引来一大批“灵感丰富”的跨境卖家,围绕Labubu搞起了花样周边产品,什么挂件、地毯、娃娃衣、帽衫应有尽有。但最近一波风控来袭,Labubu相关商品在亚马逊上被集体扫号,很多链接直接没了,连店铺都保不住!自发货到FBA,Labubu一度成为“日出千单”的爆品前阵子,“Labubu”这个关键词在亚马逊美国站搜索热度一度冲进前十,带动了大批玩偶周边销量上涨。
因AI算法不透明,亚马逊西班牙物流中心或被罚款逾10万欧元
AMZ123获悉,近日,据外媒报道,加泰罗尼亚政府对亚马逊位于西班牙埃尔普拉特-德略夫雷加特(El Prat de Llobregat)的物流中心处以罚款,原因是该公司未公开其用于监控员工绩效和分配任务的算法细节。此次罚款总额预计将超过10万欧元,成为西班牙乃至欧洲首批因职场人工智能应用缺乏透明度而受到处罚的案例之一。此次处罚源于2024年底加泰罗尼亚政府IT专家对该物流中心进行的一次大规模检查,该中心拥有超过2000名员工。由于亚马逊拒绝披露数字系统的关键参数,西班牙劳动监察机构最终做出了处罚决定。西班牙工会CCOO估计,该次检查引发的罚款总额将超过10万欧元。
欧洲消费者经济悲观情绪上升7%,通胀下削减非必需支出
AMZ123获悉,6月10日,据外媒报道,欧洲消费者在2025年前景不明的背景下,正在调整支出重点,转向理性和价值导向的消费方式。波士顿咨询集团(BCG)近日发布《欧洲消费者信心报告》,该报告基于今年4月对九个国家/地区超过16,000名消费者的调查。数据显示,超过一半(54%)的受访者对本国经济感到悲观,较2024年7月上升7个百分点。同时,52%的消费者每天都担忧个人财务状况,这一比例也比去年上涨了9个百分点。BCG欧洲、中东、非洲和南美消费者业务负责人Andreas Malby指出,消费者正对每一笔支出进行重新评估,对价格、品牌道德标准以及信任度更为敏感。
亚马逊广告AI视频生成器升级,支持更多自定义功能
AMZ123获悉,6月10日,据外媒报道,亚马逊宣布推出升级版AI视频生成器,带来更丰富、智能的视频内容创作体验。据亚马逊介绍,其在线广告平台Amazon Ads正在扩大去年10月发布的生成式AI视频工具的功能,并正式向所有美国用户开放使用。初始版本的工具可基于单张产品图像创建视频,突出产品的卖点与功能。此次更新后,视频生成器借助先进人工智能技术,可生成更具真实感的产品使用场景。例如,一段视频现在可以展示手表实际佩戴在用户手腕上的效果,而不仅仅是静态产品图像。这种更具沉浸感的场景构建将有助于提升广告的真实感与转化效率。图源:亚马逊新版本工具支持创建带有文字动画和背景音乐的多场景视频内容。
《2025年印尼燃气具及厨电市场调研报告》PDF下载
整体市场:2023年印尼厨电市场规模达 15亿美元,年增长率8.5%(Euromonitor,2024年1月)。 驱动因素:城市化率提升至 57%(世界银行2023年),中产阶级扩大至 5200万人(麦肯锡2023年)。 政府能源转型政策推动LPG灶替代燃木灶(2023年补贴200万套)。
《2025全球消费者洞察报告》PDF下载
对于2024年第三季度,西班牙和英国是唯一实现年同比增长加速的购物群体(图表1和图表2)。这两个国家是支出增长同比跌幅最大的国家,因此这种上升趋势正在将它们与其他我们所覆盖的国家重新拉回一致。两国宏观经济条件的改善正驱动这一转折点,使这一趋势很可能持续到假日季节并延伸至2025年。
《2025年东南亚节庆用品选品指南》PDF下载
01 节庆市场一览 02 2025年节庆日历 03 东南亚和拉美节庆选品参考
《2025全球移动电源市场洞察报告》PDF下载
在移动互联网和智能设备高度普及的今天,充电宝已成为人们日常生活的必需品随着中国智能手机普及率不断提高,国内市场趋于饱和,越来越多充电宝企业将“出海”视为突破增长瓶颈的关键路径。
《2025中国汽车出海洞察——泰国篇》PDF下载
按照2023年GDP规模衡量,泰国是东南亚第二大经济体。人均GDP达到了7,172美元,属于中等偏上收入国家。 2023年,批发零售、旅游、住宿餐饮业等服务业贡献了泰国61%的GDP,是泰国经济最大支柱,其次为工业(30%)和农业(9%)。 2020疫情造成泰国GDP大幅下滑,近年在降息、消费刺激和公共投资等政策下逐步恢复,也造成通胀走高,2022泰国央行开启加息周期。
《2025年印尼伞类市场调研报告》PDF下载
印度尼西亚雨伞市场正在稳步增长,这得益于商业、娱乐和住宅等各个领域的需求增长。这种增长得益于人们越来越意识到雨伞提供的实用和美学优势,包括防风雨和装饰吸引力。设计创新,加上多样化的定制选择,吸引了广泛的消费者和企业。此外,印度尼西亚户外生活和旅游相关活动的增长趋势进一步提振了市场。随着制造商专注于生产高质量、耐用且外观美观的产品,印度尼西亚的雨伞市场有望在未来几年持续扩张。
《中国环保设备出海国别机会洞察报告》PDF下载
中国环保设备出海国别机会洞察2020年至2024年,水处理设备出口金额和数量总体呈现增长趋势。2024年出口金额达到22.66亿美元,较2023年增长11.6%,创下三年来的新高。出口数量也显著增加,2024年达到63766751台,同比增长17.1%,市场需求复苏趋势强劲。2024年,美国以15.09%的占比稳居最大出口目的地。印尼和新加坡分别占8.26%和6.57%,越南和马来西亚占比3.68%和3.38%。前五大目的地总占比36.98%,市场集中度相对较高。 2024年,阿尔及利亚同比增长618.32%居首。巴西和泰国增长率分别为96.38%和65.49%,增长可能受益于新兴市场采购渠道拓展及替代效应释放。报告
《2025年智能家居市场调研报告》PDF下载
印尼 市场规模:2024年预计达到5.565亿美元,预计到2028年增长至8.734亿美元,年均增长率为11.93%。 渗透率:2024年为14.5%,预计到2028年达到23.2%。 增长驱动因素:政府激励措施、可支配收入增加以及对环保生活方式的关注推动了智能家居产品的采用,
跨境数据中心
聚合海量跨境数据,输出跨境研究智慧。
亚马逊资讯
AMZ123旗下亚马逊资讯发布平台,专注亚马逊全球热点事件,为广大卖家提供亚马逊最新动态、最热新闻。
跨境电商赢商荟
跨境电商行业唯一一家一年365天不断更的媒体!
跨境学院
跨境电商大小事,尽在跨境学院。
北美电商资讯
AMZ123旗下北美跨境电商新闻栏目,专注北美跨境电商热点资讯,为广大卖家提供北美跨境电商最新动态、最热新闻。
跨境科普达人
科普各种跨境小知识,科普那些你不知道的事...
亚马逊公告
AMZ123旗下亚马逊公告发布平台,实时更新亚马逊最新公告,致力打造最及时和有态度的亚马逊公告栏目!
AMZ123卖家导航
这个人很懒,还没有自我介绍
首页
跨境头条
文章详情
热门活动
跨境资讯
跨境资讯
跨境早报
跨境社群
品类交流群
宠物品类交流群宠物品类交流群
加入
宠物品类交流群
扫码进群
家居品类交流群家居品类交流群
加入
家居品类交流群
扫码进群
母婴用品交流群母婴用品交流群
加入
母婴用品交流群
扫码进群
品类交流群
加入
跨境资料
亚马逊运营干货包亚马逊运营干货包
加入
亚马逊运营干货包
扫码进群
TikTok运营干货包TikTok运营干货包
加入
TikTok运营干货包
扫码进群
跨境电商行业报告跨境电商行业报告
加入
跨境电商行业报告
扫码进群
跨境资料
加入
官方社区
跨境电商交流群跨境电商交流群
加入
跨境电商交流群
扫码进群
亚马逊卖家交流群亚马逊卖家交流群
加入
亚马逊卖家交流群
扫码进群
独立站卖家交流群独立站卖家交流群
加入
独立站卖家交流群
扫码进群
官方社区
加入
立即扫码咨询
立即扫码咨询
咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部