AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条正文

斯坦福:2024年人工智能指数报告(中文详解-1)

Shulex
Shulex
数智化VOC聆听,引领产品创新,驱动品牌增长。
4048
2024-05-06 16:48
2024-05-06 16:48
4048
Shulex
数智化VOC聆听,引领产品创新,驱动品牌增长。

【城市巡回计划:亿级突围者说】跨境大咖拆解多电商平台打法,实现全球流量矩阵收割,点击立即报名>>>


由华裔女科学家、“人工智能教母”李飞飞联合领导的斯坦福大学以人为本人工智能研究所(Stanford HAI)近日发布了:《2024年人工智能指数报告》(Artificial Intelligence Index Report 2024)。


斯坦福大学HAI介绍称,人工智能指数报告跟踪、整理、提取和可视化与人工智能相关的数据。该研究所的使命是提供不带偏见的、经过严格审查的、来源广泛的数据,以便政策制定者、研究人员、高管、记者和公众对复杂的人工智能领域有更深入细致的了解。人工智能指数是全球公认的最可信和最权威的人工智能数据和见解来源之一。

Shulex 将此报告的 10 个重点议题分为 10 次内容为您进行翻译和更新,以下为此次报告的基础介绍及第一章 :研究与发展部分的具体内容!

如果您希望尽快学习整篇内容,您可以扫码咨询Shulex小助手领取《2024年人工智能指数报告》(Artificial Intelligence Index Report 2024)英文版原版PDF文件,谢谢!

2024年AI指数报告介绍

欢迎来到第七版AI指数报告。2024年指数是我们迄今为止最全面的指数,在AI对社会的影响从未如此明显的重要时刻到来。今年,我们扩大了研究范围,更广泛地涵盖了AI的技术进步、公众对该技术的看法以及围绕其发展的地缘政治动态等基本趋势。该版本提供了比以往更多的原始数据,介绍了对AI培训成本的新估计,对负责任的AI前景的详细分析,以及专门介绍AI对科学和医学影响的全新章节。

AI指数报告跟踪、整理、提炼和可视化与人工智能(AI)相关的数据。我们的使命是提供公正、严格审查、来源广泛的数据,以便政策制定者、研究人员、高管、记者和公众对复杂的AI领域有更全面、更细致的了解。

AI指数是全球公认的最可信、最权威的人工智能数据和见解来源之一。之前的版本曾被《纽约时报》、《彭博社》、《卫报》等主要报纸引用,积累了数百次学术引用,并被美国、英国、欧盟等地的高层决策者引用。今年的版本在规模、规模和范围上都超过了以往的所有版本,反映了AI在我们生活中越来越重要。

联合致辞:

十年前,世界上最好的AI系统还无法像人类一样对图像中的物体进行分类。AI难以理解语言,也无法解决数学问题。如今,AI系统在标准基准上的表现经常超过人类。

2023年,这一进程加速。像GPT-4、Gemini和Claude 3这样最先进的新系统是令人印象深刻的多模态:它们可以生成数十种语言的流畅文本,处理音频,甚至解释模因。随着AI的进步,它越来越多地进入我们的生活。公司正在竞相开发基于人工智能的产品,AI越来越多地被公众使用。但目前的AI技术仍然存在重大问题。它不能可靠地处理事实,执行复杂的推理,或者解释它的结论。

AI面临两个相互关联的未来。首先,技术不断改进并被越来越多地使用,对生产力和就业产生重大影响。它可以有好的用途,也可以有坏的用途。在第二个未来,AI的采用受到技术局限性的限制。无论未来如何展开,各国政府都越来越关注。他们正在介入以鼓励有利的一面,例如资助大学研发和激励私人投资。政府也致力于管理潜在的负面影响,例如对就业、隐私问题、错误信息和知识产权的影响。

随着AI的迅速发展,AI指数旨在帮助AI社区、政策制定者、商业领袖、记者和公众应对这一复杂的局面。它提供了持续、客观的快照,跟踪几个关键领域:AI能力的技术进步,推动AI开发和部署的社区和投资,对当前和潜在未来影响的公众舆论,以及为刺激AI创新而采取的政策措施,同时管理其风险和挑战。通过全面监测AI生态系统,该指数是了解这一变革性技术力量的重要资源。

在技术方面,今年的AI指数报告称,2023年全球发布的新型大型语言模型的数量比前一年翻了一番。其中三分之二是开源的,但表现最好的模型来自拥有封闭系统的行业参与者。Gemini Ultra成为第一个在大规模多任务语言理解(MMLU)基准上达到人类水平的LLM;自去年以来,在基准测试上的性能提升了15个百分点。此外,GPT-4在语言模型综合整体评估(HELM)基准上取得了令人印象深刻的0.96平均胜率得分,其中包括MMLU和其他评估。

虽然全球对AI的私人投资连续第二年减少,但对生成式AI的投资却飙升。财富500强公司的财报电话会议中提到AI的次数比以往任何时候都多,新的研究表明,AI确实提高了员工的生产率。在政策制定方面,全球立法程序中对AI的提及从未如此之高。美国监管机构在2023年通过的人工智能相关法规比以往任何时候都多。尽管如此,许多人对AI制造深度造假和影响选举的能力表示担忧。公众对AI的意识越来越强,研究表明,他们的反应是紧张。Ray Perrault and Jack ClarkCo-directors, AI Index

十大启示:

1. A人工智能在某些任务上胜过人类,但并非在所有任务上。在一些基准测试中,人工智能的表现已经超过了人类,包括在图像分类、视觉推理和英语理解方面。然而,在竞赛级数学、视觉常识推理和规划等更复杂的任务上,人工智能却落后于人类。 

2. 工业界继续主导人工智能前沿研究。2023 年,产业界产生了 51 个著名的机器学习模型,而学术界只贡献了 15 个。2023 年,产学合作还产生了 21 个著名模型,创下新高。2023年,工业界产生了51个值得注意的机器学习模型,而学术界仅贡献了15个。 

3. 前沿模型越来越昂贵。据 AI Index 估计,最先进的人工智能模型的训练成本已经达到了前所未有的水平。例如,OpenAI 的 GPT-4 估计使用了价值 7800 万美元的计算资源进行训练,而谷歌的 Gemini Ultra 则耗费了 1.91 亿美元的计算资源。 根据AI指数的估计,最先进的AI模型的培训成本已经达到了前所未有的水平。 

4. 美国领先于中国、欧盟和英国,成为顶级人工智能模型的主要来源国。2023 年,61 个著名的人工智能模型源自美国的机构,远远超过欧盟的 21 个和中国的 15 个。2023年,61个著名的AI模型来自美国的机构,远远超过欧盟的21个和中国的15个。

5.目前严重缺乏对 LLM 责任的可靠和标准化评估。 包括 OpenAI、谷歌和 Anthropic 在内的领先开发者主要根据不同的责任人工智能基准来测试自己的模型。这种做法使得系统地比较顶级人工智能模型的风险和局限性的工作变得更加复杂。   

6.  生成式人工智能投资激增。尽管去年整体人工智能私人投资有所下降,但用于生成式人工智能的资金却激增,比2022年增长了近八倍,达到252亿美元。生成式人工智能领域的主要参与者,包括 OpenAI、Anthropic、Hugging Face 和 Inflection,都报告了一轮可观的融资。生成式AI领域的主要参与者,包括OpenAI、Anthropic、hugs Face和Inflection,都报告了大量融资。

7. 数据显示人工智能让工人更有生产力,工作质量更高。2023 年,几项研究评估了人工智能对劳动力的影响,表明人工智能使工人能够更快地完成任务,并提高产出质量。这些研究还表明,人工智能有可能缩小低技能和高技能工人之间的技能差距。不过,其他研究也提醒说,在没有适当监督的情况下使用人工智能可能会导致绩效下降。 

8.  得益于人工智能,科学进步进一步加速。2022 年,人工智能开始推动科学发现。然而,2023 年,与科学相关的更重要的人工智能应用相继问世--从提高算法排序效率的 AlphaDev,到促进材料发现过程的 GNoME。 然而,2023年,我们看到了更重要的与科学相关的AI应用程序的推出——从提高算法排序效率的AlphaDev,到促进材料发现过程的GNoME。

9.  美国人工智能法规数量急剧增加。美国人工智能相关法规的数量在过去一年和过去五年中大幅增加。2023 年,人工智能相关法规将从 2016 年的 1 项增加到 25 项。仅去年一年,人工智能相关法规的总数就增长了 56.3%。到2023年,有25项人工智能相关法规,而2016年只有一项。 

10. 益普索的一项调查显示,在过去的一年里,认为AI将在未来三到五年内极大地影响他们生活的人的比例从60%上升到66%。此外,52%的人对AI产品和服务表示紧张,比2022年上升了13个百分点。在美国,皮尤研究中心的数据显示,52%的美国人对AI感到担忧甚于兴奋,而2022年这一比例为37%。

以下为报告相关贡献者及组织:(此处不做翻译)

本篇内容主要为您分享,第一章:研究与发展!

第 一 章 :研究与发展

概述

本章研究了AI研究与发展的趋势。它首先检查趋势出版物和专利,然后检查著名的AI系统和基础模型的趋势。最后分析了AI会议出席情况和开源AI软件项目。

第 一 章 :研究与发展

1. 工业界继续主导前沿人工智能研究

2023年,工业界产生了51 个值得注意的机器学习模型,而学术界只贡献了15个。2023年产学合作产生的值得注意的模型也有21个,再创新高。

2. 更多的基金会模型和更开放的基金会模型。

2023年,共有149个基金会发布了款型,比2022年发布的数量增加了一倍多。在这些新发布的机型中,开源机型占65.7%,而2022年和2021年这一比例分别仅为44.4%和33.3%。

3. 前沿机型的价格要贵得多

根据人工智能指数的估计,最先进的人工智能模型的培训成本已经达到了前所未有的水平。例如,OpenAI的GPT-4使用了价值约7800万美元的计算进行训练,而谷歌的Gemini Ultra则花费了1.91亿美元的计算成本。

4. 美国领先中国、欧盟和英国,成为顶级人工智能模型的主要来源。

2023年,61个著名的人工智能模型来自美国的机构,远远超过欧盟的21个和中国的15个。

5. 人工智能专利数量激增。

从2021年到2022年,全球人工智能专利授权大幅增长62.7%。自2010年以来,获得授权的人工智能专利数量增长了31倍以上。

6. 中国主导着人工智能专利。

2022年,中国以61.1%的比例领先全球人工智能专利起源,显著超过美国的20.9%。自2010年以来,美国在人工智能专利中的份额从54.1%下降。

7. 开源人工智能研究爆发。 

自2011年以来,GitHub上的人工智能相关项目数量持续增长,从2011年的845个增长到2023年的180万个。值得注意的是,仅在2023年,GitHub人工智能项目总数就急剧增长了59.3%。GitHub上人工智能相关项目的星级总数在2023年也大幅增加,从2022年的400万增加到1220万,增加了两倍多。

8. 人工智能出版物的数量持续上升。

2010年至2022年间,人工智能出版物的总数几乎增加了两倍,从2010年的约8.8万篇增加到2022年的24万多篇。与去年相比,这一增幅仅为1.1%。



part1

1.1 出版物

概 述

以下数字显示了2010年至2022年全球英语和中文人工智能出版物的数量,按隶属关系类型和跨部门合作分类。此外,本节还详细介绍了人工智能期刊文章和会议论文的出版数据。

人工智能出版物总数

图1.1.1显示了人工智能出版物的全局计数。2010年至2022年间,人工智能出版物的总数几乎增加了两倍,从2010年的约8.8万篇增加到2022年的24万多篇。与去年相比,这一增幅仅为1.1%

按出版类型划分

图1.1.2显示了全球AI发布类型随时间的分布情况。2022年,大约有23万篇AI期刊文章,而大约有4.2万篇会议论文。自2015年以来,ai期刊和会议出版物以可比的速度增长。2022年,会议出版物和期刊出版物的数量分别是2015年的2.6倍和2.4倍。

按研究领域划分

图1.1.3显示了自2010年以来按研究领域划分的AI出版物总数。机器学习出版物在过去十年中增长最快,自2015年以来增长了近7倍。继机器学习之后,2022年发表最多的AI领域是计算机视觉(21,309篇)、模式识别(19,841篇)和流程管理(12,052篇)。


部门

本节介绍了AI出版物在全球范围内的分布情况,包括教育、政府、行业、非营利组织和其他部门,以及具体在美国、中国、欧洲联盟加联合王国的分布情况。2022年,学术部门贡献了大部分人工智能出版物(81.1%),在过去十年中保持了其在所有地区AI研究全球领先来源的地位(图1.1.4和图1.1.5)。工业参与在美国最为显著,其次是欧洲联盟加联合王国和中国(图1.1.5)。

AI期刊

图1.1.6显示了2010 - 2022年AI期刊发表总数。从2010年到2015年,AI期刊出版物的数量略有增长,但自2015年以来增长了约2.4倍。在2021年至2022年期间,AI期刊出版物增长了4.5%。

AI会议出版物

图1.1.7显示了自2010年以来AI会议出版物的总数。在过去的两年里,AI会议出版物的数量有了显著的增长,从2020年的22727篇上升到2021年的31629篇,到2022年达到41174篇。仅去年一年,AI会议出版物就增加了30.2%。自2010年以来,AI会议出版物的数量增加了一倍多。


part2


本节研究了全球AI专利的长期趋势,这可以揭示AI创新、研究和开发演变的重要见解。此外,分析AI专利可以揭示这些进步是如何在全球分布的。与出版物数据类似,AI专利数据的可用性也有明显的延迟,2022年是可访问数据的最近一年。本节数据来自CSET。

1.2 专利

AI专利

概述:

图1.2.1考察了2010年至2022年全球AI专利授权的增长情况。在过去十年中,AI专利数量显著增加,近年来增长尤为迅猛。例如,2010年至2014年间,AI专利授权总量增长了56.1%。然而,仅从2021年到2022年,AI专利数量就增长了62.7%。

按归档状态和地区划分

以下部分按AI专利的申请状态(是否授予)以及其发表的地区进行了分类。

图1.2.2按申请状态对全球AI专利进行比较。2022年,未授权的AI专利数量(128952件)是授权数量(62264件)的两倍多。随着时间的推移,AI专利审批的格局发生了显著变化。直到2015年,申请的AI专利中获得授权的比例更大。然而,从那以后,大多数AI专利申请都没有获得批准,差距显著扩大。例如,2015年,42.2%的AI专利申请未获批准。到2022年,这一数字已上升至67.4%。

在包括中国、欧盟和英国以及美国在内的所有主要专利起源地理区域,授权和未授权AI专利之间的差距都很明显

(图1.2.3)。近年来,这三个地理区域的AI专利申请总数和专利授权数量都有所增加。

图1.2.4展示了授权AI专利的区域细分。截至2022年,世界上大部分已授予的AI专利(75.2%)来自东亚和太平洋地区,北美是第二大贡献者,占21.2%。截至2011年,北美在全球AI专利数量方面处于领先地位。然而,从那时起,发生了重大转变,来自东亚和太平洋地区的AI专利比例不断增加。

按地理区域划分,世界上大多数授予的AI专利来自中国(61.1%)和美国(20.9%)(图1.2.5)。来自美国的AI专利份额从2010年的54.1%下降。

图1.2.6和图1.2.7显示了哪些国家在人均AI专利方面领先。2022年,每10万居民中获得AI专利最多的国家是韩国(10.3),其次是卢森堡(8.8)和美国(4.2)。

(图)相对于1.2.6。图1.2.7显示了2012年至2022年人均AI专利授权的变化。在此期间,新加坡、韩国和中国的人均AI专利申请量增幅最大。

2012年 与 2022年各国每 10万居民获批人工智能专利的百分比变化

part3

本节探讨AI研究的前沿。虽然每年都会推出许多新的AI模型,但只有一小部分样本代表了最先进的研究。诚然,什么是先进或前沿研究多少有些主观。前沿研究可以反映一个模型在基准上发布一个新的最先进的结果,引入一个有意义的新架构,或者行使一些令人印象深刻的新功能。

人工智能指数研究两类前沿人工智能模型的趋势:“显著模型”和基础模型人工智能指数数据提供商Epoch使用“著名的机器学习模型”一词来指定精心挑选的在人工智能/机器学习生态系统中特别有影响力的值得注意的模型。相比之下,基础模型是在大量数据集上训练的非常大的人工智能模型,能够执行大量的下游任务。基础模型的例子包括GPT-4、Claude 3和Gemini。虽然很多粉底模特可能有资格成为知名模特,但并非所有知名模特都是粉底模特。


在本节中,人工智能指数从不同的角度探讨了著名模型和基础模型的趋势,包括原始组织、原产国、参数计数和计算使用情况。分析最后对机器学习培训成本进行了考察。

1.3 前 沿 人 工 智 能 研 究

通用机器学习模型

概述

Epoch人工智能是一组致力于研究和预测先进人工智能进化的研究人员。他们维护着一个自20世纪50年代以来发布的人工智能和机器学习模型数据库,根据最先进的技术进步、历史意义或高引用率等标准选择条目。通过分析这些模型,可以全面概述近年来和过去几十年机器学习领域的演变数据集中可能缺少一些模型;然而,数据集可以相对地揭示趋势。

行 业 分 析

直到2014年,学术界主导了机器学习模型的发布。从那以后,工业界就走在了前面。2023年,工业界产生了51个值得注意的机器学习模型,而学术界只有15个(图1.3.1)。值得注意的是,2023年有21个值得注意的模型是由行业/学术合作产生的,创历史新高。

创建尖端的人工智能模型现在需要大量的数据、计算能力和财政资源,而这些在学术界是无法获得的。在去年的人工智能指数报告中,首次强调了这种向领先人工智能模型增加行业主导地位的转变。尽管今年差距略有缩小,但这一趋势在很大程度上仍然存在。

国家关系

为了说明不断变化的人工智能地缘政治格局,人工智能指数研究团队分析了著名模型的原产国。

图1.3.2显示了归因于研究人员附属机构位置的显著机器学习模型的总数

2023年,美国以61个著名机器学习模型领跑,中国以15个紧随其后,法国以8个紧随其后。自2019年以来,欧盟和英国生产的著名人工智能模型数量首次超过中国(图1.3.3)。自2003年以来,美国比英国、中国和加拿大等其他主要地理区域生产了更多的模型(图1.3.4)。


2003-23年按地理区域划分的著名机器学习模型数量 (sum)

参数的趋势

机器学习模型中的参数是在训练过程中学习到的数值,它决定了模型如何解释输入数据并进行预测。

在更多数据上训练的模型通常会比在更少数据上训练的模型有更多的参数。同样,具有更多参数的模型通常优于具有更少参数的模型。

图1.3.5展示了Epoch数据集中机器学习模型的参数计数,按模型起源的部门进行分类。自2010年代初以来,参数数量急剧上升,反映了AI模型设计任务的日益复杂、数据的可用性、硬件的改进以及更大模型的有效性。高参数模型在工业领域尤其引人注目,这凸显了OpenAI、Anthropic和Google等公司承担海量数据训练的计算成本的能力。

计算趋势

AI模型中的术语“计算”是指训练和操作机器学习模型所需的计算资源。一般是指模型的复杂程度和训练数据集的大小直接影响所需的计算量。模型越复杂,底层训练数据越大,训练所需的计算量就越大。

图1.3.6可视化了过去20年著名机器学习模型所需的训练计算量。最近,著名的AI模型的计算使用量呈指数级增长这一趋势在过去五年中尤为明显。计算需求的快速增长具有至关重要的意义。例如,需要更多计算的模型通常具有更大的环境足迹,公司通常比学术机构拥有更多的计算资源。

图1.3.7突出显示了2012年以来著名机器学习模型的训练计算。例如,AlexNet是推广使用gpu改进AI模型的标准做法的论文之一,该论文估计需要470千万亿次浮点运算来进行训练。

最初的Transformer于2017年发布,需要大约7400千万亿次浮点运算。谷歌的Gemini Ultra是目前最先进的基础模型之一,需要500亿次千万亿次浮点运算。

亮 点 :

模型会耗尽数据吗 ?

如上所示,最近很大一部分算法进步,包括强大的llm背后的进步,都是通过在越来越大的数据量上训练模型来实现的。正如Anthropic联合创始人兼AI指数指导委员会成员杰克·克拉克(Jack Clark)最近指出的那样,基金会模型已经在互联网上存在的所有数据中进行了有意义的训练。

AI模型对数据的依赖性越来越大,这引发了人们的担忧,即未来几代计算机科学家将耗尽数据,无法进一步扩展和改进他们的系统。

Epoch的研究表明,这些担忧在某种程度上是有道理的。Epoch的研究人员已经对AI研究人员可能会在何时耗尽数据进行了历史和基于计算的预测。历史预测是基于观察到的用于训练基础模型的数据规模的增长率。计算预测根据计算可用性的预测来调整历史增长率。

例如,研究人员估计,到2024年,计算机科学家可能会耗尽高质量语言数据的库存,在20年内耗尽低质量语言数据,并在2030年代末至2040年代中期耗尽图像数据(图1.3.8)。

从理论上讲,数据可用性有限的挑战可以通过使用合成来解决

类型对ML数据耗尽的预测:中位数和90% CI日期来源:Epoch2023 |表:2024 AIIndex报告


数据,这是AI模型本身产生的数据。例如,可以使用一个LLM生成的文本来训练另一个LLM。使用合成数据训练AI系统特别有吸引力,不仅因为它是潜在数据耗尽的解决方案,而且因为生成式AI系统原则上可以在自然发生的数据稀少的情况下生成数据,例如,罕见疾病或代表性不足的人口的数据。直到最近,使用合成数据训练生成式AI系统的可行性和有效性还没有得到很好的理解。然而,今年的研究表明,在合成数据上训练模型存在局限性。

例如,一个由英国和加拿大研究人员组成的团队发现,模型主要是在合成数据经验模型上训练的

崩溃,一种现象,随着时间的推移,他们失去了记住真实底层数据分布的能力,并开始产生一个狭窄的输出。图1.3.9展示了变分自编码器(VAE)模型的模型崩溃过程,变分自编码器是一种广泛使用的生成式AI架构。随着后续每一代的训练额外的合成数据,模型产生的输出越来越有限。如图1.3.10所示,从统计学角度来看,随着合成代数的增加,分布的尾部消失,代密度向均值偏移这种模式意味着,随着时间的推移,主要在合成数据上训练的模型的世代变化越来越小,分布也不那么广泛。

作者证明,这种现象发生在各种模型类型中,包括高斯混合模型和法学硕士。这项研究强调了人工生成数据对训练有能力的法学硕士的持续重要性,这些数据可以产生各种各样的内容。

在2023年发表的类似研究中使用

对于生成成像模型中的合成数据,研究人员发现,仅在合成数据周期上训练的生成图像模型——或者在真实人类数据不足的情况下训练的生成图像模型,输出质量会显著下降。作者将这种现象标记为模型自噬障碍(MAD),参考疯牛病。

该研究检查了两种类型的训练过程:完全合成,即模型完全根据合成数据进行训练,以及合成增强,其中,模型在合成数据和真实数据的混合上进行训练。在这两种场景中,随着训练代数的增加,图1.3.1

生成的图像下降。图1.3.11突出显示了使用合成数据增强的模型的退化图像世代;例如,第7步和第9步生成的人脸越来越多地显示出奇怪的hash标记。来自统计数据合成数据和合成增强循环生成的图像具有较高的FID分数(表明与真实图像的相似性较低),较低的精度分数(表明真实感或质量降低)和较低的召回分数(表明多样性降低)(图1.3.12)。而合成增强循环,其中包含了一些真实的数据显示出比完全合成环路更少的退化,但随着进一步的训练,这两种方法的收益都会递减。


基础模型

基础模型代表了一个快速发展和流行的AI模型类别。它们在庞大的数据集上训练,用途广泛,适用于众多下游应用。诸如GPT-4、Claude 3和羊驼2等基础模型展示了非凡的能力,并且越来越多地部署在现实场景中。

生态系统图于2023年推出,是斯坦福大学的一个新的社区资源,用于跟踪基础模型生态系统,包括数据集、模型和应用程序。本节使用来自生态系统图的数据来研究基础模型随时间的趋势

Model Release

基础模型可以通过不同的方式访问。无访问模型,比如谷歌的PaLM-E,只有开发者可以访问。有限访问模型,如OpenAI的GPT-4,通常通过公共API提供对模型的有限访问。开放模型,如Meta的羊驼2,完全释放模型的重量,这意味着模型可以修改和自由使用。

图1.3.13可视化了2019年以来按接入类型划分的基础模型总数。近年来,基础模型数量急剧上升,自2022年以来增长了一倍多,自2019年以来增长了近38倍。在2023年发布的149款基础款中,98款是开放的,23款是受限的,28款是不可访问的。

2023年,大多数基础模型都是开放获取的(65.8%),18.8%的模型没有访问权限,15.4%的模型有限制访问权限(图1.3.14)。从2021年开始,以开放获取方式发布的模型比例有了明显的提升。

人事关系

图1.3.15绘制了自2019年以来基金会模型的起源部门。2023年,大部分基础模型(72.5%)

来源于工业。2023年只有18.8%的基础模型来源于学术界。自2019年以来,越来越多的基础模型来自工业界。

图1.3.16突出显示了2023年发布的各种基础模型的来源 。Google推出的模型最多 (18个 ),其次是 Meta(11图1.3.16突出显示了2023年发布的各种基础模型的来源。Google推出的模型最多(18个),其次是Meta(11个)和微软(9个)。2023年发布最多基础模型的学术机构是加州大学伯克利分校(3个)。

2019年以来,Google发布的基础模型最多,共40个,其次是OpenAI, 20个(图1.3.17)。清华大学在非西方机构中脱颖而出,发布了7个基础模型,而斯坦福大学则是美国领先的学术机构,发布了5个。

国家关系

鉴于基础模型在前沿AI研究中具有相当的代表性,从地缘政治的角度来看,了解它们的国家归属是很重要的。图1.3.18、1.3.19和1.3.20可视化了各种基础模型的国家隶属关系。与本章前面提出的值得注意的模型分析一样,

如果为该模型作出贡献的研究人员隶属于总部设在该国的机构,则该模型被视为隶属于该国。

2023年,世界上大部分的基础模型都来自美国(109个),其次是中国(20个)和英国(图1.3.18)。自2019年以来,美国一直领先于大多数基础模型的起源

(图1.3.19)。

图1.3.20描绘了自2019年以来发布并归属于各自国家的基础模型的累计计数。2019年以来发布的基础模型数量最多的国家是美国(182个),其次是中国(30个)和英国(21个)。

训练费用

在关于基础模型的讨论中,一个突出的话题是它们的推测成本。虽然AI公司很少披露训练模型所涉及的费用,但人们普遍认为,这些成本高达数百万美元,而且还在上升。例如,OpenAI的首席执行官萨姆·奥特曼(Sam Altman)提到,GPT-4的培训成本超过1亿美元。培训费用的上涨实际上排除了传统的AI研究中心大学开发自己的前沿基础模型的可能性。作为回应,政策倡议,如拜登总统关于AI的行政命令,试图通过创建国家AI,在产业界和学术界之间创造公平的竞争环境研究资源,这将为非工业参与者提供进行更高级别人工智能研究所需的计算和数据。

了解训练AI模型的成本很重要,但关于这些成本的详细信息仍然很少。在去年的出版物中,人工智能指数是首批提供基础模型培训成本估算的机构之一。今年,人工智能指数与AI研究机构Epoch AI合作,大幅提高和巩固其AI培训成本估算的稳健性为了估算尖端模型的成本,Epoch团队利用与模型相关的出版物、新闻稿或技术报告中的信息,分析了训练持续时间,以及训练硬件的类型、数量和利用率

图1.3.21显示了基于云计算租赁价格的与选定AI模型相关的估计培训成本。人工智能指数的估计证实了近年来模型培训成本显著增加的怀疑。例如,2017年,最初的Transformer模型引入了支撑几乎所有现代LLM的架构,其培训成本约为900美元112019年发布的RoBERTa Large在SQuAD和GLUE等许多规范理解基准上取得了最先进的结果,其训练成本约为16万美元。时间快进到2023年,OpenAI的GPT-4和谷歌的Gemini Ultra的培训成本估计分别在7800万美元和1.91亿美元左右。

图1.3.22可视化了AI指数估算的所有AI模型的训练成本。如图所示,随着时间的推移,模型训练成本急剧增加。

正如之前的AI指数报告所述,AI模型的训练成本与其计算需求之间存在直接关联。如图1.3.23所示,具有更大计算训练需求的模型的训练成本要高得多。


part4

AI会议是研究人员展示他们的发现并与同行和合作者建立联系的重要平台。在过去的二十年里,这些会议在规模、数量和声望上都有所扩大。本节探讨出席主要AI会议的趋势。

1.4 AI会议

参加会议

图1.4.1自2010年以来AI会议的出席情况。AI指数报告称,在出席率下降(可能是由于转向完全面对面的形式)之后,从2022年到2023.12年,会议出席率有所增加,具体而言,去年总出席率增长了6.7%。自2015年以来,每年的与会者人数增加了约5万人,这不仅反映了人们对AI研究的兴趣日益浓厚,也反映了新的AI会议的出现。


神经信息处理系统(NeurIPS)仍然是参加人数最多的AI会议之一,在2023年吸引了大约16,380名参与者(图1.4.2和图1.4.3)。在主要的人工智能会议中,NeurIPS、ICML、ICCV和AAAI的出席人数逐年增加。然而,在过去的一年里,CVPR、ICRA、ICLR和IROS的出席人数略有下降。

part5

GitHub是一个基于web的平台,使个人和团队能够托管,审查和协作代码库。GitHub被软件开发人员广泛使用,有助于代码管理、项目协作和开源软件支持。本节利用来自GitHub的数据,提供了对学术出版数据中未反映的开源人工智能软件开发的更广泛趋势的见解。

1.5 开源人工智能软件

GitHub项目由一组文件组成,包括源代码、文档、配置文件和图像,这些文件共同构成了一个软件项目。图1.5.1显示了github 人工智能项目随时间变化的总数。自2011年以来,与人工智能相关的GitHub项目数量持续增长,从2011年的845个增长到2023年的180万个。值得注意的是,仅去年一年,GitHub人工智能项目总数就急剧增长了59.3%。

图1.5.2报告了2011年以来按地理区域划分的GitHub人工智能项目。截至2023年,GitHub人工智能项目的很大一部分位于美国,占贡献的22.9%。印度是第二大贡献者,占19.0%,紧随其后的是欧洲联盟和英国,占17.9%。值得注意的是,自2016年以来,美国开发者在GitHub上的人工智能项目比例一直在稳步下降。

明星

GitHub用户可以通过“点赞”来表达他们对某个存储库的兴趣,这一功能类似于在社交媒体上给帖子点赞,表示对开源项目的支持。其中最受欢迎的库是TensorFlow、OpenCV、Keras和PyTorch等库,它们在人工智能编码社区的软件开发人员中广受欢迎。例如,TensorFlow是一个用于构建和部署机器学习模型的流行库。OpenCV是一个为计算机视觉提供各种工具的平台,例如对象检测和特征提取。

GitHub上人工智能相关项目的星级总数在去年大幅增加,从2022年的400万增加到2023年的1220万,增加了两倍多(图1.5.3)。GitHub明星数量的急剧增加,以及此前报道的项目数量的增加,突显了开源人工智能软件开发的加速增长。

2023年,美国是获得GitHub星级最多的国家,共计1050万颗(图1.5.4)。包括欧盟和英国、中国和印度在内的所有主要地理区域,授予其所在国家的项目的GitHub星级总数都在逐年增加。


以上为报告简介及第一章翻译全部内容,部分翻译存在不准确之处,敬请谅解。后9期内容我们将每周为您发布。谢谢!


AMZ123跨境卖家导航旗下公众号【AMZ123跨境电商】深耕跨境行业,专注热点报道。
扫描右边二维码,关注后回复【加群】,加入优质卖家交流群~
目前30W+卖家关注我们
二维码
免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
4月TikTok Shop美国站销售表现:GMV环比下降15.52%
AMZ123获悉,近日,据外媒报道,2025年4月,TikTok Shop美国站的商品交易总额(GMV)环比下降15.52%,降至8.82亿美元,约合日均销售2940万美元。这一表现与3月47.04%的强劲涨幅相反,成为2024年11月以来的首次下滑。此轮下跌正值美国前总统特朗普对中国商品加征新一轮关税,跨境电商业务开始受到影响。据电商数据机构Kalodata统计,TikTok平台前十大商品类目G
第一季度美国大众美妆销售额增长3%,首次赶超高端渠道
AMZ123获悉,5月27日,据外媒报道,市场研究公司Circana的最新数据显示,2025年第一季度美国大众美妆销售额同比增长3%,而高端美妆销售额与去年同期持平,这是多年来大众渠道销售首次超越高端渠道。报告指出,大众美妆增长主要由价格上涨所驱动,尽管单位销量下滑1%,但整体销售额仍实现增长。高端美妆的整体表现则受到年初消费回落的影响,尤其是1月份表现低迷。不过,2月和3月消费者支出逐步回升,3
百元国产耳机杀疯了,半年跻身TikTok类目头部
TikTok这件国货之光,已被美国人“焊”在头上
1个月省下5位数!这套亚马逊FBA降费操作太省钱了
经过三周的深度实战,小编已系统拆解了亚马逊FBA费用优化3步走攻略——费用报告、费用分析与费用优化的逻辑。可以清晰地看到,物流仓储成本不是散装决策,而是从费用数据诊断,到各环节执行的完整闭环。下面就让小编详细解读优化物流成本的全流程tips,帮助各位卖家从发现问题到解决问题,在大促来临前丝滑降本,赢战旺季!掌握整体思路后,我们进一步拆解三大费用项的精细化操作。无论是新手卖家还是资深大卖,以下实操均
因第三方卖家违规销售仿真玩具枪,沃尔玛被罚1.6万美元
AMZ123获悉,近日,沃尔玛因违反纽约州法律向当地消费者邮寄不合规仿真玩具枪,被处以1.6万美元罚款。根据纽约州现行法律,零售商不得销售或邮寄外观与真实枪支相似的玩具枪,尤其是颜色为黑色、深蓝色、银色或铝色的产品。这类仿真玩具枪可能被误认为是致命武器,构成公共安全风险,因此在纽约被明令禁止。仿真度较高的玩具枪曾在纽约多起涉及伤亡的事件中被滥用,也有可能被用于非法活动,对社区安全构成实质威胁。此次
Jumia向第三方卖家开放物流网络,借社媒卖家拓展增收渠道
AMZ123获悉,日前,据外媒报道,非洲电商平台Jumia正在扩大其物流服务覆盖范围,宣布将旗下配送网络向第三方企业和非正式社交电商卖家开放,以提升运营收入并拓展平台功能边界。据悉,Jumia Delivery目前已向尼日利亚本地的商家提供使用其物流基础设施的权限,其中包括覆盖全国的494个取货站。该服务最早在科特迪瓦启动试点,并计划在短期内扩展至肯尼亚、加纳和塞内加尔等市场。Jumia首席执行官
7天狂卖5万件!登顶德国TikTok销冠,“口红效应”带动零食消费狂飙?
经济越不景气,零食越好卖?在“口红效应”的传导下,全球休闲零食行业销量飙升。近期,德国一家TikTok本土店,多款网红零食爆卖!这几款爆卖单品,均出自同一家德国TikTok本土零食店Candy Peak(@candypeakgmbh),该店自一个多月前上架以来,已经售出12.6万件!这些爆款带货短视频,大多出自Candy Peak自营官方账号。官方账号当前拥有粉丝量9.6万,获得了180多万个赞!
Temu每月吸引120万澳洲用户,低价策略赢得Z世代青睐
AMZ123获悉,近日,据外媒报道,在快时尚引发环保与道德争议的当下,澳大利亚Z世代年轻人正深陷“爱恨交织”的消费矛盾。一方面,他们自认对气候和社会高度关注;另一方面,却成为Shein和Temu等快时尚平台的重要用户。这一矛盾也促使本地零售商如K-Mart调整经营策略,以吸引年轻消费者重回实体店。K-Mart近日宣布将重新规划店内布局,强化美妆与服饰陈列,以应对海外平台日益增长的影响力。据Roy
重磅!网传亚马逊中国或再度大裁员
AMZ123获悉,近期,社交平台上广泛流传着亚马逊中国内部正在裁员的消息,而裁员的重点对象则是ESM(卖家管理团队)和LSC(物流服务团队)等部门。据相关人士透露,亚马逊中国已经缩减了各部门的人员预算,并暂停了大部分招聘需求,目前,亚马逊中国的核心零售业务板块只有广告团队和招商团队。裁员的背后,或与亚马逊零售业务发展遇阻有关。从亚马逊2025年第一季度财报数据来看,北美零售业务增速放缓,从9.5%
业内爆料称亚马逊大规模下架含电池产品
AMZ123获悉,近日,业内爆料称亚马逊因产品合规性问题,大规模下架了带有纽扣电池、锂电池等内置电池的产品链接。此次审核范围覆盖全平台,无论经营时间长短,相关商品链接均有被下架的可能。此外,亚马逊还关闭了相关申诉通道,并回复卖家称此类商品因安全问题被禁止在亚马逊上销售和发布。对此,有业内人士猜测,此次亚马逊大规模下架带电类产品,或与美国4月新通过的《制定锂离子电池消费者标准法案》有关,但亚马逊并未
突发!大量卖家被扫,不是还没到会员日吗?
大家都在等着大促节奏,结果大促还没开始,先被“扫”了一波!事情发生在5月22日,亚马逊后台悄悄更新了一个看似无关痛痒的公告,说是“商品和食品安全政策合规性将迁移至账户状况控制面板”。听起来像是功能位置的搬家,不少卖家一眼带过,压根没当回事。但没想到,真正的大动作藏在这不起眼的更新背后。后台功能刚刚搬家,美国站就有一批锂电池产品遭到“团灭”,收到“商品和食品安全违规”(Product and Foo
意大利VAT:有多少卖家愿意缴纳 5 万欧元保证金?如果德国、法国等国家效仿这一政策怎么办?
Birdkiller007我的C位关于意大利需要缴纳5W欧元保证金以维持VAT有效这件事上,到底有多少卖家愿意缴纳?实际上,引起这件事的原因可能有两个第一:这些年国内卖家对于VAT的偷税漏税所涉及的金额以及数量肯定是庞大的 第二:意大利作为老牌发达国家,政府赤字也是最严重的,确确实实是没钱啦。 那么我想知道,基于现有的情况下,大家还愿意去缴纳吗?万一德法这些国家一看也都跟上呢?反而 我觉得更有效的
2025.05.27亚马逊选品推荐(仅供参考):淋浴洗澡防护套
2025.05.27亚马逊选品推荐(仅供参考):淋浴洗澡防护套站 点:北美站,英国产品名:淋浴洗澡防护套专利:未经过查询采购:国内1688工厂价29.45元售价:亚马逊欧洲售价26英镑重量:重量约100G运费:FBM运费24人民币左右FBM净利润:109元左右FBA净利润:109-200元左右;模式:适合FBM和FBA,(所有价格都是建议参考价格)单量:在卖家精灵中显示上架时间是2019年11年
太阳镜“3件套”霸榜亚马逊!月销2.7万+
要说夏季的季节性热销产品,太阳镜绝对是热中之热。Amazon销量第一的偏光太阳镜月订单量超2.7万,来自品牌KALIYADI;近7天在运动&户外类目的BSR增长率有22%,热度持续中。KALIYADI走高性价比路线,主要销售基础经典款偏光太阳镜;特别的是,Amazon热销款中的所有选项都是3件装,没有单件售卖的,而品牌独立站还提供2件装组合售卖的形式。图源:Amazon根据品牌的说法,多件
单价700+的国产除螨仪,在TikTok营收千万
研究机构统计称,人一天约1/3的时间在睡梦中度过,“收纳”人体大小皮屑以及所分泌油脂的一方床榻,成为滋养螨虫生长绝佳温床。根据美国肺部协会2025年4月末发布的数据,美国大约4/5的家庭至少有一张床满足尘螨致敏“门槛”。TT123了解到,随着消费者健康意识的普遍提升,特别是对室内尘螨致敏原的关注日益增加,除螨仪作为清洁小家电中的极细类目,开启狂飙模式。01改头换面的除螨仪dataintelo预测,
25-cv-00656,下证即维权!神秘蝴蝶版权雷区曝光,大批卖家已中招!
近期跨境卖家圈炸锅!多个店铺因使用春季花卉+蝴蝶元素遭TRO冻结,部分卖家甚至未收到案件通知。经麦家支持核查,案件号为:25-cv-00656,原告为俄罗斯艺术家Olga Drozdova,其版权号为:VA000243825的作品成为致命陷阱。该作品创作于2013年,于2025年3月19日获证,并火速展开维权行动!目前仍有大量链接在售,蝴蝶与花卉的排列方式、翅膀纹理细节均为维权重点!麦家支持建议全
《跨境支付:拓展美国市场的关键策略》PDF下载
拓展美国市场是企业发展的重要机遇之一。美国电商行业2024 年规模达1.2万亿美元,预计到 2029 年将增长50%,达到 1.8万亿美元。但是,面对激烈的市场竞争和客户的高期望,企业必须选用适当工具才能取得成功。企业在规划拓展美国市场时,通常会忽略支付问题。但实际上,支付却是获取客户、确保经营顺畅、提升盈利的关键。
《跨境支付:拓展澳新市场的关键策略》PDF下载
澳大利亚和新西兰正步入电商发展新纪元。澳大利亚线上零售市场2024 年交易量达 370亿美元,预计到2029年将增长56%,达到 580 亿美元;同期,新西兰电商市场交易量预计将增长 63%,从 51.8亿美元增至 84.2 亿美元。虽然与亚太市场相比,新西兰电商市场起步较慢,但随着互联网逐渐普及,以及消费者习惯不断变化,该地区电商业务正在加速发展。合适的的支付工具可以协助企业把握这次发展机遇。
《跨境支付:拓展欧洲市场的关键策略》PDF下载
欧洲的电商市场正蓬勃发展,收入年均增长率(2025年至2029年的复合年均增长率)预计将达 7.95%,到 2029 年,市场交易量预计将达9,613亿美元。跨境购物销售额超线上总销售额的四分之一,为寻求发展的企业带来重大机遇。企业在规划拓展欧洲市场时,通常会忽略支付问题。但实际上,支付却是获取客户、确保经营顺畅、提升盈利的关键。
《跨境支付:拓展东南亚市场的关键策略》PDF下载
东南亚电商市场增速位居世界前列,收入复合年增长率预计将达 8.8%,到 2029 年,市场交易量预计将达 1,872 亿美元。届时,该地区的网购消费者将超 2.597 亿人。预计到 2029 年,仅新加坡的网络零售额就将增长 67%,马来西亚的电商市场将扩大 70%,印度尼西亚的电商市场将扩大 58%。拓展东南亚市场将为企业带来重大机遇。
《跨境支付:拓展香港市场的关键策略》PDF下载
香港电商市场正高速增长,2024年行业估值达 47.7亿美元,预计到2029年将增长52%,达到 72.5 亿美元。香港消费者精通数字技术,且越来越爱网购,推动香港电商市场蓬勃发展。要在该地区取得成功,企业必须提供符合当地消费者需求的支付体验。
《跨境支付:拓展英国市场的关键策略》PDF下载
拓展英国市场将为电商企业带来提升销量的重大机遇。英国电商市场在欧洲独占鳌头,行业发展欣欣向荣。英国电商行业2024 年估值达1300亿美元,预计到 2029 年将增长46%,达到 1890 亿美元。企业必须立足合适的支付方式,才能充分挖掘市场潜能。
《亚马逊2024年度数据报告》PDF下载
主流跨境电商 市场概况 亚马逊平台的 发展与变化 亚马逊销量 及销售额分布 亚马逊卖家 及类目数据
《清华大学第四弹:DeepSeek+DeepResearch:让科研像聊天一样简单》
DeepSeek能做什么? DeepSeek搜索要怎么做? DeepSeek输出效果如何?
跨境学院
跨境电商大小事,尽在跨境学院。
欧洲电商资讯
AMZ123旗下欧洲跨境电商新闻栏目,专注欧洲跨境电商热点资讯,为广大卖家提供欧洲跨境电商最新动态、最热新闻。
AMZ123跨境电商
专注跨境行业热点事件报道,每日坚持推送原创深度热文
侃侃跨境那些事儿
不侃废话,挣钱要紧!
跨境电商赢商荟
跨境电商行业唯一一家一年365天不断更的媒体!
亚马逊全球开店
亚马逊全球开店官方公众号,致力于为中国跨境卖家提供最新,最全亚马逊全球开店资讯,运营干货分享及开店支持。
亿邦动力网
消除一切电商知识鸿沟,每日发布独家重磅新闻。
北美电商资讯
AMZ123旗下北美跨境电商新闻栏目,专注北美跨境电商热点资讯,为广大卖家提供北美跨境电商最新动态、最热新闻。
热门活动
跨境资讯
跨境资讯
跨境早报
跨境社群
品类交流群
宠物品类交流群
加入
扫码进群
家居品类交流群
加入
扫码进群
母婴用品交流群
加入
扫码进群
品类交流群
加入
跨境资料
亚马逊运营干货包
加入
扫码进群
TikTok运营干货包
加入
扫码进群
跨境电商行业报告
加入
扫码进群
跨境资料
加入
官方社区
跨境电商交流群
加入
扫码进群
亚马逊卖家交流群
加入
扫码进群
独立站卖家交流群
加入
扫码进群
官方社区
加入
立即扫码咨询
立即扫码咨询
咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部