AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

斯坦福:2024年人工智能指数报告(中文详解-1)

Shulex
Shulex
7797
2024-05-06 16:48
2024-05-06 16:48
7797

想系统掌握亚马逊广告的投放逻辑与底层闭环?点击免费学习《亚马逊广告基础逻辑》


由华裔女科学家、“人工智能教母”李飞飞联合领导的斯坦福大学以人为本人工智能研究所(Stanford HAI)近日发布了:《2024年人工智能指数报告》(Artificial Intelligence Index Report 2024)。


斯坦福大学HAI介绍称,人工智能指数报告跟踪、整理、提取和可视化与人工智能相关的数据。该研究所的使命是提供不带偏见的、经过严格审查的、来源广泛的数据,以便政策制定者、研究人员、高管、记者和公众对复杂的人工智能领域有更深入细致的了解。人工智能指数是全球公认的最可信和最权威的人工智能数据和见解来源之一。

Shulex 将此报告的 10 个重点议题分为 10 次内容为您进行翻译和更新,以下为此次报告的基础介绍及第一章 :研究与发展部分的具体内容!

如果您希望尽快学习整篇内容,您可以扫码咨询Shulex小助手领取《2024年人工智能指数报告》(Artificial Intelligence Index Report 2024)英文版原版PDF文件,谢谢!

2024年AI指数报告介绍

欢迎来到第七版AI指数报告。2024年指数是我们迄今为止最全面的指数,在AI对社会的影响从未如此明显的重要时刻到来。今年,我们扩大了研究范围,更广泛地涵盖了AI的技术进步、公众对该技术的看法以及围绕其发展的地缘政治动态等基本趋势。该版本提供了比以往更多的原始数据,介绍了对AI培训成本的新估计,对负责任的AI前景的详细分析,以及专门介绍AI对科学和医学影响的全新章节。

AI指数报告跟踪、整理、提炼和可视化与人工智能(AI)相关的数据。我们的使命是提供公正、严格审查、来源广泛的数据,以便政策制定者、研究人员、高管、记者和公众对复杂的AI领域有更全面、更细致的了解。

AI指数是全球公认的最可信、最权威的人工智能数据和见解来源之一。之前的版本曾被《纽约时报》、《彭博社》、《卫报》等主要报纸引用,积累了数百次学术引用,并被美国、英国、欧盟等地的高层决策者引用。今年的版本在规模、规模和范围上都超过了以往的所有版本,反映了AI在我们生活中越来越重要。

联合致辞:

十年前,世界上最好的AI系统还无法像人类一样对图像中的物体进行分类。AI难以理解语言,也无法解决数学问题。如今,AI系统在标准基准上的表现经常超过人类。

2023年,这一进程加速。像GPT-4、Gemini和Claude 3这样最先进的新系统是令人印象深刻的多模态:它们可以生成数十种语言的流畅文本,处理音频,甚至解释模因。随着AI的进步,它越来越多地进入我们的生活。公司正在竞相开发基于人工智能的产品,AI越来越多地被公众使用。但目前的AI技术仍然存在重大问题。它不能可靠地处理事实,执行复杂的推理,或者解释它的结论。

AI面临两个相互关联的未来。首先,技术不断改进并被越来越多地使用,对生产力和就业产生重大影响。它可以有好的用途,也可以有坏的用途。在第二个未来,AI的采用受到技术局限性的限制。无论未来如何展开,各国政府都越来越关注。他们正在介入以鼓励有利的一面,例如资助大学研发和激励私人投资。政府也致力于管理潜在的负面影响,例如对就业、隐私问题、错误信息和知识产权的影响。

随着AI的迅速发展,AI指数旨在帮助AI社区、政策制定者、商业领袖、记者和公众应对这一复杂的局面。它提供了持续、客观的快照,跟踪几个关键领域:AI能力的技术进步,推动AI开发和部署的社区和投资,对当前和潜在未来影响的公众舆论,以及为刺激AI创新而采取的政策措施,同时管理其风险和挑战。通过全面监测AI生态系统,该指数是了解这一变革性技术力量的重要资源。

在技术方面,今年的AI指数报告称,2023年全球发布的新型大型语言模型的数量比前一年翻了一番。其中三分之二是开源的,但表现最好的模型来自拥有封闭系统的行业参与者。Gemini Ultra成为第一个在大规模多任务语言理解(MMLU)基准上达到人类水平的LLM;自去年以来,在基准测试上的性能提升了15个百分点。此外,GPT-4在语言模型综合整体评估(HELM)基准上取得了令人印象深刻的0.96平均胜率得分,其中包括MMLU和其他评估。

虽然全球对AI的私人投资连续第二年减少,但对生成式AI的投资却飙升。财富500强公司的财报电话会议中提到AI的次数比以往任何时候都多,新的研究表明,AI确实提高了员工的生产率。在政策制定方面,全球立法程序中对AI的提及从未如此之高。美国监管机构在2023年通过的人工智能相关法规比以往任何时候都多。尽管如此,许多人对AI制造深度造假和影响选举的能力表示担忧。公众对AI的意识越来越强,研究表明,他们的反应是紧张。Ray Perrault and Jack ClarkCo-directors, AI Index

十大启示:

1. A人工智能在某些任务上胜过人类,但并非在所有任务上。在一些基准测试中,人工智能的表现已经超过了人类,包括在图像分类、视觉推理和英语理解方面。然而,在竞赛级数学、视觉常识推理和规划等更复杂的任务上,人工智能却落后于人类。 

2. 工业界继续主导人工智能前沿研究。2023 年,产业界产生了 51 个著名的机器学习模型,而学术界只贡献了 15 个。2023 年,产学合作还产生了 21 个著名模型,创下新高。2023年,工业界产生了51个值得注意的机器学习模型,而学术界仅贡献了15个。 

3. 前沿模型越来越昂贵。据 AI Index 估计,最先进的人工智能模型的训练成本已经达到了前所未有的水平。例如,OpenAI 的 GPT-4 估计使用了价值 7800 万美元的计算资源进行训练,而谷歌的 Gemini Ultra 则耗费了 1.91 亿美元的计算资源。 根据AI指数的估计,最先进的AI模型的培训成本已经达到了前所未有的水平。 

4. 美国领先于中国、欧盟和英国,成为顶级人工智能模型的主要来源国。2023 年,61 个著名的人工智能模型源自美国的机构,远远超过欧盟的 21 个和中国的 15 个。2023年,61个著名的AI模型来自美国的机构,远远超过欧盟的21个和中国的15个。

5.目前严重缺乏对 LLM 责任的可靠和标准化评估。 包括 OpenAI、谷歌和 Anthropic 在内的领先开发者主要根据不同的责任人工智能基准来测试自己的模型。这种做法使得系统地比较顶级人工智能模型的风险和局限性的工作变得更加复杂。   

6.  生成式人工智能投资激增。尽管去年整体人工智能私人投资有所下降,但用于生成式人工智能的资金却激增,比2022年增长了近八倍,达到252亿美元。生成式人工智能领域的主要参与者,包括 OpenAI、Anthropic、Hugging Face 和 Inflection,都报告了一轮可观的融资。生成式AI领域的主要参与者,包括OpenAI、Anthropic、hugs Face和Inflection,都报告了大量融资。

7. 数据显示人工智能让工人更有生产力,工作质量更高。2023 年,几项研究评估了人工智能对劳动力的影响,表明人工智能使工人能够更快地完成任务,并提高产出质量。这些研究还表明,人工智能有可能缩小低技能和高技能工人之间的技能差距。不过,其他研究也提醒说,在没有适当监督的情况下使用人工智能可能会导致绩效下降。 

8.  得益于人工智能,科学进步进一步加速。2022 年,人工智能开始推动科学发现。然而,2023 年,与科学相关的更重要的人工智能应用相继问世--从提高算法排序效率的 AlphaDev,到促进材料发现过程的 GNoME。 然而,2023年,我们看到了更重要的与科学相关的AI应用程序的推出——从提高算法排序效率的AlphaDev,到促进材料发现过程的GNoME。

9.  美国人工智能法规数量急剧增加。美国人工智能相关法规的数量在过去一年和过去五年中大幅增加。2023 年,人工智能相关法规将从 2016 年的 1 项增加到 25 项。仅去年一年,人工智能相关法规的总数就增长了 56.3%。到2023年,有25项人工智能相关法规,而2016年只有一项。 

10. 益普索的一项调查显示,在过去的一年里,认为AI将在未来三到五年内极大地影响他们生活的人的比例从60%上升到66%。此外,52%的人对AI产品和服务表示紧张,比2022年上升了13个百分点。在美国,皮尤研究中心的数据显示,52%的美国人对AI感到担忧甚于兴奋,而2022年这一比例为37%。

以下为报告相关贡献者及组织:(此处不做翻译)

本篇内容主要为您分享,第一章:研究与发展!

第 一 章 :研究与发展

概述

本章研究了AI研究与发展的趋势。它首先检查趋势出版物和专利,然后检查著名的AI系统和基础模型的趋势。最后分析了AI会议出席情况和开源AI软件项目。

第 一 章 :研究与发展

1. 工业界继续主导前沿人工智能研究

2023年,工业界产生了51 个值得注意的机器学习模型,而学术界只贡献了15个。2023年产学合作产生的值得注意的模型也有21个,再创新高。

2. 更多的基金会模型和更开放的基金会模型。

2023年,共有149个基金会发布了款型,比2022年发布的数量增加了一倍多。在这些新发布的机型中,开源机型占65.7%,而2022年和2021年这一比例分别仅为44.4%和33.3%。

3. 前沿机型的价格要贵得多

根据人工智能指数的估计,最先进的人工智能模型的培训成本已经达到了前所未有的水平。例如,OpenAI的GPT-4使用了价值约7800万美元的计算进行训练,而谷歌的Gemini Ultra则花费了1.91亿美元的计算成本。

4. 美国领先中国、欧盟和英国,成为顶级人工智能模型的主要来源。

2023年,61个著名的人工智能模型来自美国的机构,远远超过欧盟的21个和中国的15个。

5. 人工智能专利数量激增。

从2021年到2022年,全球人工智能专利授权大幅增长62.7%。自2010年以来,获得授权的人工智能专利数量增长了31倍以上。

6. 中国主导着人工智能专利。

2022年,中国以61.1%的比例领先全球人工智能专利起源,显著超过美国的20.9%。自2010年以来,美国在人工智能专利中的份额从54.1%下降。

7. 开源人工智能研究爆发。 

自2011年以来,GitHub上的人工智能相关项目数量持续增长,从2011年的845个增长到2023年的180万个。值得注意的是,仅在2023年,GitHub人工智能项目总数就急剧增长了59.3%。GitHub上人工智能相关项目的星级总数在2023年也大幅增加,从2022年的400万增加到1220万,增加了两倍多。

8. 人工智能出版物的数量持续上升。

2010年至2022年间,人工智能出版物的总数几乎增加了两倍,从2010年的约8.8万篇增加到2022年的24万多篇。与去年相比,这一增幅仅为1.1%。



part1

1.1 出版物

概 述

以下数字显示了2010年至2022年全球英语和中文人工智能出版物的数量,按隶属关系类型和跨部门合作分类。此外,本节还详细介绍了人工智能期刊文章和会议论文的出版数据。

人工智能出版物总数

图1.1.1显示了人工智能出版物的全局计数。2010年至2022年间,人工智能出版物的总数几乎增加了两倍,从2010年的约8.8万篇增加到2022年的24万多篇。与去年相比,这一增幅仅为1.1%

按出版类型划分

图1.1.2显示了全球AI发布类型随时间的分布情况。2022年,大约有23万篇AI期刊文章,而大约有4.2万篇会议论文。自2015年以来,ai期刊和会议出版物以可比的速度增长。2022年,会议出版物和期刊出版物的数量分别是2015年的2.6倍和2.4倍。

按研究领域划分

图1.1.3显示了自2010年以来按研究领域划分的AI出版物总数。机器学习出版物在过去十年中增长最快,自2015年以来增长了近7倍。继机器学习之后,2022年发表最多的AI领域是计算机视觉(21,309篇)、模式识别(19,841篇)和流程管理(12,052篇)。


部门

本节介绍了AI出版物在全球范围内的分布情况,包括教育、政府、行业、非营利组织和其他部门,以及具体在美国、中国、欧洲联盟加联合王国的分布情况。2022年,学术部门贡献了大部分人工智能出版物(81.1%),在过去十年中保持了其在所有地区AI研究全球领先来源的地位(图1.1.4和图1.1.5)。工业参与在美国最为显著,其次是欧洲联盟加联合王国和中国(图1.1.5)。

AI期刊

图1.1.6显示了2010 - 2022年AI期刊发表总数。从2010年到2015年,AI期刊出版物的数量略有增长,但自2015年以来增长了约2.4倍。在2021年至2022年期间,AI期刊出版物增长了4.5%。

AI会议出版物

图1.1.7显示了自2010年以来AI会议出版物的总数。在过去的两年里,AI会议出版物的数量有了显著的增长,从2020年的22727篇上升到2021年的31629篇,到2022年达到41174篇。仅去年一年,AI会议出版物就增加了30.2%。自2010年以来,AI会议出版物的数量增加了一倍多。


part2


本节研究了全球AI专利的长期趋势,这可以揭示AI创新、研究和开发演变的重要见解。此外,分析AI专利可以揭示这些进步是如何在全球分布的。与出版物数据类似,AI专利数据的可用性也有明显的延迟,2022年是可访问数据的最近一年。本节数据来自CSET。

1.2 专利

AI专利

概述:

图1.2.1考察了2010年至2022年全球AI专利授权的增长情况。在过去十年中,AI专利数量显著增加,近年来增长尤为迅猛。例如,2010年至2014年间,AI专利授权总量增长了56.1%。然而,仅从2021年到2022年,AI专利数量就增长了62.7%。

按归档状态和地区划分

以下部分按AI专利的申请状态(是否授予)以及其发表的地区进行了分类。

图1.2.2按申请状态对全球AI专利进行比较。2022年,未授权的AI专利数量(128952件)是授权数量(62264件)的两倍多。随着时间的推移,AI专利审批的格局发生了显著变化。直到2015年,申请的AI专利中获得授权的比例更大。然而,从那以后,大多数AI专利申请都没有获得批准,差距显著扩大。例如,2015年,42.2%的AI专利申请未获批准。到2022年,这一数字已上升至67.4%。

在包括中国、欧盟和英国以及美国在内的所有主要专利起源地理区域,授权和未授权AI专利之间的差距都很明显

(图1.2.3)。近年来,这三个地理区域的AI专利申请总数和专利授权数量都有所增加。

图1.2.4展示了授权AI专利的区域细分。截至2022年,世界上大部分已授予的AI专利(75.2%)来自东亚和太平洋地区,北美是第二大贡献者,占21.2%。截至2011年,北美在全球AI专利数量方面处于领先地位。然而,从那时起,发生了重大转变,来自东亚和太平洋地区的AI专利比例不断增加。

按地理区域划分,世界上大多数授予的AI专利来自中国(61.1%)和美国(20.9%)(图1.2.5)。来自美国的AI专利份额从2010年的54.1%下降。

图1.2.6和图1.2.7显示了哪些国家在人均AI专利方面领先。2022年,每10万居民中获得AI专利最多的国家是韩国(10.3),其次是卢森堡(8.8)和美国(4.2)。

(图)相对于1.2.6。图1.2.7显示了2012年至2022年人均AI专利授权的变化。在此期间,新加坡、韩国和中国的人均AI专利申请量增幅最大。

2012年 与 2022年各国每 10万居民获批人工智能专利的百分比变化

part3

本节探讨AI研究的前沿。虽然每年都会推出许多新的AI模型,但只有一小部分样本代表了最先进的研究。诚然,什么是先进或前沿研究多少有些主观。前沿研究可以反映一个模型在基准上发布一个新的最先进的结果,引入一个有意义的新架构,或者行使一些令人印象深刻的新功能。

人工智能指数研究两类前沿人工智能模型的趋势:“显著模型”和基础模型人工智能指数数据提供商Epoch使用“著名的机器学习模型”一词来指定精心挑选的在人工智能/机器学习生态系统中特别有影响力的值得注意的模型。相比之下,基础模型是在大量数据集上训练的非常大的人工智能模型,能够执行大量的下游任务。基础模型的例子包括GPT-4、Claude 3和Gemini。虽然很多粉底模特可能有资格成为知名模特,但并非所有知名模特都是粉底模特。


在本节中,人工智能指数从不同的角度探讨了著名模型和基础模型的趋势,包括原始组织、原产国、参数计数和计算使用情况。分析最后对机器学习培训成本进行了考察。

1.3 前 沿 人 工 智 能 研 究

通用机器学习模型

概述

Epoch人工智能是一组致力于研究和预测先进人工智能进化的研究人员。他们维护着一个自20世纪50年代以来发布的人工智能和机器学习模型数据库,根据最先进的技术进步、历史意义或高引用率等标准选择条目。通过分析这些模型,可以全面概述近年来和过去几十年机器学习领域的演变数据集中可能缺少一些模型;然而,数据集可以相对地揭示趋势。

行 业 分 析

直到2014年,学术界主导了机器学习模型的发布。从那以后,工业界就走在了前面。2023年,工业界产生了51个值得注意的机器学习模型,而学术界只有15个(图1.3.1)。值得注意的是,2023年有21个值得注意的模型是由行业/学术合作产生的,创历史新高。

创建尖端的人工智能模型现在需要大量的数据、计算能力和财政资源,而这些在学术界是无法获得的。在去年的人工智能指数报告中,首次强调了这种向领先人工智能模型增加行业主导地位的转变。尽管今年差距略有缩小,但这一趋势在很大程度上仍然存在。

国家关系

为了说明不断变化的人工智能地缘政治格局,人工智能指数研究团队分析了著名模型的原产国。

图1.3.2显示了归因于研究人员附属机构位置的显著机器学习模型的总数

2023年,美国以61个著名机器学习模型领跑,中国以15个紧随其后,法国以8个紧随其后。自2019年以来,欧盟和英国生产的著名人工智能模型数量首次超过中国(图1.3.3)。自2003年以来,美国比英国、中国和加拿大等其他主要地理区域生产了更多的模型(图1.3.4)。


2003-23年按地理区域划分的著名机器学习模型数量 (sum)

参数的趋势

机器学习模型中的参数是在训练过程中学习到的数值,它决定了模型如何解释输入数据并进行预测。

在更多数据上训练的模型通常会比在更少数据上训练的模型有更多的参数。同样,具有更多参数的模型通常优于具有更少参数的模型。

图1.3.5展示了Epoch数据集中机器学习模型的参数计数,按模型起源的部门进行分类。自2010年代初以来,参数数量急剧上升,反映了AI模型设计任务的日益复杂、数据的可用性、硬件的改进以及更大模型的有效性。高参数模型在工业领域尤其引人注目,这凸显了OpenAI、Anthropic和Google等公司承担海量数据训练的计算成本的能力。

计算趋势

AI模型中的术语“计算”是指训练和操作机器学习模型所需的计算资源。一般是指模型的复杂程度和训练数据集的大小直接影响所需的计算量。模型越复杂,底层训练数据越大,训练所需的计算量就越大。

图1.3.6可视化了过去20年著名机器学习模型所需的训练计算量。最近,著名的AI模型的计算使用量呈指数级增长这一趋势在过去五年中尤为明显。计算需求的快速增长具有至关重要的意义。例如,需要更多计算的模型通常具有更大的环境足迹,公司通常比学术机构拥有更多的计算资源。

图1.3.7突出显示了2012年以来著名机器学习模型的训练计算。例如,AlexNet是推广使用gpu改进AI模型的标准做法的论文之一,该论文估计需要470千万亿次浮点运算来进行训练。

最初的Transformer于2017年发布,需要大约7400千万亿次浮点运算。谷歌的Gemini Ultra是目前最先进的基础模型之一,需要500亿次千万亿次浮点运算。

亮 点 :

模型会耗尽数据吗 ?

如上所示,最近很大一部分算法进步,包括强大的llm背后的进步,都是通过在越来越大的数据量上训练模型来实现的。正如Anthropic联合创始人兼AI指数指导委员会成员杰克·克拉克(Jack Clark)最近指出的那样,基金会模型已经在互联网上存在的所有数据中进行了有意义的训练。

AI模型对数据的依赖性越来越大,这引发了人们的担忧,即未来几代计算机科学家将耗尽数据,无法进一步扩展和改进他们的系统。

Epoch的研究表明,这些担忧在某种程度上是有道理的。Epoch的研究人员已经对AI研究人员可能会在何时耗尽数据进行了历史和基于计算的预测。历史预测是基于观察到的用于训练基础模型的数据规模的增长率。计算预测根据计算可用性的预测来调整历史增长率。

例如,研究人员估计,到2024年,计算机科学家可能会耗尽高质量语言数据的库存,在20年内耗尽低质量语言数据,并在2030年代末至2040年代中期耗尽图像数据(图1.3.8)。

从理论上讲,数据可用性有限的挑战可以通过使用合成来解决

类型对ML数据耗尽的预测:中位数和90% CI日期来源:Epoch2023 |表:2024 AIIndex报告


数据,这是AI模型本身产生的数据。例如,可以使用一个LLM生成的文本来训练另一个LLM。使用合成数据训练AI系统特别有吸引力,不仅因为它是潜在数据耗尽的解决方案,而且因为生成式AI系统原则上可以在自然发生的数据稀少的情况下生成数据,例如,罕见疾病或代表性不足的人口的数据。直到最近,使用合成数据训练生成式AI系统的可行性和有效性还没有得到很好的理解。然而,今年的研究表明,在合成数据上训练模型存在局限性。

例如,一个由英国和加拿大研究人员组成的团队发现,模型主要是在合成数据经验模型上训练的

崩溃,一种现象,随着时间的推移,他们失去了记住真实底层数据分布的能力,并开始产生一个狭窄的输出。图1.3.9展示了变分自编码器(VAE)模型的模型崩溃过程,变分自编码器是一种广泛使用的生成式AI架构。随着后续每一代的训练额外的合成数据,模型产生的输出越来越有限。如图1.3.10所示,从统计学角度来看,随着合成代数的增加,分布的尾部消失,代密度向均值偏移这种模式意味着,随着时间的推移,主要在合成数据上训练的模型的世代变化越来越小,分布也不那么广泛。

作者证明,这种现象发生在各种模型类型中,包括高斯混合模型和法学硕士。这项研究强调了人工生成数据对训练有能力的法学硕士的持续重要性,这些数据可以产生各种各样的内容。

在2023年发表的类似研究中使用

对于生成成像模型中的合成数据,研究人员发现,仅在合成数据周期上训练的生成图像模型——或者在真实人类数据不足的情况下训练的生成图像模型,输出质量会显著下降。作者将这种现象标记为模型自噬障碍(MAD),参考疯牛病。

该研究检查了两种类型的训练过程:完全合成,即模型完全根据合成数据进行训练,以及合成增强,其中,模型在合成数据和真实数据的混合上进行训练。在这两种场景中,随着训练代数的增加,图1.3.1

生成的图像下降。图1.3.11突出显示了使用合成数据增强的模型的退化图像世代;例如,第7步和第9步生成的人脸越来越多地显示出奇怪的hash标记。来自统计数据合成数据和合成增强循环生成的图像具有较高的FID分数(表明与真实图像的相似性较低),较低的精度分数(表明真实感或质量降低)和较低的召回分数(表明多样性降低)(图1.3.12)。而合成增强循环,其中包含了一些真实的数据显示出比完全合成环路更少的退化,但随着进一步的训练,这两种方法的收益都会递减。


基础模型

基础模型代表了一个快速发展和流行的AI模型类别。它们在庞大的数据集上训练,用途广泛,适用于众多下游应用。诸如GPT-4、Claude 3和羊驼2等基础模型展示了非凡的能力,并且越来越多地部署在现实场景中。

生态系统图于2023年推出,是斯坦福大学的一个新的社区资源,用于跟踪基础模型生态系统,包括数据集、模型和应用程序。本节使用来自生态系统图的数据来研究基础模型随时间的趋势

Model Release

基础模型可以通过不同的方式访问。无访问模型,比如谷歌的PaLM-E,只有开发者可以访问。有限访问模型,如OpenAI的GPT-4,通常通过公共API提供对模型的有限访问。开放模型,如Meta的羊驼2,完全释放模型的重量,这意味着模型可以修改和自由使用。

图1.3.13可视化了2019年以来按接入类型划分的基础模型总数。近年来,基础模型数量急剧上升,自2022年以来增长了一倍多,自2019年以来增长了近38倍。在2023年发布的149款基础款中,98款是开放的,23款是受限的,28款是不可访问的。

2023年,大多数基础模型都是开放获取的(65.8%),18.8%的模型没有访问权限,15.4%的模型有限制访问权限(图1.3.14)。从2021年开始,以开放获取方式发布的模型比例有了明显的提升。

人事关系

图1.3.15绘制了自2019年以来基金会模型的起源部门。2023年,大部分基础模型(72.5%)

来源于工业。2023年只有18.8%的基础模型来源于学术界。自2019年以来,越来越多的基础模型来自工业界。

图1.3.16突出显示了2023年发布的各种基础模型的来源 。Google推出的模型最多 (18个 ),其次是 Meta(11图1.3.16突出显示了2023年发布的各种基础模型的来源。Google推出的模型最多(18个),其次是Meta(11个)和微软(9个)。2023年发布最多基础模型的学术机构是加州大学伯克利分校(3个)。

2019年以来,Google发布的基础模型最多,共40个,其次是OpenAI, 20个(图1.3.17)。清华大学在非西方机构中脱颖而出,发布了7个基础模型,而斯坦福大学则是美国领先的学术机构,发布了5个。

国家关系

鉴于基础模型在前沿AI研究中具有相当的代表性,从地缘政治的角度来看,了解它们的国家归属是很重要的。图1.3.18、1.3.19和1.3.20可视化了各种基础模型的国家隶属关系。与本章前面提出的值得注意的模型分析一样,

如果为该模型作出贡献的研究人员隶属于总部设在该国的机构,则该模型被视为隶属于该国。

2023年,世界上大部分的基础模型都来自美国(109个),其次是中国(20个)和英国(图1.3.18)。自2019年以来,美国一直领先于大多数基础模型的起源

(图1.3.19)。

图1.3.20描绘了自2019年以来发布并归属于各自国家的基础模型的累计计数。2019年以来发布的基础模型数量最多的国家是美国(182个),其次是中国(30个)和英国(21个)。

训练费用

在关于基础模型的讨论中,一个突出的话题是它们的推测成本。虽然AI公司很少披露训练模型所涉及的费用,但人们普遍认为,这些成本高达数百万美元,而且还在上升。例如,OpenAI的首席执行官萨姆·奥特曼(Sam Altman)提到,GPT-4的培训成本超过1亿美元。培训费用的上涨实际上排除了传统的AI研究中心大学开发自己的前沿基础模型的可能性。作为回应,政策倡议,如拜登总统关于AI的行政命令,试图通过创建国家AI,在产业界和学术界之间创造公平的竞争环境研究资源,这将为非工业参与者提供进行更高级别人工智能研究所需的计算和数据。

了解训练AI模型的成本很重要,但关于这些成本的详细信息仍然很少。在去年的出版物中,人工智能指数是首批提供基础模型培训成本估算的机构之一。今年,人工智能指数与AI研究机构Epoch AI合作,大幅提高和巩固其AI培训成本估算的稳健性为了估算尖端模型的成本,Epoch团队利用与模型相关的出版物、新闻稿或技术报告中的信息,分析了训练持续时间,以及训练硬件的类型、数量和利用率

图1.3.21显示了基于云计算租赁价格的与选定AI模型相关的估计培训成本。人工智能指数的估计证实了近年来模型培训成本显著增加的怀疑。例如,2017年,最初的Transformer模型引入了支撑几乎所有现代LLM的架构,其培训成本约为900美元112019年发布的RoBERTa Large在SQuAD和GLUE等许多规范理解基准上取得了最先进的结果,其训练成本约为16万美元。时间快进到2023年,OpenAI的GPT-4和谷歌的Gemini Ultra的培训成本估计分别在7800万美元和1.91亿美元左右。

图1.3.22可视化了AI指数估算的所有AI模型的训练成本。如图所示,随着时间的推移,模型训练成本急剧增加。

正如之前的AI指数报告所述,AI模型的训练成本与其计算需求之间存在直接关联。如图1.3.23所示,具有更大计算训练需求的模型的训练成本要高得多。


part4

AI会议是研究人员展示他们的发现并与同行和合作者建立联系的重要平台。在过去的二十年里,这些会议在规模、数量和声望上都有所扩大。本节探讨出席主要AI会议的趋势。

1.4 AI会议

参加会议

图1.4.1自2010年以来AI会议的出席情况。AI指数报告称,在出席率下降(可能是由于转向完全面对面的形式)之后,从2022年到2023.12年,会议出席率有所增加,具体而言,去年总出席率增长了6.7%。自2015年以来,每年的与会者人数增加了约5万人,这不仅反映了人们对AI研究的兴趣日益浓厚,也反映了新的AI会议的出现。


神经信息处理系统(NeurIPS)仍然是参加人数最多的AI会议之一,在2023年吸引了大约16,380名参与者(图1.4.2和图1.4.3)。在主要的人工智能会议中,NeurIPS、ICML、ICCV和AAAI的出席人数逐年增加。然而,在过去的一年里,CVPR、ICRA、ICLR和IROS的出席人数略有下降。

part5

GitHub是一个基于web的平台,使个人和团队能够托管,审查和协作代码库。GitHub被软件开发人员广泛使用,有助于代码管理、项目协作和开源软件支持。本节利用来自GitHub的数据,提供了对学术出版数据中未反映的开源人工智能软件开发的更广泛趋势的见解。

1.5 开源人工智能软件

GitHub项目由一组文件组成,包括源代码、文档、配置文件和图像,这些文件共同构成了一个软件项目。图1.5.1显示了github 人工智能项目随时间变化的总数。自2011年以来,与人工智能相关的GitHub项目数量持续增长,从2011年的845个增长到2023年的180万个。值得注意的是,仅去年一年,GitHub人工智能项目总数就急剧增长了59.3%。

图1.5.2报告了2011年以来按地理区域划分的GitHub人工智能项目。截至2023年,GitHub人工智能项目的很大一部分位于美国,占贡献的22.9%。印度是第二大贡献者,占19.0%,紧随其后的是欧洲联盟和英国,占17.9%。值得注意的是,自2016年以来,美国开发者在GitHub上的人工智能项目比例一直在稳步下降。

明星

GitHub用户可以通过“点赞”来表达他们对某个存储库的兴趣,这一功能类似于在社交媒体上给帖子点赞,表示对开源项目的支持。其中最受欢迎的库是TensorFlow、OpenCV、Keras和PyTorch等库,它们在人工智能编码社区的软件开发人员中广受欢迎。例如,TensorFlow是一个用于构建和部署机器学习模型的流行库。OpenCV是一个为计算机视觉提供各种工具的平台,例如对象检测和特征提取。

GitHub上人工智能相关项目的星级总数在去年大幅增加,从2022年的400万增加到2023年的1220万,增加了两倍多(图1.5.3)。GitHub明星数量的急剧增加,以及此前报道的项目数量的增加,突显了开源人工智能软件开发的加速增长。

2023年,美国是获得GitHub星级最多的国家,共计1050万颗(图1.5.4)。包括欧盟和英国、中国和印度在内的所有主要地理区域,授予其所在国家的项目的GitHub星级总数都在逐年增加。


以上为报告简介及第一章翻译全部内容,部分翻译存在不准确之处,敬请谅解。后9期内容我们将每周为您发布。谢谢!


12.12 厦门emag沙龙-文章页底部
TikTok、Facebook、谷歌、Twitter广告服务,0门槛抢占全球流量!
极速开户+优化投流+风险保障+效果跟踪,仅需4步,轻松撬动亿万海外流量,让品牌销量翻倍增长!
已成功开通5000+账户
二维码
免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
俄罗斯电商市场快速增长,综合平台优势大于独立站
AMZ123获悉,近日,Euromonitor、EMARKETER及Yakov and Partners发布了《俄罗斯电商市场发展现状》报告。报告基于2020-2024年的数据,对俄罗斯电商市场的发展趋势、综合电商平台与独立电商的竞争格局、各品类表现、未来市场预测进行了系统分析。一、俄罗斯电商趋势1.互联网渗透率增长放缓2020至2024年,俄罗斯互联网使用率从78.1%(约9560万用户)提升至85.5%(约1.04亿用户),四年间增加7.4%(新增约790万用户)。俄罗斯的互联网渗透率增速正在逐年放缓,预计到2029年互联网渗透率将达到89%(约1.08亿用户)。
越南加强进口商品监管,修订多项增值税和海关规则
AMZ123获悉,近日,越南海关公布了2026年对增值税(VAT)、特别消费税(SCT)及电子交易管理的多项修订,核心在于统一税制规则、扩大免税范围并加强跨境与电子化申报管理。此次调整既有减轻企业合规成本、扶持出口与产业链升级的内容,也伴随对部分消费品与临时进口再出口环节的更严监管,直接影响生产、进出口和跨境电商卖家。在增值税方面,新法律将此前零散的官方函件并入法律和配套法令,提升透明度并便于电子化处理。关键变化包括扩大增值税免税目录:列入政府清单的自然资源与矿产(无论原料还是加工品)在出口时被明确归为增值税免税项目。
TikTok Shop黑五复盘,一堆中国卖家晒出百万GMV
黑五复盘,TikTok卖家:“库存差点给我爆完了!”
存生命危险!美国CPSC紧急召回超1万件儿童手写板玩具
AMZ123获悉,近日,美国消费品安全委员会(CPSC)宣布,紧急召回亚马逊在售的KTEBO品牌的儿童书写板玩具,原因是该产品未能符合玩具类产品的强制性安全标准,电池仓固定螺丝无法保持牢固,可能导致纽扣电池外露。若儿童误吞纽扣电池,可能造成严重伤害、内部化学灼伤,甚至威胁生命。此次召回涉及KTEBO品牌的双件套书写平板玩具,召回数量约10,380件,产品提供四种颜色组合,包括粉色/蓝色、绿色/黄色、橙色/蓝色以及紫色/红色,并有8.5英寸与10英寸两种规格,每套配有与机身同色的手写笔。
AliExpress波兰11月增长显著,双十一活动日活用户增长37%
AMZ123获悉,近日,AliExpress的数据显示,平台11月的消费者参与度与卖家销售额大幅增长。今年11月11日至19日举行的AliExpress双十一购物节活动期间,波兰用户的参与度显著提升,日活跃用户数量同比增长37%。随着去年秋季AliExpress开放波兰本地卖家入驻,今年波兰本地卖家的参与度也明显提高,他们在此次双十一促销期间的GMV同比增长74%。从消费偏好来看,智能生活类产品持续吸引波兰消费者,智能家居与清洁设备成为销售榜单的主导品类。Dreame、ILIFE、Laresar等品牌的扫地机器人和自动吸尘设备进入最畅销产品行列,反映波兰家庭对智能化、便捷化生活方式的需求不断上升。
亚马逊印度计划投资127亿美元,推动本地云和AI基础设施建设
AMZ123获悉,近日,亚马逊宣布,将在2030年前进一步推动人工智能在印度的普及,计划投入127亿美元建设本地云和AI基础设施。亚马逊表示,这项长期投资将为超过1500万家中小企业带来AI应用能力,同时在2030年前为400万名公立学校学生提供AI素养课程与职业教育,提高数字技能普及度。亚马逊认为,AI正成为提升印度数字包容性的关键力量,能够突破语言、读写能力与访问渠道的限制,让更多个人与企业受益。在中小企业领域,亚马逊正在推出新一代AI工具,以降低经营门槛、简化业务操作并提升增长效率。
“黑五网一”DTC投放数据复盘,流量都去哪了?
2025 年“黑五网一”大战,终于落下帷幕。除了 GMV ,这场仗花了多少“弹药”,你算清楚了吗?流量场上的每一发子弹,都正中靶心了吗?偏离的原因找到了吗?除了看自己后台的数据,还要看清整个大盘的趋势——这决定了我们下一步该往哪儿走。基于 GoodsFox 监控的投放数据,我们有以下发现:服装、美妆的竞争力度只增不减3D 打印与机械键盘,从“小众圈层”跃升为热门赛道宠物经济的流量稳定,不靠爆点也能撑起大盘这些变化背后,都在重塑今年“黑五网一”的投放结构,我们先从流量基本盘讲起——尽管每年都有新风口,但从广告投放的绝对体量来看,传统大盘仍在支撑整体流量水位。
还在“索评”?亚马逊Review管理的红线与出路
亚马逊的评论管理格局是如何改变的?首先要明确一点:过去几年,亚马逊的Review生态系统发生了剧变,这对各类管理工具产生了深远影响。在买家端,那些专门用来标记“虚假评论”(或帮助买家鉴别真伪)的老一代工具正在失效甚至消失。不少买家就因为Fakespot在平台冲突、合规问题和数据接口变更的压力下关停而感到措手不及。Fakespot是一个分析电商产品评论真实性、帮助消费者识别虚假评价的平台。在卖家端,亚马逊的政策合规和风控机制变得更加严厉。这意味着Review的风险红线变了:以前那些“地毯式索评”或“送测(Giveaway)”的套路可能有效,但现在操作这些手段的封号风险极高。
AMZ123PayPal计算器使用指南及常见问题详解(内附计算公式)
Paypal手续费计算器介绍及计算公式分享 https://www.amz123.com/tools-paypal
重磅!亚马逊公布2026年战略重心变化
AMZ123获悉,12月4日,2025年亚马逊全球开店跨境峰会上,亚马逊回顾了过去一年里中国卖家在亚马逊上所取得的进展,并围绕2026年四大业务战略重点——供应链服务、AI赋能、全球拓展布局、本地服务,揭晓了40余项创新举措。根据亚马逊披露的数据:2025年以来,中国卖家通过亚马逊全球站点售出数十亿件商品,在美欧等成熟站点的销售额增长超过15%,在新兴站点的销售额增长超过30%;2025年以来,销售额达到200万、500万、800万美金的中国卖家数量,增长均超过20%;销售额超过1000万美金的中国卖家数量,增幅近30%。
卖家还在等口径!欠税公示制度却已明确落地
卖家还在“等政策”,但政策已明确趋严过去几个月里,跨境卖家对税务政策最大的期待就是——“能不能再等等,看会不会有新口径”。但事实上,政策并没有往宽松走,而是沿着“数据透明—提醒申报—强化监管”这条路径一步步推进。AMZ123了解到,目前已有超过7000家境内外平台完成涉税信息报送,卖家的线上线下销售数据已全面纳入监管体系。随着数据比对展开,税务部门对申报明显低于平台数据的经营者陆续发出提示,要求补充申报;多数卖家在收到提示后完成了更正,但也的确还有部分经营者迟迟没有动作,继续处于观望甚至低申报的状态。在这种情况下,监管的态度也开始变得更为明确:对于未按规定申报的行为,将从提醒阶段进入到强化管理阶段。
亚马逊新功能,能救你一整条链接!
最近有卖家后台发现,亚马逊多了一个新功能,看起来不起眼,实则很关键——绩效提醒(Performance Notifications)。这个功能解决了我们运营过程中的一个老大难:链接出问题时能不能第一时间被提醒?以前我们发现Listing出状况,大多靠“事后诸葛”:出单突然断了,去查是不是被下架;关键词排名一夜暴跌,才想起去对比转化率;广告Acos拉爆、CTR异常,才知道图可能挂了;等你发现问题,可能已经晚了。这次,亚马逊终于“良心发现”,开始主动提醒你链接的数据异常了。这个新功能到底能干啥?说白了,它就是一个链接级别的数据异常预警系统。
汽配类目又现吸金王,TikTok卖家30天入账1100万
月销量暴涨36007900%,这一汽配用品在TikTok卖爆了
跨界AI失败?深圳大卖资产重组终止!
12月2日,跨境3C 配件大卖杰美特发布公告,宣布决定终止筹划以现金方式收购AI 算力解决方案提供商思腾合力(天津)科技有限公司(以下简称“思腾合力”)控制权的重大资产重组事项。这场筹划半年、备受行业关注的跨界收购突然落幕,消息一出引发市场热议。AMZ123获悉,杰美特于2025年6月21日首次披露了筹划重组的提示性公告,拟通过现金交易控股思腾合力,该交易初步测算构成重大资产重组,且不涉及发行股份、不构成关联交易,也不会导致公司控制权变更。杰美特是“中国手机壳第一股”,主营业务为移动智能终端保护类产品的研发、设计与销售,产品包括手机、平板及穿戴设备的保护壳与表带等。
宠物消费持续升温,亚马逊10款月销过万宠物产品推荐
AMZ123获悉,近日,亚马逊各类产品搜索量增长显著,以下10款产品在亚马逊上销量表现突出,深受消费者欢迎。1. 猫咪情绪舒缓喷雾预计销售额:139.84万美元/月销量:26,000+星级评分:4.4好评数量:12,694+图源:亚马逊产品描述:FELIWAY Optimum猫咪情绪舒缓喷雾的专利信息素复合物能显著减少猫咪的应激表现,包括喷尿、抓挠、恐惧反应、紧张冲突等。产品无药性、安全且不干扰人类与其他宠物,每个喷雾覆盖面积约 700 平方英尺。
TikTok Shop英国站黑五创历史新高,销售额同比飙升50%
AMZ123获悉,近日,根据TikTok的公告,TikTok Shop英国站在今年黑色星期五期间创下平台历史最高销售纪录,整体销售额较去年同期提升50%。高峰期出现在黑色星期五当天,当日每秒售出27件商品,刷新TikTok Shop在英国的单日销售纪录。今年消费者开始促销季的时间更早,“假黑五”(Fake Friday,即黑五前一周)的销售额达到去年黑色星期五的纪录水平。黑五周末期间,“TikTok Shop Black Friday”搜索量同比增长404%,成为2025年与黑五相关的最高热度搜索词。同期,平台活跃购物人数较去年增加28%。
《亚马逊生活日用品类攻略手册》PDF下载
作为日常生活不可或缺的重要组成,生活百货品类覆盖范围广泛,包括家居用品、家具、车用配件、户外装备、园艺 工具、运动器材、家装用品、厨房、玩具以及宠物用品等众多领域。这类产品不仅是满足基本生活所需,更体现了人们对美好生活的向往和追求。
《掘金泰国-市场洞察与战略机遇报告2025》PDF下载
随着全球经济一体化的加速,泰国作为东盟的核心枢纽,凭借其独特的地缘优势庞大的消费市场以及持续优化的营商环境,成为众多企业战略布局的重要目标。本报告深入剖析泰国市场的政策红利、消费趋势、产业机遇以及合规挑战,旨在为有志于开拓泰国市场的中国企业提供行动指南,助力企业在东盟这片充满活力的土地上把握机遇、应对挑战、!实现可持续发展。
《2025欧美假日购物季营销指南》PDF下载
2025年美国假日购物季零售额预计同比仅增长1.2%,总销售额约1.359万亿美元,虽仍保持正增长,但为2009年以来最低增速,市场正在步入低增长的新常态。
《2025年跨境电商东南亚市场进入战略白皮书》PDF下载
东南亚电商,正以惊人的速度复刻中国电商高速增长的黄金时代。2024年东南亚电商GMV达到1284亿美元,短短5年涨幅超过3倍。全球电商2024年GMV增幅最快的十大市场中,东南亚独占四席。东南亚是拥有约6.7亿人口的广阔市场,在现今全球关税的不确定性大格局下,因其电商基建完善,利好的贸易政策,和更高的年轻人口占比,成为跨境卖家生意拓张焦点之一。
《2025年TikTok Shop玩具品类行业报告(欧美站)》PDF下载
分析TikTok Shop美国市场、英国市场、西班牙市场、墨西哥市场等主流市场点短视频及直播电商数据,选取TikTok与玩具爱好品类相关的内容进行分析报告。
《2025 洗护品类趋势与创新洞察》PDF下载
本报告独特价值:将消费者的“行为结果”据),揭示消费者深层心理动机、并能精准预判未来增长机会
《亚马逊双轨增长指南》PDF下载
亚马逊以“以客户为中心”为核心理念,通过整合B2B与B2C的全渠道服务,帮助卖家实现“一店双拓”-- 一次上架,同步触达个人消费者与企业买家,获得双重收益。同时,基于Direct to Buyer(直接触达买家)的模式,更能有效减少中间环节,提升利润空间与品牌掌控力。
《亚马逊全球线上商采趋势与区域洞察》PDF下载
随着全球企业数字化转型的深入推进,B2B商采有望成为下一个万亿级别的蓝海市场然而,中国卖家在开拓海外企业商采市场时往往面临着一个关键挑战:难以准确把握海外企业买家的商采行为和决策模式。这种认知偏差不仅影响了产品开发方向,也制约了市场拓展策略的制定。
跨境科普达人
科普各种跨境小知识,科普那些你不知道的事...
侃侃跨境那些事儿
不侃废话,挣钱要紧!
跨境学院
跨境电商大小事,尽在跨境学院。
跨境电商干货集结
跨境电商干货集结,是结合亚马逊跨境电商卖家交流群内大家在交流过程中最常遇到的问题,进行收集整理,汇总解答,将会持续更新大家当前最常遇见的问题。欢迎大家加入跨境电商干货集结卖家交流群一起探讨。
AMZ123卖家导航
这个人很懒,还没有自我介绍
亿邦动力网
消除一切电商知识鸿沟,每日发布独家重磅新闻。
跨境平台资讯
AMZ123旗下跨境电商平台新闻栏目,专注全球跨境电商平台热点事件,为广大卖家提供跨境电商平台最新动态、最热新闻。
北美电商资讯
AMZ123旗下北美跨境电商新闻栏目,专注北美跨境电商热点资讯,为广大卖家提供北美跨境电商最新动态、最热新闻。
首页
跨境头条
文章详情
斯坦福:2024年人工智能指数报告(中文详解-1)
Shulex
2024-05-06 16:48
7797

由华裔女科学家、“人工智能教母”李飞飞联合领导的斯坦福大学以人为本人工智能研究所(Stanford HAI)近日发布了:《2024年人工智能指数报告》(Artificial Intelligence Index Report 2024)。


斯坦福大学HAI介绍称,人工智能指数报告跟踪、整理、提取和可视化与人工智能相关的数据。该研究所的使命是提供不带偏见的、经过严格审查的、来源广泛的数据,以便政策制定者、研究人员、高管、记者和公众对复杂的人工智能领域有更深入细致的了解。人工智能指数是全球公认的最可信和最权威的人工智能数据和见解来源之一。

Shulex 将此报告的 10 个重点议题分为 10 次内容为您进行翻译和更新,以下为此次报告的基础介绍及第一章 :研究与发展部分的具体内容!

如果您希望尽快学习整篇内容,您可以扫码咨询Shulex小助手领取《2024年人工智能指数报告》(Artificial Intelligence Index Report 2024)英文版原版PDF文件,谢谢!

2024年AI指数报告介绍

欢迎来到第七版AI指数报告。2024年指数是我们迄今为止最全面的指数,在AI对社会的影响从未如此明显的重要时刻到来。今年,我们扩大了研究范围,更广泛地涵盖了AI的技术进步、公众对该技术的看法以及围绕其发展的地缘政治动态等基本趋势。该版本提供了比以往更多的原始数据,介绍了对AI培训成本的新估计,对负责任的AI前景的详细分析,以及专门介绍AI对科学和医学影响的全新章节。

AI指数报告跟踪、整理、提炼和可视化与人工智能(AI)相关的数据。我们的使命是提供公正、严格审查、来源广泛的数据,以便政策制定者、研究人员、高管、记者和公众对复杂的AI领域有更全面、更细致的了解。

AI指数是全球公认的最可信、最权威的人工智能数据和见解来源之一。之前的版本曾被《纽约时报》、《彭博社》、《卫报》等主要报纸引用,积累了数百次学术引用,并被美国、英国、欧盟等地的高层决策者引用。今年的版本在规模、规模和范围上都超过了以往的所有版本,反映了AI在我们生活中越来越重要。

联合致辞:

十年前,世界上最好的AI系统还无法像人类一样对图像中的物体进行分类。AI难以理解语言,也无法解决数学问题。如今,AI系统在标准基准上的表现经常超过人类。

2023年,这一进程加速。像GPT-4、Gemini和Claude 3这样最先进的新系统是令人印象深刻的多模态:它们可以生成数十种语言的流畅文本,处理音频,甚至解释模因。随着AI的进步,它越来越多地进入我们的生活。公司正在竞相开发基于人工智能的产品,AI越来越多地被公众使用。但目前的AI技术仍然存在重大问题。它不能可靠地处理事实,执行复杂的推理,或者解释它的结论。

AI面临两个相互关联的未来。首先,技术不断改进并被越来越多地使用,对生产力和就业产生重大影响。它可以有好的用途,也可以有坏的用途。在第二个未来,AI的采用受到技术局限性的限制。无论未来如何展开,各国政府都越来越关注。他们正在介入以鼓励有利的一面,例如资助大学研发和激励私人投资。政府也致力于管理潜在的负面影响,例如对就业、隐私问题、错误信息和知识产权的影响。

随着AI的迅速发展,AI指数旨在帮助AI社区、政策制定者、商业领袖、记者和公众应对这一复杂的局面。它提供了持续、客观的快照,跟踪几个关键领域:AI能力的技术进步,推动AI开发和部署的社区和投资,对当前和潜在未来影响的公众舆论,以及为刺激AI创新而采取的政策措施,同时管理其风险和挑战。通过全面监测AI生态系统,该指数是了解这一变革性技术力量的重要资源。

在技术方面,今年的AI指数报告称,2023年全球发布的新型大型语言模型的数量比前一年翻了一番。其中三分之二是开源的,但表现最好的模型来自拥有封闭系统的行业参与者。Gemini Ultra成为第一个在大规模多任务语言理解(MMLU)基准上达到人类水平的LLM;自去年以来,在基准测试上的性能提升了15个百分点。此外,GPT-4在语言模型综合整体评估(HELM)基准上取得了令人印象深刻的0.96平均胜率得分,其中包括MMLU和其他评估。

虽然全球对AI的私人投资连续第二年减少,但对生成式AI的投资却飙升。财富500强公司的财报电话会议中提到AI的次数比以往任何时候都多,新的研究表明,AI确实提高了员工的生产率。在政策制定方面,全球立法程序中对AI的提及从未如此之高。美国监管机构在2023年通过的人工智能相关法规比以往任何时候都多。尽管如此,许多人对AI制造深度造假和影响选举的能力表示担忧。公众对AI的意识越来越强,研究表明,他们的反应是紧张。Ray Perrault and Jack ClarkCo-directors, AI Index

十大启示:

1. A人工智能在某些任务上胜过人类,但并非在所有任务上。在一些基准测试中,人工智能的表现已经超过了人类,包括在图像分类、视觉推理和英语理解方面。然而,在竞赛级数学、视觉常识推理和规划等更复杂的任务上,人工智能却落后于人类。 

2. 工业界继续主导人工智能前沿研究。2023 年,产业界产生了 51 个著名的机器学习模型,而学术界只贡献了 15 个。2023 年,产学合作还产生了 21 个著名模型,创下新高。2023年,工业界产生了51个值得注意的机器学习模型,而学术界仅贡献了15个。 

3. 前沿模型越来越昂贵。据 AI Index 估计,最先进的人工智能模型的训练成本已经达到了前所未有的水平。例如,OpenAI 的 GPT-4 估计使用了价值 7800 万美元的计算资源进行训练,而谷歌的 Gemini Ultra 则耗费了 1.91 亿美元的计算资源。 根据AI指数的估计,最先进的AI模型的培训成本已经达到了前所未有的水平。 

4. 美国领先于中国、欧盟和英国,成为顶级人工智能模型的主要来源国。2023 年,61 个著名的人工智能模型源自美国的机构,远远超过欧盟的 21 个和中国的 15 个。2023年,61个著名的AI模型来自美国的机构,远远超过欧盟的21个和中国的15个。

5.目前严重缺乏对 LLM 责任的可靠和标准化评估。 包括 OpenAI、谷歌和 Anthropic 在内的领先开发者主要根据不同的责任人工智能基准来测试自己的模型。这种做法使得系统地比较顶级人工智能模型的风险和局限性的工作变得更加复杂。   

6.  生成式人工智能投资激增。尽管去年整体人工智能私人投资有所下降,但用于生成式人工智能的资金却激增,比2022年增长了近八倍,达到252亿美元。生成式人工智能领域的主要参与者,包括 OpenAI、Anthropic、Hugging Face 和 Inflection,都报告了一轮可观的融资。生成式AI领域的主要参与者,包括OpenAI、Anthropic、hugs Face和Inflection,都报告了大量融资。

7. 数据显示人工智能让工人更有生产力,工作质量更高。2023 年,几项研究评估了人工智能对劳动力的影响,表明人工智能使工人能够更快地完成任务,并提高产出质量。这些研究还表明,人工智能有可能缩小低技能和高技能工人之间的技能差距。不过,其他研究也提醒说,在没有适当监督的情况下使用人工智能可能会导致绩效下降。 

8.  得益于人工智能,科学进步进一步加速。2022 年,人工智能开始推动科学发现。然而,2023 年,与科学相关的更重要的人工智能应用相继问世--从提高算法排序效率的 AlphaDev,到促进材料发现过程的 GNoME。 然而,2023年,我们看到了更重要的与科学相关的AI应用程序的推出——从提高算法排序效率的AlphaDev,到促进材料发现过程的GNoME。

9.  美国人工智能法规数量急剧增加。美国人工智能相关法规的数量在过去一年和过去五年中大幅增加。2023 年,人工智能相关法规将从 2016 年的 1 项增加到 25 项。仅去年一年,人工智能相关法规的总数就增长了 56.3%。到2023年,有25项人工智能相关法规,而2016年只有一项。 

10. 益普索的一项调查显示,在过去的一年里,认为AI将在未来三到五年内极大地影响他们生活的人的比例从60%上升到66%。此外,52%的人对AI产品和服务表示紧张,比2022年上升了13个百分点。在美国,皮尤研究中心的数据显示,52%的美国人对AI感到担忧甚于兴奋,而2022年这一比例为37%。

以下为报告相关贡献者及组织:(此处不做翻译)

本篇内容主要为您分享,第一章:研究与发展!

第 一 章 :研究与发展

概述

本章研究了AI研究与发展的趋势。它首先检查趋势出版物和专利,然后检查著名的AI系统和基础模型的趋势。最后分析了AI会议出席情况和开源AI软件项目。

第 一 章 :研究与发展

1. 工业界继续主导前沿人工智能研究

2023年,工业界产生了51 个值得注意的机器学习模型,而学术界只贡献了15个。2023年产学合作产生的值得注意的模型也有21个,再创新高。

2. 更多的基金会模型和更开放的基金会模型。

2023年,共有149个基金会发布了款型,比2022年发布的数量增加了一倍多。在这些新发布的机型中,开源机型占65.7%,而2022年和2021年这一比例分别仅为44.4%和33.3%。

3. 前沿机型的价格要贵得多

根据人工智能指数的估计,最先进的人工智能模型的培训成本已经达到了前所未有的水平。例如,OpenAI的GPT-4使用了价值约7800万美元的计算进行训练,而谷歌的Gemini Ultra则花费了1.91亿美元的计算成本。

4. 美国领先中国、欧盟和英国,成为顶级人工智能模型的主要来源。

2023年,61个著名的人工智能模型来自美国的机构,远远超过欧盟的21个和中国的15个。

5. 人工智能专利数量激增。

从2021年到2022年,全球人工智能专利授权大幅增长62.7%。自2010年以来,获得授权的人工智能专利数量增长了31倍以上。

6. 中国主导着人工智能专利。

2022年,中国以61.1%的比例领先全球人工智能专利起源,显著超过美国的20.9%。自2010年以来,美国在人工智能专利中的份额从54.1%下降。

7. 开源人工智能研究爆发。 

自2011年以来,GitHub上的人工智能相关项目数量持续增长,从2011年的845个增长到2023年的180万个。值得注意的是,仅在2023年,GitHub人工智能项目总数就急剧增长了59.3%。GitHub上人工智能相关项目的星级总数在2023年也大幅增加,从2022年的400万增加到1220万,增加了两倍多。

8. 人工智能出版物的数量持续上升。

2010年至2022年间,人工智能出版物的总数几乎增加了两倍,从2010年的约8.8万篇增加到2022年的24万多篇。与去年相比,这一增幅仅为1.1%。



part1

1.1 出版物

概 述

以下数字显示了2010年至2022年全球英语和中文人工智能出版物的数量,按隶属关系类型和跨部门合作分类。此外,本节还详细介绍了人工智能期刊文章和会议论文的出版数据。

人工智能出版物总数

图1.1.1显示了人工智能出版物的全局计数。2010年至2022年间,人工智能出版物的总数几乎增加了两倍,从2010年的约8.8万篇增加到2022年的24万多篇。与去年相比,这一增幅仅为1.1%

按出版类型划分

图1.1.2显示了全球AI发布类型随时间的分布情况。2022年,大约有23万篇AI期刊文章,而大约有4.2万篇会议论文。自2015年以来,ai期刊和会议出版物以可比的速度增长。2022年,会议出版物和期刊出版物的数量分别是2015年的2.6倍和2.4倍。

按研究领域划分

图1.1.3显示了自2010年以来按研究领域划分的AI出版物总数。机器学习出版物在过去十年中增长最快,自2015年以来增长了近7倍。继机器学习之后,2022年发表最多的AI领域是计算机视觉(21,309篇)、模式识别(19,841篇)和流程管理(12,052篇)。


部门

本节介绍了AI出版物在全球范围内的分布情况,包括教育、政府、行业、非营利组织和其他部门,以及具体在美国、中国、欧洲联盟加联合王国的分布情况。2022年,学术部门贡献了大部分人工智能出版物(81.1%),在过去十年中保持了其在所有地区AI研究全球领先来源的地位(图1.1.4和图1.1.5)。工业参与在美国最为显著,其次是欧洲联盟加联合王国和中国(图1.1.5)。

AI期刊

图1.1.6显示了2010 - 2022年AI期刊发表总数。从2010年到2015年,AI期刊出版物的数量略有增长,但自2015年以来增长了约2.4倍。在2021年至2022年期间,AI期刊出版物增长了4.5%。

AI会议出版物

图1.1.7显示了自2010年以来AI会议出版物的总数。在过去的两年里,AI会议出版物的数量有了显著的增长,从2020年的22727篇上升到2021年的31629篇,到2022年达到41174篇。仅去年一年,AI会议出版物就增加了30.2%。自2010年以来,AI会议出版物的数量增加了一倍多。


part2


本节研究了全球AI专利的长期趋势,这可以揭示AI创新、研究和开发演变的重要见解。此外,分析AI专利可以揭示这些进步是如何在全球分布的。与出版物数据类似,AI专利数据的可用性也有明显的延迟,2022年是可访问数据的最近一年。本节数据来自CSET。

1.2 专利

AI专利

概述:

图1.2.1考察了2010年至2022年全球AI专利授权的增长情况。在过去十年中,AI专利数量显著增加,近年来增长尤为迅猛。例如,2010年至2014年间,AI专利授权总量增长了56.1%。然而,仅从2021年到2022年,AI专利数量就增长了62.7%。

按归档状态和地区划分

以下部分按AI专利的申请状态(是否授予)以及其发表的地区进行了分类。

图1.2.2按申请状态对全球AI专利进行比较。2022年,未授权的AI专利数量(128952件)是授权数量(62264件)的两倍多。随着时间的推移,AI专利审批的格局发生了显著变化。直到2015年,申请的AI专利中获得授权的比例更大。然而,从那以后,大多数AI专利申请都没有获得批准,差距显著扩大。例如,2015年,42.2%的AI专利申请未获批准。到2022年,这一数字已上升至67.4%。

在包括中国、欧盟和英国以及美国在内的所有主要专利起源地理区域,授权和未授权AI专利之间的差距都很明显

(图1.2.3)。近年来,这三个地理区域的AI专利申请总数和专利授权数量都有所增加。

图1.2.4展示了授权AI专利的区域细分。截至2022年,世界上大部分已授予的AI专利(75.2%)来自东亚和太平洋地区,北美是第二大贡献者,占21.2%。截至2011年,北美在全球AI专利数量方面处于领先地位。然而,从那时起,发生了重大转变,来自东亚和太平洋地区的AI专利比例不断增加。

按地理区域划分,世界上大多数授予的AI专利来自中国(61.1%)和美国(20.9%)(图1.2.5)。来自美国的AI专利份额从2010年的54.1%下降。

图1.2.6和图1.2.7显示了哪些国家在人均AI专利方面领先。2022年,每10万居民中获得AI专利最多的国家是韩国(10.3),其次是卢森堡(8.8)和美国(4.2)。

(图)相对于1.2.6。图1.2.7显示了2012年至2022年人均AI专利授权的变化。在此期间,新加坡、韩国和中国的人均AI专利申请量增幅最大。

2012年 与 2022年各国每 10万居民获批人工智能专利的百分比变化

part3

本节探讨AI研究的前沿。虽然每年都会推出许多新的AI模型,但只有一小部分样本代表了最先进的研究。诚然,什么是先进或前沿研究多少有些主观。前沿研究可以反映一个模型在基准上发布一个新的最先进的结果,引入一个有意义的新架构,或者行使一些令人印象深刻的新功能。

人工智能指数研究两类前沿人工智能模型的趋势:“显著模型”和基础模型人工智能指数数据提供商Epoch使用“著名的机器学习模型”一词来指定精心挑选的在人工智能/机器学习生态系统中特别有影响力的值得注意的模型。相比之下,基础模型是在大量数据集上训练的非常大的人工智能模型,能够执行大量的下游任务。基础模型的例子包括GPT-4、Claude 3和Gemini。虽然很多粉底模特可能有资格成为知名模特,但并非所有知名模特都是粉底模特。


在本节中,人工智能指数从不同的角度探讨了著名模型和基础模型的趋势,包括原始组织、原产国、参数计数和计算使用情况。分析最后对机器学习培训成本进行了考察。

1.3 前 沿 人 工 智 能 研 究

通用机器学习模型

概述

Epoch人工智能是一组致力于研究和预测先进人工智能进化的研究人员。他们维护着一个自20世纪50年代以来发布的人工智能和机器学习模型数据库,根据最先进的技术进步、历史意义或高引用率等标准选择条目。通过分析这些模型,可以全面概述近年来和过去几十年机器学习领域的演变数据集中可能缺少一些模型;然而,数据集可以相对地揭示趋势。

行 业 分 析

直到2014年,学术界主导了机器学习模型的发布。从那以后,工业界就走在了前面。2023年,工业界产生了51个值得注意的机器学习模型,而学术界只有15个(图1.3.1)。值得注意的是,2023年有21个值得注意的模型是由行业/学术合作产生的,创历史新高。

创建尖端的人工智能模型现在需要大量的数据、计算能力和财政资源,而这些在学术界是无法获得的。在去年的人工智能指数报告中,首次强调了这种向领先人工智能模型增加行业主导地位的转变。尽管今年差距略有缩小,但这一趋势在很大程度上仍然存在。

国家关系

为了说明不断变化的人工智能地缘政治格局,人工智能指数研究团队分析了著名模型的原产国。

图1.3.2显示了归因于研究人员附属机构位置的显著机器学习模型的总数

2023年,美国以61个著名机器学习模型领跑,中国以15个紧随其后,法国以8个紧随其后。自2019年以来,欧盟和英国生产的著名人工智能模型数量首次超过中国(图1.3.3)。自2003年以来,美国比英国、中国和加拿大等其他主要地理区域生产了更多的模型(图1.3.4)。


2003-23年按地理区域划分的著名机器学习模型数量 (sum)

参数的趋势

机器学习模型中的参数是在训练过程中学习到的数值,它决定了模型如何解释输入数据并进行预测。

在更多数据上训练的模型通常会比在更少数据上训练的模型有更多的参数。同样,具有更多参数的模型通常优于具有更少参数的模型。

图1.3.5展示了Epoch数据集中机器学习模型的参数计数,按模型起源的部门进行分类。自2010年代初以来,参数数量急剧上升,反映了AI模型设计任务的日益复杂、数据的可用性、硬件的改进以及更大模型的有效性。高参数模型在工业领域尤其引人注目,这凸显了OpenAI、Anthropic和Google等公司承担海量数据训练的计算成本的能力。

计算趋势

AI模型中的术语“计算”是指训练和操作机器学习模型所需的计算资源。一般是指模型的复杂程度和训练数据集的大小直接影响所需的计算量。模型越复杂,底层训练数据越大,训练所需的计算量就越大。

图1.3.6可视化了过去20年著名机器学习模型所需的训练计算量。最近,著名的AI模型的计算使用量呈指数级增长这一趋势在过去五年中尤为明显。计算需求的快速增长具有至关重要的意义。例如,需要更多计算的模型通常具有更大的环境足迹,公司通常比学术机构拥有更多的计算资源。

图1.3.7突出显示了2012年以来著名机器学习模型的训练计算。例如,AlexNet是推广使用gpu改进AI模型的标准做法的论文之一,该论文估计需要470千万亿次浮点运算来进行训练。

最初的Transformer于2017年发布,需要大约7400千万亿次浮点运算。谷歌的Gemini Ultra是目前最先进的基础模型之一,需要500亿次千万亿次浮点运算。

亮 点 :

模型会耗尽数据吗 ?

如上所示,最近很大一部分算法进步,包括强大的llm背后的进步,都是通过在越来越大的数据量上训练模型来实现的。正如Anthropic联合创始人兼AI指数指导委员会成员杰克·克拉克(Jack Clark)最近指出的那样,基金会模型已经在互联网上存在的所有数据中进行了有意义的训练。

AI模型对数据的依赖性越来越大,这引发了人们的担忧,即未来几代计算机科学家将耗尽数据,无法进一步扩展和改进他们的系统。

Epoch的研究表明,这些担忧在某种程度上是有道理的。Epoch的研究人员已经对AI研究人员可能会在何时耗尽数据进行了历史和基于计算的预测。历史预测是基于观察到的用于训练基础模型的数据规模的增长率。计算预测根据计算可用性的预测来调整历史增长率。

例如,研究人员估计,到2024年,计算机科学家可能会耗尽高质量语言数据的库存,在20年内耗尽低质量语言数据,并在2030年代末至2040年代中期耗尽图像数据(图1.3.8)。

从理论上讲,数据可用性有限的挑战可以通过使用合成来解决

类型对ML数据耗尽的预测:中位数和90% CI日期来源:Epoch2023 |表:2024 AIIndex报告


数据,这是AI模型本身产生的数据。例如,可以使用一个LLM生成的文本来训练另一个LLM。使用合成数据训练AI系统特别有吸引力,不仅因为它是潜在数据耗尽的解决方案,而且因为生成式AI系统原则上可以在自然发生的数据稀少的情况下生成数据,例如,罕见疾病或代表性不足的人口的数据。直到最近,使用合成数据训练生成式AI系统的可行性和有效性还没有得到很好的理解。然而,今年的研究表明,在合成数据上训练模型存在局限性。

例如,一个由英国和加拿大研究人员组成的团队发现,模型主要是在合成数据经验模型上训练的

崩溃,一种现象,随着时间的推移,他们失去了记住真实底层数据分布的能力,并开始产生一个狭窄的输出。图1.3.9展示了变分自编码器(VAE)模型的模型崩溃过程,变分自编码器是一种广泛使用的生成式AI架构。随着后续每一代的训练额外的合成数据,模型产生的输出越来越有限。如图1.3.10所示,从统计学角度来看,随着合成代数的增加,分布的尾部消失,代密度向均值偏移这种模式意味着,随着时间的推移,主要在合成数据上训练的模型的世代变化越来越小,分布也不那么广泛。

作者证明,这种现象发生在各种模型类型中,包括高斯混合模型和法学硕士。这项研究强调了人工生成数据对训练有能力的法学硕士的持续重要性,这些数据可以产生各种各样的内容。

在2023年发表的类似研究中使用

对于生成成像模型中的合成数据,研究人员发现,仅在合成数据周期上训练的生成图像模型——或者在真实人类数据不足的情况下训练的生成图像模型,输出质量会显著下降。作者将这种现象标记为模型自噬障碍(MAD),参考疯牛病。

该研究检查了两种类型的训练过程:完全合成,即模型完全根据合成数据进行训练,以及合成增强,其中,模型在合成数据和真实数据的混合上进行训练。在这两种场景中,随着训练代数的增加,图1.3.1

生成的图像下降。图1.3.11突出显示了使用合成数据增强的模型的退化图像世代;例如,第7步和第9步生成的人脸越来越多地显示出奇怪的hash标记。来自统计数据合成数据和合成增强循环生成的图像具有较高的FID分数(表明与真实图像的相似性较低),较低的精度分数(表明真实感或质量降低)和较低的召回分数(表明多样性降低)(图1.3.12)。而合成增强循环,其中包含了一些真实的数据显示出比完全合成环路更少的退化,但随着进一步的训练,这两种方法的收益都会递减。


基础模型

基础模型代表了一个快速发展和流行的AI模型类别。它们在庞大的数据集上训练,用途广泛,适用于众多下游应用。诸如GPT-4、Claude 3和羊驼2等基础模型展示了非凡的能力,并且越来越多地部署在现实场景中。

生态系统图于2023年推出,是斯坦福大学的一个新的社区资源,用于跟踪基础模型生态系统,包括数据集、模型和应用程序。本节使用来自生态系统图的数据来研究基础模型随时间的趋势

Model Release

基础模型可以通过不同的方式访问。无访问模型,比如谷歌的PaLM-E,只有开发者可以访问。有限访问模型,如OpenAI的GPT-4,通常通过公共API提供对模型的有限访问。开放模型,如Meta的羊驼2,完全释放模型的重量,这意味着模型可以修改和自由使用。

图1.3.13可视化了2019年以来按接入类型划分的基础模型总数。近年来,基础模型数量急剧上升,自2022年以来增长了一倍多,自2019年以来增长了近38倍。在2023年发布的149款基础款中,98款是开放的,23款是受限的,28款是不可访问的。

2023年,大多数基础模型都是开放获取的(65.8%),18.8%的模型没有访问权限,15.4%的模型有限制访问权限(图1.3.14)。从2021年开始,以开放获取方式发布的模型比例有了明显的提升。

人事关系

图1.3.15绘制了自2019年以来基金会模型的起源部门。2023年,大部分基础模型(72.5%)

来源于工业。2023年只有18.8%的基础模型来源于学术界。自2019年以来,越来越多的基础模型来自工业界。

图1.3.16突出显示了2023年发布的各种基础模型的来源 。Google推出的模型最多 (18个 ),其次是 Meta(11图1.3.16突出显示了2023年发布的各种基础模型的来源。Google推出的模型最多(18个),其次是Meta(11个)和微软(9个)。2023年发布最多基础模型的学术机构是加州大学伯克利分校(3个)。

2019年以来,Google发布的基础模型最多,共40个,其次是OpenAI, 20个(图1.3.17)。清华大学在非西方机构中脱颖而出,发布了7个基础模型,而斯坦福大学则是美国领先的学术机构,发布了5个。

国家关系

鉴于基础模型在前沿AI研究中具有相当的代表性,从地缘政治的角度来看,了解它们的国家归属是很重要的。图1.3.18、1.3.19和1.3.20可视化了各种基础模型的国家隶属关系。与本章前面提出的值得注意的模型分析一样,

如果为该模型作出贡献的研究人员隶属于总部设在该国的机构,则该模型被视为隶属于该国。

2023年,世界上大部分的基础模型都来自美国(109个),其次是中国(20个)和英国(图1.3.18)。自2019年以来,美国一直领先于大多数基础模型的起源

(图1.3.19)。

图1.3.20描绘了自2019年以来发布并归属于各自国家的基础模型的累计计数。2019年以来发布的基础模型数量最多的国家是美国(182个),其次是中国(30个)和英国(21个)。

训练费用

在关于基础模型的讨论中,一个突出的话题是它们的推测成本。虽然AI公司很少披露训练模型所涉及的费用,但人们普遍认为,这些成本高达数百万美元,而且还在上升。例如,OpenAI的首席执行官萨姆·奥特曼(Sam Altman)提到,GPT-4的培训成本超过1亿美元。培训费用的上涨实际上排除了传统的AI研究中心大学开发自己的前沿基础模型的可能性。作为回应,政策倡议,如拜登总统关于AI的行政命令,试图通过创建国家AI,在产业界和学术界之间创造公平的竞争环境研究资源,这将为非工业参与者提供进行更高级别人工智能研究所需的计算和数据。

了解训练AI模型的成本很重要,但关于这些成本的详细信息仍然很少。在去年的出版物中,人工智能指数是首批提供基础模型培训成本估算的机构之一。今年,人工智能指数与AI研究机构Epoch AI合作,大幅提高和巩固其AI培训成本估算的稳健性为了估算尖端模型的成本,Epoch团队利用与模型相关的出版物、新闻稿或技术报告中的信息,分析了训练持续时间,以及训练硬件的类型、数量和利用率

图1.3.21显示了基于云计算租赁价格的与选定AI模型相关的估计培训成本。人工智能指数的估计证实了近年来模型培训成本显著增加的怀疑。例如,2017年,最初的Transformer模型引入了支撑几乎所有现代LLM的架构,其培训成本约为900美元112019年发布的RoBERTa Large在SQuAD和GLUE等许多规范理解基准上取得了最先进的结果,其训练成本约为16万美元。时间快进到2023年,OpenAI的GPT-4和谷歌的Gemini Ultra的培训成本估计分别在7800万美元和1.91亿美元左右。

图1.3.22可视化了AI指数估算的所有AI模型的训练成本。如图所示,随着时间的推移,模型训练成本急剧增加。

正如之前的AI指数报告所述,AI模型的训练成本与其计算需求之间存在直接关联。如图1.3.23所示,具有更大计算训练需求的模型的训练成本要高得多。


part4

AI会议是研究人员展示他们的发现并与同行和合作者建立联系的重要平台。在过去的二十年里,这些会议在规模、数量和声望上都有所扩大。本节探讨出席主要AI会议的趋势。

1.4 AI会议

参加会议

图1.4.1自2010年以来AI会议的出席情况。AI指数报告称,在出席率下降(可能是由于转向完全面对面的形式)之后,从2022年到2023.12年,会议出席率有所增加,具体而言,去年总出席率增长了6.7%。自2015年以来,每年的与会者人数增加了约5万人,这不仅反映了人们对AI研究的兴趣日益浓厚,也反映了新的AI会议的出现。


神经信息处理系统(NeurIPS)仍然是参加人数最多的AI会议之一,在2023年吸引了大约16,380名参与者(图1.4.2和图1.4.3)。在主要的人工智能会议中,NeurIPS、ICML、ICCV和AAAI的出席人数逐年增加。然而,在过去的一年里,CVPR、ICRA、ICLR和IROS的出席人数略有下降。

part5

GitHub是一个基于web的平台,使个人和团队能够托管,审查和协作代码库。GitHub被软件开发人员广泛使用,有助于代码管理、项目协作和开源软件支持。本节利用来自GitHub的数据,提供了对学术出版数据中未反映的开源人工智能软件开发的更广泛趋势的见解。

1.5 开源人工智能软件

GitHub项目由一组文件组成,包括源代码、文档、配置文件和图像,这些文件共同构成了一个软件项目。图1.5.1显示了github 人工智能项目随时间变化的总数。自2011年以来,与人工智能相关的GitHub项目数量持续增长,从2011年的845个增长到2023年的180万个。值得注意的是,仅去年一年,GitHub人工智能项目总数就急剧增长了59.3%。

图1.5.2报告了2011年以来按地理区域划分的GitHub人工智能项目。截至2023年,GitHub人工智能项目的很大一部分位于美国,占贡献的22.9%。印度是第二大贡献者,占19.0%,紧随其后的是欧洲联盟和英国,占17.9%。值得注意的是,自2016年以来,美国开发者在GitHub上的人工智能项目比例一直在稳步下降。

明星

GitHub用户可以通过“点赞”来表达他们对某个存储库的兴趣,这一功能类似于在社交媒体上给帖子点赞,表示对开源项目的支持。其中最受欢迎的库是TensorFlow、OpenCV、Keras和PyTorch等库,它们在人工智能编码社区的软件开发人员中广受欢迎。例如,TensorFlow是一个用于构建和部署机器学习模型的流行库。OpenCV是一个为计算机视觉提供各种工具的平台,例如对象检测和特征提取。

GitHub上人工智能相关项目的星级总数在去年大幅增加,从2022年的400万增加到2023年的1220万,增加了两倍多(图1.5.3)。GitHub明星数量的急剧增加,以及此前报道的项目数量的增加,突显了开源人工智能软件开发的加速增长。

2023年,美国是获得GitHub星级最多的国家,共计1050万颗(图1.5.4)。包括欧盟和英国、中国和印度在内的所有主要地理区域,授予其所在国家的项目的GitHub星级总数都在逐年增加。


以上为报告简介及第一章翻译全部内容,部分翻译存在不准确之处,敬请谅解。后9期内容我们将每周为您发布。谢谢!


咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部