前沿模型论坛更新
编者按:今天,OpenAI、Anthropic、Google 和 Microsoft 发布了以下联合声明。
- Chris Meserole 被任命为前沿模型论坛的首任执行董事,该论坛是一个致力于确保全球前沿人工智能模型安全、负责任的开发和使用的行业机构。
- Meserole 拥有丰富的经验,专注于新兴技术及其未来应用的治理和安全。
- 今天,论坛成员与慈善合作伙伴 Patrick J. McGovern 基金会、David and Lucile Packard 基金会、Eric Schmidt 和 Jaan Tallinn 合作,承诺为新的 AI 安全基金提供超过 1000 万美元的资金,以推进对正在开发的工具的研究帮助社会有效测试和评估最有能力的人工智能模型。
今天,Anthropic、谷歌、微软和 OpenAI 宣布推选Chris Meserole为前沿模型论坛首任执行董事,并设立新的人工智能安全基金,这是一项超过 1000 万美元的倡议,旨在促进该领域的研究人工智能安全。前沿模型论坛是一个专注于确保安全和负责任地开发前沿人工智能模型的行业机构,该论坛还发布了第一个有关红队的技术工作组更新,以与更广泛的受众分享行业专业知识,同时该论坛扩大了有关负责任的人工智能治理的对话接近。
执行董事
Chris Meserole 来到前沿模型论坛,在技术政策方面拥有深厚的专业知识,他在新兴技术及其未来应用的治理和安全方面进行了广泛的研究。最近,他担任布鲁金斯学会人工智能和新兴技术计划主任。
在这个新角色中,Meserole 将负责帮助论坛履行其使命:
- 推进人工智能安全研究,促进前沿模型的负责任开发并最大程度地减少潜在风险。
- 确定前沿模型的安全最佳实践。
- 与政策制定者、学者、民间社会和其他人分享知识,推动负责任的人工智能发展。
- 支持利用人工智能解决社会最大挑战的努力。
最强大的人工智能模型为社会带来了巨大的希望,但为了实现它们的潜力,我们需要更好地了解如何安全地开发和评估它们。我很高兴能够通过前沿模型论坛接受这一挑战。
Chris Meserole,前沿模型论坛执行董事
人工智能安全基金
在过去的一年里,工业界推动了人工智能功能的显着进步。随着这些进步的加速,需要对人工智能安全进行新的学术研究。为了解决这一差距,论坛和慈善合作伙伴正在创建一个新的人工智能安全基金,该基金将支持来自世界各地附属于学术机构、研究机构和初创公司的独立研究人员。AI 安全基金的初始资金承诺来自 Anthropic、Google、Microsoft 和 OpenAI,以及我们的慈善合作伙伴 Patrick J. McGovern 基金会、David and Lucile Packard 基金会的慷慨解囊A[A]
大卫和露西尔·帕卡德基金会打算提供支持,但在分发时尚未正式承诺提供资金。
、埃里克·施密特和贾恩·塔林。初始资金总计超过 1000 万美元。我们期待其他合作伙伴的额外贡献。
今年早些时候,论坛成员在白宫签署了自愿人工智能承诺,其中包括承诺促进第三方发现和报告我们人工智能系统中的漏洞。论坛将人工智能安全基金视为履行这一承诺的重要组成部分,为外部社区提供资金,以更好地评估和理解前沿系统。关于人工智能安全和通用人工智能知识库的全球讨论将受益于更广泛的声音和观点。
该基金的主要重点将是支持红队人工智能模型新模型评估和技术的开发,以帮助开发和测试前沿系统潜在危险能力的评估技术。我们相信,增加该领域的资金将有助于提高安全标准,并为行业、政府和民间社会应对人工智能系统带来的挑战所需的缓解和控制提供见解。
该基金将在未来几个月内征集提案。Meridian Institute 将管理该基金——他们的工作将得到一个咨询委员会的支持,该委员会由独立外部专家、人工智能公司的专家以及具有资助经验的个人组成。
技术专长
在过去的几个月里,论坛致力于帮助建立一套术语、概念和流程的通用定义,以便我们有一个可以构建的基线理解。这样,研究人员、政府和其他行业同行就能够在讨论人工智能安全和治理问题时拥有相同的起点。
为了支持建立共识,论坛还致力于分享整个行业的红队最佳实践。作为起点,论坛共同制定了人工智能“红队”的通用定义,并在新的工作组更新中提供了一组共享案例研究。我们将红队定义为一种结构化流程,用于探测人工智能系统和产品,以识别有害功能、输出或基础设施威胁。我们将以这项工作为基础,并致力于共同努力,继续我们的红队工作。
我们还在开发一种新的负责任的披露流程,通过该流程,前沿人工智能实验室可以共享与前沿人工智能模型中发现的漏洞或潜在危险功能及其相关缓解措施相关的信息。一些前沿模型论坛公司已经发现了人工智能在国家安全领域的功能、趋势和缓解措施。论坛相信,我们在这一领域的综合研究可以作为前沿人工智能实验室如何完善和实施负责任的披露流程的案例研究。
下一步是什么
在接下来的几个月中,前沿模型论坛将成立一个顾问委员会,以帮助指导其战略和优先事项,代表一系列观点和专业知识。未来的版本和更新,包括有关新成员的更新,将直接来自前沿模型论坛 - 因此请继续关注他们的网站以获取更多信息。
人工智能安全基金将在未来几个月内发出第一次提案征集,我们预计拨款将在不久后发放。
前沿模型论坛还将发布更多可用的技术研究结果。
论坛很高兴与 Meserole 合作,并加深与更广泛的研究界的合作,包括 Partnership on AI、MLCommons以及其他领先的非政府组织、政府和跨国组织,以帮助实现人工智能的好处,同时促进其安全开发和使用。
您好,这是一条评论。若需要审核、编辑或删除评论,请访问仪表盘的评论界面。评论者头像来自 Gravatar。