2025年人工智能安全指数报告.pdf下载

本报告是未来生命研究所（FLI）发布的第三期人工智能安全指数（AI Safety Index），该指数对八家领先的AI公司在管理即时危害和高级AI系统的灾难性风险方面的努力进行了独立评估。报告由AI研究员和治理专家组成的专家评审小组完成，揭示了AI行业难以跟上自身能力快速发展的步伐，在风险管理和安全规划方面存在关键差距，威胁着控制日益强大AI系统的能力。 **关键发现：** * **领先企业地位稳固，但存在退步：** Anthropic、OpenAI和Google DeepMind继续保持其领先地位，其中Anthropic在每个领域都获得最高分。Anthropic通过高透明度的风险评估、完善的安全框架、大量技术安全研究投资以及其公益性公司结构和对州级立法的支持，维持了其在安全实践方面的领导地位。然而，其最新的风险评估周期中缺失了人类能力提升试验，并且默认训练方式转向用户互动，这显示出一些退步迹象。 * **头部与第二梯队差距大，但改进迹象显现：** 头部三家公司与第二梯队（xAI、Z.ai、Meta、DeepSeek和Alibaba Cloud）之间存在显著差距。尽管如此，第二梯队公司近期采取的一些措施预示着改进，有望缩小差距。这些公司在风险评估披露、安全框架完整性和治理结构（如举报政策）方面仍存在重大不足。 * **存在主义安全是核心结构性失败：** 尽管AGI/超智能的野心在加速，但没有一家公司能够提出一个可信的计划来防止灾难性滥用或失控。在这一领域，所有公司得分均低于D。尽管一些领导者公开表达了对存在主义风险的担忧，但这些言论尚未转化为量化的安全计划或具体的对齐失败缓解策略。 * **安全实践与新兴标准存在差距：** 许多公司的安全实践未能达到欧盟AI行为准则等新兴标准。行业内普遍存在公开治理框架与实际安全实践之间的差距，公司仍未能满足独立监督、透明威胁建模、可衡量阈值和明确的缓解触发器等基本要求。 * **中国公司受国内法规推动，具备较强基线：** 尽管中国公司未进入前三名，但其在安全实践方面的一些规定受到了赞扬。国内法规，包括内容标签和事件报告的强制性要求，以及自愿性国家技术标准，为中国公司在某些指标上提供了比西方同行更强的基线责任。 **总体而言，** 报告指出，AI公司的安全承诺远远落后于其能力野心。即使是表现最佳的公司也缺乏应对强大系统的具体保障措施、独立监督和可信的长期风险管理战略，而行业其余部分在基本的透明度和治理义务方面则远远落后。这种能力与安全之间的差距，使得该行业在结构上未能为自身创造的风险做好准备。 **方法论：** * **指标：** 评估涵盖风险评估、当前危害、安全框架、存在主义安全、治理与问责、信息共享与公众沟通六个领域，共35项指标。 * **公司选择：** 包括Anthropic、OpenAI、Google DeepMind、xAI、Z.ai、Meta、DeepSeek和Alibaba Cloud。 * **数据收集：** 截至2025年11月8日，结合公开可用材料（模型卡、研究论文、基准测试结果）和公司调查问卷。 * **专家评估：** 由八位AI研究员和治理专家组成的独立小组进行评分。报告最后提供了各公司的详细排名和在各领域的表现，以及改进建议，旨在推动行业朝着更安全、更负责任的方向发展。

2025年人工智能安全指数报告.pdf

相关报告

12.4 MB 456页 2025年人工智能指数报告-斯坦福-202506.pdf

4.45 MB 298页 2025年国际人工智能安全报告.pdf

2.83 MB 36页 AI领域趋势深度洞察报告——从蛮力到智能：2025年人工智能发展的三大核心趋势.pdf

3.1 MB 28页 2025年彩妆消费趋势与指数报告-值得买-202512.pdf

3.04 MB 115页人工智能安全风险测评白皮书（2025年）.pdf

38.81 MB 59页 2025年中国出口新动能与企业信心指数报告-中国国际贸易促进委员会x毕马威-202512.pdf

6.11 MB 42页 2025年全球著名电竞城市产业发展指数与排行报告-上海市电子竞技运动协会-202512.pdf

2.82 MB 43页 2025年研究前沿热度指数报告-中国科学院x科睿唯安-202512.pdf

2.28 MB 33页 2025年中国IXI体验指数报告-益普索-202510.pdf

43.77 MB 313页 2025年人工智能现状报告(1).pdf

981.58 KB 36页中国小微经营者调查2025年二季度报告暨2025年三季度中国小微经营者信心指数报告-蚂蚁集团-202508.pdf

3.55 MB 160页 2025年AI就绪指数报告：Arm AI Readiness Index full-report.pdf

30.6 MB 76页 2025年企业初创活动指数报告.pdf

5.53 MB 53页 2025年前沿人工智能风险管理框架报告.pdf

3.02 MB 63页 2025年人工智能治理专业报告.pdf

5.56 MB 74页 2025年人工智能现状报告-建筑手册.pdf

8.76 MB 74页 2025年度全球社会进步指数报告.pdf

6.24 MB 58页 2025年中国低空经济发展指数报告.pdf

5.16 MB 34页 2025年人工智能在社交媒体管理中的专家指南报告.pdf

3.5 MB 45页 IDC-人工智能行业：2025年中国人工智能计算力发展评估报告.pdf