鑒別人工智慧研究

这份数据简报由乔治城大学安全与新兴技术中心 (CSET) 发布,旨在探讨识别人工智能 (AI) 研究的不同方法,并评估这些方法在识别 AI/ML 相关文献方面的效果。简报比较了四种主要方法:关键词搜索、研究领域分类、基于 arXiv 的分类以及研究聚类,并分析了它们在 CSET 整合的学术文献语料库、AI/ML 会议出版物和 arXiv 预印本上的表现。
核心发现包括:
* **方法选择至关重要:** 不同的方法在识别 AI/ML 相关文献方面存在显著差异,选择哪种方法会对分析结果产生影响。
* **arXiv 分类器表现最佳(英文):** 对于英语文献,经过 arXiv 专家标签微调的 SPECTER-based transformer 模型表现优于其他方法,在精确度和召回率方面均表现出色。
* **跨语言方法:** 对于包含中文的文献,建议首先使用 arXiv 分类器处理英文文本,然后对中文文本进行关键词搜索。
* **关键词搜索的局限性:** 虽然关键词搜索实施门槛较低,但难以维护,且容易受到术语漂移的影响。此外,关键词搜索在 arXiv 语料库中的表现最差。
* **研究领域分类的优势:** 研究领域分类能够识别应用领域中的 AI/ML 研究,例如在生物技术研究和开发中使用 AI/ML 技术。
* **研究聚类方法的优势:** 研究聚类方法可以通过引用网络扩展到英语和中文以外的语言。
* **语料库差异的影响:** 分析机构在考察作者所属机构时,需要注意不同方法对AI/ML研究识别的语言和地域差异。
简报强调,研究人员和政策制定者在识别 AI/ML 相关文献时应谨慎选择方法,并充分了解每种方法的优势和局限性。 arXiv 分类器由于其性能和对更新的专家标签的支持,被推荐用于识别英语 AI/ML 相关出版物。关键词搜索在英文结果中可能需要手动审查。
相关报告
-
1.73 MB 13页 人工智能伦理风险与治理研究.pdf
-
2.14 MB 13页 人工智能赋能下的全球知识工作者工作方式变革研究.pdf
-
11.6 MB 83页 智慧工地整体解决方案.pdf
-
1.06 MB 45页 智慧银行:以人工智能驱动转型并创造价值.pdf
-
9.41 MB 38页 人工智能+”时代公共云发展模式与路径研究研究报告.pdf
-
4.36 MB 49页 智慧工厂智慧安防监管平台建设方案.pdf
-
5.14 MB 43页 智慧工地的现状及发展趋势.pdf
-
3.37 MB 33页 2024人工智能开源大模型生态研究-甲子光年.pdf
-
806.09 KB 68页 大视研究:中国人工智能(AI)2024各行业应用研究报告.pdf
-
1.85 MB 18页 艾瑞咨询:互利共赢,重振增长+-+分期免息工具价值研究白皮书 -.pdf
-
1.08 MB 17页 埃森哲:智慧医疗新引擎——数字医疗工具应时而起-15页.pdf
-
1.98 MB 106页 2022人工智能产业政策研究及法律风险防控白皮书.pdf
-
3.67 MB 26页 智慧工厂解决方案(智慧工厂精益生产).pdf
-
4.81 MB 36页 电子行业深度研究:人工智能加速发展,电子通信硬件迎来发展新机遇
-
1.37 MB 14页 军工行业研究:航空中上游企业高增长持续,美国24财年国防预算规模创新高
-
3.93 MB 25页 基础化工行业研究:需求持续扰动产品价格,光刻胶板块继续强势
-
1.96 MB 15页 前瞻研究全球人工智能AI行业证券研究报告4:GPT_4发布,持续逼近通用人工智能AGI
-
886.69 KB 9页 人工智能算法之多目标进化算法的研究与进展_崔逊学.pdf
-
1.57 MB 15页 机械行业研究:挖机需求有望进入筑底阶段,23年工程机械景气度回升-国金证券.pdf