用主动进攻确保AI安全，微软披露其“AI红队”细节

用主动进攻确保AI安全，微软披露其“AI红队”细节 | 最前线

来源: 36氪新媒体时间：2023-08-12 09:10:26

作者 | 周愚

(相关资料图)

编辑 | 邓咏仪

人工智能巨大的潜在风险正在不断浮现。在监管脚步逼近之际，如今美国的科技巨头们，不得不在激烈的AI竞赛中分神应对。

美国时间8月7日，微软在其官网发文，公布了其内部人工智能“红队”的相关细节。该团队于2018年正式成立，由一群跨学科专家组成，目的是揭露人工智能系统存在的漏洞。

这一举措意在应对如今的监管要求。7月下旬，包括微软在内的7家人工智能领域巨头，在白宫做出的集体承诺中就提及，在发布AI模型之前，将对其进行内部和外部的安全测试，即“红队测试”。

“红队”，就是指对模型进行渗透测试的攻击方。在AI的“红队测试”中，AI作为防守方，而红队成员则需要模拟现实世界中可能存在的对手及其工具、策略和过程，对AI进攻，以识别风险并改进系统的整体安全状态。

具体而言，微软将AI红队的关键经验，归结为如下五点：

AI红队更具扩张性：应对的安全问题更多更复杂，还需要探索公平性问题、有害内容等。

AI红队需要同时关注恶意和善意的使用者：除恶意对手会利用漏洞破坏AI系统，普通用户在交互过程中也会产生问题和有害内容。

AI系统在不断发展：AI系统的变化速度比传统应用更快，需要进行多轮红队测试，建立系统化、自动化的测量和监测系统。

AI系统红队测试需要多次尝试：生成式人工智能系统的结果是概率性的，因此可能需要多次尝试，才能发现问题。

减少AI问题需要深度防御：修复通过AI红队发现的故障需要深度防御方法，包括使用分类器标记潜在的有害内容，使用元提示符指导行为以限制会话漂移等。

来源：微软

事实上，“红队”并非是人工智能时代的新术语，但AI红队在工作方式上与传统红队却有显著差异。

“我们在大型语言模型上看到了一些新颖的攻击——只需要一个满嘴脏话的青少年，或是一个使用浏览器的休闲用户，我们不想忽视它。”微软人工智能红队创始人库马尔表示。

“如果你只把人工智能红队看作传统的红队，那可能还不够。不仅要考虑安全问题，还要考虑负责任的人工智能问题。”库马尔表示。不过，他也承认，提出这种区别需要时间，AI红队的许多早期工作仍然与发布传统的安全工具有关。

2020年10月，微软与MITRE等合作伙伴共同开发并发布了对抗性机器学习威胁矩阵(Adversarial Machine Learning Threat Matrix)，供安全分析师检测、响应和修复AI威胁。同年，微软研发并开源了Counterfit——一项用于人工智能系统安全测试的自动化工具。

2021年，微软发布了人工智能安全风险评估框架，并对Counterfit进行了更新。

微软还表示，在今年早些时候，已经将Counterfit集成到了MITRE工具中，并与hug Face合作开发了一款人工智能的安全扫描仪，可在GitHub上获取。

微软人工智能红”的发展历程。来源：微软

标签：

上一篇：弱电线槽（关于弱电线槽的介绍）

下一篇：最后一页

精彩推送

用主动进攻确保AI安全，微软披露其“AI红队”细节 | 最前线

作者|周愚编辑|邓咏仪人工智能巨大的潜在风险正在不断浮现。在监管脚步

来源：36氪新媒体时间：2023-08-12 09:10:26
弱电线槽（关于弱电线槽的介绍）
诚志股份08月11日获深股通增持70.71万股

08月11日，诚志股份获深股通增持万股，已连续5日获深股通增持，共计万

来源：东方财富Choice数据时间：2023-08-12 07:40:28
股票行情快报：凯普生物（300639）8月11日主力资金净买入395.79万元
盛美上海（688082）：8月11日北向资金减持7.93万股

8月11日北向资金减持7 93万股盛美上海。近5个交易日中，获北向资金减持

来源：证券之星时间：2023-08-12 05:13:44
股票行情快报：爱克股份（300889）8月11日主力资金净卖出291.35万元
华润材料（301090）周评：本周跌2.78%，主力资金合计净流出1143.58万元

截至2023年8月11日收盘，华润材料（301090）报收于10 51元，较上周的10

来源：证券之星时间：2023-08-12 00:19:51
广东鸿图最新公告：启动武汉二期项目设备投资
【pc】尘封大陆|Atlas Fallen解压即撸

【游戏介绍】《尘封大陆》游戏中，于尘埃中崛起，在这片永恒之地上御沙

来源：哔哩哔哩时间：2023-08-11 21:21:37
美丽的错误（美丽的）
什么是博客?什么是微博（什么是博客）

大家好,小乐来为大家解答以上的问题。什么是博客?什么是微博，什么是博

来源：乐拇指时间：2023-08-11 19:54:19
上海国际能源交易中心开展集运指数（欧线）期货品种做市商招募工作
圣诺生物：司美格鲁肽现处于临床前研究阶段

圣诺生物公告，公司关注到，近期市场面对糖尿病和减重治疗药物利拉鲁肽

来源：可来股吧时间：2023-08-11 18:45:00
铆足干劲促发展实干笃行谱新篇——新区深入推进“三抓三促”行动为高质量发展赋能
大宗交易：芯朋微成交374.16万元，成交价62.36元（08-11）

2023年8月11日，芯朋微发生1笔大宗交易，总成交6万股，成交金额374 16

来源：东方财富Choice数据时间：2023-08-11 17:17:08
重庆建工(600939.SH)上半年累计新签合同金额289.31亿元同比减少约17.14%
万容调研“2335”现代制造业集群体系建设

8月7日，区委副书记、区长万容率队到我区部分重点企业，调研“2335”现

来源：荣昌新闻网时间：2023-08-11 16:22:04
2023腾讯视频动漫大赏开幕，国漫《天影》惊艳亮相
瑞银：维持华虹半导体(01347)“沽售”评级目标价降至15.5港元

瑞银发布研究报告称，考虑到华虹半导体(01347)毛利结构不利因素，以及

来源：亚汇网时间：2023-08-11 15:34:50
小米 Redmi 12 手机上架：骁龙 4 Gen 2 处理器，双面玻璃机身
油气板块持续走低十余股跌超5%

油气股盘中持续走低，成都燃气、深圳燃气、佛然能源、蓝焰控股、中泰股

来源：万隆证券网时间：2023-08-11 13:41:13
“月球-25”号成功升空！时隔近半个世纪后俄罗斯将重返月球
深圳报业集团出版《午后的空旷》，路也讲授《创意写作》

8月10日，2023年深圳报业集团“湾区传媒会客厅”第一期活动在商报大厦2

来源：读特客户端时间：2023-08-11 12:11:16
养老行业市场发展黄金时代来临 2023年中国养老型酒店行业发展分析
官宣！舍得酒将携手上海“最美退役军人”敖长生放歌“舍得之夜”

用歌声讲好中国故事，以乐章传递舍得精神。由“舍得酒”独家冠名的“舍

来源：腾讯网时间：2023-08-11 11:18:38
“先诊疗后付费”如何更好推行
临泉县艾亭镇开展“八一”慰问立功军人家属活动

为大力弘扬拥军优属、拥政爱民的光荣传统，扎实做好“八一”期间的双拥

来源：安徽科技报时间：2023-08-11 10:29:42
腾势N7作为比亚迪第500万辆新能源汽车交付至得到App创始人罗振宇
德阳市罗江区鄢家镇第63届鸽子会顺利举行

8月10日，一年一度的鸽子会在德阳市罗江区鄢家镇柚乡广场顺利举行。本

来源：本站原创时间：2023-08-11 09:44:38
蕾奥规划8月11日快速上涨
济郑高铁与济南铁路枢纽实现互联互通

工人日报-中工网记者邓崎凡通讯员薛冰邵帅董玉记者从中国铁路济南局

来源：工人日报客户端时间：2023-08-11 08:45:49
海思科08月10日被深股通减持1.22万股
第三批出境团队游国家名单公布旅游平台咨询量大增

文化和旅游部10日发布通知，即日起恢复出境团队游的第三批名单，新增名

来源：央视网时间：2023-08-11 07:57:52
美国罕见地从波兰进口小麦，运抵休斯顿港却被阻止卸货
房地产经纪人执业资格证书哪里发_房地产经纪人执业资格证书

1、国家法规的有关规定根据国家工商局颁布的《经纪人管理办法》规定：

来源：互联网时间：2023-08-11 05:10:01
卤牛肉的香料包可以卤猪头肉吗?
动漫大全速速动漫飞极速飞速动漫网

1、先下载raysource软件（在百度上搜索一下）安装后进入网址，在右侧点

来源：城市网时间：2023-08-10 23:14:24
康恩贝：公司的中成药和饮片暂无提价计划
罗马体育报：“国际米兰4-3逆转萨尔茨堡红牛，新...

罗马体育报：“国际米兰4-3逆转萨尔茨堡红牛，新加盟的主力门将索默踢

来源：懂球帝时间：2023-08-10 21:52:49
湖南裕能：拟定增募资不超过65亿元
暑期档多部国产影片引发话题效应呈现供给和需求端双重修复

2023年暑期档（6 1-8 31），多部国产影片引发话题效应，市场表现格外亮

来源：金证研时间：2023-08-10 20:53:57
《博德之门3》地狱铁位置一览
春节前珠海出入境大厅什么时候放假？最晚什么时候可以去办理去澳门的签证（正规的非地下签）

一、春节前珠海出入境大厅什么时候放假？最晚什么时候可以去办理去澳门

来源：环球旅程网时间：2023-08-10 19:04:27
注册会计师考试内容及时间安排
金十期货整理|全国建材成交量数据8月10日：建材成交量为13.12万吨，环比上个交易日减少13.8%。8月9日

金十期货整理|全国建材成交量数据8月10日：建材成交量为13 12万吨，环

来源：和讯时间：2023-08-10 18:02:37
注意！海泰科将于9月1日召开股东大会
中芯国际：2023年Q2毛利为3.165亿美元2023年第一季为3.047亿美元2022年第二季为7.505亿美元

【中芯国际：2023年Q2毛利为3 165亿美元2023年第一季为3 047亿美元2022

来源：互联网时间：2023-08-10 17:03:27
23张家城投SCP004票面利率为2.4900%
河北滦平发现明代戚继光督建长城石碑

近日，河北省滦平县金山岭长城文物保护中心工作人员在对县域内的五道梁

来源：新华社时间：2023-08-10 15:43:19
即将推出的MahindraXUV700将提供11种变体