自Open AI推出ChatGPT大模型以来,AI大模型进入到公众视野,探讨热度飙升,百度、腾讯、阿里等互联网巨头也纷纷公布了其对AI大模型的投资与布局路线图。
然而,在一片火热中,也有不少科技巨头表达了对AI大模型的担忧。利用人工智能写论文、制作虚假图片……在给人类带来便利的同时,“稚嫩”的人工智能技术也暴露出许多安全隐患问题。据媒体报道,被誉为“人工智能教父”的杰弗里·辛顿已从谷歌辞职,只为完全自由地谈论AI大模型等人工智能技术所带来的危险。
狂野生长的AI大模型,真的管不住了吗?来自美国卡内基梅隆大学语言技术研究所、国际商业机器公司研究院等机构的研究人员提出了一种全新的方法——自对齐。该方法结合了原则驱动式推理和大模型的生成能力,从而使用极少的人类监督便能实现AI大模型的“自我监管”。
【资料图】
和人类价值观“对齐”
目前,即便是最先进的AI大模型,也无法实现自我监管,仍需要依赖人类指令以及注释进行相应的调整。
“生成式人工智能可以被看作一个预测工具,它主要依靠大量数据样本来预测正确答案。”清华大学交叉信息研究院助理教授、人工智能国际学术交流项目主任于洋表示,所有基于数据统计的人工智能模型,对于“答案”的预测都必然有一定的随机性,而这种随机性所产生的偏差一旦与人类价值观、伦理观、道德观以及法律法规等相悖,就需要对该模型进行监管、完善。计算科学工作者致力于消除这类偏差,尽量使之与人类的价值观、伦理、法律、公序良俗等相符,这被称为“对齐”。
然而,从统计学的角度看,AI大模型一定会“犯错”。因此,AI模型对齐的监管,不应追求获得一个不犯错的完美AI大模型,而是要管理AI大模型产生违规错误的风险。“例如,对话类AI大模型在其对话中,是否会大量出现针对某个地区的地域歧视。”于洋举例道,对于AI大模型的监管,就是为了避免这类内容出现的概率过高、避免模型的答案系统性发生整体倾向这类偏误。
然而,如果AI大模型严重依赖人类监督,会造成成本过高、可靠性不足、存在偏向性等问题。因此,以最少的人类监督实现AI大模型的自我监督成为构建AI大模型的关键。
为了解决这一难题,研究人员提出了一种自对齐的新方法,仅需一个人工定义的小型原则集(规则),便能引导AI大模型生成答复的正确导向,且能显著减少对人类监督的需求,使其几乎无需任何额外注释。AI大模型可以自对齐的设计目标是开发出有用、可靠且符合人类道德观念的AI大模型,包括在生成答案时可以反对用户的有害询问,并且为表示反对的背后原因提供解释。
值得一提的是,此前一些AI大模型至少需要5万条注释,而整个自对齐过程所需的注释量少于300行,监督效率非常高,极大地降低了AI大模型对人类监管工作的需求。
把“打骂”变为“讲道理”
那么,未来AI大模型是否可以实现完全的自我监管?于洋表示,AI大模型监管的主要方式必然是自动化、机器化、算法化的,因为AI大模型依赖海量数据支撑,仅凭人工监管是不现实的。但完全的自我监督不太可能实现,这是因为即使AI学会了相应的人类规则,但它和人类所掌握的规则数量仍然无法比较。同时,人类的思维以及逻辑推理过程具有极高的复杂性,也是AI大模型难以真正“理解”人类的原因之一。
于洋举了个例子,现在的AI大模型监管就好比教育孩子,现有的人工对齐技术方案,其实都是在“打骂”孩子,也就是用奖励和惩罚的方式训练AI什么能做、什么不能做。而真正的教育,是要对孩子讲道理,了解为什么有些事情不能做,即要让AI理解背后的逻辑,理解人类的评判标准。这是一件很难的事情,目前大多数的AI大模型的训练和对齐技术的开发,还停留在“打骂”阶段,要从“打骂”变成“讲道理”,还有很长的路要走。
“除了技术人员开发教育AI合规的技术外,监管当局也必须制度化、系统化地从社会合规和社会影响等方面对AI大模型进行多维度的审计和监管。”于洋进一步解释道,相关行业及管理部门,需要对AI大模型违背人类价值的概率,有一个系统化的评估,并根据AI大模型相关产业的发展现状,调整监管手段,有针对性地提出监管方案,建立动态、敏捷响应技术前沿变化的监管体系。企业也要建立专门针对AI大模型的监管部门,来审核AI大模型中是否包含自我监管机制,以及具体到每一个模块将带来哪些影响,以此尽量降低AI模型的违规风险。
此外,于洋还建议,人工智能的治理,也需要大量的公众参与,因为和训练模型寻找漏洞相比,在大量应用实践中去发现漏洞、完善AI大模型,显然更加高效,也能显著降低AI大模型开发成本,推动AI大模型在各行各业的广泛应用。
东莞市教育局东莞市财政局民办义务教育学位补贴实施办法为进一步落实国家进城务工人员随迁子女 "两为主、两
现在大家基本都是通过机顶盒看电视。安装机顶盒后,你家可以接收40、50甚至更多电视台的电视信号。第一次使
【ITBEAR科技资讯】5月23日消息,美国联邦法官近日驳回了一批玩家阻止微软收购动视暴雪的请求。这些玩家担
5月21日,中办、国办印发《关于推进基本养老服务体系建设的意见》,并首次公布《国家基本养老服务清单》,
【新华社酒泉5月22日电】记者从中国载人航天工程办公室了解到,5月22日,神舟十六号载人飞船与长征二号F遥
1、瘠jí(形声。2、从疒(chuáng),表示与疾病有关,脊声。3、本义:身体瘦弱)同本义。4、或作“膌”[lean;thinandweak;wi
明天新股上市一览(5月24日),星期三,共有2只新股上市,为深交所主板三联锻造、科创板航天软件。三联锻造
中国石化新闻网讯 记者王福全 通讯员 徐鑫报道:今年以来,西北油田全力推动增储上产,提高油气供给
点击上方“码农突围”,马上关注这里是码农充电第一站,回复“666”,获取一份专属大礼包真爱,请设置“星
1、注册码CD-KEY:5RP2E-EPH3K-BR3LG-KMGTE-FN8PY5ZN2F-C6N
1、楼主你别听一楼那位。2、我是广州外国语学校的学生。3、那里的校风算是比较严,录取分很高,特别是高中
1、1 下载太阳神三国杀,内附带三国杀武将编辑器,可以编辑四个势力的任何武将。2、(易操控,资源少)获得方
1、西方的穷人与富人之间的差距也是比较大的,,也存在许多的社会矛盾 但是西方国家的社会分层与社会财富的分
今天来聊聊关于土鸡蛋,价格,土鸡蛋价格行情的文章,现在就为大家来简单介绍下土鸡蛋,价格,土鸡蛋价格行
想必现在有很多小伙伴对于吃四世同堂海狗鞭好吗有用吗方面的知识都比较想要了解,那么今天小好小编就为大家
安徽安庆市正式成立“老年助餐慈善基
记者日前从安庆市民政局获悉,该市慈善会近日设立老年助餐慈善基金,共同守护老年人舌尖上的幸福。该基金专项用于资助城乡社区老年食堂、社
安徽淮北积极落实2022年电网防汛度汛
近日,国网淮北供电公司工作人员来到110千伏中泰变电站开展防汛隐患排查。该公司积极落实2022年防汛度汛措施,提前细化应急预案,推进极端
安徽全椒县完善拓展人力信息资源助企
今年以来,全椒县不断完善拓展人力资源信息库、劳务对接信息库、企业用工需求信息库三库信息资源,已摸排400多家次企业缺工岗位信息1 2万个
宿州市埇桥区柔性引进博士推进乡村振
宿州市埇桥区实施博士汇工程,柔性引进29名博士担任副乡镇长或园区副主任,他们将为加快产业发展、推进乡村振兴强化智力支持。目前,博士专
安徽印发出台全面实施零基预算改革方
为进一步提高财政资源配置效率和资金使用效益,省政府印发《安徽省全面实施零基预算改革方案》,明确从编制2023年预算起,在全省范围内全面
5月份安徽居民消费价格同比上涨2.3%
近日,国家统计局安徽调查总队发布了我省5月份居民消费价格统计数据。统计显示,我省居民消费价格同比上涨2 3%,同比涨幅比上月回落0 4个百分
安徽多种方式引导群众防范非法集资风
合肥地铁1号线、3号线上滚动播放防范非法集资宣传视频,淮南市发布《致老年群众的一封信》……6月份是一年一度防范和处置非法集资宣传月,今
铁路部门持续加大长三角地区运力投放
记者从中国铁路上海局集团有限公司获悉,随着上海疫情防控形势持续向好,为进一步适应旅客出行需要,助力复工复产,铁路部门自6月10日起持续加
安徽六安持续精准施策全力促进工业发
六安市与蔚来汽车签署合作协议,共建智能电动汽车零部件配套产业园区。该园区一期计划2023年上半年投产,建成后将具备年产30万吨铝压铸产能,
安徽淮北全力维护外卖送餐员合法权益
为切实防范化解新业态领域重大风险隐患,强化外卖送餐员权益保障工作,淮北市市场监管局充分发挥职能作用,全力维护外卖送餐员合法权益。淮北
湖南涟源开展专项行动一对一为企业纾
位于涟源市的湖南三合美新材料科技有限公司,两条生产线满负荷运行,生产聚氨酯和岩棉复合板。因产品升级与产能扩充,急需新增两条生产线,
湖南蓝山县进村入户排查整治自建房安
老叔,这栋房屋墙体有开裂痕迹,要维修加固,安全重要!5月20日,蓝山县塔峰镇果木村,党员干部上门开展农村自建房安全隐患排查整治。连日来
一季度湖南万元产值综合能耗同比下降
近日,湖南省工业通信业节能监察中心发布一季度全省六大高耗能行业能源消耗统计监测报告。据该报告,一季度全省146家主要高耗能企业的万元
济南起步区一年来累计签约优质项目11
万里黄河第一隧济南黄河济泺路隧道建成通车,占地4000余亩的新能源乘用车零部件产业园加快施工……记者21日采访获悉,建设实施方案获批复一
山东发布通知启动传统民居保护利用试
省住房城乡建设厅、省财政厅近日联合印发《关于做好传统民居保护利用试点工作的通知》,在全省部署开展传统民居保护利用试点工作。此次试点