自Open AI推出ChatGPT大模型以來,AI大模型進入到公眾視野,探討熱度飆升,百度、騰訊、阿里等互聯(lián)網(wǎng)巨頭也紛紛公布了其對AI大模型的投資與布局路線圖。
然而,在一片火熱中,也有不少科技巨頭表達了對AI大模型的擔憂。利用人工智能寫論文、制作虛假圖片……在給人類帶來便利的同時,“稚嫩”的人工智能技術也暴露出許多安全隱患問題。據(jù)媒體報道,被譽為“人工智能教父”的杰弗里·辛頓已從谷歌辭職,只為完全自由地談論AI大模型等人工智能技術所帶來的危險。
狂野生長的AI大模型,真的管不住了嗎?來自美國卡內基梅隆大學語言技術研究所、國際商業(yè)機器公司研究院等機構的研究人員提出了一種全新的方法——自對齊。該方法結合了原則驅動式推理和大模型的生成能力,從而使用極少的人類監(jiān)督便能實現(xiàn)AI大模型的“自我監(jiān)管”。
【資料圖】
和人類價值觀“對齊”
目前,即便是最先進的AI大模型,也無法實現(xiàn)自我監(jiān)管,仍需要依賴人類指令以及注釋進行相應的調整。
“生成式人工智能可以被看作一個預測工具,它主要依靠大量數(shù)據(jù)樣本來預測正確答案。”清華大學交叉信息研究院助理教授、人工智能國際學術交流項目主任于洋表示,所有基于數(shù)據(jù)統(tǒng)計的人工智能模型,對于“答案”的預測都必然有一定的隨機性,而這種隨機性所產(chǎn)生的偏差一旦與人類價值觀、倫理觀、道德觀以及法律法規(guī)等相悖,就需要對該模型進行監(jiān)管、完善。計算科學工作者致力于消除這類偏差,盡量使之與人類的價值觀、倫理、法律、公序良俗等相符,這被稱為“對齊”。
然而,從統(tǒng)計學的角度看,AI大模型一定會“犯錯”。因此,AI模型對齊的監(jiān)管,不應追求獲得一個不犯錯的完美AI大模型,而是要管理AI大模型產(chǎn)生違規(guī)錯誤的風險。“例如,對話類AI大模型在其對話中,是否會大量出現(xiàn)針對某個地區(qū)的地域歧視。”于洋舉例道,對于AI大模型的監(jiān)管,就是為了避免這類內容出現(xiàn)的概率過高、避免模型的答案系統(tǒng)性發(fā)生整體傾向這類偏誤。
然而,如果AI大模型嚴重依賴人類監(jiān)督,會造成成本過高、可靠性不足、存在偏向性等問題。因此,以最少的人類監(jiān)督實現(xiàn)AI大模型的自我監(jiān)督成為構建AI大模型的關鍵。
為了解決這一難題,研究人員提出了一種自對齊的新方法,僅需一個人工定義的小型原則集(規(guī)則),便能引導AI大模型生成答復的正確導向,且能顯著減少對人類監(jiān)督的需求,使其幾乎無需任何額外注釋。AI大模型可以自對齊的設計目標是開發(fā)出有用、可靠且符合人類道德觀念的AI大模型,包括在生成答案時可以反對用戶的有害詢問,并且為表示反對的背后原因提供解釋。
值得一提的是,此前一些AI大模型至少需要5萬條注釋,而整個自對齊過程所需的注釋量少于300行,監(jiān)督效率非常高,極大地降低了AI大模型對人類監(jiān)管工作的需求。
把“打罵”變?yōu)?ldquo;講道理”
那么,未來AI大模型是否可以實現(xiàn)完全的自我監(jiān)管?于洋表示,AI大模型監(jiān)管的主要方式必然是自動化、機器化、算法化的,因為AI大模型依賴海量數(shù)據(jù)支撐,僅憑人工監(jiān)管是不現(xiàn)實的。但完全的自我監(jiān)督不太可能實現(xiàn),這是因為即使AI學會了相應的人類規(guī)則,但它和人類所掌握的規(guī)則數(shù)量仍然無法比較。同時,人類的思維以及邏輯推理過程具有極高的復雜性,也是AI大模型難以真正“理解”人類的原因之一。
于洋舉了個例子,現(xiàn)在的AI大模型監(jiān)管就好比教育孩子,現(xiàn)有的人工對齊技術方案,其實都是在“打罵”孩子,也就是用獎勵和懲罰的方式訓練AI什么能做、什么不能做。而真正的教育,是要對孩子講道理,了解為什么有些事情不能做,即要讓AI理解背后的邏輯,理解人類的評判標準。這是一件很難的事情,目前大多數(shù)的AI大模型的訓練和對齊技術的開發(fā),還停留在“打罵”階段,要從“打罵”變成“講道理”,還有很長的路要走。
“除了技術人員開發(fā)教育AI合規(guī)的技術外,監(jiān)管當局也必須制度化、系統(tǒng)化地從社會合規(guī)和社會影響等方面對AI大模型進行多維度的審計和監(jiān)管。”于洋進一步解釋道,相關行業(yè)及管理部門,需要對AI大模型違背人類價值的概率,有一個系統(tǒng)化的評估,并根據(jù)AI大模型相關產(chǎn)業(yè)的發(fā)展現(xiàn)狀,調整監(jiān)管手段,有針對性地提出監(jiān)管方案,建立動態(tài)、敏捷響應技術前沿變化的監(jiān)管體系。企業(yè)也要建立專門針對AI大模型的監(jiān)管部門,來審核AI大模型中是否包含自我監(jiān)管機制,以及具體到每一個模塊將帶來哪些影響,以此盡量降低AI模型的違規(guī)風險。
此外,于洋還建議,人工智能的治理,也需要大量的公眾參與,因為和訓練模型尋找漏洞相比,在大量應用實踐中去發(fā)現(xiàn)漏洞、完善AI大模型,顯然更加高效,也能顯著降低AI大模型開發(fā)成本,推動AI大模型在各行各業(yè)的廣泛應用。
東莞市教育局東莞市財政局民辦義務教育學位補貼實施辦法為進一步落實國家進城務工人員隨遷子女 "兩為主、兩
現(xiàn)在大家基本都是通過機頂盒看電視。安裝機頂盒后,你家可以接收40、50甚至更多電視臺的電視信號。第一次使
【ITBEAR科技資訊】5月23日消息,美國聯(lián)邦法官近日駁回了一批玩家阻止微軟收購動視暴雪的請求。這些玩家擔
5月21日,中辦、國辦印發(fā)《關于推進基本養(yǎng)老服務體系建設的意見》,并首次公布《國家基本養(yǎng)老服務清單》,
【新華社酒泉5月22日電】記者從中國載人航天工程辦公室了解到,5月22日,神舟十六號載人飛船與長征二號F遙
1、瘠jí(形聲。2、從疒(chuáng),表示與疾病有關,脊聲。3、本義:身體瘦弱)同本義。4、或作“膌”[lean;thinandweak;wi
明天新股上市一覽(5月24日),星期三,共有2只新股上市,為深交所主板三聯(lián)鍛造、科創(chuàng)板航天軟件。三聯(lián)鍛造
中國石化新聞網(wǎng)訊 記者王福全 通訊員 徐鑫報道:今年以來,西北油田全力推動增儲上產(chǎn),提高油氣供給
點擊上方“碼農突圍”,馬上關注這里是碼農充電第一站,回復“666”,獲取一份專屬大禮包真愛,請設置“星
1、注冊碼CD-KEY:5RP2E-EPH3K-BR3LG-KMGTE-FN8PY5ZN2F-C6N
1、樓主你別聽一樓那位。2、我是廣州外國語學校的學生。3、那里的校風算是比較嚴,錄取分很高,特別是高中
1、1 下載太陽神三國殺,內附帶三國殺武將編輯器,可以編輯四個勢力的任何武將。2、(易操控,資源少)獲得方
1、西方的窮人與富人之間的差距也是比較大的,,也存在許多的社會矛盾 但是西方國家的社會分層與社會財富的分
今天來聊聊關于土雞蛋,價格,土雞蛋價格行情的文章,現(xiàn)在就為大家來簡單介紹下土雞蛋,價格,土雞蛋價格行
想必現(xiàn)在有很多小伙伴對于吃四世同堂海狗鞭好嗎有用嗎方面的知識都比較想要了解,那么今天小好小編就為大家
安徽安慶市正式成立“老年助餐慈善基
記者日前從安慶市民政局獲悉,該市慈善會近日設立老年助餐慈善基金,共同守護老年人舌尖上的幸福。該基金專項用于資助城鄉(xiāng)社區(qū)老年食堂、社
安徽淮北積極落實2022年電網(wǎng)防汛度汛
近日,國網(wǎng)淮北供電公司工作人員來到110千伏中泰變電站開展防汛隱患排查。該公司積極落實2022年防汛度汛措施,提前細化應急預案,推進極端
安徽全椒縣完善拓展人力信息資源助企
今年以來,全椒縣不斷完善拓展人力資源信息庫、勞務對接信息庫、企業(yè)用工需求信息庫三庫信息資源,已摸排400多家次企業(yè)缺工崗位信息1 2萬個
宿州市埇橋區(qū)柔性引進博士推進鄉(xiāng)村振
宿州市埇橋區(qū)實施博士匯工程,柔性引進29名博士擔任副鄉(xiāng)鎮(zhèn)長或園區(qū)副主任,他們將為加快產(chǎn)業(yè)發(fā)展、推進鄉(xiāng)村振興強化智力支持。目前,博士專
安徽印發(fā)出臺全面實施零基預算改革方
為進一步提高財政資源配置效率和資金使用效益,省政府印發(fā)《安徽省全面實施零基預算改革方案》,明確從編制2023年預算起,在全省范圍內全面
5月份安徽居民消費價格同比上漲2.3%
近日,國家統(tǒng)計局安徽調查總隊發(fā)布了我省5月份居民消費價格統(tǒng)計數(shù)據(jù)。統(tǒng)計顯示,我省居民消費價格同比上漲2 3%,同比漲幅比上月回落0 4個百分
安徽多種方式引導群眾防范非法集資風
合肥地鐵1號線、3號線上滾動播放防范非法集資宣傳視頻,淮南市發(fā)布《致老年群眾的一封信》……6月份是一年一度防范和處置非法集資宣傳月,今
鐵路部門持續(xù)加大長三角地區(qū)運力投放
記者從中國鐵路上海局集團有限公司獲悉,隨著上海疫情防控形勢持續(xù)向好,為進一步適應旅客出行需要,助力復工復產(chǎn),鐵路部門自6月10日起持續(xù)加
安徽六安持續(xù)精準施策全力促進工業(yè)發(fā)
六安市與蔚來汽車簽署合作協(xié)議,共建智能電動汽車零部件配套產(chǎn)業(yè)園區(qū)。該園區(qū)一期計劃2023年上半年投產(chǎn),建成后將具備年產(chǎn)30萬噸鋁壓鑄產(chǎn)能,
安徽淮北全力維護外賣送餐員合法權益
為切實防范化解新業(yè)態(tài)領域重大風險隱患,強化外賣送餐員權益保障工作,淮北市市場監(jiān)管局充分發(fā)揮職能作用,全力維護外賣送餐員合法權益。淮北
湖南漣源開展專項行動一對一為企業(yè)紓
位于漣源市的湖南三合美新材料科技有限公司,兩條生產(chǎn)線滿負荷運行,生產(chǎn)聚氨酯和巖棉復合板。因產(chǎn)品升級與產(chǎn)能擴充,急需新增兩條生產(chǎn)線,
湖南藍山縣進村入戶排查整治自建房安
老叔,這棟房屋墻體有開裂痕跡,要維修加固,安全重要!5月20日,藍山縣塔峰鎮(zhèn)果木村,黨員干部上門開展農村自建房安全隱患排查整治。連日來
一季度湖南萬元產(chǎn)值綜合能耗同比下降
近日,湖南省工業(yè)通信業(yè)節(jié)能監(jiān)察中心發(fā)布一季度全省六大高耗能行業(yè)能源消耗統(tǒng)計監(jiān)測報告。據(jù)該報告,一季度全省146家主要高耗能企業(yè)的萬元
濟南起步區(qū)一年來累計簽約優(yōu)質項目11
萬里黃河第一隧濟南黃河濟濼路隧道建成通車,占地4000余畝的新能源乘用車零部件產(chǎn)業(yè)園加快施工……記者21日采訪獲悉,建設實施方案獲批復一
山東發(fā)布通知啟動傳統(tǒng)民居保護利用試
省住房城鄉(xiāng)建設廳、省財政廳近日聯(lián)合印發(fā)《關于做好傳統(tǒng)民居保護利用試點工作的通知》,在全省部署開展傳統(tǒng)民居保護利用試點工作。此次試點