新京報貝殼財經(jīng)訊(記者羅亦丹)北京時間1月24日,OpenAI首席執(zhí)行官山姆·奧特曼現(xiàn)身直播間,演示了OpenAI的新智能體Operator(操作員)。根據(jù)演示,該智能體可以在用戶向電腦端輸入一段需求后,自動開始執(zhí)行任務(wù)。用戶即便“放開雙手”,智能體也可以自動執(zhí)行下去,其所有操作可以在桌面上顯示。


OpenAI首席執(zhí)行官山姆·奧特曼(左1)在直播中 來源:官方直播視頻截圖


例如,當(dāng)直播人員在對話框中輸入去某飯店訂桌的需求后,Operator自動打開網(wǎng)頁進(jìn)入了預(yù)訂網(wǎng)站,搜索到餐廳并完成了網(wǎng)上預(yù)訂。而上傳一張寫有“雞蛋、蘑菇”等食物的購物清單后,Operator就自動打開了瀏覽器去買菜網(wǎng)站上進(jìn)行搜索并將這些食物放進(jìn)了購物車。不過值得注意的是,在付款環(huán)節(jié)其會要求用戶手動操作。


山姆·奧特曼表示,Operator的發(fā)布是OpenAI進(jìn)入Level 3(等級三)的開始,在未來幾周和幾個月內(nèi)還將推出更多智能體。根據(jù)此前OpenAI發(fā)布的“從人工智能到通用人工智能的五個等級”,等級三是智能體,等級四是可以進(jìn)行創(chuàng)新的人工智能,等級五則是能夠完成組織工作的人工智能。


不過,值得注意的是,在OpenAI發(fā)布Operator前一天,國內(nèi)AI“六小虎”之一的智譜更新了其電腦智能體大模型GLM-PC(中文昵稱為牛牛),該AI代理智能體早在去年11月就已經(jīng)開放內(nèi)測,并在今年1月23日進(jìn)行了深度思考模式的更新。有開發(fā)者對貝殼財經(jīng)記者表示,Operator在視頻中所展示的內(nèi)容,GLM-PC也完全可以做到。


二者的相同之處在于, 輸入的模態(tài)(圖像感知)、輸出的操作空間(點(diǎn)擊、滾動、輸入)一致,并且都做了敏感性檢測,讓用戶在敏感時刻(例如確認(rèn)提交等)接盤操作,以及都有推理和一定程度的自反饋。不同之處在于,Operator現(xiàn)階段主要針對網(wǎng)頁,而GLM-PC針對電腦的任何操作(也包括瀏覽器)。


編輯 王進(jìn)雨

校對 柳寶慶