人工智能繪畫,驚喜伴著爭議 |
發(fā)布時間:2023-03-25 文章來源:本站 瀏覽次數(shù):2294 |
Midjourney生成的圖片“一只和汽車賽跑的貓” Midjourney生成的圖片“香港街道上的出租車”
Midjourney生成的圖片“中國情侶” 一幅由人工智能(AI)生成的“中國情侶”圖片近期在國內(nèi)外社交媒體上被普遍轉(zhuǎn)發(fā),其逼真的視覺效果令不少網(wǎng)友感慨:“AI曾經(jīng)不遜于人類畫師了。”這幅作品由AI圖片生成工具Midjourney新推出的V5版本生成,該工具是近期繼GPT-4后又一遭到關(guān)注的AI產(chǎn)品。 在承受記者采訪時,多名人工智能與互聯(lián)網(wǎng)業(yè)內(nèi)人士以為,Midjourney V5版本代表了目前生成式AI的前沿程度,其生成的圖像在某些范疇曾經(jīng)得到商用,經(jīng)過繼續(xù)學(xué)習(xí)和技術(shù)迭代,估計其才能能夠進一步加強。不過,上述人士也提到,Midjourney以及生成式AI由于經(jīng)過公開數(shù)據(jù)停止鍛煉,其生成的作品在版權(quán)等問題上存在較大爭議。 “中國情侶圖片”是如何出圈的 由美國一家工作室開發(fā)的Midjourney于去年3月初次亮相,在當(dāng)年8 月迭代至V3版本并開端引發(fā)一定的關(guān)注,而今年更新的V5版本讓Midjourney及其作品勝利“出圈”,代表作是上述的“中國情侶”圖片。 在這張圖片中,一對年輕中國情侶衣著夾克和牛仔褲坐在樓頂,背景是上世紀90年代的中國城市。由于在光影、人物細節(jié)、氣氛感等方面的出色描寫,這張圖片以至被一些網(wǎng)友以為是一張真實拍攝的老照片,而非AI生成的圖片。 據(jù)外媒報道,自上線以來,Midjourney在圖像細節(jié)上不斷在不停進步。Midjourney官方表示,V5版本的圖像質(zhì)量更高、輸出更多樣化、有更普遍的作風(fēng)、支持無縫紋理、有更寬的縱橫比、有更好的圖像提示以及更寬的動態(tài)范圍等。 此外,該版本還大幅優(yōu)化了此前無法精確生成人物手部的問題。一名運用過Midjourney的畫師通知記者,在此前版本中,Midjourney對手部描寫有很多問題,例如手指數(shù)量錯誤或形態(tài)扭曲,這也是此前分辨圖片能否為AI生成的主要判別根據(jù)。不過,Midjourney V5版本在這方面有了明顯提升,固然仍能察看到手部不自然的狀況。 在V5版本之前,Midjourney已得到一系列應(yīng)用。去年9月,一幅名為《太空歌劇院》的作品取得了美國科羅拉多州博覽會藝術(shù)競賽的金獎,這幅作品就是由Midjourney完成的。去年6月,英國雜志《經(jīng)濟學(xué)人》曾運用Midjourney設(shè)計過一期封面,以照應(yīng)“AI新前沿”的封面故事主題。 記者近日也體驗了Midjourney,該技術(shù)目前主要在通訊軟件Discord上以與“Midjourney bot”對話的方式運用。經(jīng)過輸入提示詞的方式,記者能夠讓Midjourney bot生成相應(yīng)的圖片,提示詞能夠設(shè)定很多,還能夠請求分辨率、能否寫實作風(fēng)等。通常Midjourney bot會在1分鐘左右生成4張圖片,用戶還能夠請求重重生成。 在運用過程中,記者發(fā)現(xiàn)Midjourney的另一個問題:用戶只能經(jīng)過提示詞來提出請求,但無法對圖片生成過程停止控制或修正,圖片生成更像是一個“黑盒”。因而,用戶需求不時改換或調(diào)整提示詞,讓生成的圖片更契合需求。創(chuàng)作出《太空歌劇院》的杰森·艾倫就曾對外媒透露,他總共生成了900多張圖片才選擇出稱心的作品。 背后是什么技術(shù) 業(yè)內(nèi)人士通知記者,Midjourney是一種大模型生成式AI。2015年,谷歌公司的一名研討員創(chuàng)立了首個用于藝術(shù)創(chuàng)作的機器學(xué)習(xí)應(yīng)用 DeepDream。爾后,AI圖像生成開端走進群眾視野中。 一家知名跨國企業(yè)的AI算法工程師李濤通知記者,基于擴散模型,Midjourney打造了本人的閉源模型,經(jīng)過抓取大量公開數(shù)據(jù)停止鍛煉。與此同時,Midjourney也不時搜集用戶反應(yīng)數(shù)據(jù)并對模型停止迭代,終構(gòu)成目前的成果。 擴散模型屬于一種無監(jiān)視生成模型。計算機視覺處置開源軟件庫OpenCV擔(dān)任人馬利克在承受外媒采訪時曾表示,擴散模型應(yīng)用從文本數(shù)據(jù)中取得的學(xué)問來了解單詞匯合在一同的語義,并與真實世界聯(lián)絡(luò)起來,這使AI可以在不依賴特定數(shù)據(jù)集的狀況下生成更復(fù)雜和多變的圖像。馬利克以為,擴散模型是生成式AI的嚴重進步,由于它們不依賴監(jiān)視學(xué)習(xí)。經(jīng)過應(yīng)用從無監(jiān)視學(xué)習(xí)中取得的學(xué)問,這些模型能夠生成復(fù)雜多樣的圖像,而無須手動標(biāo)志數(shù)據(jù),從而使其愈加靈敏。 一段時間以來,不少公司均推出了AI圖片生成模型或相關(guān)產(chǎn)品。近日,微軟Bing宣布接入OpenAI的AI繪畫模型DALL·E,上線了AI生勝利能,Adobe也為旗下的Firefly模型新增了AI繪圖產(chǎn)品。 “再無法置信本人的眼睛” 雖然憑仗強大的圖片生勝利能,Midjourney曾經(jīng)取得上千萬用戶,但它也遭到大量的批判與質(zhì)疑,首當(dāng)其沖的就是版權(quán)問題。 美國《福布斯》雜志網(wǎng)站稱,與一切AI圖片生成工具一樣,Midjourney從互聯(lián)網(wǎng)上搜集了大量圖像停止鍛煉,使其可以創(chuàng)作出看似全新的藝術(shù)作品,這引發(fā)了人類發(fā)明者的不滿。目前,曾經(jīng)有不少機構(gòu)和個人對Midjourney發(fā)起起訴,指控該公司涉嫌普遍地進犯版權(quán)。 另據(jù)媒體報道,美國版權(quán)局近日宣布,Midjourney等生成的AI圖像不受版權(quán)維護。在闡明文件中,美國版權(quán)局以為,經(jīng)過Midjourney等平臺自動生成的作品,在整個創(chuàng)作過程中完整由機器人自動完成,并且鍛煉的數(shù)據(jù)是基于人類創(chuàng)作的作品,因而不受版權(quán)法維護。 上海申倫律師事務(wù)所律師夏海龍對記者表示,AI生成工具給人類的版權(quán)法帶來宏大沖擊。一方面,相較海量的AI生成作品,即便其中存在侵權(quán)狀況,權(quán)益人也很難及時發(fā)現(xiàn);另一方面,在AIGC(人工智能生成內(nèi)容)時期,冗長、昂貴的司法程序招致對版權(quán)維護也會越來越力不從心。人類的版權(quán)法以及著作權(quán)維護機構(gòu)恐怕不得不作出嚴重調(diào)整。 除版權(quán)問題外,越來越逼真的AI生成內(nèi)容也讓人擔(dān)憂這些圖片、視頻可能會被用作非法用處,例如用AI生成的圖片停止狡詐。美國前總統(tǒng)特朗普日前宣布,他將于21日被拘捕。隨后,大量經(jīng)過AI生成的“特朗普被捕”圖片在社交媒體上傳播,誤導(dǎo)了一局部網(wǎng)友。 印度News18新聞網(wǎng)則提到,近期有網(wǎng)友經(jīng)過AI生成了一張美國前總統(tǒng)奧巴馬與德國前總理默克爾在海邊一同吃冰激凌的圖片,這讓人們愈加擔(dān)憂將來會呈現(xiàn)怎樣的深度造假。該網(wǎng)站征引網(wǎng)友的評論稱,“這種技術(shù)正變得越來越可怕。技術(shù)越來越完善,目前的AI能夠創(chuàng)立簡直圓滿的名人聲音或圖片,我們可能很快再無法置信本人的耳朵和眼睛。”此外,也有家長向記者表達了AI生成不當(dāng)圖片對兒童影響的擔(dān)憂。 互聯(lián)網(wǎng)專家郭濤對記者表示,當(dāng)前AIGC技術(shù)尚處于早期探究階段,相關(guān)法律法規(guī)、規(guī)范體系和倫理標(biāo)準(zhǔn)等還不健全,存在數(shù)據(jù)平安風(fēng)險、著作權(quán)侵權(quán)風(fēng)險、深度偽造風(fēng)險、商業(yè)機密泄露風(fēng)險、違法信息傳播風(fēng)險等問題。有關(guān)部門需求盡快樹立健全相關(guān)法律法規(guī)和規(guī)范體系,增強內(nèi)容檢查及內(nèi)容過濾,推進行業(yè)安康可持續(xù)開展。 |
|