人工智能繪畫，驚喜伴著爭議

發(fā)布時間：2023-03-25 文章來源：本站瀏覽次數(shù)：2294

Midjourney生成的圖片“一只和汽車賽跑的貓”

Midjourney生成的圖片“香港街道上的出租車”

Midjourney生成的圖片“中國情侶”

一幅由人工智能（AI）生成的“中國情侶”圖片近期在國內(nèi)外社交媒體上被普遍轉(zhuǎn)發(fā)，其逼真的視覺效果令不少網(wǎng)友感慨：“AI曾經(jīng)不遜于人類畫師了。”這幅作品由AI圖片生成工具Midjourney新推出的V5版本生成，該工具是近期繼GPT-4后又一遭到關(guān)注的AI產(chǎn)品。

在承受記者采訪時，多名人工智能與互聯(lián)網(wǎng)業(yè)內(nèi)人士以為，Midjourney V5版本代表了目前生成式AI的前沿程度，其生成的圖像在某些范疇曾經(jīng)得到商用，經(jīng)過繼續(xù)學(xué)習(xí)和技術(shù)迭代，估計其才能能夠進一步加強。不過，上述人士也提到，Midjourney以及生成式AI由于經(jīng)過公開數(shù)據(jù)停止鍛煉，其生成的作品在版權(quán)等問題上存在較大爭議。

“中國情侶圖片”是如何出圈的

由美國一家工作室開發(fā)的Midjourney于去年3月初次亮相，在當(dāng)年8 月迭代至V3版本并開端引發(fā)一定的關(guān)注，而今年更新的V5版本讓Midjourney及其作品勝利“出圈”，代表作是上述的“中國情侶”圖片。

在這張圖片中，一對年輕中國情侶衣著夾克和牛仔褲坐在樓頂，背景是上世紀90年代的中國城市。由于在光影、人物細節(jié)、氣氛感等方面的出色描寫，這張圖片以至被一些網(wǎng)友以為是一張真實拍攝的老照片，而非AI生成的圖片。

據(jù)外媒報道，自上線以來，Midjourney在圖像細節(jié)上不斷在不停進步。Midjourney官方表示，V5版本的圖像質(zhì)量更高、輸出更多樣化、有更普遍的作風(fēng)、支持無縫紋理、有更寬的縱橫比、有更好的圖像提示以及更寬的動態(tài)范圍等。

此外，該版本還大幅優(yōu)化了此前無法精確生成人物手部的問題。一名運用過Midjourney的畫師通知記者，在此前版本中，Midjourney對手部描寫有很多問題，例如手指數(shù)量錯誤或形態(tài)扭曲，這也是此前分辨圖片能否為AI生成的主要判別根據(jù)。不過，Midjourney V5版本在這方面有了明顯提升，固然仍能察看到手部不自然的狀況。

在V5版本之前，Midjourney已得到一系列應(yīng)用。去年9月，一幅名為《太空歌劇院》的作品取得了美國科羅拉多州博覽會藝術(shù)競賽的金獎，這幅作品就是由Midjourney完成的。去年6月，英國雜志《經(jīng)濟學(xué)人》曾運用Midjourney設(shè)計過一期封面，以照應(yīng)“AI新前沿”的封面故事主題。

記者近日也體驗了Midjourney，該技術(shù)目前主要在通訊軟件Discord上以與“Midjourney bot”對話的方式運用。經(jīng)過輸入提示詞的方式，記者能夠讓Midjourney bot生成相應(yīng)的圖片，提示詞能夠設(shè)定很多，還能夠請求分辨率、能否寫實作風(fēng)等。通常Midjourney bot會在1分鐘左右生成4張圖片，用戶還能夠請求重重生成。

在運用過程中，記者發(fā)現(xiàn)Midjourney的另一個問題：用戶只能經(jīng)過提示詞來提出請求，但無法對圖片生成過程停止控制或修正，圖片生成更像是一個“黑盒”。因而，用戶需求不時改換或調(diào)整提示詞，讓生成的圖片更契合需求。創(chuàng)作出《太空歌劇院》的杰森·艾倫就曾對外媒透露，他總共生成了900多張圖片才選擇出稱心的作品。

背后是什么技術(shù)

業(yè)內(nèi)人士通知記者，Midjourney是一種大模型生成式AI。2015年，谷歌公司的一名研討員創(chuàng)立了首個用于藝術(shù)創(chuàng)作的機器學(xué)習(xí)應(yīng)用 DeepDream。爾后，AI圖像生成開端走進群眾視野中。

一家知名跨國企業(yè)的AI算法工程師李濤通知記者，基于擴散模型，Midjourney打造了本人的閉源模型，經(jīng)過抓取大量公開數(shù)據(jù)停止鍛煉。與此同時，Midjourney也不時搜集用戶反應(yīng)數(shù)據(jù)并對模型停止迭代，終構(gòu)成目前的成果。

擴散模型屬于一種無監(jiān)視生成模型。計算機視覺處置開源軟件庫OpenCV擔(dān)任人馬利克在承受外媒采訪時曾表示，擴散模型應(yīng)用從文本數(shù)據(jù)中取得的學(xué)問來了解單詞匯合在一同的語義，并與真實世界聯(lián)絡(luò)起來，這使AI可以在不依賴特定數(shù)據(jù)集的狀況下生成更復(fù)雜和多變的圖像。馬利克以為，擴散模型是生成式AI的嚴重進步，由于它們不依賴監(jiān)視學(xué)習(xí)。經(jīng)過應(yīng)用從無監(jiān)視學(xué)習(xí)中取得的學(xué)問，這些模型能夠生成復(fù)雜多樣的圖像，而無須手動標(biāo)志數(shù)據(jù)，從而使其愈加靈敏。

一段時間以來，不少公司均推出了AI圖片生成模型或相關(guān)產(chǎn)品。近日，微軟Bing宣布接入OpenAI的AI繪畫模型DALL·E，上線了AI生勝利能，Adobe也為旗下的Firefly模型新增了AI繪圖產(chǎn)品。

“再無法置信本人的眼睛”

雖然憑仗強大的圖片生勝利能，Midjourney曾經(jīng)取得上千萬用戶，但它也遭到大量的批判與質(zhì)疑，首當(dāng)其沖的就是版權(quán)問題。

美國《福布斯》雜志網(wǎng)站稱，與一切AI圖片生成工具一樣，Midjourney從互聯(lián)網(wǎng)上搜集了大量圖像停止鍛煉，使其可以創(chuàng)作出看似全新的藝術(shù)作品，這引發(fā)了人類發(fā)明者的不滿。目前，曾經(jīng)有不少機構(gòu)和個人對Midjourney發(fā)起起訴，指控該公司涉嫌普遍地進犯版權(quán)。

另據(jù)媒體報道，美國版權(quán)局近日宣布，Midjourney等生成的AI圖像不受版權(quán)維護。在闡明文件中，美國版權(quán)局以為，經(jīng)過Midjourney等平臺自動生成的作品，在整個創(chuàng)作過程中完整由機器人自動完成，并且鍛煉的數(shù)據(jù)是基于人類創(chuàng)作的作品，因而不受版權(quán)法維護。

上海申倫律師事務(wù)所律師夏海龍對記者表示，AI生成工具給人類的版權(quán)法帶來宏大沖擊。一方面，相較海量的AI生成作品，即便其中存在侵權(quán)狀況，權(quán)益人也很難及時發(fā)現(xiàn)；另一方面，在AIGC（人工智能生成內(nèi)容）時期，冗長、昂貴的司法程序招致對版權(quán)維護也會越來越力不從心。人類的版權(quán)法以及著作權(quán)維護機構(gòu)恐怕不得不作出嚴重調(diào)整。

除版權(quán)問題外，越來越逼真的AI生成內(nèi)容也讓人擔(dān)憂這些圖片、視頻可能會被用作非法用處，例如用AI生成的圖片停止狡詐。美國前總統(tǒng)特朗普日前宣布，他將于21日被拘捕。隨后，大量經(jīng)過AI生成的“特朗普被捕”圖片在社交媒體上傳播，誤導(dǎo)了一局部網(wǎng)友。

印度News18新聞網(wǎng)則提到，近期有網(wǎng)友經(jīng)過AI生成了一張美國前總統(tǒng)奧巴馬與德國前總理默克爾在海邊一同吃冰激凌的圖片，這讓人們愈加擔(dān)憂將來會呈現(xiàn)怎樣的深度造假。該網(wǎng)站征引網(wǎng)友的評論稱，“這種技術(shù)正變得越來越可怕。技術(shù)越來越完善，目前的AI能夠創(chuàng)立簡直圓滿的名人聲音或圖片，我們可能很快再無法置信本人的耳朵和眼睛。”此外，也有家長向記者表達了AI生成不當(dāng)圖片對兒童影響的擔(dān)憂。

互聯(lián)網(wǎng)專家郭濤對記者表示，當(dāng)前AIGC技術(shù)尚處于早期探究階段，相關(guān)法律法規(guī)、規(guī)范體系和倫理標(biāo)準(zhǔn)等還不健全，存在數(shù)據(jù)平安風(fēng)險、著作權(quán)侵權(quán)風(fēng)險、深度偽造風(fēng)險、商業(yè)機密泄露風(fēng)險、違法信息傳播風(fēng)險等問題。有關(guān)部門需求盡快樹立健全相關(guān)法律法規(guī)和規(guī)范體系，增強內(nèi)容檢查及內(nèi)容過濾，推進行業(yè)安康可持續(xù)開展。

上一條：第四范式類GPT產(chǎn)品“式...

下一條：打兩性“擦邊球”的聊天機...