2023 年以 ChatGPT 的活躍發展與廣泛應用為起點,被視作「生成式 AI 元年」,各式各樣的 AI 工具遍地開花,引領出嶄新的工作方式與創作思維。而近來,又以升級至 5.2 版本的 Midjourney 最具討論度。
Midjourney 是一款透過文字指令來生成圖像的 AI 工具,不過,如果使用者在輸入指令時「打錯字」又會發生什麼事呢?數位創作者 mossymayn 以馬丘比丘、雪梨歌劇院、吉力馬札羅山等世界著名地標為題材,在 Midjourney 生成介面上故意打錯字,竟意外產出一系列充滿迷因感的有趣圖像,而此創作行為背後隱含的諷刺性也引人反思,在 AI 科技擾動之下,創作者如何自我定位?
Midjourney 是什麼?
Midjourney 是一款可以根據文字指令快速生成圖像的 AI 程式,圖像生成後,還可依使用者的喜好進行後續的細節優化與調整。其強大的功能與簡易的操作,使 Midjourney 成為近期討論度最高的生成式 AI 工具之一。
從 Midjourney 使用邏輯發想,數位創作者用「錯字」惡搞世界地標
如今的圖像生成工具,是立基於 AI 的兩項突破性進展——理解語言、創造圖片,將兩者結合後所發展出的技術革新,造就一波全新趨勢,Midjourney 也由此應運而生。自 2022 年 7 月首次公開上線後,期間不斷迭代優化,時至今日已演變為一套功能強大的美學系統,應用場景也愈趨多元。
Midjourney 的使用邏輯十分簡單明瞭——輸入文字指令便能生成精緻圖片。數位創作者 mossymayn 由此核心概念與功能出發,並刻意將著名地標拼錯字,如:把馬丘比丘寫成馬丘皮卡丘、布蘭登堡門拼成布蘭登漢堡門⋯⋯,而這些看似違反常理的惡搞奇想,竟成功被 Midjourney 一一化為圖像,一系列天馬行空的創作也在社群上掀起陣陣討論。
惡搞背後的諷刺,反思科技擾動下的創作者定位
面對網友們熱烈的迴響,數位創作者 mossymayn 表示,其實這系列圖像的製作過程比想像中輕鬆許多,因為 Midjourney 非常善於解讀文字及創造圖像,因此對他而言,最難的部分反倒是構思出聰明、好笑的錯字指令。
而繼 mossymayn 的世界知名地標系列後,另一位數位創作者也循著同樣的「錯字」邏輯,將惡搞對象指向達文西名畫,他把「蒙娜麗莎(Mona Lisa)」刻意拼成「蒙娜蜥蜴(Mona Lizard)」,最後產出帶有暗黑童話感的陰鬱成像。
這一連串由「打錯字」而生的圖像,除了為觀者帶來趣味與娛樂性之外,實則也針對 Midjourney 的功能與使用方法,做出帶有諷刺意味的些許挑釁與愚弄,令人不禁反思,AI 與使用者之間的角色關係究竟為何?當 AI 發展已是不可逆的主流趨勢,數位創作者又該如何自我定位?而以上種種疑問,或許可從最初始的命題開始理起頭緒,也就是「我們該如何看待 AI?」
身而為創作者、身而為人,如何面對這座名為 AI 的未知水域?
Midjourney 創辦人 David Holz 認為,大部分人將 AI 視為具有威脅性、攻擊性的猛獸,不過,他更傾向於將 AI 看作是一片未知的水域。是的,水中可能暗藏凶險,但別忘了,水同時也是文明的驅動力。當 AI 發展勢不可擋,我們真正應該思考的方向或許是:如何從昔日那個害怕溺水的人,變成未來乘風破浪的衝浪者?
人們如何看待 AI,也將深深影響人們如何使用 AI,即使 AI 的圖片生成技術比人類更快速、更有效,但這並不意味著人們將停止創作,David Holz 比喻道,就像汽車的發明為人們的移動帶來革命性的變遷,可我們何曾停止行走?
「我們將 Midjourney 這項技術,視作『想像力的引擎』。」——Midjourney 創辦人 David Holz
不可否認地,數位創作者 mossymayn 所發表的系列圖像,雖帶有些許諷刺意味,卻也是透過 Midjourney 為想像力賦形的案例之一。最終, AI 究竟是驅動創作,還是取代創作?仍無從解答、尚待定奪,但面對這片名為 AI 的未知水域,如何與其共生共存,絕對是當代最為重要的課題之一,畢竟,我們早已身在其中。
參考資料/The Verge