10月9日,美圖公司舉辦15周年生日會(huì )并發(fā)布自研AI視覺(jué)大模型MiracleVision(奇想智能)3.0版本。面世100天后,美圖AI視覺(jué)大模型MiracleVision3.0將全面應用于美圖旗下影像與設計產(chǎn)品,并將助力電商、廣告、游戲、動(dòng)漫、影視五大行業(yè)。
美圖視覺(jué)大模型的100天進(jìn)化:奇思妙想與智能創(chuàng )作
在美圖公司15周年生日會(huì )現場(chǎng),美圖公司創(chuàng )始人、董事長(cháng)兼首席執行官吳欣鴻發(fā)布了自研AI視覺(jué)大模型MiracleVision3.0版本。
美圖公司創(chuàng )始人、董事長(cháng)兼首席執行官吳欣鴻
吳欣鴻介紹說(shuō),三個(gè)月前,MiracleVision繪畫(huà)水平還停留在初級階段,如今3.0版本已經(jīng)能描繪出真實(shí)細膩的畫(huà)面細節,目前用戶(hù)可以訪(fǎng)問(wèn)AI視覺(jué)創(chuàng )作工具“WHEE”官網(wǎng)體驗。
吳欣鴻將自己15歲的繪畫(huà)作品與面世100天的美圖視覺(jué)大模型生成作品進(jìn)行對比,他認為訓練AI與人類(lèi)學(xué)畫(huà)有很多共通之處,通過(guò)充分學(xué)習不同的繪畫(huà)風(fēng)格和技巧,AI能創(chuàng )作出具有獨特性的原創(chuàng )作品。
美圖公司將自研AI視覺(jué)大模型MiracleVision(奇想智能)的核心能力拆解為“奇思妙想”和“智能創(chuàng )作”兩大特性。
在“奇思妙想”層面,MiracleVision通過(guò)“提示詞智能聯(lián)想”功能降低大眾的使用門(mén)檻,當用戶(hù)輸入關(guān)鍵詞,MiracleVision可自動(dòng)補充相關(guān)表述,如光影效果、質(zhì)感、風(fēng)格、圖片質(zhì)量等,推動(dòng)創(chuàng )作平權。此外,MiracleVision通過(guò)“提示詞精準控制”功能來(lái)滿(mǎn)足更加專(zhuān)業(yè)的設計要求,如使用“近景”、“遠景”、“順光”、“逆光”等描述控制最終生成效果。
在“智能創(chuàng )作”層面,MiracleVision通過(guò)“深化創(chuàng )作”功能,可以進(jìn)一步豐富作品細節和提升表現力。通過(guò)“AI畫(huà)面擴展”功能讓作品尺寸更大、細節更豐富。通過(guò)“局部修改”功能,對部分畫(huà)面進(jìn)行精準修改與調整。通過(guò)“分辨率提升”功能生成高清大圖,讓細節表現、色彩展示、物體辨識更加的精準和生動(dòng)。
助力電商、廣告、游戲、動(dòng)漫、影視五大行業(yè)
在吳欣鴻看來(lái),AI視覺(jué)大模型帶來(lái)的不僅僅是更好的視覺(jué)呈現,還有對工作流的效率提升,但目前大模型與工作流的結合仍在探索階段,抓住應用場(chǎng)景的核心需求更為重要。
吳欣鴻介紹說(shuō),MiracleVision將落地電商、廣告、游戲、動(dòng)漫、影視五大行業(yè),希望能幫助五大行業(yè)“工作流提效”。
在電商行業(yè),從涂鴉生成線(xiàn)稿、線(xiàn)稿上色、商品圖、模特試穿圖,再到電商物料輸出,全程可通過(guò)MiracleVision實(shí)現。
在廣告行業(yè),MiracleVision覆蓋創(chuàng )意腦暴、創(chuàng )意深化、平面排版、多尺寸延展、線(xiàn)下投放預覽的全工作流,助力客戶(hù)在廣告物料制作環(huán)節提效。
在游戲行業(yè),MiracleVision可以包攬場(chǎng)景設計、角色設計、道具設計、UI圖標、宣發(fā)物料等流程,拓寬設計師想象空間的同時(shí)助力游戲行業(yè)降本。
在動(dòng)漫行業(yè),MiracleVision打通了概念設計、故事板生成、線(xiàn)稿上色、動(dòng)漫補幀、視頻轉動(dòng)漫等流程,支持創(chuàng )意到物料成品的快速落地。
在影視行業(yè),MiracleVision的高可控性可充分滿(mǎn)足概念場(chǎng)景設計、分鏡設計、人物造型、道具設計、宣發(fā)物料的效果要求,極大提升影視行業(yè)設計環(huán)節的效率。
吳欣鴻表示,MiracleVision將充分發(fā)揮奇思妙想、智能創(chuàng )作的能力,在上述五大行業(yè)深耕,持續助力更多的設計場(chǎng)景。
視覺(jué)大模型應用普及將在2026-2030年走向成熟期
活動(dòng)現場(chǎng),吳欣鴻還分享了對于A(yíng)I視覺(jué)大模型的思考。“AI視覺(jué)大模型的本質(zhì),是無(wú)窮無(wú)盡的視覺(jué)創(chuàng )意庫。應用層相當于內容提取器,根據用戶(hù)的需求,從這個(gè)巨大的創(chuàng )意庫中提取所需要的內容,讓用戶(hù)在特定場(chǎng)景中使用。AI視覺(jué)大模型和應用之間相輔相成,大模型為應用提供技術(shù)支撐,應用反哺大模型的效果迭代。”
吳欣鴻表示,目前AI視覺(jué)大模型在生產(chǎn)端的三個(gè)待解決的問(wèn)題是:垂直領(lǐng)域的極致效果、工作流整合、變現能力。隨著(zhù)AI視覺(jué)大模型和生產(chǎn)端的磨合,這三個(gè)問(wèn)題會(huì )被逐步解決。
在吳欣鴻看來(lái),視覺(jué)大模型應用普及將經(jīng)歷三個(gè)階段:2024年之前為探索期,2024-2025年為高速發(fā)展期,2026-2030年為成熟期,隨著(zhù)視覺(jué)大模型在生產(chǎn)端的應用走向成熟,視覺(jué)大模型將助力千萬(wàn)設計場(chǎng)景,引領(lǐng)美學(xué)的升級與社會(huì )經(jīng)濟增長(cháng)。
此外,美圖公司還公布了6月19日發(fā)布的影像生產(chǎn)力工具最新數據:AI視覺(jué)創(chuàng )作工具“WHEE”的優(yōu)質(zhì)AI效果生成數已超過(guò)550萬(wàn)張,打造的設計師生態(tài)也初見(jiàn)成效;AI口播視頻工具“開(kāi)拍”月活躍用戶(hù)數已突破35萬(wàn);桌面端AI視頻編輯工具“WinkStudio”已累計服務(wù)近10萬(wàn)名視頻創(chuàng )作者;主打AI商業(yè)設計的“美圖設計室”正助力近百萬(wàn)中小電商賣(mài)家降本增效;美圖AI助手“RoboNeo”每天幫助近萬(wàn)名用戶(hù)自動(dòng)修圖,比傳統修圖效率提升35%;AI數字人生成工具“DreamAvatar”于8月底上線(xiàn)并主打“AI演員”數字人服務(wù)。
標簽: AI 大模型 MiracleVision 美圖 故事板