阿里智能設(shè)計(jì)實(shí)驗(yàn)室負(fù)責(zé)人樂乘:當(dāng)設(shè)計(jì)遇上AI

來源:
忍者
時(shí)間:
2017-05-17 17:45:42
閱讀:
4582


 

在今年UCAN大會(huì)開場(chǎng),阿里巴巴集團(tuán)UED委員會(huì)委員長楊光發(fā)布的智能設(shè)計(jì)平臺(tái)——魯班,便出自樂乘的團(tuán)隊(duì)。此平臺(tái)是通過人工智能算法和大量數(shù)據(jù)訓(xùn)練機(jī)器學(xué)習(xí)設(shè)計(jì)。通過一段時(shí)間的學(xué)習(xí),此平臺(tái)從去年“雙十一”前就已經(jīng)在阿里內(nèi)部大規(guī)模投入使用,目前其設(shè)計(jì)水平已經(jīng)非常接近專業(yè)設(shè)計(jì)師設(shè)計(jì)的效果。在大會(huì)上,樂乘介紹了阿里智能設(shè)計(jì)實(shí)驗(yàn)室的實(shí)踐全過程。

 

 

-用AI做設(shè)計(jì)-

 

我們團(tuán)隊(duì)現(xiàn)在叫人工智能設(shè)計(jì)實(shí)驗(yàn)室,做的事情很簡(jiǎn)單,用AI做設(shè)計(jì)。人工智能現(xiàn)在這個(gè)概念太火了,有一個(gè)數(shù)據(jù)證明它有多火:去年人工智能這個(gè)領(lǐng)域的創(chuàng)業(yè)公司開業(yè)速度超過了肯德基的開店速度。不可否認(rèn),這里一定有泡沫成分,也有很多概念的炒作。我們先拋開高大上的詞,把這個(gè)事情拆解一下。

 

現(xiàn)在講的人工智能都是通過算法、數(shù)據(jù)和強(qiáng)大的計(jì)算能力來完善服務(wù)場(chǎng)景,這是人工智能的四個(gè)要素。今天我們團(tuán)隊(duì)做的就是用算法、數(shù)據(jù)、計(jì)算、場(chǎng)景來解決商業(yè)領(lǐng)域的事情,這樣使得這件事情看起來比較靠譜、容易落地。

 

 

為什么我們團(tuán)隊(duì)會(huì)想要做這個(gè)事情呢,這不是YY出來的想法,而是從廣泛的業(yè)務(wù)場(chǎng)景里找到的一個(gè)機(jī)會(huì)。以一個(gè)廣告Banner為例,我們把它歸類為“大量低質(zhì)易耗”的設(shè)計(jì),這樣的設(shè)計(jì),設(shè)計(jì)師花一天做出來,在線上投放時(shí)間也只有一天。而且是重復(fù)的,改改字就可以了,非常適合被機(jī)器所取代。

 

今年UCAN的主題是新設(shè)計(jì)x新商業(yè),新商業(yè)里非常大的概念,是要通過新的技術(shù)、互聯(lián)網(wǎng)的手段,完成人、貨、場(chǎng)的重構(gòu),人是消費(fèi)者,貨是商品的服務(wù),場(chǎng)景就是連接人和商品之間的手段。在新的時(shí)期下,需要找到一種新的方式做設(shè)計(jì)。

 

我們團(tuán)隊(duì)的使命是基于算法數(shù)據(jù)和前臺(tái)業(yè)務(wù)需求,打造一個(gè)商業(yè)設(shè)計(jì)大腦。這個(gè)大腦能理解設(shè)計(jì),能為商業(yè)的產(chǎn)品去服務(wù),做出合理的設(shè)計(jì)。

 

商業(yè)設(shè)計(jì)大腦的三大挑戰(zhàn)

 

在開始做事情之前,我們遇到了三個(gè)比較嚴(yán)峻的挑戰(zhàn)。

 

第一個(gè)挑戰(zhàn),缺少標(biāo)注數(shù)據(jù)。今天所有的人工智能都基于大量的結(jié)構(gòu)化標(biāo)注數(shù)據(jù),設(shè)計(jì)這件事情連數(shù)據(jù)都沒有完成在線化,更別說標(biāo)準(zhǔn)化、結(jié)構(gòu)化的數(shù)據(jù)了。

第二個(gè)挑戰(zhàn),設(shè)計(jì)不確定性。設(shè)計(jì)是個(gè)很不確定的東西,比如今天你讓機(jī)器設(shè)計(jì)一個(gè)高端大氣的Banner廣告,它就蒙圈了。

第三個(gè)挑戰(zhàn),無先例可循。在整個(gè)行業(yè)里過去一年做下來發(fā)現(xiàn),沒有一些現(xiàn)成的技術(shù)或者框架可以參考。比如AlphaGo把圍棋AI論文發(fā)完之后,全世界圍棋AI照這個(gè)方法都可以做到先進(jìn)的水平。我們過去一年來都是自己一路摸索中走過來的,這一年走來我們給人工智能做的定義是,我們做的是可控的視覺生成。可控,就是根據(jù)商業(yè)的需求、業(yè)務(wù)的需求,智能地進(jìn)行控制。它解決的是視覺從無到有的問題。

 

可控的視覺生成過程 

 

這是機(jī)器人從誕生的第一版到最近一版的發(fā)展歷程。2016年9月,勉強(qiáng)完成一張圖片的拼合,沒有什么美感可言。第二張是去年圣誕節(jié)前做的廣告,稍微看起來精致一點(diǎn),整個(gè)設(shè)計(jì)還是非常簡(jiǎn)單。第三張是兩個(gè)月前的進(jìn)展,基本上可以根據(jù)這個(gè)商品輸入主體的氛圍,找到最符合的背景氛圍,整個(gè)設(shè)計(jì)細(xì)節(jié)和結(jié)構(gòu),看起來更穩(wěn)定一點(diǎn)。

 

 

我們現(xiàn)在大概學(xué)會(huì)幾百種常規(guī)的設(shè)計(jì)手法,并且每天都在學(xué)習(xí)中。這是我們目前的設(shè)計(jì)能力和設(shè)計(jì)效果,青云給它定的評(píng)級(jí)是P4,意味著它還只是個(gè)助理設(shè)計(jì)師。我們今年目標(biāo)是做到P5,還有很長的路要走。

 

-機(jī)器如何學(xué)習(xí)設(shè)計(jì)-

 

下面和大家詳細(xì)解釋一下這個(gè)機(jī)器背后的學(xué)習(xí)設(shè)計(jì)邏輯。

 

我們要讓機(jī)器學(xué)習(xí)設(shè)計(jì),首先必須要讓機(jī)器理解感知設(shè)計(jì)是什么。以這樣一張非常常見的廣告為例,在機(jī)器的眼里是有一堆像素點(diǎn)組成的。如果今天以像素為單位讓機(jī)器去理解設(shè)計(jì),對(duì)設(shè)計(jì)的可控性非常弱,所以在前期技術(shù)方案選擇中沒有走像素級(jí)生產(chǎn),而是走向了元素級(jí)生產(chǎn)。 

 

 

四個(gè)組成部分:設(shè)計(jì)框架、元素中心、行動(dòng)器、評(píng)估網(wǎng)絡(luò)

 

組成一,設(shè)計(jì)框架。還是以這個(gè)廣告為例,首先通過人工標(biāo)注的方式,讓機(jī)器理解這張?jiān)O(shè)計(jì)有哪些元素組成,比如它的商品主體,花的背景,蒙版。往上一層,我們通過設(shè)計(jì)的經(jīng)驗(yàn)知識(shí),定義一些設(shè)計(jì)的手法和風(fēng)格。手法指的是這些元素為什么可以這么構(gòu)成,這個(gè)知識(shí)在設(shè)計(jì)腦子里機(jī)器是不知道的,所以會(huì)有手法這一層做輸入。最上面這一層是風(fēng)格,當(dāng)這些元素構(gòu)成之后,它從美學(xué)或者視覺角度看是一個(gè)什么感受。讓機(jī)器知道它是用什么組成的,為什么可以這么組成,以及它組成后的效果。這個(gè)過程將一個(gè)設(shè)計(jì)問題轉(zhuǎn)化成數(shù)據(jù)問題,這就是設(shè)計(jì)數(shù)據(jù)化。

 

下一步是準(zhǔn)備設(shè)計(jì)的原始文件,比如一系列花朵和設(shè)計(jì)方法,輸入到深度學(xué)習(xí)系列網(wǎng)絡(luò)。這個(gè)網(wǎng)絡(luò)有一個(gè)很大特點(diǎn):具備一定記憶功能。因?yàn)樵O(shè)計(jì)是個(gè)步驟很復(fù)雜的過程,經(jīng)常有好幾十步才能完成一個(gè)設(shè)計(jì)。

 

經(jīng)過這層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)之后,我們會(huì)得到一個(gè)設(shè)計(jì)框架。從技術(shù)上理解,它是一堆空間特征和視覺特征構(gòu)成的模型。設(shè)計(jì)師的視角來理解的話,它相當(dāng)于設(shè)計(jì)師腦子里面在做一組設(shè)計(jì)之前大概的框架印象,比如今天你接到一個(gè)任務(wù)要做一個(gè)花朵風(fēng)格,思考這個(gè)設(shè)計(jì)大概會(huì)怎么做,然后從一堆文件里提取出了特征模型出來。

 

 

組成二,元素中心。因?yàn)槲覀冏龅氖窃丶?jí)生成,所以必須準(zhǔn)備一個(gè)元素的庫。我們會(huì)通過收集一些版權(quán)圖庫,以及自己造設(shè)計(jì)元素的方式,輸入到一個(gè)元素的分類器。這個(gè)分類器會(huì)把這些元素分布到各個(gè)類型里,比如背景、主體、修飾,也會(huì)完成圖片庫的提取。

 

 

組成三,行動(dòng)器。接下來,就是設(shè)計(jì)的具體過程。比如今天我們接到一個(gè)設(shè)計(jì)任務(wù),要為這樣一件衣服設(shè)計(jì)一個(gè)花朵風(fēng)格的廣告。這時(shí)候會(huì)有一個(gè)行動(dòng)器,負(fù)責(zé)把前面準(zhǔn)備好的底料放到設(shè)計(jì)框架里。這個(gè)過程和下圍棋很像,左邊是棋盤,右邊是下圍棋的棋子。行動(dòng)器就是把元素放到棋盤里,這是整個(gè)行動(dòng)器的生成原理。

 

它很像設(shè)計(jì)師實(shí)際在做設(shè)計(jì)的過程,如設(shè)計(jì)師要做一個(gè)花朵的時(shí)候,也在軟件里面會(huì)不斷去調(diào)每個(gè)位置、每個(gè)像素、每個(gè)角度。同時(shí),整個(gè)過程也是一個(gè)強(qiáng)化學(xué)習(xí)的過程,行動(dòng)器會(huì)在不斷試錯(cuò)中更智能。 

 

 

組成四,評(píng)估網(wǎng)絡(luò)。設(shè)計(jì)成品出來之后,我們要告訴機(jī)器人,從設(shè)計(jì)的角度是好還是不好。我們有一個(gè)設(shè)計(jì)評(píng)估網(wǎng)絡(luò),最終實(shí)現(xiàn)的效果就是給它輸入任何一個(gè)設(shè)計(jì)成品,它能打個(gè)分。技術(shù)原理是,我們通過人工輸入大量歷史上投放過的一些設(shè)計(jì)圖評(píng)分,它從這里訓(xùn)練出一個(gè)打分的模型出來。同時(shí),專家也會(huì)人工干預(yù)打分,完成雙向反饋。 

 

 

這套框架并不是只能做Banner廣告,Banner廣告是我們找到的第一個(gè)最適合落地的業(yè)務(wù)場(chǎng)景。我們把它定義為是一個(gè)通用的設(shè)計(jì)智能,理論上,它可以設(shè)計(jì)一切的數(shù)字內(nèi)容。只要是通過元素或者像素組成的圖像,理論上都是可以完成的。

 

預(yù)告一下我們最新的實(shí)踐。前兩張圖是機(jī)器完成的服飾搭配,根據(jù)用戶輸入的服飾商品進(jìn)行組合搭配,生成類似雜志的搭配效果圖。另外,我們也正在訓(xùn)練機(jī)器完成頁面模塊的設(shè)計(jì),比如大量的營銷活動(dòng)頁面,我們現(xiàn)在正在訓(xùn)練它完成復(fù)雜的排版設(shè)計(jì)。 

 

 

正在攻克的三個(gè)難題

 

目前,我們已經(jīng)完成了框架搭建,以及數(shù)據(jù)的自我學(xué)習(xí)成長。接下來我們決心攻克的三個(gè)難題,也是讓機(jī)器變得更加強(qiáng)大的關(guān)鍵突破點(diǎn)。

 

第一,讓機(jī)器能夠自主生成元素。我們目前的元素是靠設(shè)計(jì)師來提供,一方面是為了保證版權(quán),另一方面,保證它的質(zhì)量足夠高。我們希望能做到,要求機(jī)器造一個(gè)花朵時(shí),它自己能生成出來,這也是目前計(jì)算機(jī)視覺生成的一個(gè)非?;鸬脑掝}。

 

第二,提高認(rèn)知理解?,F(xiàn)在機(jī)器還不太理解語義,只能根據(jù)需求或者任務(wù)生成一個(gè)結(jié)果,并不了解其中的關(guān)系。我們下一步要做的事情是,當(dāng)用戶輸入了“清涼一夏”的文案時(shí),機(jī)器人能理解“清涼”這個(gè)詞代表了什么意思,并且理解這張照片代表了“清涼一夏”的理念,圖文之間有一定的關(guān)系。

 

最后一個(gè),設(shè)計(jì)的遷移。比如今天通過大量專家數(shù)據(jù)訓(xùn)練了幾百種常規(guī)數(shù)據(jù)手法之后,它能夠完成主流的設(shè)計(jì)要求了。當(dāng)這些手法很相似時(shí),就可以完成風(fēng)格遷移。我們會(huì)進(jìn)一步探索AI,不再根據(jù)需求完成使命,而是通過自我學(xué)習(xí)和演化之后有新的東西出來。

 

-AI+Design 擁抱新時(shí)代-

 

今天人工智能設(shè)計(jì)真的來了,它不以任何意志為轉(zhuǎn)移的趨勢(shì)走來了,它離我們很近。當(dāng)一個(gè)新的浪潮打過來的時(shí)候,我們應(yīng)該學(xué)會(huì)的是擁抱它,而不是掉頭就跑,邊跑邊罵不靠譜。

 

 

視覺設(shè)計(jì)的四個(gè)層次 

 

 

最基礎(chǔ)的是臨摹拓展。給你一個(gè)東西,照著它拓展一份出來,很明顯這一定是機(jī)器第一步取代的工作。而且目前已經(jīng)做到一大半了,證明這是一個(gè)沒法回避的問題。

 

 

第二層,場(chǎng)景表達(dá)。今天你給它一個(gè)東西,它能理解,能表達(dá)對(duì)。比如今天你根據(jù)情人節(jié),這些品牌能夠找到一種合適的設(shè)計(jì)手段,去表達(dá)出情人節(jié)的溫馨,這種手繪的方式會(huì)稍微難一點(diǎn),也就是我們前面講到的語義這一層。

 

 

第三層,創(chuàng)意洞見。它能夠有一些啟發(fā)性的東西出來。天貓品牌里面經(jīng)常有把貓頭和品牌創(chuàng)意做聯(lián)合的事情,這是機(jī)器不可能做到的事情,或者在我有生之年沒有指望它能做到的。

 

 

最后一層,創(chuàng)造趨勢(shì)。這一般是設(shè)計(jì)大師做的事情。它能定義明年、未來幾年的設(shè)計(jì)趨勢(shì)走向,這是更高的設(shè)計(jì)能力。比如今年“三八”女王節(jié),天貓用了一種全新的設(shè)計(jì)手段,用這種很輕的質(zhì)感、很細(xì)膩的方式來表達(dá)商品。它能夠代表一個(gè)新的趨勢(shì)和未來,代表一個(gè)新的手段,這件事情一定是人來做的。

 

 

回到今天機(jī)器和人之間的差異和對(duì)比,如果今天我們搞設(shè)計(jì)人機(jī)大戰(zhàn)的話,機(jī)器最擅長的是數(shù)據(jù)、計(jì)算、學(xué)習(xí)。數(shù)據(jù)上,可以完成巨量素材庫,訓(xùn)練成長速度,不斷地完成閉環(huán)。它的學(xué)習(xí)速度之快,一個(gè)晚上可以完成幾十萬次的學(xué)習(xí)訓(xùn)練,是人不吃不喝也趕不上的。而人類設(shè)計(jì)師的特征,首先在情感層面,我們理解共情,情緒上有表達(dá),這是機(jī)器很難做到的。另外兩層,創(chuàng)意和創(chuàng)造,設(shè)計(jì)師能夠創(chuàng)造出一些新的東西,做組合遷移,組合創(chuàng)意,美學(xué)趨勢(shì)。如果真正人機(jī)對(duì)戰(zhàn)的話,設(shè)計(jì)師還是應(yīng)回歸創(chuàng)造、創(chuàng)意,以及理解用戶的層面。       

 

 

擁抱這個(gè)AI時(shí)代,對(duì)我們來說有沒有什么新的工作方式呢。比如今天有顧客讓你做一個(gè)設(shè)計(jì),以前是一對(duì)一的給他一個(gè)成品,一對(duì)一的完成一個(gè)設(shè)計(jì)任務(wù)。有了設(shè)計(jì)AI之后,就可以將一個(gè)設(shè)計(jì)手段輸入給機(jī)器,教會(huì)機(jī)器做執(zhí)行和生成。這樣,你就可以不止為一個(gè)客戶服務(wù),而是為成千上萬的客戶服務(wù)。

 

人工智能設(shè)計(jì)是個(gè)不可阻擋的時(shí)代,是未來。但是它也剛剛來,我們也剛剛走出第一步。我們還有大量的時(shí)間,希望接下來和設(shè)計(jì)同行一起努力,繼續(xù)把這件事情做好。

 

[關(guān)于UCAN]

 

UCAN是阿里巴巴的年度設(shè)計(jì)盛會(huì),聚焦用戶體驗(yàn)設(shè)計(jì)。4月27—28日,由阿里巴巴用戶體驗(yàn)設(shè)計(jì)委員會(huì)舉辦的UCAN2017用戶體驗(yàn)設(shè)計(jì)論壇在阿里巴巴西溪園區(qū)舉行,本屆主題是“新設(shè)計(jì)×新商業(yè)”。圍繞“無界、融通、超距、生長”等概念,重新定義用戶體驗(yàn)在新商業(yè)環(huán)境中的蛻變和價(jià)值,不斷把設(shè)計(jì)領(lǐng)域、設(shè)計(jì)概念向外延展,與技術(shù)、能源和商業(yè)產(chǎn)生新的化學(xué)反應(yīng)。

 



轉(zhuǎn)載請(qǐng)注明:優(yōu)波設(shè)計(jì)


掃描二維碼可分享給好友