在今年UCAN大會開場,阿里巴巴集團UED委員會委員長楊光公布的智能設計平臺——魯班,便出自樂乘的團隊。此平臺是通過人工智能算法和大量數據訓練機械學習設計。通過一段時間的學習,此平臺從昨年“雙十一”前就已經在阿里里面大規模投入使用,目前其設計水平已經非常接近專業設計師設計的效果。在大會上,樂乘介紹了阿里智能設計實驗室的現實全過程。
-用AI做設計-
我們團隊現在叫人工智能設計實驗室,做的事情很簡單,用AI做設計。人工智能現在這個概念太火了,有一個數據證明它有多火:昨年人工智能這個平臺的創業公司開業速度超過了肯德基的開店速度。不可否定,這里一定有泡沫成分,也有很多概念的炒作。我們先拋開高大上的詞,把這個事情拆解一下。
現在講的人工智能都是通過算法、數據和強大的計較能力來完善服務場景,這是人工智能的四個要素。今天我們團隊做的即是用算法、數據、計較、場景來辦理商業平臺的事情,這樣使得這件事情看起來相對靠譜、容易落地。
為何我們團隊會想要做這個事情呢,這不是YY出來的年頭,而是從寬泛的業務場景里找到的一個機會。以一個廣告Banner為例,我們把它歸類為“大量低質易耗”的設計,這樣的設計,設計師花一天做出來,在線上投放時間也惟有一天。而且是重復的,改改字就可以了,非常適用被機械所取代。
今年UCAN的主題是新設計x新商業,新商業里非常大的概念,是要通過新的技術、互聯網的手段,實現人、貨、場的重構,人是消費者,貨是商品的服務,場景即是連接人和商品之間的手段。在新的時期下,需要找到一種新的方式做設計。
我們團隊的使命是基于算法數據和前臺業務需求,打造一個商業設計大腦。這個大腦能理解設計,能為商業的產品去服務,做出合理的設計。
商業設計大腦的三大挑戰
在開始做事情之前,我們遇到了三個相對嚴峻的挑戰。
第一個挑戰,貧乏標注數據。今天所有的人工智能都基于大量的結構化標注數據,設計這件事情連數據都沒有實現在線化,更別說標準化、結構化的數據了。
第二個挑戰,設計不確定性。設計是個很不確定的東西,好比今天你讓機械設計一個高端大氣的Banner廣告,它就蒙圈了。
第三個挑戰,無先例可循。在整個行業里過去一年做下來發現,沒有一些現成的技術或者框架可以參考。好比AlphaGo把圍棋AI論文發完之后,全世界圍棋AI照這個技巧都可以做到先進的水平。我們過去一年來都是自己一路摸索中走過來的,這一年走來我們給人工智能做的定義是,我們做的是可控的視覺生成??煽?,即是憑據商業的需求、業務的需求,智能地進行控制。它辦理的是視覺從無到有的問題。
可控的視覺生成過程
這是機械人從誕生的第一版到最近一版的發展歷程。2016年9月,勉強實現一張圖片的拼合,沒有什么美感可言。第二張是昨年圣誕節前做的廣告,稍微看起來精致一點,整個設計還是非常簡單。第三張是兩個月前的進展,基本上可以憑據這個商品輸入主體的空氣,找到最符合的背景空氣,整個設計細節和結構,看起來更穩定一點。
我們現在大概學會幾百種常規的設計手法,而且每天都在學習中。這是我們目前的設計能力和設計效果,青云給它定的評級是P4,意味著它還只是個助理設計師。我們今年目標是做到P5,另有很長的路要走。
-機械怎樣學習設計-
下面和大家詳細注釋一下這個機械背后的學習設計邏輯。
我們要讓機械學習設計,開始必須要讓機械理解感知設計是什么。以這樣一張非常常見的廣告為例,在機械的眼里是有一堆像素點組成的。若今天以像素為單位讓機械去理解設計,對設計的可控性非常弱,所以在前期技術方案選定中沒有走像素級生產,而是走向了元素級生產。
四個組成片面:設計框架、元素中心、行動器、評估網絡
組成一,設計框架。還是以這個廣告為例,開始通過人工標注的方式,讓機械理解這張設計有哪些元素組成,好比它的商品主體,花的背景,蒙版。往上一層,我們通過設計的經驗知識,定義一些設計的手法和風格。手法指的是這些元素為何可以這么構成,這個知識在設計腦筋里機械是不知道的,所以會有手法這一層做輸入。最上面這一層是風格,當這些元素構成之后,它從美學或者視覺角度看是一個什么感受。讓機械知道它是用什么組成的,為何可以這么組成,以及它組成后的效果。這個過程將一個設計問題轉化成數據問題,這即是設計數據化。
下一步是籌辦設計的原始文件,好比一系列花朵和設計技巧,輸入到深度學習系列網絡。這個網絡有一個很大特點:具備一定影象功效。因為設計是個步驟很復雜的過程,經常有好幾十步才氣實現一個設計。
經過這層神經網絡學習之后,我們會得到一個設計框架。從技術上理解,它是一堆空間特性和視覺特性構成的模型。設計師的視角來理解的話,它相當于設計師腦筋里面在做一組設計之前大概的框架印象,好比今天你接到一個任務要做一個花朵風格,思考這個設計大概會怎么做,然后從一堆文件里提取出了特性模型出來。
組成二,元素中心。因為我們做的是元素級生成,所以必須籌辦一個元素的庫。我們會通過網絡一些版權圖庫,以及自己造設計元素的方式,輸入到一個元素的分類器。這個分類器會把這些元素分布到各個類型里,好比背景、主體、修飾,也會實現圖片庫的提取。
組成三,行動器。接下來,即是設計的具體過程。好比今天我們接到一個設計任務,要為這樣一件衣服設計一個花朵風格的廣告。這時候會有一個行動器,負責把前面籌辦好的底料放到設計框架里。這個過程和下圍棋很像,左邊是棋盤,右側是下圍棋的棋子。行動器即是把元素放到棋盤里,這是整個行動器的生成道理。
它很像設計師現實在做設計的過程,如設計師要做一個花朵的時候,也在軟件里面會不斷去調每個位置、每個像素、每個角度。同時,整個過程也是一個強化學習的過程,行動器會在不斷試錯中更智能。
組成四,評估網絡。設計成品出來之后,我們要告訴機械人,從設計的角度是好還是不好。我們有一個設計評估網絡,最終實現的效果即是給它輸入任何一個設計成品,它能打個分。技術道理是,我們通過人工輸入大量歷史上投放過的一些設計圖評分,它從這里訓練出一個打分的模型出來。同時,專家也會人工干涉打分,實現雙向反饋。
這套框架并不是只能做Banner廣告,Banner廣告是我們找到的第一個最適用落地的業務場景。我們把它定義為是一個通用的設計智能,理論上,它可以設計全部的數字內容。只要是通過元素或者像素組成的圖像,理論上都是可以實現的。
預報一下我們最新的現實。前兩張圖是機械實現的衣飾搭配,憑據用戶輸入的衣飾商品進行組合搭配,生成相似雜志的搭配效果圖。另外,我們也正在訓練機械實現頁面模塊的設計,好比大量的營銷活動頁面,我們現在正在訓練它實現復雜的排版設計。
正在攻克的三個難題
目前,我們已經實現了框架搭建,以及數據的自我學習成長。接下來我們決心攻克的三個難題,也是讓機械變得加倍強大的環節突破點。
第一,讓機械能夠自主生成元素。我們目前的元素是靠設計師來提供,一方面是為了保證版權,另一方面,保證它的質量足夠高。我們希望能做到,要求機械造一個花朵時,它自己能生成出來,這也是目前計較機視覺生成的一個非?;鸬脑掝}。
第二,提高認知理解?,F在機械還不太理解語義,只能憑據需求或者任務生成一個結果,并不打聽其中的關系。我們下一步要做的事情是,當用戶輸入了“清冷一夏”的文案時,機械人能理解“清冷”這個詞代表了什么意思,而且理解這張照片代表了“清冷一夏”的理念,圖文之間有一定的關系。
最后一個,設計的遷徙。好比今天通過大量專家數據訓練了幾百種常規數據手法之后,它能夠實現主流的設計要求了。當這些手法很相似時,就可以實現風格遷徙。我們會進一步探索AI,不再憑據需求實現使命,而是通過自我學習和演化之后有新的東西出來。
-AI+Design 擁抱新時代-
今天人工智能設計真的來了,它不以任何意志為轉移的趨勢走來了,它離我們很近。當一個新的浪潮打過來的時候,我們應該學會的是擁抱它,而不是掉頭就跑,邊跑邊罵不靠譜。
視覺設計的四個層次
最基礎的是臨摹拓展。給你一個東西,照著它拓展一份出來,很明顯這一定是機械第一步取代的工作。而且目前已經做到一大半了,證明這是一個沒法回避的問題。
第二層,場景表白。今天你給它一個東西,它能理解,能表白對。好比今天你憑據情人節,這些品牌能夠找到一種合適的設計手段,去表白出情人節的溫馨,這種手繪的方式會稍微難一點,也即是我們前面講到的語義這一層。
第三層,創意洞見。它能夠有一些啟發性的東西出來。天貓品牌里面經常有把貓頭和品牌創意做團結的事情,這是機械不可能做到的事情,或者在我有生之年沒有指望它能做到的。
最后一層,創造趨勢。這一般是設計大師做的事情。它能定義來歲、未來幾年的設計趨勢走向,這是更高的設計能力。好比今年“三八”女王節,天貓用了一種全新的設計手段,用這種很輕的質感、很細膩的方式來表白商品。它能夠代表一個新的趨勢和未來,代表一個新的手段,這件事情一定是人來做的。
回到今天機械和人之間的差異和對比,若今天我們搞設計人機大戰的話,機械最擅長的是數據、計較、學習。數據上,可以實現巨量素材庫,訓練成長速度,不斷地實現閉環。它的學習速度之快,一個晚上可以實現幾十萬次的學習訓練,是人不吃不喝也趕不上的。而人類設計師的特性,開始在情感層面,我們理解共情,情緒上有表白,這是機械很難做到的。另外兩層,創意和創造,設計師能夠創造出一些新的東西,做組合遷徙,組合創意,美學趨勢。若真正人機對戰的話,設計師還是應回來創造、創意,以及理解用戶的層面。
擁抱這個AI時代,對我們來說有沒有什么新的工作方式呢。好比今天有顧客讓你做一個設計,過去是一對一的給他一個成品,一對一的實現一個設計任務。有了設計AI之后,就可以將一個設計手段輸入給機械,教會機械做執行和生成。這樣,你就可以不止為一個客戶服務,而是為不計其數的客戶服務。
人工智能設計是個不可攔截的時代,是未來。但是它也剛剛來,我們也剛剛走出第一步。我們另有大量的時間,希望接下來和設計同行一起努力,繼續把這件事情做好。