計算機圖形學是否已經進入瓶頸期?

看到下面那個相關問題有感而發,希望做圖形的筒子們暢所欲言

圖形學,以人眼為評價尺度,終極目的是在電腦屏幕上還原大自然,似乎我們已經快要做到了

相關問題:

計算機視覺是否已經進入瓶頸期? - 人工智慧

現階段物理模擬(Physically Based Animation)有什麼熱門的研究問題? - 物理學


來回答一下個人的看法:

個人覺得之前的幾個回答過於樂觀了, 我倒想潑點冷水,所謂到達 「瓶頸」 期,並不是「沒有東西可做了」, 而是雖然還存在大量問題, 但這些問題要麼就是難以解決, 要麼就是解決了之後能帶來的質的提升太小了。

誠然, 現在的計算機圖形學, 比之真實世界, 還差很多, 還有很多可做, 然而, 剩下的東西, 是否過於超過人類現有的計算能力,認知水平,甚至存儲空間了呢?

繪製一個超級真實的小籠包, 是否不可能?

有一個叫HYPER REAL CG的網站, 大家可以去看一看。

http://hyperrealcg.tumblr.com/post/112613421044/title-oreo-cheesecake-software-zbrush

http://hyperrealcg.tumblr.com/page/4

誠然, 繪製這樣一幅圖所需要的人力是巨大的, 包括了建模, 模擬, 材質等等等等等。

而理想就是讓一切能夠越來越自動化,然而,人類企圖在人造的機器里去追趕自然界的計算能力,就目前來看, 是否圖樣圖森破了?

所謂瓶頸, 就是到達瓶口前最細最窄的一條路, 而我覺得我們目前就是在瓶頸。


謝邀。話說這問題到底是標題里的「瓶頸期」還是評論里的「做的差不多了」?

兩個問題都答一下:都不是。

首先現在圖形學發展很快,並不是瓶頸期。就以流體模擬為例,今年SIGGRAPH上就有surface-only liquids(http://www.cs.columbia.edu/cg/surfaceliquids/)和「薛定諤的煙」(http://multires.caltech.edu/pubs/SchrodingersSmoke.pdf)兩篇重量級paper。前者說水可以只在表面模擬,內部計算完全可以省掉,大概相當於直接把計算量從O(n^3)拉到O(n^2);後者提出一個新的框架,不需要計算NS方程的傳導項,就可以精確模擬旋度很高的流體,秒殺以前所有處理傳導數值消散的paper。

所有的科研其實都是細水長流的過程。個人認為其實不存在「瓶頸期」,所謂瓶頸期其實是對領域外人士而言的。比如他們之前對某個領域了解限於N年前的狀態,有一天突然看到哇!原來現在已經這樣做了,然後覺得好像看到了一個大新聞;然後把沒有看到大新聞的領域說是發展在瓶頸期了。其實他們沒看到的是那些所謂大新聞其實也是作者站在巨人肩膀上搞出來的,包括站在從前的自己的肩膀上。

就上面提到的兩篇paper,作者們其實很久以前就在思考那些問題了,然後他們發了不起眼的幾篇作為鋪墊以後,才有能力做出這些很有影響力的成果。圖形學發展到現在四十多年,就目前為止,還沒聽說有某個大神不知道怎麼回事就luckily duang-ed出來一個超越前沿好多年的成果。

至於第二個問題,個人看法是圖形學做了個大概其,但是細節和真實世界還差得遠。尤其是生活瑣碎,拿出一張真實照片,和CG截圖,就算是業外人士也還是能分辨出哪張是照片。比如說下面這樣:

或者下面這樣:

你用CG怎麼做?

無論是渲染、建模還是物理模擬都是對現在CG來說難度很大的。比如肉用什麼樣的幾何表示,皮是不是得用thin shell,破碎、撕裂怎麼處理,汁液的存儲和流出怎麼做等等。更不要說模擬烹調過程了,那還要涉及蛋白質變性、碳化等過程。

作為一隻吃貨一直以為,什麼時候所有人能在虛擬世界裡吃到米其林三星了,圖形學才可以有底氣說自己做的差不多了。


我想"瓶頸"有兩個要素:1. 還有很多問題需要解決,2. 幾乎不知道怎麼解決。

渲染是圖形學最傳統的領域,經歷了幾十年的發展已經比較成熟,已經被廣泛用於電影中替代實拍以降低成本或者完成無法實拍的內容(比如少年派里的老虎)。這些成功容易讓人覺得渲染問題解決了,然而,正如其他答案介紹的,還有許多物體和現象是我們至今難以甚至無法渲染到以假亂真程度的。因此,渲染可以算是比較成熟了,但顯然也還有很多問題需要解決,同時也確實不斷有新技術出現,只是可能確實研究的人相對比以前更少了。

研究如何「生成」圖片是圖形學的一大分支,渲染完成的是從給定場景到圖片這最後一個環節,在此之前還需要先生成待渲染的場景,包括三維建模,材質建模,物理模擬,動作建模等等,我都叫建模吧。相對於渲染,建模還遠遠談不上成熟。很多時候,CG圖片看上去比較假,問題不在於渲染假,而是因為待渲染的場景本身和現實世界差距太大 -- 「過於簡化」,「過於乾淨」,「過於規則」,因此再怎麼渲染真實感也上不去。

現實世界非常複雜,具有豐富的細節,這些東西是無法通過人工規則來表達的,甚至不是從小規模數據集就可以學習得來的。很可惜,現在建模的研究不少是基於人工規則來的,或者僅僅能夠利用很小規模的數據集來訓練,至於效果嘛,當然是在User(其實就是論文作者實驗室的朋友們) Study中表現不錯...而已。因此,現階段高真實感建模還是需要引入大量的人工交互,成本非常高,效率非常低下,這部分工作是不能通過增加計算量來彌補的。圖形學裡也很早就在提數據驅動,但是沒有大數據,沒有能處理大數據的有效工具,是驅不動的,除非計算機能夠有效利用大規模真實數據集!非常幸運地,CNN帶來的計算機視覺領域的飛躍可能能夠打破這個「除非」,使得計算機圖形學能夠被大規模真實數據驅動,而不是選擇性的一小部分。

不難想像,計算機理解圖像能力的提高必然帶來其合成圖片能力的提高。現在計算機理解圖像的能力已經取得巨大進步,因此這裡存在很大機遇。GAN已經能夠利用大量圖片進行像素級圖片合成,其結果雖然離CG真實感還有一段距離,但*乍一看*還真是不錯,給人無限遐想。

再舉個幾個栗子,正如我之前吐槽的,我們現在的場景合成質量是通過User(Labmate) Study來評價的,說實話,我表示非常呵呵。怎麼做比較客觀呢?上CNN啊!現在CNN在高層次特定圖片理解任務上的表現不輸人類,如果claim場景合成以假亂真,先試試結果在多大程度上能欺騙CNN吧,做啥User(Labmate) Study。。。CNN可以用來評價合成數據,反過來,當然合成數據也可以用來訓練CNN,這裡ground truth label可是既準確又不要錢,而且直擊CNN訓練嚴重依賴於大規模標註數據這個痛點。話都說到這裡了,順便投兩個廣告:Render for CNN和Deep 3D Pose,^_^

一個可能的理想的循環是,視覺通過分析大規模真實數據為圖形學提供生成真實感圖片的素材(三維模型、材質、動態、物體姿態等等各種屬性分布),圖形學根據這些素材(從各種屬性分布中sample)生成真實感場景,渲染成圖片(在此期間視覺技術用於評價和指導生成質量),然後反過來用於訓練。當然,如何保證兩者相互提高,而不是原地打轉是關鍵。我猜想不斷在此循環中引入更多真實數據或許就能很大程度上防止原地打轉。

綜上,我覺得凡是和真實圖片以及語義打交道的計算機圖形學研究都應該思考如何從計算機視覺對圖像理解能力的提高中獲益,重新審視面臨的問題和解決方案,很可能會有新的突破。

當然,計算機圖形學還有非常幾何的分支,比如三維列印,這些領域也是有大量的問題亟待解決。至於是不是「幾乎不知道怎麼解決」,我不熟悉,但我猜想大抵不是的~我猜想每個子領域都是在被逐漸推進的,而且領域內的人總是不至於完全不知道怎麼解決的,只是確實在不同的歷史階段發展進展可能不一樣。雖然「瓶頸」,也不是一籌莫展的。

但確實,計算機圖形學裡和真實圖片以及語義打交道的部分,藉助於視覺的發展,可能可以在最近幾年飛的快一些。


原來上課的時候,Ron Fedkiw教授曾經說過,computer graphics has reached a plateau,並不是沒有進步,但是革新性的進展很少見了,渲染,物理模擬,毛髮等等,差不多都如此。不過依然有大量的工程問題需要解決,好效果還是十分昂貴。也許某一天一個默默無聞的phd又開闢了一個新的分支,足夠灌上十年水。


GI還有的做呢……進展和過去相比沒那麼大倒是真的

動畫,物理模擬...坑好多(逃


很多人以為圖形學 == 渲染,這才是瓶頸。

圖形學那麼多分支,渲染到瓶頸期了,其他早著呢。渲染可以做到和現實分不出區別,但數據從哪來?一點一點靠美術堆?動畫從哪來?一點一點靠美術調?材質從哪來?一點一點靠美術畫?


AR和computer vision等說不定還是在萌芽期呢。


就遊戲行業,這幾年這方面的從業人員和關注度都在銳減


個人覺得未來的圖像技術會是基於數據的,絕不是會現用的這一套基於運算的


拿遊戲來說吧,遊戲是最有可能在圖形計算方面做出突破的行業。我很看好minecraft這款遊戲,將來的3d遊戲場景可能都是像minecraft那樣的方塊模式,minecraft遊戲僅不到兩百M,但裡面的地圖面積超過現在任何一款遊戲的面積。裡面的玩家利用有限一兩百個方塊,造出了摩天大樓,現代城市,大炮,甚至是微型計算機。就像構成世界萬物的東西僅僅是元素周期表上的那一兩百個單質元素。

未來的3d遊戲與minecraft模式相同,但不同的是一個方塊要小的多,組成一個角色將有上千個小方塊構成,然後場景由數億個小方塊構成,每個小方塊可以被物理系統模擬。只要方塊足夠小,人眼就看不到馬賽克。然後可玩的東西就多了,操控的角色一掌轟平一座山是何等的快哉!這時候幾個億小方塊的計算就不再用到圖形處理器,而是cpu的運算能力。cpu運算計算能力越強,能模擬的方塊物理性能就能越多。將來量子計算機成功後,個人電腦也擁有超級計算機的運算能力時,這個想法大概才會實現。這個模式上限可以非常高,只要電腦好,甚至能以細胞為方塊單位構成一個人體角色,幾百億個細胞方塊。

太膩害!國外大神在《Minecraft》中成功造出「硬碟」造硬碟的大神,雖然只有1KB的存儲量,但幾十年前,真正計算機不也這樣嗎。裡面僅僅用了十來種方塊被附加的物理特性。

【Minecraft】當曾經的聖潔淪為黑暗單人建築從遠看的話這座城堡已經很難看出是方塊建造的了。

[我的世界][TheRedPixel] 32位紅石電腦 RSC-3230_單機聯機紅石模擬的32位計算機

《我的世界》中的大神能達到什麼程度? - 回答作者: 00000000 《我的世界》中的大神能達到什麼程度? - 00000000 的回答

其他的還有很多很多,就不列舉了


推薦閱讀:

為什麼高解析度屏幕在使用低解析度時無法做到點對點映射?
紋理坐標三角形內插值問題,我搞不定了。?
為什麼一些採用 Source 引擎的遊戲,會有「看畫風知引擎」的感覺?
Google開發的RAISR演算法利用機器學習壓縮圖片,提高解析度,實際應用怎麼樣?
虛擬現實(vr)將會是下一個熱點嗎?

TAG:計算機科學 | 計算機視覺 | 計算機圖形學 |