当前位置:首页 >> 膨胀阀

旷视科技AI影像之王缔造者王珏把深度学习计算摄影推向极致手拉葫芦

2022-11-18 12:05:24  鸿狮机械网

08-02

提到旷视,除了孙剑,你还应该知道王珏。或许,这个名字你不是很熟悉,没关系,这很正常,毕竟大牛都是非常低调的。然而,正是这样低调的人物,曾同时在计算机视觉、计算机图形学、人机交互三大领域最高级别会议和期刊发表65篇学术论文。也曾在9年时间里手把手带领过31位博士实习生,获得了64项美国专利,实现了13项重要技术的研发和产品转换。还曾是Adobe Research历史上升职最快的首席科学家之一,提出的技术做成产品后,曾拿下奥斯卡科学技术奖。如今,他转战旷视,率领一支全球团队,正把深度学习+计算摄影推向极致。他就是旷视AI影像之王的缔造者——王珏。

师出名门的清华学霸,助力拿下奥斯卡科学技术奖

项目完成前,只吃鸡肉炒饭

哪有什么所谓的天才,还不都是孤独地翻山越岭。这句话用在王珏身上再合适不过了。

2003年,从清华念完本科和硕士的王珏,前往美国华盛顿大学电子工程系攻读博士学位。

在此期间,“两点一线”是他的常态。正如王珏自己所述:“我在做研究的过程中,一旦进入状态,就不想打断它。”

这也正是为什么连圣诞节期间,他也会开着车到学校泡在实验室里的原因,也造就了王珏每年发表2篇顶会论文,3年得到导师毕业许可的“神话”。

而他在刚刚工作接触项目时,还是会保持这种习惯——项目完成前,只吃鸡肉炒饭。

“若是每天想着去哪儿吃,吃什么,非常麻烦。而当时公司附近刚好有一家不错的鸡肉炒饭,于是我们默认都去那里解决吃饭问题。”

除了“嫌麻烦”,王珏另一个如此废寝忘食的原因是他很珍惜这种状态,就仿佛身处于科研的高峰体验,静待“突破”孕育而生。

求学期间获点拨,助力拿下奥斯卡科学技术奖

除了自身的努力之外,来自“外界”的点拨与启发也非常重要。

王珏读博士期间与多位名师有过深入的合作,分别是李衍达院士、微软亚洲研究院的徐迎庆、王坚和沈向洋博士,以及计算机图形学泰斗级人物Michael Cohen。

在李衍达院士的实验室中,王珏主要辅佐医学图像处理方面的工作,在与微软亚洲研究院的众多大牛的合作中,王珏主要负责数字墨水和卡通、交互图像视频处理等工作。

这让王珏一开始做研究便跨越了多个领域,培养出了宽阔的视野,为后来的工作不论在技术还是思想层面,都奠定了一定的基础。正如王珏所说:

“像徐老师,他不仅擅长图形学和计算机视觉,在动画等领域也比较擅长;王坚老师是心理学博士出身,但在人机交互方面的工作也是十分出色。因此他们在做工作的时候,思想、视野都是比较开阔的。”

也正是这种长期不懈的坚持,王珏博士毕业加入Adobe Research的几年期间,不断取得突破,创造了硕果累累的业绩。

而在发表的众多论文中,让王珏印象最为深刻的是2007年发表在SIGGRAPH的一篇题为《Soft Scissors: An Interactive Tool for Realtime High Quality Matting》的文章。

论文地址:http://www.juew.org/publication/softscissors-SIG07.pdf

在这篇文章中,王珏提出一种用于实时提取前景蒙版(alpha matte)的交互式工具——Soft Scissors,它是一种新的实时在线matting算法,可以在复杂的前景对象(如毛茸茸的动物)中提取高质量的蒙版。

系统流程图

甚至可以实时调整画笔的宽度和边界条件。在高质量图像matting和合成任务中,Soft Scissors是第一个可以做到又快又准确的交互式工具,将一系列的算法创新融入到一个小小的笔刷之中。

这篇论文虽然很较短,只有6页,但却是最能体现王珏论文风格的一篇——注重实用性。

在此之前,大家在这个领域所做的工作更侧重于数学层面上的建模与优化,而王珏是从用户的角度出发,打造一个好用的实时系统,将复杂的算法融入到简单、流畅的交互过程当中。

也正是基于“王珏特色”的研究工作,使得像美国好莱坞的影像特效公司Digital Film Tools买下了技术版权并做成了产品。而就在今年,这家公司凭借着该技术,获得了奥斯卡科学技术奖。

回首狂扫顶会论文的这些年,王珏总结其修炼之路的经验为:

选择自己擅长的工作,认清自己的优、劣势;

文章立意要新颖,若是启发性不够或者较为雷同,完成论文会较为困难;

为自己寻找思维开阔的导师。

从美国顶级公司到国内创业公司,“一碗面”引发的人才迁移

身处Adobe九载,一“面”之缘加入旷视

在学术上屡获佳绩的王珏在工作上也是一把好手。王珏曾在Adobe Research任职长达九年,并取得了非常不错的成绩。但他加入旷视,却源于和孙剑的一“面”之缘。

那时,王珏恰好和孙剑在西雅图,两人相约一起吃饭,聊的很投机,一碗面的功夫,王珏就有了加入旷视的打算。

告别Adobe时,王珏用“专利石”拼了自己的名字

那么最终选择旷视的原因是什么呢?王珏这样解释:

“主要是三个方面的原因。

一是和旷视有天然的亲近感。旷视出自清华姚班,企业文化中有清华行胜于言,脚踏实地的价值观。对于作为清华校友的我来讲,有着天然的熟悉感。

二是孙剑博士的诚意邀请。我和孙剑博士认识并同行多年,彼此都比较熟悉,他不远万里到西雅图来邀请我,我内心是无法拒绝的。

三是机遇。中国目前人工智能研究的环境,从数据规模到商业机会都比美国要好,但是在人才储备上仍然不占优势。能够帮助中国人工智能公司,特别是初创公司更进一步,在美国吸引顶尖人才为我所用,对中国高科技发展是一件里程碑性质的事情。这样的机会在人生中并不多见,碰到了就应该抓住”。

于是,2017年4月,王珏加入旷视,与孙剑负责的中国研究院遥相呼应。

旷视,效率最高的公司

加入旷视两年后,王珏步入了科研的快车道。与偏向于温室的Adobe不同,作为一家创业公司,旷视的节奏是很快的,需要有短时间内攻克难关的能力。

王珏在Adobe做的第一个项目是关于视频里面交互物体的分割,前前后后3年时间产品才发布,而同样难度、甚至更高难度的项目,通过团队协作,旷视4-6个月左右就能落地。

用王珏自己的话讲:旷视是他见过效率最高的公司。

王珏(左二)参加2018旷视北京年会

旷视之所以能够如此高效的运作与几个地方默契配合分不开。旷视在北京、上海、南京、成都设有研究院,如此一来,项目推进就可以做到24小时不间断,国内休息,国外接着干,再加上团队的默契配合,才会有如此高的效率。

为什么最近几年大家觉得苹果的创新速度变慢了?王珏认为可能是因为过于温室、压力小,所以脚步放慢了。对于赶超,王珏很有信心。

两年铸一剑,打造国际顶尖AI水平团队

旷厂“人缘王”,关键时刻冲在第一线

工作中的王珏是怎样的呢?

Leader一般分两类,一类是强硬派,一类是温和派,王珏显然是后者,甚至还被誉为“旷视最和蔼可亲的Leader”,旷厂的“人缘王”。

慢性子的王珏喜欢先想清楚再决策,深知生气并不解决问题,作为Leader,他追求的是慢中求快,高效而平静是他最喜欢的工作状态。

王珏最喜欢的一个电影场景就是《指环王》中希优顿冲锋陷阵,带领士兵奋勇杀敌。在工作上,王珏对自己的要求也是如此,关键时刻冲在第一线。不光写代码、搞算法,包括数据采集有时也会亲力亲为、通宵作业。

《指环王》剧照希优顿王(左一)

生活中的王珏不仅没有领导架子,还非常关心同事。同事遇到难处,他都会尽力帮忙。之前同事买房,资金周转不开,多会找王珏借钱,获得帮助。有这样的Leader,员工更是无后顾之忧,工作起来干劲十足。

超强战斗力,打造国际顶尖AI团队

影像之王,这是旷视CEO印奇下达的一道“指令”。两年以来,王珏团队挺进目标已取得赫赫战绩。这主要归功于4个方面:

旷视原创自研的底层科研利器Brain++的有力支撑;

从问题和需求出发,推出一系列高水准论文,包括CVPR Oral在内;

AI技术覆盖国内一线主流手机厂商,打造明星手机技术,比如OPPO Reno 夜拍超清画质;

团队冲锋陷阵,与国内打配合,24小时不间断推进项目。

王珏团队成立以来不断在壮大,而目前发展的状况,用王珏的话就是:“非常满意,层次丰富。”

王珏团队成员

目前王珏团队成员主要专攻如下三个方面:深度学习、传统计算机视觉/计算机图形学、计算摄影。

两年前,王珏在接受新智元采访时提到:“不追求将招聘重心放在顶级专家上,对于初创公司来讲,战斗力决定一切。”从目前成员构成来看,也的确如此。

正是如此小而精的团队,在今年CVPR 2019中就入围两篇论文,其中一篇为Oral:

论文地址:https://arxiv.org/abs/1901.00680v1

在这项研究中,旷视研究院首次提出了名为GeoNet的全新深度学习网络,可以建模点云所潜在表征的网格曲面特征。

并在点云上采样、法向量估计、网格重建及非刚性形状分类等多项经典任务中取得了最优结果。

而在另一篇工作中,王珏团队提出了GIF2Video的方法,解决了长期以来GIF动图颜色分层、模糊不清的困扰。

论文地址:https://arxiv.org/pdf/1901.02840.pdf

在CVPR 2019会议期间,王珏团队在做展示时,苹果、三星、谷歌等大厂的研究人员也会前来交流,并对其工作表示了高度的认可。

不仅是在科研方面,在将技术转化为应用落地方面也是较为成功的。正如王珏所介绍:“我们给各个手机厂商提供了不少非常原创的技术,现在我们的客户口碑是非常好的。”

比如,旷视的raw域超画质技术,将最好的深度去噪算法和最优的传统算法结合起来,不仅在OPPO Reno手机上率先落地,更是受邀在高通和MTK的展会上进行了多次技术展示。

除此之外,旷视研发的超清夜景人像,大光比人像HDR以及人像AI微整形等多项技术已经广泛应用于国内主流手机产品中。

其中,大光比人像HDR算法还流传为旷视的一段佳话。有一次,团队某个项目搁浅一周没用进展。当时王珏随时随刻都在思考这个问题,终于灵感在机场降临——他当场在候机室写出了正确解决问题的大光比人像HDR算法。由于诞生在机场,这一算法又顺理成章地被称为“机场算法”。

旷视在CVPR2019上展示的超画质技术

而在此“荣耀”的背后,王珏团队也是付出了异于常人的努力。

去年7-9月份,团队所面临的项目挑战可谓是极其艰难,团队成员纷纷“冲锋陷阵”,几位同事甚至直接住在了公司。

加之与旷视国内研究院的协战,整个旷视团队相当于每天24小时不停奋战,最后终于攻克难关,取得胜利。

带领团队向前走,正是王珏所最为骄傲且认为值当的事情。

“大尺度”电影爱好者还有些话要送给后来者

工作之余,王珏是一名“大尺度”科幻电影爱好者。这里的“大”尺度是“宏大”的大,王珏喜欢通过看宏大的、宇宙尺度的科幻片解压。他对科幻电影的喜爱可以用“狂热”来形容。

王珏与《星球大战》角色楚巴卡合影

《流浪地球》在国内上映的时候,王珏兴奋得不得了,身在异国的他按耐不住内心的激动,给国内的朋友们买票替他去支持国产科幻片。后来美国上映了,王珏马上去电影院看。

而王珏的这一爱好也许与他的科研也是”一脉相承“。AI技术的高速发展,打造的正是像科幻大片里超未来的世界。而王珏所做的工作,可以说是在实现着他的”梦想“。

最后,王珏将自己摸爬滚打这么多年的经验总结成两点送给后来者:

1、要深入到问题的本质

希望大家能够沉下心来,在学习新技术的同时,也去翻翻老的、经典的教科书,里面很多知识对以后的工作会非常有帮助。

2、做好当前这件事

未来具有高度的不确定性,有时候很难进行长远规划,但想要一个比较理想的契机,必须要做好当前这件事情,未来才会有更宽阔的空间。

文章来源:新智元

西安能治癫痫的专科医院

上海哪家割双眼皮最好

杭州哪家男科医院好

邯郸男科医院哪家正规

北京耳科医院

相关资讯
友情链接