上个月,人工智能与多智能体顶级会议 AAMAS-17 在巴西顺利举行。而其中,凭借「Stability of generalized two-sided markets with transaction thresholds」论文获得最佳论文和最佳学生论文提名的唐平中博士也参加了本次大会。在雷锋网的邀请下,唐博士向我们阐述了他参加大会的一些心得以及他对于交叉学科的一些思考。
唐平中博士是清华大学交叉信息研究院青年千人助理教授(2012 – 至今),博士生导师,计算经济学研究室主任。在加入清华大学之前,他在美国卡耐基梅隆大学计算机系从事了两年的博士后研究员工作,师从 Tuomas Sandholm 教授从事人工智能、拍卖、肾脏交换和机制设计的研究工作。他于 2010 在香港科技大学计算机系获得博士学位,在林方真教授的指导下进行人工智能与经济学交叉学科的研究。他曾在斯坦福大学计算机系(2008-2009),哈佛大学计算机系(2010),微软亚洲研究院(2013)以及加州大学伯克利分校(2015)从事访问研究工作。
唐平中博士的研究兴趣是人工智能及多智能体系统,专注于互联网背景下计算机科学与经济学的交互,包括机制设计,市场设计,拍卖和博弈,并将其理论应用于电子商务,互联网广告等相关的领域。他在该领域著名会议及期刊发表论文四十余篇,获得 IJCAI-15 媒体论文奖和 AAMAS-17 最佳论文和最佳学生论文提名,并将于国际人工智能大会 IJCAI-2017 作青年事业奖特邀报告(Early career spotlight talk)。他是中组部青年和微软研究院铸星计划的入选者,并担任国家自然科学基金中国-以色列国际合作项目中方首席科学家。
唐平中博士致力于将科研成果应用于互联网企业,包括百度,阿里,谷歌等顶级互联网企业。提出的解决方案包括百度搜索广告中的保留价项目,淘宝平台的防刷单流量分配算法和滴滴拼车的动态定价算法。
1. 近期您的论文「Stability of generalized two-sided markets with transaction thresholds」近期获得了人工智能顶级会议之一 AAMAS-2017 的最佳论文和最佳学生论文双料提名,请问老师是否能简单介绍一下团队所做的工作?
这个工作源于我国西北甘肃省石羊河流域的水权市场设计。众所周知,西北尤其是甘肃的干旱问题非常严重。当地政府为了缓解干旱问题,设计了两级的水权市场。一级市场由政府设计,旨在年初将总水量按往年需求分配给各个村庄。年中随时间进展,每个村庄的需求发生动态变化,需要设计一个二级市场来让村庄之间进行交易,有盈余的村庄将水权卖给有需求的村庄,从而进一步达到水资源的有效分配。之前设计的二级市场提供一个接口,由各村庄输入买卖单,由工作人员手动将这些买卖单进行匹配,效率十分低,而且很难优化。
我们在 [Liu, et. al. AAAI-16] (雷锋网注:指「Optimizing Trading Assignments in Water Right Markets」)这篇论文中,首次证明了这个问题是 SNP-Hard(通俗地说,如果有二十个村庄,手动匹配几乎没有任何可能找到最优匹配),并提供了快速算法,能够有效地在现有规模上计算出最优匹配。
现在的问题是,能够计算出最优匹配并没有完全解决问题:村和村的之间将以多少价格进行交易并没有说清楚。按照当地习惯,村和村之间还需要讨价还价,这使得交易效率降低,而且更直接的后果是有些村庄由于最后价格不满意,取消交易。
在 AAMAS-2017 这篇论文中,我们提出了搭配最优匹配的定价,并证明该定价能够最大程度的满足各村的交易动机,促进村和村之间的交易。总结一下,AAAI-2016 加 AAMAS-2017 两个工作从计算和经济两个角度组合出击,解决了水权市场的设计难题。该工作最近得到了水利方面专家的极大认可,目前正在和清华水利系以及当地政府一起合作,推进该系统落地。
市场设计与定价是经济学和计算机科学交叉学科的热门课题之一,被认为是经济学中的「工程学」。计算机科学(尤其是 AI)一方面能够设计有效的算法,将复杂的经济学机制实现,又能够利用机制运行中产生的数据进一步优化设计。
2. 本次参加 AAMAS 2017,纵观会议全场,您有看到什么新的研究趋势吗?在论文的投递情况和主题的选择上,您有发现什么有意思的现象么?
会前的一个猜测是关于深度学习等热门方向的论文数量会增加,但据我观察,这方面的论文还比较少。原因之一可能是深度学习在多智能体系统的应用还比较初步,像围棋和扑克等方向的两人博弈技术也暂时难以扩展到多智能体系统。总体的主题分布跟往年类似,偏应用(博弈或强化学习等)的文章较往年略有增加。
3. AAMAS 现在同样是中国学者关注的重点会议之一。今年中国学者论文的投递情况如何?有哪些中国企业也向本次会议投递了论文?是否能谈谈您所了解到的国内人工智能发展近况?
AAMAS community 近年来在国内发展非常良好。现有一个两百多人的多智能体学组,并定期组织高水平的线上线下讲座。据我局限地了解,今年国内参会的高校包括清华大学、南京大学、厦门大学、华中科技大学、重庆大学等,企业包括阿里巴巴和百度也在会议上有论文发表。我组内的学生今年在 AAMAS 发表了六篇论文,其中有两篇是学生独立完成。
国内的人工智能发展是个非常大的话题。我个人喜欢的研究是从科学的本源出发,结合具体场景提炼出有价值的新问题,并提出新方法进行解决。这可以是纯理论问题,也可以是结合具体场景的应用。国内各大 IT 企业的迅猛发展给国内的研究者提供了非常好的场景和机遇,做引领世界的科研。
4. AI for social good 是一个社会热门议题,能否结合您的一些研究工作,谈谈可以从哪些角度出发,用 AI 改善社会生活?
之前提到的水权市场的设计和优化就是一个非常典型的例子。事实上,在学术圈内现在主推的一个主题叫做 computational substanability,就是用计算方法帮助可持续发展。这里面包括关于肾脏交换与匹配机制的设计,帮助肾病患者和捐赠者进行更有效的匹配,我们组在这个方向有一系列的工作。也包括利用博弈方法保护公共资源(如野生动物)等。南洋理工的安波教授和 CMU 的新晋教授方飞在这个方向也有一系列的工作(雷锋网按:安波博士此前也接受过雷锋网的采访,详情请点击《能玩德扑也能保障国家安全,南洋理工安波博士阐述算法博弈论的魅力何在?》查看)。我们组最近和滴滴公司合作,用 AI 等技术优化现有的定价和匹配算法,优化出行效率减少拥堵,也是用 AI 改善社会生活的一个例子。
5. 算法机制设计(algorithmic mechanism design)是一个客观的过程,但人在决策的过程中很难做到绝对理性,那么在这个过程中,如何兼顾人作为个体在决策中所起的作用?
传统的机制设计和算法机制设计都基于完全理性假设,忽略了个体行为数据。在现实场景中,完全理性很难满足,使得设计的机制并不能达到理想的效果。如何在博弈模型中结合机制运行产生的个体数据是学术和工业界共同关心的话题之一。可以参阅我近期为国际人工智能大会 IJCAI-2017 写的一篇特邀论文「Reinforcement mechanism design」。里面提到了近年来我们组在这个方向上的初步探索,即将强化学习的思想结合行为经济学建模,应用到传统的机制设计框架中。
6. 了解到唐老师曾经参与百度搜索广告中的个性化保留价项目,那么如何更好地通过博弈论、拍卖理论及机制设计的结合实现计算广告领域的市场设计?有哪些设计的难点?
博弈论和拍卖理论在广告拍卖这个场景下提供了一类经典的模型,但是事实上这类经典的模型还有较大的优化空间。因此搜索引擎会花大量的人力物力对经典模型进行优化。这里面就涉及到刚刚提及的模型与数据结合的问题,也涉及到公平性和经济利益的权衡问题,是非常前沿的学术问题。
7. 去年您的团队与阿里合作,提出基于博弈论与优化的方案,以解决「商家刷单提升信用问题」,并凭借论文「Mechanism Design for Personalized Recommender Systems」发表于 ACM RecSys 2016,是否能请唐老师介绍一下该合作项目的主要过程及目前进展?另外,这个项目也被「中青教育」列为「清华最有趣的十大前沿研究」,那么您个人认为这是一个「有趣」的研究吗?
刷单问题可谓电子商务最头疼的问题,指电商平台上的卖家利用各种手段增加近期交易数量和评分,从而让自己在接下来的搜索结果中排名靠前,获得更多的购买流量。这是一个典型的算法设计问题中(如协同过滤)没有考虑到个体的策略性动机所带来的负面结果。结合博弈理论,我们在 Recsys 这个工作中对这类策略性问题进行了分析,设计了一系列防刷单的排序机制,并在仿真实验中取得了好的效果。该项目还在进一步进展当中,目前的进展是用一个深度神经网络替代原有的行为模型,用神经网络来描述卖家的行为,这个建模对性能提升很大,近期提交到 NIPS 2017 并在审稿中。
8. 唐老师您有着与互联网企业的合作经验,包括百度、阿里、谷歌等公司。想了解下,您作为一名奋斗在学术一线的科研人员,是否能谈谈与工业界合作和做科研的不同之处?
工业界中很多问题都非常的繁杂,处理起来毫无美感可言;在学术界则可以做一些理论假设规避这些繁杂,得到比较干净漂亮的结果。最后还是看研究者本人的满足感来自何处,是追求实际应用的满足感,还是漂亮理论的满足感;工业界的大多数问题都是经济效益驱动的,而学术界则有更多可能,科研人员可以凭兴趣研究很多更有意义的问题。此外在高校的满足感还有很大一部分来自于把自己的知识和经验传授给学生们,和同学们一起进步,这个满足感是工业界无法获得的。
9. 作为一位交叉信息研究专家,想了解下老师是如何与这个领域结缘的?
我博士期间的导师林方真 (HKUST),Yoav Shoham(Stanford) 和博士后导师 Tuomas Sandholm(CMU)都是 AI 和经济学交叉领域的专家,所以对我而言研究这个领域是非常自然的选择。这个选择跟我们院长姚期智院士在清华大学成立交叉信息研究院的视野是一致的。
10. 计算机科学与经济学的交互涵盖了包括机制设计、市场设计、拍卖和博弈等内容。所涵盖的知识面大,考虑的内容更加复杂。它们两者各有怎样的特点?老师在选择研究方向和选题的时候,如何综合两者的特点进行考虑?
经济学模型偏抽象,旨在用通用的模型解释一大类社会问题;计算机模型偏具体,旨在用建设性的算法在特定场景中实现模型。在选题时应考虑到二者的平衡点和自身的学术背景进行研究。