数据库领域顶级会议VLDB 2020 的“前世今生”

VLDB (Very Large Data Base)国际会议于 1975 在美国的弗雷明汉马成立,由美国 VLDB 基金会赞助。VLDB 和另外两大数据库会议 SIGMOD、ICDE 构成了数据库领域的三个顶级会议,已成为数据库研究人员,供应商,参与者,应用开发者,以及用户一年一度的主要国际论坛。
VLDB 2020 已经于 9 月 4 日顺利落下帷幕。会议虽然已经结束,但秉持着学习不停!奋斗不止!的精神,小编今天带着大家一起来纵向了解下 VLDB 的过去和现在。

VLDB 的过去五年

通过对 AMiner 平台中 VLDB 2015-2019 这五年来收录论文数据的挖掘,从词云可以看出,VLDB 的关键词主要集中在 Experimental Evaluation、Modern Hardware、Query Processing、Relational Data 等方向。

通过对 2015-2019 这五年来接收论文中所有学者信息的提取,我们分析了这些学者的性别比例、国籍分布与语言分布情况。可以看出,VLDB 的投稿学者以男性为主,占比 86.06%。从学者分布情况来看,来自美国和中国的学者一骑绝尘,分别占比 40.6% 和 18.69%。

那么在过去五年中,VLDB 又有哪些高引论文呢?有哪些论文和学者在 VLDB 舞台上大放光彩呢?

AMiner 清单奉上~

2015-2019五年间高引论文TOP10
TOP 1: The dataflow model: a practical approach to balancing correctness, latency, and cost in massive-scale, unbounded, out-of-order data processing
作者:Tyler Akidau, Robert Bradshaw, Craig Chambers, Slava Chernyak, Rafael Fernández-Moctezuma, Reuven Lax, Sam McVeety, Daniel Mills, Frances Perry, Eric Schmidt, Sam Whittle
被引用:423
TOP 2: One Trillion Edges: Graph Processing at Facebook-Scale
作者:Avery Ching, Sergey Edunov, Maja Kabiljo, Dionysios Logothetis, Sambavi Muthukrishnan
被引用:300
TOP 3: Constructing an Interactive Natural Language Interface for Relational Databases
作者:Fei Li, H. V. Jagadish
被引用:237
TOP 4: A confidence-aware approach for truth discovery on long-tail data
作者:Qi Li, Yaliang Li, Jing Gao, Lu Su, Bo Zhao, Murat Demirbas, Wei Fan, Jiawei Han
被引用:214
TOP 5: GraphMat: High performance graph analytics made productive
作者:Narayanan Sundaram, Nadathur Satish, Md. Mostofa Ali Patwary, Subramanya Dulloor, Michael J. Anderson, Satya Gautam Vadlamudi, Dipankar Das, Pradeep Dubey
被引用:210
TOP 6: How Good Are Query Optimizers, Really
作者:Viktor Leis, Andrey Gubichev, Atanas Mirchev, Peter A. Boncz, Alfons Kemper, Thomas Neumann
被引用:210
TOP 7: Clash of the titans: MapReduce vs. Spark for large scale data analytics
作者:Juwei Shi, Yunjie Qiu, Umar Farooq Minhas, Limei Jiao, Chen Wang, Berthold Reinwald, Fatma Özcan
被引用:202
TOP 7: Fast rule mining in ontological knowledge bases with AMIE+
作者:Luis Galárraga, Christina Teflioudi, Katja Hose, Fabian M. Suchanek
被引用:202
TOP 9: Profiling relational data: a survey
作者:Ziawasch Abedjan, Lukasz Golab, Felix Naumann
被引用:196
TOP 10: Incremental Knowledge Base Construction Using DeepDive
作者:Jaeho Shin, Sen Wu, Feiran Wang, Christopher De Sa, Ce Zhang, Christopher Ré
被引用:194
2015-2019五年间高引作者TOP10

VLDB 2015-2019 五年间引用量排名第一的为香港科技大学计算机科学与工程系的陈雷教授,共有 726 引用量。陈雷教授于 1994 年在天津大学计算机科学与工程系获得工学学士学位,1997 年于泰国亚洲理工大学获得硕士学位,2005 年在加拿大滑铁卢大学计算机科学系获得博士学位。并于同年开始任教于香港科技大学计算机科学与工程系。研究兴趣包括:Crowdsourcing-based data processing、Data-driven machine learning、Multimedia systems、Uncertain and probabilistic databases、Web information management 等。

过去五年间引用量排名第二的为来自清华大学计算机科学与技术系计算机软件研究所李国良教授,共有 676 引用量。李国良教授在 VLDB 2020 共有三篇论文入选。李国良教授于 2004 年在哈尔滨工业大学计算机科学与技术学院获得工学学士学位,2007 年于清华大学计算机科学与技术学院获得硕士学位,2009 年在清华大学计算机科学与技术学院获得博士学位。研究兴趣包括:数据库,众包数据管理,大数据清理和集成,空间文本数据处理。

VLDB 的 2020

AMiner 通过对 VLDB 2020 会议论文数据的挖掘,2020 年,VLDB 的关键词主要集中在 Anomaly Detection、Database Storage、Machine Learning 等方向。

更多关于 VLDB 2020 的会议信息,请移步https://aminer.cn/conf/vldb2020/homepage

2020 奖项获得者

Best Paper Award
标题:Opportunities for Optimism in Contended Main-Memory Multicore Transactions
作者:Yihe Huang, William Qian, Eddie Kohler, Barbara Liskov, Liuba Shrira

Best Industrial Paper Award

标题:DIAMetrics: Benchmarking Query Engines at Scale

作者:Anja Gruenheid, Shaleen Deep, Kruthi Nagaraj, Hiro Naito, Jeff Naughton, Stratis Viglas

“Most Reproducible Paper” Award
标题:Mind the Gap: An Experimental Evaluation of Imputation of Missing Valuesh

作者:Mourad Khayati, Alberto Lerner, Zakhar Tymchenko, Philippe Cudré-Mauroux

标题:A Comparative Evaluation of Order-Revealing Encryption Schemes and Secure Range-Query Protocols
作者:Dmytro Bogatov, George Kollios, Leonid Reyzin

2020 中国学者

今年共有 98 名中国学者论文入选,学者数量仅次于美国。其中六位学者有超过两篇论文入选。其中来自清华大学计算机科学与技术系的李国良教授和来自卡塔尔计算研究所的汤南排名第一,均有三篇论文入选。

入选论文:
VisClean: Interactive Cleaning for Progressive Visualization
DeepTrack: Monitoring and Exploring Spatio-Temporal Data – A Case of Tracking COVID-19 
Evaluating Ridesharing Algorithms using the Jargo Real-Time Stochastic Simulator

入选论文:
DeepTrack: Monitoring and Exploring Spatio-Temporal Data – A Case of Tracking COVID-19
VisClean: Interactive Cleaning for Progressive Visualization
Debugging Large-Scale Data Science Pipelines using Dagger

入选论文:
FASTS: A Satisfaction-Boosting Bus Scheduling Assistant
IMO: A Toolbox for Simulating and Querying ``Infected’’ Moving Objects

入选论文:
AnalyticDB-V: A Hybrid Analytical Engine Towards Query Fusion for Structured and Unstructured Data
LedgerDB: A Centralized Ledger Database for Universal Audit and Verification

入选论文:
AnalyticDB-V: A Hybrid Analytical Engine Towards Query Fusion for Structured and Unstructured Data
LedgerDB: A Centralized Ledger Database for Universal Audit and Verification

入选论文:
Helios: Hyperscale Indexing for the Cloud & Edge

Ease.ml/snoopy in Action: Towards Automatic Feasibility Analysis for Machine Learning Application Development

(0)

相关推荐