【杂谈】如何学会看arxiv.org才能不错过自己研究领域的最新论文？

2024-04-30 08:26:48

今天介绍一个用于追踪arxiv.org平台上最新论文的工具arxiv-sanity。

作者&编辑 | vivian&言有三

1 什么是arxiv-sanity

我们都知道arxiv.org是一个非常大的预印本资源库，里面有大量的最新的论文，但缺点是浏览、搜索和排序不是很方便。这个库每天会更新大量的论文，如果只是通过手动搜索和浏览效率就太低了。

这样特别容易让人和一些优秀的有趣儿的论文擦肩而过，这些论文可能是和你的研究领域相关的。所以接下来你可能就能猜到这个arxiv-sanity是干什么用的了。

网址为：http://www.arxiv-sanity.com/

2 arxiv-sanity的基本功能

1、便捷的预览

首先，arxiv-sanity在展示最新更新的文献时，提供了可读性更强的缩略图预览模式方便读者来快速预览，并在缩略图下方的绿色区域显示文献的abstract 。

2.感兴趣相关度排序

更重要的是，它可以让你根据自己的阅读兴趣对文献进行重新排序。比如这里有一篇关于对人体姿态估计的文献是你感兴趣的，点击右上角的' rank by tf-idf similarity to this'，文献列表会按照与这篇文章的相关度进行排序，接下来我们会看到arxiv上所有关于人体姿态识别的论文。这个功能是基于TF-DF算法来实现的，效果很好。（一种文档特征提取法，它是由Salton在1988 年提出。其中TF称为词频, IDF称为反文档频率, 感兴趣的可以自己百度。）

3.个人图书馆

如果你是注册用户，在登录账户之后，还可以把自己感兴趣的文献收藏到你的个人图书馆。比如，我喜欢上图的这篇人体姿态估计的文献，点击右上角存盘图标，（看到了吗？就在' rank by tf-idf similarity to this'下面），点击之后就把这篇文献存在我自己的library里面了。

这时，刚刚黑色的图标变成了蓝色，点击上面的library标签，可以看到它出现在了最上方。你可以像这样收藏很多自己感兴趣的文献。想删除的时候，在自己的library里面再次点击那个图标就可以删除了。

4.感兴趣推荐系统

另外，library不光是用来收藏和跟进自己领域的论文更新进度，arxiv-sanity可以通过你收藏的内容给你推荐你也许会感兴趣的论文。具体怎么实现的呢？library内部的论文会被标记为positive，Library之外的论文标记为negative，然后arxiv-sanity基于bigram文本特征提取来训练你的personal SVM，然后在reconmmended 标签里推荐给你。点击recommended标签你就可以看到最近两周arxiv-sanity认为你会感兴趣的文献。当然，你也可以通过设置时间来自己筛选，如去年，上个月，上周，昨天和全部，看看自己有没有错过什么文献。

5.看看大家都在看什么

最后，再介绍一下“top recent”标签。这里面展示的是arxiv-sanity上被用户收藏最多的文献。这些文献也可以按照时间来筛选。即使你不是注册用户，你也可以浏览到大家都在收藏的文献。

6.网站代码开源

在页面上方可以看到，arxiv-sanity只展示machine learning的论文，如CV，CL等ML的分支领域，因为这是arxiv-sanity作者自己的研究领域。（对，这是人家闲暇时间写的）。作者已经把arxiv-sanity开源了，所以如果你想根据自己的研究领域新建自己的arxiv-sanity，可以去GitHub自己fork。GitHub搜索 karpathy/arxiv-sanity-preserver。

各分支领域缩写翻译如下：

cs.CV： Computer Vision and Pattern Recognition 计算机视觉与模式识别；

cs.CL：Computation and Language 计算语言学；

cs.LG：Learning 机器学习（计算机科学）；

cs.AI：Artificial Intelligence 人工智能；

cs.NE：Neural and Evolutionary Computing 神经与演化计算；

stat.ML：Machine Learning 机器学习（统计学）。

好了，就是这样，赶快用起来吧。

总结

能够及时地找到自己感兴趣领域里最新最全的资料，本身就是一种学习能力，如果你有更好的推荐方法和建议，不妨来有三AI分享，一起成长吧。

转载文章请后台联系

侵权必究

arXiv（预印本平台） | 科塔学术

开放存取超过140万篇论文预印本服务平台国内镜像 http://cn.arxiv.org/ 预印本平台(arXiv.org)为全世界的作者和研究人员提供了一个科学研究的开放获取知识库,对所有用户免费 ...
图神经网络中的Graph Pooling

https://blog.csdn.net/leviopku/article/details/106949616 本文仅作学术交流,如有侵权,请联系后台删除. 前言 GNN/GCN在非欧数据中的 ...
1077篇！ICCV2019接收结果公布，你中了吗？（附7篇论文链接，含Oral）

ICCV2019接收论文id查看链接(或后台回复"ICCV2019"获取PDF): https://docs.google.com/document/d/1ip33oABDWYT9 ...
概述：各学科和各种任务的最新机器学习算法

了解NLP,计算机视觉,语音识别和推荐系统的最佳算法 CV Computer Vision, NLP Natural Language Processing, RS Recommender Syste ...
【文献调研中，如何快速找到与某篇文献相关联的文献？】

进入一个新的领域,往往会伴随着大量的文献调研.今天分享一个神器,connected paper:网页链接,它可以分析一篇文献的引文和被引,建立与这篇文献相关的图谱. 打开网站,输入要查询的文献信息(D ...
2020年13篇人脸算法综述，全部安排上

作者丨cynthia yawain 编辑丨极市平台本文为极市平台原创整理,如需转载,请联系极市小编. 导读我们对2020年全部计算机视觉综述论文进行了分方向梳理,本文为人脸识别方向,包括人脸识别. ...
堪比当年的LSTM，Transformer引燃机器学习圈：它是万能的

机器之心报道作者:魔王谷歌研究科学家 David Ha:Transformer 是新的 LSTM. 2017 年 6 月谷歌发布论文<Attention is All You Need> ...
【学会释怀和看淡，才能活得轻松自然】

学会释怀和看淡,才能活得轻松自然文字/网络编辑/思思再远的路,走着走着也就近了:再高的山,爬着爬着也就上去了:再难的事,做着做着也就顺了.每次重复的能量,不是相加,而是相乘,水滴石穿不是水的力量 ...
学会看清自己，才能做更好的自己

学会看清自己，才能做更好的自己
学会看籽料的“细节”| 才能成为玩玉“高手”

上周联盟给大家分享了非常实用的"玩玉"的实战经验,今天咱们主要针对玩料继续深入.玩料玩料,什么样的料子才能称得上是玩料?可根据以下几点分析判断: 玩料细节标准参考 1.形:原石籽料 ...
容易优柔寡断的女生，请看这十句话，学会为自己松绑才能真的快乐

我是用文字温暖你的夕言,点击上方蓝色按键关注我哦. 优柔寡断是很多女生的通病,明明知道这个人不适合自己的,可就是无法下定决心离开,明明知道这件事不可能有好的结果,可就是不舍得放手. 最终,遍体鳞伤.一 ...
新手一定要看！植物浇水法则，学会家里的植物才能越长越旺

花养不养得活全看浇水,但一直以来养花浇水都是一件非常让人头疼的问题,不论新老花友,只要提到浇水都有非常多的困惑. 没错,养花浇水确实有讲究,浇得多了容易导致盆土积水烂根,浇得少了植物生长得不到充足的水 ...
看书法要撑握这几点，学会看书法才能写好书法

在很多人看来,书法高深莫测,觉得是内行人的事,其实,书法是全中国人的事,你可以不写书法,但要会欣赏书法.书法欣赏可谓"仁者见仁,智者见智",不可一概而论,但书法欣赏仍有其基本规律可 ...
新手养多肉别头疼，新买的多肉学会看状态，服盆了才能长得好

老手尚可,基本都已在长久的养花中,摸到了一些门路,不出意外的情况下,均能辨别出多肉服盆的标志.反之,这显然是养花新手的短板,他们中的很多人,不仅无法做好服盆的前期准备工作,合理的安排后续养护,还不太能 ...
新手如何才能学会看盘，看看以下几个方法！

交易的第一堂入门课就是学会看盘,不懂得看盘,学再多交易技巧也如同盲人摸象,交易全靠瞎蒙乱猜,盈亏看运气. 在看盘时,交易者一般有三种下单选择:买入.卖出.观望,而让交易者做出的选择源于他对盘面的认知. ...
【交易知识】新手如何才能学会看盘，看看以下几个方法！

交易的第一堂入门课就是学会看盘,不懂得看盘,学再多交易技巧也如同盲人摸象,交易全靠瞎蒙乱猜,盈亏看运气. 在看盘时,交易者一般有三种下单选择:买入.卖出.观望,而让交易者做出的选择源于他对盘面的认知. ...

【杂谈】如何学会看arxiv.org才能不错过自己研究领域的最新论文？

相关推荐