Hiplot绘图项目(无需R语言就可以上车高颜值图表)
众所周知,我个人是极力主张所有想掌握生物信息学的朋友必须入门基于R语言的统计可视化和基于Linux的NGS数据处理。而且一直认为学无止境,提供大量学习资料给粉丝,比如:ggplot2绘图基础功不扎实?看完这5个资源
但不可能人人都有时间和精力系统性学习咱们生物信息学,Hiplot项目为这些无法抽空学习R语言的小伙伴提供了一个解决方案!
Hiplot 是由 openbiox 社区于 2019 年 10 月发起,并在新冠疫情爆发后快速发展的一个社区开发项目:致力于建立一个快速迭代、支持中英文环境的科研数据可视化平台和协作社区。
Hiplot 项目(https://hiplot.com.cn)已经发布有段时间了,截止目前,网站的总访问量大约 7 万余次,在免注册使用大部分可视化插件,以及仅开放教育用户和邀请注册的情况下,已有正式注册用户千余人,日均访问量千余次。目前,该平台提供基于 R 语言的 60 余种基础可视化和 50 余种进阶绘图的功能(可能已经是市面上相对比较全的平台之一),同时还部署了多个 openbiox 社区项目(如 bget 下载文献附录、UCSCXenaShiny 等)。作为开发者,能够看着自己维护的项目从无到有,一点一滴慢慢成长,用户量逐渐增多,也算又一次比较特别的科研经历。我们团队从一开始就希望能够有更多志同道合的朋友参与到我们的社区项目中来,不论你是否毕业于名校、是否在知名院所或科研单位工作、亦或还只是一名未毕业的本科学生。我一直相信每个人都有无限潜能,只要在一个好的团队、好的老师影响下,都可以做的很好。
基础绘图
Hiplot 项目发起的初衷就是为了解决广大临床医学学生和科研工作者的课题数据可视化需求。我身边有很多同时在科研和临床上的朋友,感觉大家都很忙,又要处理众多临床病人、收集样本,又要忙实验、分析数据,同时还要挤出时间去阅读前沿文献和撰写文章。进度比较慢,或者实验迟迟不能出结果的研究生/医生,被导师/上级主管直接在公共场合骂的或者严厉批评的不在少数。科研绘图可能只是大家科研工作中众多复杂步骤中小小的一步,我们希望可以多走出这么一小步,让大家可以更好地、更轻松地完成这一小步(不至于在一开始就放弃)。
组合热图(基因表达、基因突变、元信息)
两个月前的 Hiplot :基础插件大概 40 个,进阶插件 10 几个,开源书籍 4-5 个。只支持 PNG/PDF 格式导出。没有临时区,任务不可以中途切换。没有任务报错提交途径。
现在的 Hiplot:基础插件 60 余个,进阶插件 50 余个,开源书籍 15 个,支持 PNG/PDF 导出,注册用户支持 PPT/TIFF/Plotly 导出。新增了任务临时区,任务提交后可以随意切换和重新运行。提供了任务临时码和全面的用户反馈途径。提供了 Tiny Tiny RSS、Galaxy Mirror 服务。新增加了类知乎的问答专区模块(https://question.hiplot.com.cn/),解决一些用户经常遇到的一些问题和疑惑。同时,新增加了小工具箱(https://hiplot.com.cn/mini-tools)模块,为了后续开发更多临床、湿实验用户需要的小工具。
生物信息学等同于灌水?
之前,有一部分人认为生物信息学不需要做实验,分析公共数据就可以发表 SCI 文章,所以纷纷开始自学 R 语言和公共数据挖掘技能。生物信息学就好像已经成为了论文灌水的代名词。哪怕本身已是生物信息学领域多年的从业人员,可能都希望将自己归类为计算生物学领域,来与之划清界限。在笔者眼里,生物信息学是一个应用面很广的前沿交叉学科。生物信息学数据分析算法、数据库/知识库/Web 服务、公共数据整合分析和挖掘,这些都属于生物信息学的范畴。它们是密不可分的一个整体。同时,生物信息学与各类动植物模型、生物化学/分子生物学实验也都密不可分。其最终研究成果一般都需要被多维度(不同条件、不同队列、不同方法)验证后才能发挥真正影响。
从生物信息学算法/工具/数据库开发者的角度,我们不可能希望大家用它一直去做一些毫无意义的科学研究工作。我们希望我们的工作能够带来真正实际的影响,不论是对社会、经济或者是科学共同体。如何去评价一个科研工作的意义?比较简单的方式就是看后续有没有人、有多少人在这个已有的工作上开展进一步研究工作。以及它所带来的经济效益、社会效应等有多大。发表论文只是我们介绍和宣传自己研究工作的途径,而不是唯一途径。破除唯论文论,首先需要改变的是人心或者说是科研工作者的初心。基于兴趣和实际意义而去探索未知或者能够为其他探索未知的人提供更好的条件应该就是其中我们可以选择的一种。
生物信息学等同于灌水?至少我认为 Hiplot 这个生物信息学项目它不是一个灌水的项目(还有其他很多都不是),我们是真切希望能够为科学共同体贡献出一份力量。
书籍与文档
Hiplot 是如何协作开发的?
Hiplot 是一个非常包容的开放平台,我们提供多样化的协作开发方式,并且非常支持不同开发者贡献可以完成同种数据可视化工作的应用(提高了容错率,并且可以进行结果交叉验证)。Hiplot 的协作仓库主要分为平台核心仓库、社区协作私有仓库、开源协作仓库以及个人私有仓库四部分(开发者自由选择):平台核心仓库与其他相关代码库直接建立 submodule 链接;社区私有库对所有报名和筛选后参与 Hiplot 代码提交的开发者开放 (已开放 20 余个插件的源代码,后续将开放更多);开源协作仓库对所有人开放提交(近期将启用);个人私有仓库也可以直接整合至平台核心仓库。
同时,我们为用户设计了一套完整的成长流程:普通用户(无编程经验或新手入门;有一定编程经验,但是可视化和统计学相关知识还比较欠缺) ⇒ 可视化插件贡献者(入门完毕,通过开发项目练手) ⇒ 核心代码库维护者(熟手,独当一面,Bug 快速解决和性能优化) ⇒ 核心团队(项目管理权限,决定项目走向)。开发者达成一定贡献成就后即可成为核心团队的一员,拥有访问和直接修改核心代码库的权限。理论上,每个人都可以为 Hiplot 添砖加瓦:
提出新特性、新可视化需求; 提交网站 Bug 和安全漏洞; 完善文档; 进行项目推广; 提交可视化代码; 优化 API 接口设计和提升网站性能; 前端 UI 美化和性能提升; 推荐其他优秀人才加入开发团队。
Hiplot 开发者享有的福利:
免费使用 Hiplot; 最优先的功能体验; 社区协作私有库访问权限; 定期的小礼品和周边; 获得 hiplot.org 域名邮箱; 优先吸收加入 openbiox 社区; 科研项目免费技术咨询; 可视化应用优先展示; 按开发者实际贡献进行文章署名和致谢; 其他
临床医生或湿实验工作者如何贡献 Hiplot 平台?
我们非常重视目前奋战在临床一线和湿实验工作环境下的所有科研人员。在 Hiplot 最新版本中,我们新增了一个 https://hiplot.com.cn/mini-tools 独立模块,旨在将来为临床医生和湿实验工作者提供除了科学绘图以外的更多需求:
临床或问卷评分量表; 文件格式转换; 细胞计数; 实验操作手册查询; 一些常用数据库的检索功能; 其他。
作为临床医生或湿实验工作者,如果你希望贡献 Hiplot,则可以:
帮助我们进行正确性测试; 提出更多需求,以此扩充和完善平台功能; 报名作为我们的咨询顾问,辅助开发人员更好地解决你或你身边同学/同事遇到的实际问题(不需要你具备代码开发能力):admin@hiplot.org。
普通用户感言
路人甲:尝试了市面上大部分泛科研绘图网站,还是最爱 Hiplot。 卿:首先很荣幸作为 Hiplot 的首批开放用户,在这里我看到了一款国产在线科研绘图软件的强大。在可视化用户群中每位开发人员都对用户提出的问题进行细致的记录与修改。之前我也尝试过一些其他软件的在线绘图功能,但是对比起来 Hiplot 具有功能丰富操作简单的优势。这款在线软件的产生对于一些不精通编程的基础科研工作者无疑有巨大的帮助。在科研中,时间就是生命,可能在学习和调试一个又一个的绘图代码中,好的 idea 就有可能被别人抢发。我认为 Hiplot 当之无愧是每个一线科研工作者必备的利器,吐血推荐。 路人乙:非常棒的一个网站,已经习惯了每天去刷更新的绘图插件,感谢开发团队的辛苦付出。 林医生:我觉得医生们会爱死 Hiplot。我都舍不得发在朋友圈。 王医生:Hiplot 很好地跨度生物,信息和医学三大学科,并涉猎统计学,美工等多学科领域。目前,医学领域尤其临床医学,稀缺数据分析型人才。但是兼备临床医学和数据分析的双领域人才的培养极为困难。而 Hiplot 有希望能够改善这一现状,帮助更多的临床医生在不需要有太多数据分析知识储备的情况下,只需要提供输入自己的临床数据,依旧能够获得心仪的数据分析结果和精美的科研图片,方便发表高质量文章。 路人丙:已经粉了,很铁很铁的那种。
开发团队成员感言
能在这样的平台开发 R Shiny 应用实属荣幸,平台慢慢成为开发者心中的样子,推广数据分析与可视化应用,为代码零基础的人带去实在的便利,更为开发者提供了一个互相学习的空间。By Chris Lou
随着注册用户人数不断增长,平台操作指南和绘图教学视频的需求日益迫切。我们目前已公布了部分基础绘图简易的中英文指南,在接下来的一段时间内,我们会继续完善绘图指南,并陆续在 B 站发布视频教程,让用户不仅可以根据自身需求绘图,更能实现零基础作图(只需阅读我们的指南和教学视频),真正实现作图无忧。By Mr. Wang
人生有四大幸事,我觉得还应该加上两件,就是与志同道合的朋友一起做事,有人不厌其烦的指导。欢迎更多的朋友加入hiplot大家庭,因为一个人走的快,一群人走的远。Mason Liu
大部分计算机小白刚上来就使用黑白界面的 R 语言是有难度的,从 R 包的安装、数据导入导出、包的用法,到图片的美化等等都可能遇到不同的问题。在没有人指导的情况下,分分钟劝退一点都不夸张。可能 Hiplot 最基础的意义在于可以降低一些软件的学习和使用门槛。同时 Hiplot 的社区协作模式也可以让可视化工具开发者可以更好地统一整合和管理分散的可视化相关代码(如数据的导入/导出、数据的自动化清洗和格式转换、颜色和绘图主题等等),而且也可以让我们更快地去找出某些软件的潜在 Bug ,并了解广大一线用户的实际需求。By Feng.
上一次和项目的发起人 Jack Wang 聊天还是六月初录制关于临床医生学习生信的播客 (https://www.bilibili.com/video/BV1RK4y1x7pM),师兄在节目里提到了 Hiplot,不到四个月的时间,Hiplot 如今已经在我们这个圈子里小有名气。一方面它很好的满足了不少医生学生对于科研绘图的需求,另一方面是这个平台和目前市面大多数类似工具相比更好用。之所以好用是因为整个团队非常给力,新图更新的速度和 Bug 解决的速度都让我佩服。目前作为一个代码贡献小透明,希望后续能多做贡献,现在先卖力安利。Hiplot,你值得拥有!By 思考问题的熊
生物信息学是一门交叉学科,致力于通过计算机和数学等手段,解决生物学中的问题。在我看来,生物信息学是未来生命科学领域发展的大潮流和大趋势,这里并非是指利用生物信息学的方法灌水发文章,而是立足于大列队生物样本多组学测序,来阐释生物学过程,理解生命的意义。生物信息发展,将会为生命领域带来一次"工业革命"。可视化作为生物信息行业的一个重要分支,也将会顺应时代潮流,蓬勃发展。Hiplot 致力于为广大分析人员提供更方便、快捷、全面的可视化应用。我们希望它能够服务更多人,给大家带来赏心悦目的分析图表,为大家解决研究中的问题。By YTDai
很荣幸能加入到这样优秀的团队进行平台的开发,看到平台注册使用用户的不断增长和大家的肯定,是对我们莫大的鼓励,平台的功能和性能也在不断的增加和完善,极大地满足了人们对科研绘图的需求,真正实现了零基础绘图。同时,也为开发者们提供了一个相互学习、团队协作、共同进步的社区,让那些乐于开源,喜爱数据可视化的朋友能充分发挥自己的长处,为广大科研工作者贡献自己的一份力量!By Davey
非常荣幸能够加入 Hiplot 大家庭,作为一个医学生,我深深的明白数据可视化对于提升文章档次以及行文逻辑的重要性。然而想要画好一张 CNS 级别的图片对于科研小白来说是那么的可望而不可即,现在有了 Hiplot,炫酷的弦图、火山图....变得如此简单,用一次你就会爱上它!对于我个人而言,Hiplot 是我向优秀的师兄师姐们学习的最佳途径,能够参与其中本身就让我倍感骄傲,感谢 HIplot!By houshi
最开始和几位创始人一起创立 Hiplot 的时候,其实就是想做一个好用的绘图的网站,解决大家在科研绘图当中的痛点。可是,随着 Hiplot 的不断发展,我开始发现有越来越多志同道合的伙伴,让我兴奋不已。这里面有生信专业的技术人员、有临床医生、有实验人员、有学生、有老师,大家都积极地参与到整个项目中,不断贡献着自己的想法、代码等等,小到一次朋友圈的转发,大到服务器硬件的无偿赞助,大家的努力,让 Hiplot 在上线短短几个月的时间内,从一个"丑小鸭"原型,迅速成长为累计 8 万访问量的科研一体化平台。从想法诞生至今,在将近1年的时间里,我最大的两点收获:
关于未来的规划,我们的团队畅想了很多,大概的方向有以下几个方面:
总之,我们不会忘记自己的初心,希望有更多的开发人员加入进来,把 Hiplot 构建成一个开放性、综合性平台,可以为大家提供一个展现技能、实现价值的平台。
--- By Jack Wang
绘图功能的完善,朝着 GraphPad、Origin 等专业绘图软件靠拢; 生物信息流程的扩展和完善,目前集中火力做单细胞、空间转录组等使用量较大的流程; 临床工具、临床模型的完善,比如临床诊断、预测模型的构建和评估,构建智能诊疗工具; 实验工具的完善,进一步深挖实验技术人员的需求,构建诸如qPCR、引物设计等实用工具; 论文书写工具的搭建,通过 NLP、AI 算法构建智能化 SCI 文章书写、文章框架构建的智能化协助系统; 统计分析,目前的 Hiplot 有一些统计工具,但是不够全面,不够专业,努力向着 SPSS 完善; C2C(Customer2Coder)模式的逐步完善,目前已经实现了 bug 实时反馈的机制,以后还要更进一步完善,将需求和实现无缝衔接,构建一个正向交互的平台环路; 学习社区的进一步完善,构建教程发布、技术交流的交互式平台; 第一,收获了知己,第一次深入认识了很多志同道合的技术宅们,团队里的小伙伴都很可爱,特别聊得来; 第二,收获了知识,Hiplot 最开始的代码框架是很"简陋"的,经过几次的迭代和优化,框架日渐明细和完善,我可以自豪地说,我们的代码可以媲美任何一家市面上的商业化绘图平台;
更多实例
双侧标准化
热图决策树
矩阵气泡图
散点饼图
GO/KEGG 富集分析
gggenes Shiny
森林图 Shiny
OTU Tree Shiny
注册方式
教育用户(有 .edu 或 .edu.cn 邮箱)可以进入 https://hiplot.com.cn/signup 直接进行注册; 非教育用户可以关注 Hiplot 官方微信,并回复 "Hiplot" 申请注册邀请码,管理员会在工作日的 48h 内审核并发送邀请码至您邮箱。
欢迎关注 Hiplot 官方微信,获取每周功能更新推送:
写在最后
和国外已经发展几十年的诸多工具相比,Hiplot 才刚刚起步,略显稚嫩。但是九层之台,起于累土。既然已经开始,剩下的只能交给时间了。感谢所有关注和支持 Hiplot 发展的同学、老师和朋友。同时,也要特别感谢 Hiplot 所有团队成员在过去这段时间里所作出的努力。
我只能说,继续加油吧,少年们。
SPSS:
1968年:斯坦福大学三位学生创建了 SPSS
1968年:诞生第一个用于大型机的统计软件
1975年:在芝加哥成立 SPSS 总部
1984年:推出用于个人电脑的 SPSS/PC+
1992年:推出 Windows 版本,同时全球自 SPSS 11.0 起,SPSS 全称为 "Statistical Product and Service Solutions",即"统计产品和服务解决方案"
2009年:SPSS 公司宣布重新包装旗下的 SPSS 产品线,定位为预测统计分析软件 (Predictive Analytics Software) PASW,包括四部分:PASW Statistics (formerly SPSS Statistics):统计分析; PASW Modeler (formerly Clementine) :数据挖掘; Data Collection family (formerly Dimensions):数据收集; PASW Collaboration and Deployment Services (formerly Predictive Enterprise Services):企业应用服务
2010年:随着 SPSS 公司被 IBM 公司并购,各子产品家族名称前面不再以 PASW 为名, 修改为统一加上 IBM SPSS 字样。
Graphpad:
自1989年以来,GraphPad Software 一直致力于为国际科学界专门创建软件。由科学家为科学家创建的直观程序可以为全球研究人员提供简化数据分析,统计和图形绘制所需的工具。
Prism 8.4.3 - June 17, 2020
Prism 8.4.2 - April 13, 2020
Prism 8.4.1 - March 23, 2020
Prism 8.4.0 - March 5, 2020
Prism 8.3.1 - January 20, 2020
Prism 8.3.0 - October 29, 2019
......
Prism 1.00 - June 1994
Origin:
Origin 自 1991 年问世以来,版本从 Origin 4.0、5.0、6.0、7.0、8.0 到 Origin 2020 ,软件不断推陈出新,逐步完善。在近 30 年的时间里,Origin 为世界上数以万计需要科技绘图、数据分析和图表展示软件的科技工作者提供了一个全面解决方案。
Hiplot Team (admin@hiplot.org)