专利分析可视化的数据思维

封面及文中图片来自网络

数据思维是专利分析可视化思维的基础。首先是要保证数据的正确展示,这里既包括了确保数据的准确,还包括了采用合适的可视化图表展示数据,避免展示过程导致读者的错误理解。第二是数据与情报的对应性,即数据要与图表最后所表达的情报信息对应,数据能够支撑信息和情报的输出;第三是要保证数据的全面性,尽可能通过更多数据角度支撑最终的结论,以保证结论的正确性;第四个是要尽可能通过专利可视化表达出数据解读成情报的逻辑过程。

1

数据的正确展示

根据所需展示和表达的内容而定

同样一组数据可以用不同的图表表达,例如一组申请人的申请量的统计数据,可以画出柱状图、条形图、饼图等多种不同的图表,而选择哪个图表则是根据你要展示和表达的内容决定的,如果你选择的图表不适合表达你要展示的内容,那么这个可视化就是失败的。

如图1所示,通过面积图的形式展示技术来源国和目标国。通过该图我们可以获取一些信息,例如:日本是最大的技术来源国,也是最大的技术输出目标国。但这个可视化形式对于表达专利技术的输入输出情况却并不是最合适的,在这个图中没有办法解答如下问题:技术来源国是中国的专利都在哪些目标国进行了布局,因为它左右的树形图是独立的,没有展示出每个技术来源国与每个目标国之间的关系。

图1 技术来源国与技术目标国树状图

但如果我们采用如图2所示矩阵气泡图的展示形式,技术来源国与技术目标国之间的关系就一目了然了。在这个图,我们很容易给客户传达这样的信息:我们国家走出去的专利很少,大部分只在中国申请。相反瑞典籍的申请人,在各大专利局的申请较为均匀。

图2 技术来源国与技术目标国矩阵气泡图

图3展示的是一种常见的IPC分类号统计排序方法,将IPC小组统计出来直接进行条形图排名的可视化。但这种可视化是否准确表达了我们想要表达的信息呢,是否带有可能带来一些错误的结论呢?我们看这个图中,每一个不同的颜色都是属于不同大组和小组的分类号,将这些不同大组和小组的分类号放到一起进行排序并不合适,至少从技术层级上不完全在同一个层次上。我们都知道即使是分类号小组,也是有点组层级的,例如排名首位的B60W30/18是一个一点组(其含义是车辆的牵引),而倒数第三个分类号B60W30/182隶属于是B60W30/18的一个二点组,也就是说被分到B60W30/182的457件专利实质上也都是属于车辆的牵引这个技术的。也就是说这个图实际上并没有很好的表达出这种层级和隶属关系。

图3 IPC分类号申请量排序

如果我们意识到分类号层级的重要性,我们就需要采用如图4所示的图表,该图能够反映层级和隶属关系。上图中最大一级的圆代表了整个数据包的数据量,通过对比第二级圆形的大小可以看出不同大组专利数量的多寡,再向下一级的圆形则是大组下一点组的数量,以此类推。通过这样的可视化反映出的IPC分类号统计才是对分类数据的正确展示。

图4 IPC分类号申请量比较

参考文献书籍:


文源:专利分析师

作者: 可视化撰写组

(0)

相关推荐