大家好,今天是2021年1月2日,五年前的今天,2016年1月2日,专利分析可视化发出了第一篇文章。五年来,我们坚持每周发一篇原创文章,截止目前已经发出了458篇原创内容。
感谢小编们五年来不求任何回报的坚持创作,在创作的同时小编自己也不断学习到了很多新的知识和技能。
也感谢亲爱的读者们,常常给我们留言鼓励和打赏,因为你们的支持,才能让我们一直坚持下来。
创办“专利分析可视化”这个公众号的目的,就是为了跟大家分享专利分析、数据可视化的思想和方法。所以今天我们跟大家分享猫老师的文章《从统计到分析》,这篇文章也是即将出版的《专利分析实务手册(第二版)》中的部分内容。
文末还有福利,注意看完哦~
初入行的分析人员在开展专利分析工作时,最容易发生“卡顿”的位置就在于,当按照常规分析的套路完成了各著录项目的统计,甚至完成了各著录项目之间常见的交叉统计之后,不知道应该从何处入手进行所谓的“深入分析”。众所周知,“异常点”是专利深入分析的切入点和突破口。态势分析中常见的是,通过对高点、低点、拐点等“异常”数据发生的原因和背景进行分析,从而对影响数据变化的因素进行梳理,进而基于现状对未来进行预测;排名分析中常见的是,通过对排名靠前或靠后以及通过其他途径确定的重点对象所处位置等“特定”情况进行追踪分析,从而发掘出值得关注的主体或事件,进而为后续的监控、对策、解读或借鉴等行为提供基础。然而,有些异常点是明显的,例如曲线图上的高点等,但有些异常点则是隐形的,同样以曲线图为例,某领域大型公司申请量的总体态势是平稳向上的,似乎缺少值得关注的异常点,但如果行业总体的申请态势在某年份存在大的波动,申请量急剧减少,那就意味着该公司在相应年份反而是相对异常的。从这个例子可以看出,在捕捉异常的过程中,最容易发生“卡顿”的原因在于,“异常点”是相对于“常态”存在的概念,初入行的分析人员由于不了解常态而无法发现异常,其与经验老道的分析人员在发掘异常点能力方面的差异,往往来自于对常态的熟悉度不同。
例如,当对甘精胰岛素领域的申请人进行排名分析时,不难看出,原研药企赛诺菲安万特高居榜首,而在胰岛素领域深耕多年的诺和诺德排名第二,礼来与勃林格殷格翰形成联盟则排名第三,其次为其他企业。围绕这样的数据,如果开展深度的分析,常见的是对排名第一的原研药企,以及作为竞争者的排名第二和第三的药企进行分析,或者还会进一步对我国企业山东新时代进行分析,往往会忽略其他企业。但是,分析实践中却放弃了排名第二的诺和诺德,转而对排名位置似乎有些不上不下的BIODEL和WOCKHARDT进行了深入分析,原因是这两个企业并不是医药领域常见企业,对医药常见子领域进行分析时并未见到这两个企业,此时排名相对靠前,就属于“异常”,必然有其值得分析的特殊原因。在这个过程中,能够发现这两个企业是值得分析的“不常见”企业,凭借的是分析人员清楚地知晓何为“常见”企业。
同样的,再例如,当对肿瘤免疫领域CAR-T细胞免疫疗法的申请人类型进行分析时,发现除了企业和高校以外,还有多家医院申请量较为突出,后续报告就对其中部分医院专利技术的内容和合作研发模式等方面开展了深入分析,原因就是分析人员根据对医药全产业链的了解能够知晓,医院往往是药品的消费场所,而非生产场所,因此很少会以研发者的姿态出现,这些医院就是值得关注的“异常点”。归根结底,分析人员发掘“异常点”仰赖于对“常态”的熟悉,那么如何积累产业常态信息呢?
一是,致力于做好专利分析的人员必须坚持做一个持续的技术和产业发展追踪者,在本领域内通过日常的技术和产业新闻阅读,不断的积累和更新常态。当然,人力有穷尽,除了打造自身硬以外,也可以借助“外脑”作为补充,通过与行业内的专家交流座谈或者收集调查问卷等多种形式,快速补充产业常态信息。二是,重视分析过程中行业调查报告和技术调查报告的撰写工作,这两份报告原本的目的就是通过收集整理相关信息以帮助分析人员快速建立起技术和行业发展的常态认知。三是,结合课题前期的统计分析结果,基于申请量态势、申请人排名、各技术分支比较等统计信息,或者通过对现有已知的相同或相似领域的分析类报告和技术综述的学习,基于技术发展的一般逻辑,形成正在分析的领域和技术“应然”状态的心理预期,从而找到与之不同的异常状态。
2. 寻找“意义”——写什么
做专利分析的人常说“分析不是数羊”,是指分析不能仅仅停留在数量统计和描述的阶段。对申请总量按照不同的维度进行细分,从而在比较中分析异同,发掘各自的特点,是所有专利分析项目的基础性计数工作,但仅仅通过图表和文字展示计数之后的数量大小、排名先后、占比差异等等,是对数据的描述,而不是分析。
分析应当是在对数据呈现出的现状进行描述之后,对原因进行探求,对未来进行预测,这实际上是一个解释数据的意义的过程,在分析报告中多以“是因为”和“表明了”的方式呈现。例如当申请量陡然增长时,意味着什么?是什么力量导致了这种现象的发生?也许是理论研究的突破性进展,也许是重大成果的示范效应,也许是全球经济形势的快速回暖,也许是行业鼓励政策的出台等等,能够对申请量产生影响的因素有很多,哪一个切实地在发挥作用?哪一个又占主导地位?通过追问“为什么”来对数据的意义进行解读,是从数羊到分析的关键一步。在这个过程中,最容易发生“卡顿”的原因在于,无法尽可能穷尽地罗列出足够多的对数据产生影响的可能的原因,或者无法知晓如何证明可以归因于某个原因,也就无法对可能原因进行逐一排查。
对原因的积累可以通过阅读其他人的专利分析报告或者市场分析报告等类似的分析报告,观摩对方是如何对数据产生的原因进行分析的,从而不断延长自己心中的原因列表,也还可以通过一定的思维训练来提高自己的原因分析能力。
上图中列举了专利分析中常见的标引项,可以对这些标引项进行两两组合,并尝试解释当其发生变化意味着什么。例如:
如果在某领域,不同的申请人类型,其申请的专利在法律状态方面存在差异,企业平均有效专利高于高校平均有效专利,是否说明在该领域企业研发实力优于高校?
如果某市场主体,在不同的国家,专利申请类型的占比存在明显区别,实用新型占比在某地区明显占比较高,是否意味着该区域只是短期目标市场?
如果在某地区,行业领先的某企业却很少进行专利布局,是否意味着该区域已经存在严重的专利壁垒?
通过这样的练习,能够促使自己对数据的意义进行思考,形成一系列假设,积累一系列可能的原因,同时也能够达到在学习其他的分析报告时带着问题学习的效果。
如何完成归因更能体现一名分析人员的逻辑论证能力。大体而言,最终的归因无外乎三个角度:技术本身、权利影响和市场情况。技术有其自身的生命周期,替代技术和支撑技术都会强烈的影响技术的生命周期,从而影响记载和保护技术的专利申请的数量与分布;权利之间的相互排斥和/或联合,以及权利的生产周期,也会对权利本身的数量和分布产生影响;而不论是技术,还是权利,最终的目的始终是市场,市场释放出的利好或利空信号,以及市场对产出专利的成本和对市场主体的行为的直接作用,也同样会对专利申请的数量和分布产生影响。
从上述三个视角出发,具体对归因进行分析时采用的方法通常是数据的进一步拆分与比较,通过细分来排除或者确定某些原因。仍旧利用图中列举的标引项来进行思维训练和实际操作,可以通过再引入其中一个标引项,对数据进行拆分和比较,来证明归因是否正确。
例如,市场主体A的专利申请量高于市场主体B,是否意味着A技术实力优于B?
引入标引项申请日来分析是否是由于A历史更悠久造成的?
引入标引项申请类型来分析是否是由于A的改进策略是小步快跑或者市场策略是短平快导致的实用新型产出量和速度较高造成的?
引入申请人标引项来分析是否是合适的合作对象的带动效应?
通过不断的继续拆分和交叉分析,对最终的归因给出尽可能详实的论证使得分析的结论更具可信性。在这个过程中,最忌讳的是想当然的简单归因。数据统计完成,不去做细分的比较,简单地将原因归结为某个可能性是不可取的,这样的分析报告会显得没有说服力和可信度。
专利分析工作的开展始终要围绕分析的目的,明确通过专利分析工作所要解决的存在于产业发展、技术研发或者专利运营等工作中的问题,越是具体而微的、明确的目的,越有利于选取合适的分析子项目,并进行工作分解和分配。分析工作开展之初最容易发生“卡顿”的原因往往是分析目的相对比较宽泛,例如对某领域或某区域的情况进行总体摸排,以厘清现状,发现存在的问题并找到解决的办法,即需要通过开展分析工作来发掘存在的问题和具体的分析目的,相对宽泛的分析目的会导致无法快速有效地选取分析的子项目类型,造成分析人员无从下手进行项目分解。在彷徨的时候,惟有行动才能寻找方向,实践永远是解决问题的最佳手段,就像科技研发一样,通过小型预实验从零获取一,再从一到十。破局之法是将分析目的不明确造成的大开放式的“问答题”先按照简单的“选择题”来做,选取常规的著录项目进行统计分析,通过对各个选项的梳理和比较,来快速获取分析对象的整体概况,再通过标引项之间的交叉分析来寻找和选择值得关注的异常点,综合专利数据信息和前期调研信息,最终确定值得分析的合适的子项目,完成具体分析目的的聚焦工作。之后,针对具体分析目的来完成一道“论述题”,对异常点进行深入的追踪分析,阐明其代表的数据意义,解释其产生的原因,并针对原因给出解决办法,能否交出一份证据充足、论述详实的答卷是体现分析报告是否具有足够的深度的关键。一是,行动要有一致性,在对选取的标引项进行初步统计分析,特别是将不同技术分支或者不同的申请人与其他标引项进行交叉统计分析时,应尽可能的选取相同的标引项组合方式。同时,对于同一术语也应规定相同的含义,例如欧洲是指欧洲国家的集合,还是特指欧专局。统一的目的是为了形成可进行比较的基础。二是,在回答“论述题”时,应根据之前初步比较之后得出的各自的特点有针对性的进行“差异化”地深入分析,如果一份分析报告选取的各重点分支之间分析了完全相同的分析子项目,无法提供个性化地解决各分支之间的问题和需求,那这份分析报告十之八九是极其平庸的。此外,在专利分析的工作中经常会听到“一步到位,不要返工”的呼声,其结果是花了大量的时间来论述方案的可行性。古人云,与其坐而论道,不如起而行之。能够解决实际问题的专利分析常常需要随着数据特点的浮现有针对性地调整分析重点,只有迈出第一步才能知道下一步该怎么走,所以与其停滞在纯思考中,不如小范围的开展一些尝试性的标引、统计和分析工作,在实践结果的基础上再调整实践的方案。而且在前述的归因过程中,也常常会出现细分分析后,对于假设的原因似乎既不能证实,也不能证伪,看似白做工,但实际上将这种未证实的结果与其他结果综合比较后,就能得出何种归因更能够获得数据的有效支撑的结论。分析工作中也许有白做的功课,但没有白付出的努力,尤其要记得一点:越是只能从专利信息中获取的新的信息,越是靠人工一篇一篇专利文献读出来的。