笛卡尔实验室告诉你如何经营数据资产
疫情之下,各大航空公司纷纷砍航线、停飞航班,航班骤减90%,繁忙的欧洲上空变得清冷起来。航班减少,也带来了一个副作用,这些航班除了运人、运货之外还有一项功能,那就是给做天气预报的超级计算机提供高空气象观测数据。欧洲预报中心最新报告显示,3月23号跟3月2号相比,来自欧洲上空的实测减少了65%,全球实测减少了42%。
before↑
after↑
缺失了的这部分资料,在包含气象站、卫星、雷达、探空气球等的所有提供给计算机的初始数据中占13%;经此前统计研究,这部分资料对24小时预报中北半球对流层顶附近气温和风速的误差影响可达15%,对近地面气压影响可达3%,给天气预报的准确性带来了很大影响。
欧洲中心超级计算机提供的全球预报准确性领先世界,很多国家和地区都在用它家的模式资料,在我国的业务预报里是一项重要参考。最新消息指出,受疫情影响,3月底澳大利亚上空的航班亦将减少60%,给超级计算机提供的数据还要进一步减少。
要说天气预报的预测会受到影响,介绍一家万物皆可预测的公司给你认识——笛卡尔实验室 Descartes Labs。
前世今生
笛卡尔实验室以17世纪法国数学家笛卡尔的名字命名。2007年时,该实验室作为美国Los Alamos”国家实验室的一个项目而成立。这个Los Alamos国家实验室就是当年因曼哈顿计划组建的绝密 site Y。2014年笛卡尔实验室从Los Alamos实验室分离出来成为创业公司,创始团队是Los Alamos实验室的一组顶级科学家,其基础技术已经孵化了七年多,研究经费为1500万美元。
美国宇航局、欧洲航天局和其他商业卫星资源给它们提供了近四十年的卫星存档资料,并且每天都在扩展,据估计总共数据量达到500万千兆字节。这些天体物理学家和宇宙学家在处理大量图像数据方面拥有丰富的经验,是国际公认的机器学习专家。他们的科学家发表了大量的论文,并参与了有史以来最大规模的计算。
海银资本全球创始人王煜全曾经这样评价数据与人工智能的关系
“未来世界里大数据就是石油,人工智能就是炼油厂,炼油技术已经越来越成熟了,找石油就成了一门技术活。”
靠着“爸爸”给的丰厚“资产”,笛卡尔实验室将人工智能应用到卫星图像上,构建一个生动的、可呼吸的世界地图。每天,笛卡尔实验室的人工智能都在读取和处理近5tb的新数据,包括天气数据和环绕地球运行的卫星最新图像。通过分析千万亿像素的像素,并将其与过去的数据进行对比,它的全自动算法可以确定一片土地是否适合种植玉米,大豆或其他像芜菁之类的东西,以及它的发芽率。红外线读数也可以让人工智能确定某一作物的健康状况,这让他们能够准确地了解地球的未来。
据官网的介绍,他们的业务涵盖了多个行业,主要是以卫星获取各种图像数据,结合气象等各种数据,置于地理空间平台中,形成大数据。通过对大数据进行清洗,重构,最终精炼成各种有效数据进行输出。尤其是在农业方面的NDVI,BAI,SAVI等等,精炼之后输出给第三方用户,用户可根据接口和平台进行对接,提取数据进行有效利用。翻译成人话就是:我们有牛逼的各种遥感科学家,我们有牛逼的数据渠道,我们能够拿到足够多的数据,并能将他们进行清洗和重构,你需要什么只管开口,我们开放接口,你来对接就行了。我们就是基础性的大平台,有了基础数据之后,你们爱怎么玩怎么玩。
通过地球监测,地理定位搜索以及农产品预告,笛卡尔实验室将卫星图像与贸易、经济紧密结合在一起。
辉煌战绩
2017年美国生产超过20亿蒲式耳的玉米,笛卡尔的预估偏差在1%。
笛卡尔实验室首席执行官兼联合创始人Mark Johnson表示,投资者们总是问,你们的玉米模型有什么秘诀吗?但我每次都告诉他们,其实我们没有秘密算法,但是我们的数据比任何人都多,比任何人都好,运行的次数比任何人都多。”
笛卡尔实验室能预测的远不止农作物产量。农业是国家安全和世界健康的保证,食物短缺会导致饥荒,饥荒会导致社会动荡,如果通过预测战乱地区的粮食产量,提前部署,是不是能解决这场灾难?笛卡尔已经这样做了。在美国国防高级研究计划局(DARPA)给予的150万美元赠款的帮助下,笛卡尔实验室正在利用其技术预测食物短缺,并预测中东和北非的社会政治冲突热点地区。
笛卡尔预测的不仅包括地球表面发生的事情,还包括地球上方的空气。与德克萨斯州共同开发二叠纪页岩气的新墨西哥州开始利用卫星和人工智能来跟踪甲烷排放,以绘制甲烷排放地图并采取措施减少甲烷排放。该技术将应用于笛卡尔实验室(Descartes Labs)开发的一个模型中,该模型将使跟踪和量化新墨西哥州蓬勃发展的页岩油行业的甲烷排放成为可能。
2020年,新墨西哥州合作使用笛卡尔的野火探测器预防山火。2018年,新墨西哥州约有360,500英亩土地被烧毁,当年的野火季节在该州引发了1,334起火灾。笛卡尔实验室开始着手使用卫星数据构建自动预警的野火探测器。按照传统做法,火灾是通过飞机、look望塔发现的,或者是由平民报告的,这种做法过程缓慢且不可靠,往往发现山火时形式已经不可控。
Descartes Labs野火探测器基于GOES-16和GOES-17(这是美国国家海洋与大气管理局NOAA最近发射的两颗对地静止卫星,主要用于天气预报。还具有特殊的光谱带并捕获热信息。)的数据。首先,将来自卫星GOES-16和GOES-17的数据和图像摄取到笛卡尔实验室平台中。由于图像是在热红外光谱中捕获的,因此科学家可以在拍摄图像时测量地球的温度。笛卡尔实验室通过数据分析,运行几种算法以确定是否存在火灾。比如说,一种算法着眼于空间环境,检查火势是否比周围环境更热。另一种算法会及时回溯,以查看没有火灾的区域正常情况,以查看是否发生了变化。第三种算法查找与历史温度相比异常高温的区域。
尤特公园大火于2018年5月爆发。
左图的光学图像显示烟羽的增长,右侧的红外图像显示鲜红色的火。
每种算法都查找野火的不同属性。如果算法之间达成共识,那么笛卡尔实验室可以高度肯定地确定发生了火灾。如果算法确定有野火,则将信息发送到新墨西哥州林业局。从捕获数据到报告数据,整个过程大约需要9分钟。
前不久,中共中央、国务院发布了《关于构建更加完善的要素市场化配置体制机制的意见》,落实十九届四中全会精神,将数据纳入生产要素范畴。从这个角度来看看,笛卡尔实验室,它的财富可真是够分量了。这家公司自己很难满足那么多用户的个性化需求,未来还是要靠各个行业里的专业机构给自己的数据找到更多的应用场景,所以,对于那些打破迷关的如何使用数据的创业公司来说,机会真的是已经来了!
王煜全
全球科技投资人、海银资本创始合伙人
如果你也想在前沿科技趋势中寻找机会、增长见识、开始行动,成为中国这一批最懂全球化的企业家、创业者、制造家,请加入我们最有活力的创新社群,欢迎报名加入【前哨科技特训营2020】
— 报名咨询 —
▼