大数据与营养健康研究
任向楠,丁钢强,彭茂祥,程峰
清华大学化学系
清华大学公共健康研究中心
中国疾病预防控制中心
清华大学科技与社会研究所
大数据是推动人类进步的又一次新的信息技术革命,给公共卫生领域带来了巨大变革机遇,作为公共卫生的分支营养学科也进入了大数据时代。本文收集、分析了大数据在营养健康领域的应用情况,梳理、归纳成六个大的类别,即食物成分电子数据库的管理、营养调查和监测信息的管理和共享、食品安全和食品风险评估、手机的“营养”相关应用程序的评估、慢病管理中可穿戴设备数据的挖掘、公共卫生预警与流行病预测等。同时,通过应用大数据的相关理论,结合我国营养健康领域的实际情况,探讨了大数据对慢性病防控、疾病预测、个性化健康管理、食品风险评估等方面的影响,为营养健康领域的研究提供了新的视角。
1998年,美国《Science》杂志第一次使用了大数据(big data)一词。2008年,英国《Nature》杂志刊登了“大数据”专刊,探讨了大数据在互联网、超级运算、经济学、生物医药等多方面的变革、创新与挑战。2014年,“大数据”首次进入我国政府工作报告,李克强总理提出在疾病预防、社会保障、电子政务等领域开展大数据应用示范。2015年国务院通过《关于促进大数据发展的行动纲要》,引起社会各界的广泛关注。《Science》杂志近年刊登了大数据引入“公共卫生”领域方面的两篇文章【1-2】,然而,作为公共卫生重要分支之一的营养学科的大数据应用报道目前相对较少,本文重点探讨大数据在营养健康领域的应用。
1 大数据的特点
大数据并不仅仅指数量大,更重要的是通过对海量数据的整合、挖掘和分析,发现新的知识、新的信息和新的科技【3】。大数据具有4V特点:数据数量大(volume)、数据类型多(variety)、数据价值密度低(value)、处理速度需求快(velocity)【3-4】。中国科学院李国杰院士建议大数据的研究要多与国计民生密切相关的领域相结合,如科学决策、环境与社会管理、金融工程、应急管理等【3】。
随着食品产业的快速发展,营养与食品安全领域信息已逐步呈现大数据的特征,具体表现在以下四个方面:(1)数据量大:检测机构的食品抽检数据近年快速增长,营养监测涵盖全国数据,至今数据仍在不断地增加和更新;(2)数据种类多:如分析检测数据、营养监测数据、网络舆论数据、现场照片、录像等结构化、半结构化和非结构化数据;(3)处理速度需求快:政府相关部门进行监管决策以及消费者在购买产品时都需要信息参考,而这些应用场景对信息的处理速度提出了越来越高的要求;(4)数据的价值偏低:目前的分析检测数据除了主要以检测报告或统计报表等简单形式外,尚未显著发挥其他作用;然而,全国营养监测的数据公布速度缓慢,滞后的信息很难为相关政策的制定提供充足的循证依据【5】。如何深入挖掘大数据的信息,提高营养监测、食品安全、慢性病管理方面的数据洞察能力,既可以为政府制定相关政策提供依据,也可为生产企业、消费者、社会媒体等社会公众提供信息服务,这既是信息社会的现实需求,也是营养学科发展的必然趋势,更是保障营养与食品安全的有效措施。
2 大数据在营养健康领域的应用
2.1 食物成分电子数据库的管理
食物成分表是食物和营养素相互转化所必备的工具。美国的食物成分数据库将食物分为23类,并侧重于直接入口的食品;英国比较重视食物原料,将食物分为14类【6】。我国的食物成分表在2009年将食物分成了8大类【7】。随着新资源食物品种的不断涌现,食物成分数据库中的食物种类必将越来越多。另外,由于对食物成分分析手段的改进,一些新的营养成分,如植物化学物、抗营养成分等也逐渐出现在食物成分表或数据库,这些更有利于慢性病干预和膳食指导等。各国食品贸易的交流与合作日渐频繁,世界各国的食物成分共享是一种趋势,建立食物成分电子数据库将有利于搜索到高效和准确的信息、有利于不同国家和地区之间的信息共享。
随着生活水平的提高,个性化的饮食越来越受到消费者的关注,特别是对于孕妇、乳母、慢性病等特殊人群的膳食关注尤为青睐【8-9】。个性化智能饮食系统可以根据用户的身体状况、平时的饮食喜好,推荐适合用户的健康饮食菜单。随后,系统对每个菜品设置相关的健康属性,对用户关注的菜品进行跟踪【10】。一方面,经过对用户关注饮食的菜品属性进行分析,挖掘到用户在饮食过程中的饮食喜好,从而能结合中医体质实现个性化菜品推荐。另一方面,这些个性化饮食的电子档案也可为疾病诊断提供参考,进而给出适宜的膳食指导和饮食建议。
2.2 营养调查和监测信息的共享
我国定期会进行全国居民营养与健康调查,不仅可以为修订《中国居民膳食营养素参考摄入量》提供依据,而且可以掌握全国居民的营养状况,某些营养素是缺乏还是过量,这对于慢性病的防控有很大的意义。然而我国的全国居民营养与健康调查仍存在一些不足,一方面,我国营养信息收集的时效性远远落后于发达国家。美国两年进行一次全国健康与营养调查,其调查结果、调查方法、检测手段、趋势分析等信息最早在当年即可在美国疾控中心网站上查询【11】。而我国2002年的全国居民营养与健康调查结果于2004年公布,十年后再次实施的2010~2013年中国居民营养与健康状况监测,其结果至2015年方才公布【12】。在膳食结构和疾病发展变化迅速、互联网交互发达的今天,滞后的信息很难为相关政策的制定提供充足的循证依据。另一方面,我国营养工作和发达国家相比较为落后。美国的全国健康与营养调查分为传统入户调查和可移动监测中心两部分。其中入户调查包括筛查问卷、关系问卷、样本参与问卷及家庭问卷四部分,由专业调查员在住户家中进行调查。同时,为了减少环境因素带来的误差,美国全国健康与营养调查自1999年起引入了可移动监测中心,希望在每一个调查地点都能够在可控制环境内完成身体检测,以及完成血样、尿样及其他生物样品的采集、加工、储存和运输工作【13】。与国外相比,我国营养工作在体格检测、实验室检测、膳食调查、样品运输及数据共享等方面还存在较大差距。加快我国营养监测数据库的建立,将信息及时共享,可以为制定营养素参考摄入量提供最新依据,能及时挖掘到营养素与慢性病之间的关系,及早预防慢性病。
2.3 食品安全管理和食品风险评估
食品安全问题越来越受到消费者的广泛关注。人们摄入被污染或者农药残留超标的食品,将会导致各种急性和慢性疾病,甚至危及生命。大数据的出现为食品安全的有效保障提供了新的平台和视野。刘彤等【14】利用大数据建立了食品安全与营养信息的分析系统。该系统分为数据汇集、数据处理、信息分析和用户应用四部分。首先汇集实验室数据、企业上报数据、现场检查数据、网络数据等,利用相关软件和方法进行数据提取、集成、转化处理,通过产品合格率、用户满意度、热词、信息传播模式、事件关联等分析,挖掘隐藏在数据中的规律,通过网页、电话、笔记本、掌上电脑(PDA)、移动设备的应用程序(APP)等多种信息交互方式为政府、企业、消费者、社会媒体四大用户进行信息服务,促进信息公开与交流。这个平台一方面能加强食品安全检测信息的深度挖掘,另一方面通过关键营养成分信息服务引导使消费者更关注食品的品质。
3S(地理信息系统、全球定位系统、遥感)技术有助于推动公共健康问题的全面发展,结合地理信息和疾病的空间分析最早可追溯到17世纪【15】。将收集到的食品安全信息进行时空GPS定位标注到GIS地图上,结合相应的RS遥感信息,利用相关模型进行数据分析,在大数据平台上实现食品安全可视化,有助于掌握食品安全的态势【16】。庞国芳院士团队的最新研究将食品安全和互联网紧密的联系在一起,结合了高分辨质谱、互联网和地理信息系统形成的三元融合技术,一方面为1200多种农药建立了一个自身独有的电子身份证,建立了以电子标准取代传统农药实物标准做参比的鉴定方法,研究开发了质谱自动匹配筛查软件分析农药残留,能快速筛查非靶向农药的残留【17-18】。另一方面高分辨质谱、互联网和五大数据库形成的监测技术平台,使样品采集、高分辨质谱监测、数据采集和分析、地理信息、食品名称和产地等多维度数据,形成了一条数据链,每个关键节点都有严格的质量控制措施,能保证数据的及时、精确和安全。
2.4 手机的“营养”相关应用程序的评估
近几年,随着移动互联网技术的飞速发展,智能手机和移动医疗对人们健康行为的改变发挥着极大的作用。截至2015年12月,中国手机网民规模达6.20亿,其中22.1%的用户使用过互联网医疗服务【19】。通过随时使用简单方便的手机APP来寻求医疗保健信息和维持个体健康状态,已成为移动互联网塑造的全新社会生活形态。当前,手机应用市场上已出现多种多样的营养APP,为网民提供了方便的营养学习软件。然而营养APP信息的准确性将直接影响人群接收信息的有效性。目前国际上有一些关于营养学习APP内容的评估【20-23】,国内目前这部分还属于空白。应用安卓手机,选用360手机助手和百度手机助手为检索平台,以“营养”作为关键词,360手机助手共搜索到278个结果,百度手机助手搜索到330结果,去除完全无关的软件、英文软件及重复的软件,共有413个软件,主要涉及营养知识学习、孕妇乳母饮食指南、减肥锻炼、美食制作等方面。这些软件中营养知识的准确性及其对于《中国居民膳食指南》、《中国居民膳食营养素参考摄入量》的依从性将直接关系到营养知识的传播效率及民众接收信息的有效性。
2.5 慢病管理中可穿戴设备数据的信息挖掘
近年来,慢病管理的“可穿戴设备”涌入市场,这些设备通过软件录入个人信息如性别、年龄、身高、体质量、职业、个人史、家族史,通过可穿戴设备测出血压、体温、心率、脉搏、睡眠、锻炼习惯、生活方式等生理指标和行为监测数据,通过仪器记录血糖、血脂等生化指标。系统结合各项指标给出用户的健康状态,同时用户也可以根据自己身体各项指标的变化,判断一段时间内身体的健康状况,许多智能的可穿戴设备能够让我们随时、随地、随身获得个体的健康信息、运动状况和慢性疾病管理等健康信息【24-25】。一方面通过收集含有健康状况和疾病预警的人体健康数据,包括生理和行为监测数据,上传至云平台,就诊时医生根据收集的数据,进行病情分析和挖掘,并结合个人基因谱、完整疾病数据及多方面的检测结果,将健康危险因素进行对比分析,给出比普通诊断更准确、有效的临床干预、康复建议和健康指导【26-28】。另一方面,疾控系统、医院、研究单位等可以对采集到的信息进行分析、处理和挖掘,并利用网络技术将数据上传至云服务器,进行云存储、管理和共享,便于相关机构对个体进行远程管理及提供咨询和指导,同时疾控中心也能利用数据预测慢性病的发展趋势【29】。如何挖掘可穿戴设备采集的大量数据,对慢性病趋势的研究、相关部门制定政策及个人自我健康的管理都非常有意义。
2.6 公共卫生预警与流行病预测
美国相关研究显示,美国有三分之一的医疗费用被浪费,大数据的研究将节省12%~17%的医疗成本【30】。2009年,谷歌借助大数据技术从用户的相关搜索中预测到了甲型H1N1流感暴发【31】,其预测速度比美国疾控中心提前了1~2周。谷歌把2004~2008年的流感流行病数据和美国疾控中心数据对比,结果非常接近,基本能够有效弥补卫生系统在疾病预测方面的不足,为疾病的防控赢得了时间。此后,百度公司上线了“百度疾病预测”,借助用户搜索预测疾病爆发。中国疾控中心已于2013年开始与百度公司开展疾病监测预警方面的战略合作。在2014年的Ebola疫情控制中,疾控中心的专家利用流行病学数据建立了相关模型,预测了Ebola疫情的严重后果【2】。有研究者通过社交网络数据的挖掘对人类免疫缺陷病毒患者进行远程监测,其结果与疾控中心的监测结果非常吻合【32】。在过去十年里大数据也已成功应用于心脏病的预测、肝癌特征的辨识,未来大数据必然会对慢性病的预测提供更有价值的信息。
3 结论
在数据爆炸的时代,营养学科面临巨大的机遇和挑战。全球化的数据共享为科研工作者带来新的视角,在第一时间掌握最新的营养和食品信息动态,能有效提供膳食指导,对于慢性病防控、疾病预测、个性化健康管理等方面都有深远而积极的影响。作者建议从食物成分电子数据库的管理、营养调查和监测信息的管理和共享、食品安全和食品风险评估、手机的“营养”相关应用程序的评估、慢病管理中可穿戴设备数据的挖掘、公共卫生预警与流行病预测等六个维度来研究、探讨和推进营养健康领域的数据化和数据开放共享,建立我国营养与食品领域的大数据体系。
参考文献
Khoury MJ, Ioannidis JP. Medicine. Big data meets public health. Science. 2014;346:1054-1055.
Fung IC, Tse ZT, Fu KW. Converting big data into public health. Science. 2015;347:620.
刘智慧, 张泉灵. 大数据技术研究综述. 浙江大学学报. 2014;48:957-972.
龚捷. 大数据时代突发事件的舆论引导策略研究——以议程设置主体话语权变迁为视角. 重庆:重庆大学. 2013.
李磊, 周昇昇. 中国食品安全信息交流平台的建立现状分析. 食品工业. 2011;12:78-82.
潘兴昌, 杨月欣. 国外食物成分数据及其描述规则. 中国食品学报. 2003;3:92-96.
黄淑芬, 曾瑶池, 谢懿. 1991与2009版《食物成分表》常用八类食物营养成分比较. 现代医院. 2013;13:152-154.
熊燕华. 个性化饮食指导在糖尿病患者中的临床价值. 糖尿病新世界. 2016:94-97.
于江荣, 许现娣, 孙伟宏, 等. 个性化饮食处方对妊娠期糖尿病患者母婴的影响. 现代中西医结合杂志. 2014;23:1203-1204.
盛实旺. 个性化的智能饮食推荐系统开发. 浙江:浙江理工大学. 2016.
Centers for Disease Control and Prevention. National Health Interview Survey. Georgia:Centers for Disease Control and Prevention. www.cdc.gov/nchs/nhis/releases.htm
王烨, 于欣平, 曹薇等. “互联网+营养健康”的设想与应用. 营养学报. 2016;38:322-325.
布鲁金斯学会技术创新中心. 中美移动医疗健康研究报告(2014年). 北京:工业和信息化部电信研究院. www.miit.gov.cn/n1146312/n1146909/n1146991/n1648536/c3489521/part/3489522.pdf
刘彤, 谭红, 张经华. 基于大数据的食品安全与营养云平台服务模式研究. 食品安全质量检测学报. 2015;6:366-371.
Richardson DB, Volkow ND, Kwan MP, et al. Medicine. Spatial turn in health research. Science. 2013;339:1390-1392.
肖革新, 肖辉, 刘杨. 食品安全大数据分析思考. 中国数字医学. 2014;9:4-7.
曹新悦, 庞国芳, 金铃和, 等. 气相色谱-四极杆-飞行时间质谱和气相色谱-串联质谱对水果、蔬菜中208种农药残留筛查确证能力的对比. 色谱. 2015;33:389-396.
彭兴, 赵志远, 康健, 等. LC-TOF /MS无标准品定性筛查水果蔬 菜中210种农药残留. 分析实验室. 2014;33:282-291.
中国互联网络信息中心(CNNIC). 第37次中国互联网络发展状 况统计报告. 北京:中国互联网络信息中心. www.cnnic.cn/hlwfzyj/hlwxzbg/hlwtjbg/201601/P020160122444930951954.pdf
Dute DJ, Bemelmans WJ, Breda J. Using mobile apps to promote a healthy lifestyle among adolescents and students: A review of the theoretical basis and lessons learned. JMIR Mhealth Uhealth. 2016;4(2):e39.
Wang Q, Egelandsdal B, Amdam GV, et al. Diet and physical activity apps: perceived effectiveness by app users. JMIR Mhealth Uhealth. 2016;4:e33.
Franco RZ, Fallaize R, Lovegrove JA, et al. Popular nutrition-related mobile apps: a feature assessment. JMIR Mhealth Uhealth. 2016;4:e85.
DiFilippo KN, Huang WH, Andrade JE, et al. The use of mobile apps to improve nutrition outcomes: A systematic literature review. J Telemed Telecare. 2015;21:243-253.
于广军, 杨佳泓. 医疗大数据. 上海:上海科学技术出版社. 2015:7-93.
余德林, 高磊, 孙金海, 等. 大数据技术方法在健康管理中的应用. 解放军医院管理杂志. 2016;23:44-48.
颜延, 秦兴彬, 樊建平, 等. 医疗健康大数据研究综述. 科研信息化技术与应用. 2014;5:3-16.
宋波, 杨艳利, 冯云霞. 医疗大数据研究进展. 转化医学杂志. 2016;5:298-300.
孟润堂, 罗艺, 宇传华. 健康大数据在公共卫生领域中的应用与挑战. 中国全科医学. 2015;18:4388-4392.
张锋, 温鸿天, 黄镇宏, 等. 基于物联网技术的人体云健康监护及预警系统. 计算机测量与控制. 2015;23:1898-1901.
金兴, 王咏红. 健康医疗大数据的应用与发展. 中国卫生信息管理杂志. 2016;13:187-190.
Davidson MW, HaimDA, Radin JM. Using networks to combine "big data" and traditional surveillance to improve influenza predictions. Sci Rep. 2015;5:8154.
Young SD. A "big data" approach to HIV epidemiology and prevention. Prevent Med. 2015;70:17-18.
原文参见:营养学报. 2017;39(1):5-9.