且不说人们控制饮食的执行力如何,在清晰记住或查阅每种食物单位重量的营养含量、目测重量、再计算面前食物各种营养物质总量这一环节,已经使一部分人失去耐心。对此,德国卡尔斯鲁厄理工学院的 Robin Ruede 及其团队本月初发表的题为《在富含营养信息的新型大规模食谱数据集上进行多任务学习,来预测食物热量》(Multi-Task Learning for Calorie Prediction on a Novel Large-Scale Recipe Dataset Enriched with Nutritional Information)的论文中提到的计算机识别方法,或许能够帮助人们轻松完成计算食物营养物质含量的第一步,直达控制饮食的最关键环节。图 | 在多任务设置中进行训练的模型,可推断卡路里、成分和营养素如蛋白质等事实上,使用计算机视觉技术估算图片中食物热量的技术早就有所应用,但 Robin Ruede 团队表示,现有的基于图像视觉计算食物热量的大多数产品通常需要手动输入份量大小甚至指定配料,耗时且不够准确,而且计算过程繁琐。已有技术通常采用多阶段方法完成,将图像按像素方向细分为食物和非食物,然后将属食物的图像分类到固定的类别集,下一阶段进行食物体积、重量估算以及营养信息预测,再通过上一阶段估算出的信息与数据库数据进行匹配来预测卡路里,最后,使用元数据(例如 GPS 位置和用户的食物偏好)来改善预测结果。而 Robin Ruede 团队提出,要 “从一顿饭的图像以端到端的方式直接预测食物热量”,他们引入了一个框架,通过使用短语嵌入将食物成分及质量、与已建立的数据库中大量菜肴食谱图像数据进行对比匹配,从而实现端到端地估算一张图片中食物的卡路里、脂肪、蛋白质以及其他营养物质含量。