Percy Liang、李飞飞等百余位学者联名发布:「基础模型」的机遇与挑战
能力:语言、视觉、机器人学、推理、交互、理解等; 应用:医疗、法律、教育等; 技术:模型内部角度(建模、训练、适应、评估),模型输入输出角度(数据),模型的系统性分析角度(数据、安全与隐私、稳健性、理论、可解释性) 社会影响:不平等、滥用、环境、法规、经济、伦理道德等。
基础模型的能力
1.1 语言能力
1.2 视觉能力
文章概述了计算机视觉领域的关键能力和方法,阐明了计算机视觉领域的几大关键任务,包括:语义理解任务,含有几何、运动等元素的三维任务,多模态集成任务等,基础模型在这些任务中可以起到重要作用。
但文章也同时指出基础模型处于初级阶段,可能会整合和影响视觉模型,如面向医疗保健和家庭环境的外围( ambient )智能领域;移动和消费领域;可互动的智能体中领域等。未来发展大规模动态视觉输入的高效建模,将视觉有效推广到自然场景和人类层面的技术将是前景。
1.3 机器人
1.4 推理和搜索
1.5 交互
1.6 理解的原理
基础模型的应用
2.1 医疗保健
2.2 法律
2.3 教育
基础模型的技术层面
3.1 模型内部层面
1)模型的构建
2)模型训练
从系统参数和评价衍生原则选择; 跨数据源、多模态、可扩展的统一训练方法。
3)模型适应性
4)模型评估
3.2 模型的数据层面
3.3 模型的系统性分析
1)系统协同设计
2)安全、稳定、鲁棒与隐私问题
基础模型带来的社会影响
4.1 不平等
4.2 滥用
4.4 合法性
4.5 经济
4.6 道德尺度
赞 (0)