Dataset:Big Mart Sales数据集的简介、下载、案例应用之详细攻略
Dataset:Big Mart Sales数据集的简介、下载、案例应用之详细攻略Big Mart Sales数据集的简介BigMart的数据科学家收集了不同城市10家商店1559种产品,这是2013年的销售数据。其目的是建立一个预测模型,并找出每种产品在特定商店的销售情况。使用这种预测模型,数据科学家atBigMart可以了解产品和商店的属性,这些属性对增加销售额起着关键作用。BigMart Sales面临的挑战是构建一个预测模型来估算特定门店中每种商品的销售额,这将有助于BigMart的决策者找出每一个产品或门店的重要属性,这对提高整体销售起着关键性作用。竞赛地址:https://datahack.analyticsvidhya.com/contest/practice-problem-big-mart-sales-iii/1、特征解释变量描述Item_Identifier商品编号Item_Weight商品重量Item_Fat_Content是否是低脂商品Item_Visibility该商品展示区域占门店中所有商品展示区域的比例Item_Type商品所属分类Item_MRP商品最高售价Outlet_Identifier门店编号Outlet_Establishment_Year门店建立年份Outlet_Size门店占地面积Outlet_Location_Type门店所在城市类型Outlet_Type门店类型(杂货店或超市)Item_Outlet_Sales门店商品销售额(即需要预测的输出变量)Big Mart Sales数据集的下载数据集下载地址:https://download.csdn.net/download/qq_41185868/13715309Big Mart Sales数据集的案例应用1、基础案例更新……Data ExplorationData QAQCOutlier detection and missing data replacement strategyData ETLUnderstanding about sales domainFeature Engineering*Advanced Data AnalysisRegression modeling TechniquesHybrid modeling TechniquesSpecific measure to Evaluate Model 数据探索数据进程离群点检测与缺失数据替换策略数据ETL了解销售领域功能工程*高级数据分析回归建模技术混合建模技术评价模型的具体措施