文本描述
2019届京东春招商业分析笔试 1.数据分析类型的描述错误的是() 正确答案:A A.描述型:从自然语言中提取含义 B.预测型:通过历史数据预估未来 C.指导型:提出建议 D.诊断型:解释问题的发生 2.CRISP-DM(即“跨行业数据挖掘标准流程”)将项目分成的阶段为()正确答案:C A.业务目标-数据了解-数据准备-建模-部署-维护 B.业务目标-数据采集-数据清洗-数据挖掘-评估-结论 C.商业了解-数据了解-数据准备-建模-评估-部署 D.商业了解-数据采集-数据清洗-建模-结论-评估 3.用回归模型预测时,() 正确答案:B A.R平方越大越好,P值越大越好 B.R平方越大越好,P值越小越好 C.R平方越小越好,P值越大越好 D.R平方越小越好,P值越小越好 4.下列关于假设检验的说法中,正确的是() 正确答案:D A.假设检验中II类错误是指真实情况为H0成立,但判断H0不成立,犯了“以真为假”的错误, 其概率通常用q表示。 B.假设检验I类错误是指H0实际不成立,但判断H0成立,犯了“以假为真”的错误,其概率 通常用a表示。 C.在固定样本例数的情况下,a越大,6越大。 D.单尾检验:H0:口}口0,H1:口平0。 5.下列各项关于聚类分析的描述中,不正确的是() 正确答案:C A.常用的聚类算法包括层次聚类、K-均值聚类和DBSCAN聚类 B.相关聚类度量是表示两个事物之间关联度的值,常见的计算方法包括SADxSSDxMAE、MSE、 欧几里得度量、曼哈顿距离等 C.层次聚类算法的缺点是必须提前知道数据有多少组/类,否则会造成严重的错误和偏差 D.自下而上层次聚类算法称为凝聚的层次聚类算法,自上而下的层次聚类算法称为分裂的层次聚 类算法 6.回归分析的前提假设不包含() 正确答案:B A.因变量同方差性 B.自变量为随机变量 C.因变量与自变量呈线性 D.残值(剩余误差)正态分布 7.根据表中数据,以下分析错误的是() Coefficients3 Model Unstandardized Coefficients Standardized Coefficients tSig. BStd.ErrorBeta 1(Constant)-710000.000105009.052-6.808.000 30.0001.297.95622.871.000 点击率15666.0002668.718.2515.870.000 价格-36.00072.052-.009-216.830 a.DependentVariable:销售 正确答案:C A.在其他条件不变的情况下,客流每增长1,销售预计增长30。' B.点击率为百分数,导致其系数较大。 C.降低价格可以明显提高销售。 D.各变量可以取自然对数再做回归,并能反应弹性关系。 8.下列各项说法不正确的是() 正确答案:C A.逻辑回归模型是基于数据服从伯努利分布(BernouHiDistribution)的前提假设下实现的。 B.主成分分析(PCA)和因子分析(FA)两者都常用于数据降维和信息浓缩。 C.因子分析中按照因子的贡献率从高到低排列,选取贡献率较高的因子来解释与因变量的关系。 D.因子分析着重要求新变量具有实际的意义,能解释原始变量间的内在结构,但因子分析得到的 因子数量一般由人为事先确定。 9.以下方法适用于评估决策单元(DMU)从投入到产出的效率的是() 正确答案:C A.整数规划(IntegerProgramming) B.动态规划(DynamicProgramming) C.数据包络分析(DEA) D.离散事件模拟(DES) 10.随着快递的普及,物流对一个公司的利润甚至国家的经济都会产生重大影响,因此物流优化至 关重要。现假设有三个物流城,可分别输送到四个城市。每个物流城运输到每个城市的单位材 料的交通费用如下表所示。且已知每个物理城最多可分别提供3500,5000和4000个快递,而 每个城市的快递需求分别是4500,2000,3000和3000个。要使 总运输费用最小,下列说法不正确的是()