文本描述
百度2014校园招聘数据挖掘笔试题
一、简答题30分
1、静态数据库和动态数据库的优缺点?10分
2、轮询任务调度和抢占式任务调度?10分
3、n折交叉验证的思想?10分
二、算法与程序题45分
1、对一个正整数,找到比它大的最小的不重复数,其中不重复数就是相临的两个数不同,比如1101 是重复数,1231不是重复数?15分
2、很长的一串字符串,求最长回文子串。15分
3、数组a[0],a[1]…a[n-1]是数轴上从左到右的n个数字点,长为L的绳子最多能覆盖几个点?15分
三、系统设计25分 记不清了!!好像如下:
查询q,将样本分为两类xi和xj两个集合,yi和yj是对应相关函数,yi比yj更相关则记为xi>xj;fi(xi)和fj(xj),定义损失函数为 L=log(1+e^(fj-fi));xi>xj 1,求L关于fj,fi的导数; 2.损失函数的缺陷,重新设计