数据分析师常见的面试问题

时间:2022-06-26 15:47:42
数据分析师常见的面试问题

数据分析师常见的面试问题

  随着大数据概念的火热,数据科学家这一职位应时而出,那么成为数据科学家要满足什么条件?或许我们可以从国外的数据科学家面试问题中得到一些参考,下面是77个关于数据分析或者数据科学家招聘的时候会常会的几个问题,供各位同行参考。   1、你处理过的最大的数据量?你是如何处理他们的?处理的结果。   2、告诉我二个分析或者计算机科学相关项目?你是如何对其结果进行衡量的?   3、什么是:提升值、关键绩效指标、强壮性、模型按合度、实验设计、2/8原则?   4、什么是:协同过滤、n-grams, map reduce、余弦距离?   5、如何让一个网络爬虫速度更快、抽取更好的信息以及更好总结数据从而得到一干净的数据库?   6、如何设计一个解决抄袭的方案?   7、如何检验一个个人支付账户都多个人使用?   8、点击流数据应该是实时处理?为什么?哪部分应该实时处理?   9、你认为哪个更好:是好的数据还是好模型?同时你是如何定义“好”?存在所有情况下通用的模型吗?有你没有知道一些模型的定义并不是那么好?   10、什么是概率合并(AKA模糊融合)?使用SQL处理还是其它语言方便?对于处理半结构化的数据你会选择使用哪种语言?   11、你是如何处理缺少数据的?你推荐使用什么样的处理技术?   12、你最喜欢的编程语言是什么?为什么?   13、对于你喜欢的统计软件告诉你喜欢的与不喜欢的3个理由。   14、SAS, R, Python, ……此处隐藏1418个字……   57、是假阳性好还是假阴性好?   58、你熟悉价格优化、价格弹性、存货管理、竞争智能吗?分别给案例。   59、Zillow’s算法是如何工作的?   60、如何检验为了不好的目的还进行的虚假评论或者虚假的FB帐户?   61、你如何创建一个新的匿名数字帐户?   62、你有没有想过自己创业?是什么样的想法?   63、你认为帐号与密码输入的登录框会消失吗?它将会被什么替代?   64、你用过时间序列模型吗?时滞的相关性?相关图?光谱分析?信号处理与过滤技术?在什么样的场景下?   65、哪位数据科学有你最佩服?从哪开始?   66、你是怎么开始对数据科学感兴趣的?   67、什么是效率曲线?他们的缺陷是什么,你如何克服这些缺陷?   68、什么是推荐引擎?它是如何工作的?   69、什么是精密测试?如何及什么时候模拟可以帮忙我们不使用精密测试?   70、你认为怎么才能成为一个好的数据科学家?   71、你认为数据科学家是一个艺术家还是科学家?   72、什么是一个好的、快速的聚类算法的的计算复杂度?什么好的聚类算法?你怎么决定一个聚类的聚数?   73、给出一些在数据科学中“最佳实践的案例”。   74、什么让一个图形使人产生误解、很难去读懂或者解释?一个有用的图形的特征?   75、你知道使用在统计或者计算科学中的“经验法则”吗?或者在商业分析中。   76、你觉得下一个20年最好的5个预测方法是?   77、你怎么马上就知道在一篇文章中(比如报纸)发表的统计数字是错误,或者是用作支撑作者的论点,而不是仅仅在罗列某个事物的信息?例如,对于每月官方定期在媒体公开发布的失业统计数据,你有什么感想?怎样可以让这些数据更加准确?
《数据分析师常见的面试问题.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式