前40毫升的面试问题和答案

准备闪耀在你的ML面试!在这篇文章中,探索前40名机器学习面试问题和答案,这将有助于你excel和土地梦想的工作。
机器学习的面试问题和答案

目前,人工智能(AI)和机器学习(ML)是两个世界上最流行的技术。

私营企业,以及世界各地的政府组织,是采用新时代技术人工智能和ML让人民服务和信息更容易。

人们很容易注意到这些技术的采用在银行等工业领域,金融、零售汽车、医疗、农业、制造业等。

这些行业的公司正在寻找训练有素的专业人员在数据科学家等组织角色,人工智能工程师,机器学习工程师,数据分析师、软件工程师和开发人员等。

如果你希望这些类型的机器学习工作,重要的是要知道什么样的机器学习面试招聘人员或雇主可能会问你的问题。

在这篇文章中,您将学习40这样的机器学习常见面试问题,他们的答案,一个典型的招聘人员可能会问一个毫升求职者。

以下是他们…

机器学习的面试问题和答案

前40毫升的面试问题和答案

1。解释机器语言,人工智能和深度学习吗?

机器学习:机器学习或ML基本上是人工智能(AI)的一个分支,它被定义为一个机器的能力/计算机系统模仿人类复杂行为。机器学习(ML)是一种人工智能技术,使各种应用软件来预测更准确的结果没有明确设定。

人工智能:人工智能是人类行为的仿真计算机系统。它模拟人类智能依靠算法。换句话说,你可以说AI让计算机像人一样思考。

一般来说,有四种方法来人工智能。

  1. 行为人为
  2. 思考人类
  3. 理性思考问题
  4. 理性的行为

深度学习:深度学习涉及到几个算法,使软件学习自己和有效地执行各种任务,如图像和语音识别。在深入学习、系统暴露大量数据的多层神经网络。

2。机器学习有什么区别和深度学习吗?

机器学习 深度学习
根据过去的数据需要自己决定 人工神经网络的帮助下做出决定
少量的数据所需的培训 大量的数据是必需的
在低端系统非常有效 需要高端系统,大量的计算机能力是必需的
特性必须提前确定和手动 从提供的数据机器学习的特性
问题分为两个部分,一个接一个地解决。 端到端解决方案。

3所示。不同类型的毫升是什么?

一般来说,有三种类型的机器学习。

  1. 监督式学习——一个模型做出预测或决策基于过去或标签数据。
  2. 无监督学习——没有标签数据。该系统能够识别模式,输入数据异常和关系。
  3. 强化学习——基于收到的奖励系统学习以前的行为。

4所示。建立一个模型的三个阶段是什么机器学习?

第三阶段是:

  • 模型建立——选择一个适当的算法模型和训练它根据要求。
  • 模型试验——检查模型通过测试数据的准确性
  • 应用模型——需要修改模型后实时项目测试和使用它。

5。训练集和测试集是什么机器学习模型?

3参与创建模型的步骤。

  • 火车模型
  • 测试模型
  • 部署模型
训练集 测试集
训练集的例子给模型来分析和学习 测试集是用来测试生成的假设模型的准确性
总数的70%数据通常被认为是一个训练集 剩下的30%作为测试数据集
标签数据用于训练模型 无标签数据,然后验证结果与标签

6。监督和非监督机器学习之间的区别是什么?

监督式学习:算法使用标签数据得到训练。模型采取直接反馈确认输出是否正确。SL提供更准确的结果,可以大致分为两个部分,分类和回归。

无监督学习:相反的无监督学习使用无标号数据进行训练。模型识别隐藏数据的趋势没有采取任何反馈!无监督学习模型的主要目的是校正隐藏模式从未知的数据集来提取信息。然而,他们的结果是不准确的。

7所示。semi-supervised机器学习是什么?

监督毫升使用标签数据,无监督学习不使用训练数据。

然而,对于semi-supervised学习,训练数据包含一些标记数据但大量的未标记数据。

8。无监督的机器学习技术是什么?

一般来说,有两种技术:集群和协会。

集群:在聚类方法中,数据被分成子集。这些子集或集群包含数据相似。每个集群显示不同的对象的详细信息。

协会:协会的方法,模式识别不同项目之间的关联。

9。监督机器学习的应用在现代是什么业务?

一些实际的应用程序包括:

  • 医疗诊断——训练模型来检测疾病。
  • 电子邮件垃圾邮件检测——培训模型分类垃圾邮件和非垃圾邮件。
  • 情绪分析——确定正面、中性和负面的情绪。
  • 欺诈检测——模型来识别可疑的模式。

10。机器学习有什么区别归纳和演绎机器学习?

归纳学习 演绎学习
观察实例根据预定义的原则来得出结论。 它使用过去的经验。
例子:让孩子远离毒品的显示一个视频,药物造成损害。 例如:允许孩子使用药物,如果孩子高,他们将学习,它是危险的,避免它。

11。线性回归在机器学习是什么?

线性回归是一个监督机器学习算法通常用于查找依赖和独立变量之间的线性关系进行预测分析。

方程是Y = A + B.X

其中X是输入或自变量,Y是输出或因变量,是拦截,b系数。

12。什么是过度学习,如何避免它?

过度学习发生在一台机器有一个数据集,并试图分析不足。过度学习到的数据量成反比。

有多种方法,以避免过度学习。有些是正规化、交叉验证方法k-folds和制作简单的模型。

13。你如何处理数据集数据缺失或损坏?

最好的方法之一来处理数据缺失或损坏的数据集是放弃那些特定的行和列或完全取代他们与其他数据。

熊猫有两个方法:

  1. IsNull()和dropna()允许您找到与缺失的数据,列和行。
  2. Fillna()将取代错误的价值观与正确的价值观。

14。机器学习中Baye定理是什么?

Baye定理告诉任何事件发生的概率使用先验知识。在数学术语,它可以被定义为真阳性的给定的样本率除以真阳性率之和表示条件和假阳性的整个人口。

15。天真的朴素贝叶斯分类器是什么?

在天真幼稚,贝叶斯假设可能或不可能被证明是正确的。

天真的算法认为存在一个类的一个特性是与班上其他任何功能的存在。

例如,一个水果可以被认为是一个苹果,如果颜色是红色的,圆形的,不管其他特性。但这种假设不一定是正确的,因为樱桃也是一个水果红色和圆形。

16。你如何选择一个分类器基于一组训练数据大小?

当训练集太小,一个拥有正确的偏差和方差的模型是有效的,因为他们不太可能over-fit。

例如,朴素贝叶斯训练集较大时效果最好。

17所示。主成分分析在机器学习是什么?

主成分分析和主成分分析是多元统计技术用于定量分析数据。

主成分分析的目的是减少高维数据降低维度,例如,去除噪声,提取关键信息,如从大型数据集的特性和其他属性。

18岁。机器学习中交叉验证是什么?

交叉验证的机器学习技术,增加一个给定的算法的性能,这是美联储大量的样本数据集的数据。

抽样过程完成数据集分解成更小的部分,其中一个随机选择部分作为测试集,剩下的被用作训练集。交叉验证防止过度学习的数据。

K-fold交叉验证是最受欢迎的技术。其他交叉验证技术分层K-Fold,离开p等。

19所示。机器学习中熵是什么?

熵在机器学习意味着随机性测量在一个给定的数据集需要被处理。如果有更多的熵在给定的数据,然后它变得更加难以得出任何有用的结论。

20.机器学习是什么时代?

时代在机器学习是用来表示通过或者迭代训练数据集的数量需要在设计算法成功地完成其工作。

One pass时计算数据集完成向前和向后传递。

大量数据分组在几个批次。那么这些批次经过给定的模型,也称为迭代。

21。随机森林是什么?

随机森林是一个监督机器学习算法通常用于解决分类问题。随机森林算法在训练阶段创建多个决策树。最后,随机森林选择大多数决策树作为最终决定。

22。你什么时候使用分类回归?

分类时使用目标变量分类(如预测是或否,确定性别,或颜色),而回归时使用的目标是连续的(如预测降雨量或团队的分数)。他们都属于监督ML算法。

23。支持向量机(SVM)在机器学习?在SVM支持向量是什么?

支持向量机是一种机器学习算法,主要用于分类的目的。使用支持向量机算法在高维度的特征向量。

在SVM支持向量数据点靠近仿真。它们影响了仿真的位置和姿态。支持向量帮助建立支持向量机模型。

24。各种内核中支持向量机是什么?内核支持向量机是什么?

各种内核中支持向量机

  1. 线性
  2. 多项式
  3. 径向基
  4. 乙状结肠

内核支持向量机是一种通常用于模式分析的算法。

25。如何设计一个电子邮件垃圾邮件过滤器?

电子邮件垃圾邮件过滤器使用统计分析和决策树等算法和支持向量机(SVM)来确定多久传入电子邮件是垃圾邮件。如果概率是很高,那么该算法将标签为垃圾邮件,这封邮件不会到达收件箱。

设计一个垃圾邮件过滤器包括以下步骤:

  • 垃圾邮件过滤器将充斥着成千上万的过滤电子邮件。
  • 这些电子邮件会被贴上“垃圾邮件”或“不是垃圾邮件”。
  • 监督机器学习算法将决定哪种类型的邮件标记为垃圾邮件的是垃圾邮件通过解析这样的词“免费的钱”,“彩票”,“快速致富”,“赌场”、“全额退款”等。
  • 不同模型的准确性测试后,我们将使用最合适的一个。

26岁。修剪决策树是什么,以及它是如何做的呢?

顾名思义,修剪是机器学习的技术错误或降低了决策树的大小。修剪技术减少了最终的分类器的复杂性,从而增加精度,减少过度学习。

修剪以两种方式实现:自顶向下方法和自底向上的方式。

最常用的是减少错误修剪修剪算法。

27。决策树分类是什么?

顾名思义,决策树分类是一个树状结构与各个节点与各个部门和每个分支。

决策树创建分类或回归模型基于树结构。构建决策树时,数据集分叉成更小的子集反映出树状模型。

决策树分类都能够处理以及数字数据。

28。集成学习是什么?

整体学习技术结合不同的结果从多个机器学习模型来创建更强大的和精确的模型。

最常见的技术参与合奏装袋和促进学习。

例如,随机森林和100 +树更有可能比使用一个决策树给出改善的结果。

29。解释相关性和协方差吗?

密切联系告诉我们如何彼此相关的两个随机变量是定量。其值是- 1和+ 1之间。

公式是相关= x (x, y) / 6 x * 6 y

另一方面,协方差告诉我们一个变量对另一个改变或影响。换句话说,它讲述了两个随机变量之间线性关系的方向。

公式是x (x, y) =σ(xi - x) * (yi - y) / N

30.I型和II型的错误是什么?

错误:错误,也假阳性,是一个错误,测试的结果显示,拒绝承兑的真实情况。

例如,一个人患有某种恐惧,即使他或她不是遭受相同的。

II型错误:II型错误,也假阴性,是一个错误的结果显示了一个错误条件的验收测试。

例如,一个人的x射线显示他们没有任何疾病,但实际上,他或她的确有一种疾病。

31日。你怎么理解F1得分和如何使用它?

F1的分数是一个指标,二进制分类模型的整体精度的措施。理解F1分数之前,您需要了解两个其他指标测量精度,精度和召回。

精度=(真阳性/数量的真阳性+假阳性的数量)

回忆=(真阳性数/真阳性+数量的假阴性)

FI得分= 2 X(精密X召回)/(精度+召回)

F1的分数是最受欢迎的测量精度的机器学习。

32。解释逻辑回归?

逻辑回归是一个分类算法用于预测一组二进制结果对于一个给定的独立变量。这是一个技术进行预测分析。

逻辑回归的输出总是0或1和5的阈值。

例如,它是用来预测是否会下雨(1)(0)。

33。你什么时候使用分类回归?

分类时使用目标变量分类,而回归时使用的目标是连续的。

分类和回归属于监督机器学习算法的范畴。

分类问题的例子是预测是或否,性别识别颜色的类型、评估等。

回归问题的例子是估算降雨天气怎么样,预测未来大宗商品的价格、分数等。

34。偏差和方差在机器学习模型是什么?

偏差:偏差在机器学习模型预报值时发生远离实际价值的方式。低偏见意味着预报值非常接近实际。高偏见意味着预测值远非实际。

方差:告诉我们预测的差异在训练集和其他训练集的预测价值。高方差意味着大的波动;因此方差必须很低。

35。降维是什么?一些方法是什么?

通常,机器学习模型的帮助下设计的特性和参数。这些特性和参数是多维的,大的数字。降维是用来减少这种不相关和冗余特性的主要变量。

降维可以通过结合工程特性与功能,实现消除共线的特性,或者使用算法降维。

36。混淆矩阵是什么?

混淆矩阵是一个特定的表,用于衡量一个算法的性能,给的总结分类的预测问题。它给正确的和不正确的值的计数和错误类型。

他们有两个参数实际和预测。它主要用于监督学习。

37岁。解释的K最近邻算法资讯

K近邻算法是一种分类算法,分配给一个新的数据点邻近部落最相似。K可以是数字或整数大于1。这是一个监督机器学习算法。

38。K意味着和资讯算法进行比较

K的意思 然而,
K的意思是无人监督的ML算法 然而,是一个监督ML算法
K的意思是聚类算法 然而,一个分类算法
变量在每个集群是相似的,而每个集群不同于其他集群 它将一个标记观察基于K周边邻国。

39岁。推荐系统是什么?

人都使用亚马逊购物搜索引擎或者YouTube搜索框能够理解什么是推荐系统。

它是一种信息过滤系统,确定用户想要根据他们的选择模式。他们的购物行为,他们在互联网上搜索或他们想听的,这一切都是预测的推荐系统。

40。亚马逊是如何能够推荐其他东西买吗?推荐引擎是如何工作的呢?

亚马逊是现在最流行的一种购物的算法。一旦一个客户从他们的网站上购买东西,亚马逊商店的购买数据客户备查,并推荐最合适的产品可能会购买的客户。

亚马逊使用关联算法,在给定的数据集可以识别模式和推荐适当的产品根据客户的购物习惯。

绝不是你可以说这是一个机器学习的面试问题及答案的完整列表。你不可能在一篇文章中写这个话题。

然而,40以上问题&答案是最常见和重要的机器学习的面试问题,你是最有可能要求面试官的工作。

更多的问题和答案,我建议你阅读书籍和网上机器学习相关文献以及离线。

40以上的机器学习问题&答案会给你一个公平的想法关于这个话题,帮助你找到你梦想的工作。

1
股票
留下一个回复

你的电子邮件地址将不会被发表。必填字段标记*

Baidu
map