笔试分享 | 带你解读校招人工智能笔试题-白红宇

笔试分享 | 带你解读校招人工智能笔试题

阅读量：4227 次

发布时间：2019-05-26

本文共 3605 字，大约阅读时间需要 12 分钟。

来源：机器学习算法工程师

本文约3100字，建议阅读9分钟

本文作者与你分享人工智能校招经验。

疫情下，感觉要爆发金融危机了啊，工作都可能找不到了，赶紧梳理下之前的笔试题，给大家个参考。

想了想当初，面试是在阳台上进行的，中午刚睡醒，然后就是开始自我介绍，然后就是简单的寒暄。

然后根据简历，问我的项目细节，问我使用的哪个卷积神经网络模型，为什么选择这个模型，通常都有哪些模型。

1. 深度学习和过往的神经网络训练方法有什么区别？列举几种深度学习的loss function，并说明意义。

深度学习是一种方法，神经网络是个模型，深度学习方法呢可以有效解决层数多的神经网络不好学习的问题，为了让层数较多的多层神经网络可以训练，能够起作用并演化出来的一系列的新的结构和新的方法；

结构：一般分为两大阵营，CNN，RNN，感觉这里欠妥，请指正；

方法：权重初始化方法（逐层初始化，XAVIER等），损失函数，防止过拟合方法（Dropout, BN等）。

这些方面主要都是为了解决传统的多层神经网络的一些不足：梯度消失，过拟合等。

分类问题常用的损失函数：

交叉熵损失函数，也称作softmax损失函数，可用于解决多分类问题，通过指数化将输出转换成概率的形式；

合页损失函数，一般情况下，交叉熵损失函数的效果优于合页损失函数；

坡道损失函数，对离群点或者噪声的抗干扰能力强，是一种鲁棒性的损失函数，对误差较大的区域会进行截断；

大间隔损失函数，保证能够正确分类的同时，还满足增大类间的差异，提升了特征的分辨能力，防止网络发生过拟合；

中心损失函数，保证能够正确分类的同时，还满足减少类内的差异，提升了特征的分辨能力。

回归问题常用的损失函数：

l1损失函数，衡量的是预测值与真实值之间的偏差；

l2损失函数，效果优于l1；

tukey‘s biweight损失函数，是一种具有鲁棒性的损失函数。

其他任务的损失函数：

KL散度损失函数，衡量的是样本标记分布与真实标记分布的差异，可用于年龄估计等。

2. 什么是卷积神经网络？请说明卷积的意义

分开看就明确了，“卷积” 和 “神经网络”。卷积也就是说神经网络不再是对每个像素的输入信息做处理了，而是图片上每一小块像素区域进行处理，这种做法加强了图片信息的连续性。使得神经网络能看到图形，而非一个点。这种做法同时也加深了神经网络对图片的理解。

具体来说，卷积神经网络有一个批量过滤器，持续不断地在图片上滚动收集图片里的信息，每一次收集的时候都只是收集一小块像素区域，然后把收集来的信息进行整理，这时候整理出来的信息有了一些实际上的呈现，比如这时的神经网络能看到一些边缘的图片信息。然后再以同样的步骤，用类似的批量过滤器扫过产生的这些边缘信息，神经网络从这些边缘信息里面总结出更高层的信息结构，比如说总结的边缘能够画出眼睛，鼻子等等。

卷积的重要的物理意义是：一个函数（如：单位响应）在另一个函数（如：输入信号）上的加权叠加，这就是卷积的意义：加权叠加，不同的卷积核提供了不同的加权方式，从而得到鲁棒的特征，进行参数共享，大大减少了参数量，避免过拟合；