1.大佬总结-七厂22场算法岗面经

 

作者:踏云逐梦
链接:https://www.nowcoder.com/discuss/98421
来源:牛客网

秋招提前批基本结束,前前后后面了7家公司22场技术面,全部流程都走完了,目前过4待定3,发波面经攒RP。

本人nlp方向无top水硕,总体来说,各个公司风格差别很大,但总的来说就是手撕算法,细扣简历项目及其涉及到的算法基础,给实际场景求解题思路三种。项目相关没啥参考性,这篇面经主要是算法题以及场景题

 

 

微软一面30min

手撕:一堆绳子,给定段数k,求最大的可能长度

 

微软二面30min

手撕:逆序对问题

英语自我介绍

中文讲项目

一开始没做出来,最后变成了写归并排序,然后才做出来

 

微软三面40min

手撕

环形有序链表插入元素

英语讲项目,项目中的最大困难,如何解决

给定股票价格图,初始资金,求最大收益

 

微软四面

某部门老大,

貌似是个大佬,全程项目

 

 

阿里一面 1.2h

现场

手撕:判断一个字符串是否能被分割成斐波拉契数列

项目

场景:给1w人数据集,判断一个新的名字是男是女(新名字不一定合法,如张凳子;新名字的字不一定出现在训练集中)

给淘宝相关数据,为女生节活动筛选出100个女生。

聊天

 

阿里二面 1h

部门老大,现场

全程白板讲项目,感觉不像面试,更像交流会

期间穿插具体工作中的问题,问我的思路:

商家买了“拖鞋”关键字广告,但拖鞋分很多种(室内、室外、男、女等),如何有针对的推荐

如何把不同维度的信息向量化,用以深度学习系统,如:商品描述,图片,用户信息,购买记录等等。

数据可视化怎么做

 

 

阿里3面  50min

详细梳理项目,细致到分析所用神经网络神经元中参数的维度。

关于论文研究,创新点在哪里,为什么这么做,如何运用到实际任务中。

项目中有的用了CNN,有的用了RNN,两者特征有什么区别,如何根据具体任务判定使用哪种网络结构

 

华为一面30min

全程项目

 

华为二面30min

全程项目

 

华为总裁面

聊天……

 

拼多多一面40min

手撕一个easy级别题目,接下来全项目

 

拼多多二面1.2h 

手撕一个easy级别题目

深度学习中的过拟合,如何解决

梯度消失原因,解决方法,为什么LSTM可以避免梯度消失(数学层面分析)

BN公式,为什么work

 

头条一面

完全手撕代码

已知f(x)的定义域在正整数,值域在正整数,单调递增。

给定y,求t,使得 |f(t)-y| 最小

函数可能溢出,只保证出题有意义,那么,二分上界为多少

 

给数据流(大于内存上限),m,求从数据流中抽样m个样本。

 

头条二面

完全手撕代码

定义:

Double A[N]

Double ans=0;

For(i=0; i<n; i++)

   For (j = 0; j<n; j++)

{

Ans += abs(A[i]-A[j])           (1)

Ans += floor(abs(A[i]-A[j]))      (2)

}

优化算法至O(n^2)以下。1,2代表第一问和第二问

 

头条三面

项目介绍

你投的文章没中,为什么没中,怎么改进

手撕代码

给一个只包含‘(’ 和‘)’的字符串,求最长合法子串,要求用两种以上的O(n)算法求解。

 

腾讯一面 1h

算法:x的n次方 (最水版,越界检测,高精度计算什么的完全不需要)

四个项目,串在一起,讲一遍

 

 

腾讯2面 30min

项目

应用场景面:从一系列的用户行为特征中选出用于支撑推荐系统的重点行为

 

 

腾讯3面  30min

项目

项目中最大困难,如何解决,你在团队中的角色。

应用场景面:如何生成有吸引力的新闻标题

职业规划

 

腾讯4面  40min

项目

场景:同时出现多个球星名字的新闻在新闻分类中通常被分做体育类别,但是如果一条新闻内容是一群球星参加了某电影的发布会,简单将其归为体育类显然是不合适的,如何处理

腾讯和阿里的比较(送命题)

工作地意愿

 

 

百度1面  45min

手撕代码:

给定一个字符串,请找出最长无重复子串,要求输出子串和子串的长度

求解N以内的所有质数

简单简历面

Dropout的理解

 

百度2面 45min

手撕代码:

一系列有序数列,求出现次数topk的数

简单讲下项目

 

百度3面 1.5h

序列标注你知道多少

序列标注如何在没有上下文的情况下区分周杰伦-青花瓷  周杰-伦青花瓷(不能使用词库)

序列标注中,如何针对语音识别中的错误进行纠错

实体链接知道吗,你觉得可以使用什么类型的特征做

设计一个识别如“放《晴天》”这样的语音指令的模型

关系抽取模型如何针对特定领域进行优化

Joint train序列标注模型和关系抽取模型时,为什么不用CRF

你怎么看当团队需要你离开最熟悉的领域进行新方向的研究和开发

 

 

 

 

 

 

2.百度阿里图像算法岗面经

作者:明月千里寄相思2
链接:https://www.nowcoder.com/discuss/122670
来源:牛客网

一.百度面经

百度是转正面试,虽然是转正,但也不水。

1.一面

实习期间做的项目,具体到网络结构参数,损失函数怎么定义等等;

Linux常用指令,比如如何找到Python的进程并杀死;

git常用指令,遇到冲突怎么办;

resnet,mobilenet比较分析特点;

bn层详解,优点以及如何反向传播;

算法题:最长公共子序列;

开放题:图文匹配,训练模型如何采集数据,如果构建模型,以及hard case怎么收集?;

2.二面

如果bat都给你offer的话怎么选?;(肿么可能)

觉得技术的价值在哪里;

最优化里面的一些算法,牛顿法,共轭梯度法,拟牛顿;

3.经理面三面

最近感觉工作怎么样?压力大不大?

(因为楼主最近在做粗分类,所以)

粗分类要怎么做?最重要的是什么

还有一些和实习相关的问题~~

 

二.阿里(时间久远记不太清了)

1.一面(还比较正常)

cpp基本知识,内存分配,堆和栈哪个快,指针引用区别,虚函数;

目标检测算法rcnn系列到yolo等梳理一遍;

问ssd如果做道路上汽车的检测应该怎么改进比较合适;

堆排序;

关于排序的一个情景题(25个小车 速度未知,只有五个跑道,如何最快选出最快的五个车);

二面全程讲项目

三面蚂蚁面试官交叉面,讲项目

四面主管面:讲项目

HR面:还问了一些技术问题,然后就是正常HR面问题

 

 

 

 

 

 

 

 

3.百度-机器学习

 

作者:过把火
链接:https://www.nowcoder.com/discuss/121233
来源:牛客网

百度正常批,成都面经

一面:

一面遇到的面试官十分注重算法基本功,因此一口气被问了5道编程:

1、链表反转

2、二叉树后序遍历

3、TopK

4、IP地址 32位int存储

5、快排非递归

全部编程题需要手写,但是我当场提出了是否可以使用电脑的要求,面试官特别好说话,就同意了,只是全程会盯着我的电脑......然后让我写了测试用例,感觉自己挖了坑

6、项目介绍

 

二面:

一面结束相隔一天就被通知二面。

二面的面试官特别萌,态度超nice,穿着一身AJ,感觉打球很不错的样子。

1、编程题01:编辑距离

2、编程题02:01矩阵找出最大面积的由1组成的矩形(lintcode 510-hard),当时给了非最优的解法,回家后找了下答案,的确是没有想到。

3、论文01逼问:

1)数据集

2)创新点

3)ARMA、LSTM、CNN、convLSTM原理以及网络结构

4)论文中的网络结构,每层参数如何计算、feature map大小的计算方法。

5)特征工程如何做的,是否使用过可视化组件,怎么用的。

4、论文02逼问:

1)创新点

2)MapReduce资源消耗的预测模型怎么做的,公式推导一遍。

3)Hadoop优化相关问题

5、专利逼问:

1)Spark原理、与Hadoop对比

2)CheckPoint原理,spark中的ckp有什么特性

3)专利中的模型如何优化计算成本

4)为何使用了图论方法

6、比赛逼问:

1)特征工程

2)缺失数据填补方法

3)滑窗法具体怎么做的

4)上分最快的几个方式详细介绍一下

5)为何选用LSTM+xgb

6)怎样做的模型融合

7、推导softmax

8、详细比较sigmoid、relu、leaky-relu等激活函数

9、Batch Normal的原理以及作用

10、怎样理解机器学习和深度学习。

二面基本上是简历面试,论文较为被看重,详细问了很多建模方法以及实现细节,包括keras里面的一些代码问题,但是面试官超好,全程没有紧张的感觉。

 

三面:交叉面

三面通知邮件中没有写房间号,到了现场被告知是部门随机,感觉就是哪个部门看重你,就会在三面面你。

面试官的确是手百-feed流的主管,全程场景题。

1、性格介绍

2、优缺点介绍

3、为什么要去北京

4、场景题

线上的图片推荐因为实时性要求不同分为图文和图集,balabal介绍一通图集 图文的区别,抛出一个问题:如何改善图集推荐时的bad case,要求给出各个模块的实现思路以及建模方法。

当被问到推荐系统相关问题时我是懵逼的,因为从没做过推荐,全程脑子里在搜索以前在天池看过的直播课,然后给出了一套设计方案。

面试官围绕我给出的方案一步步进行讨论和引导,差不多讨论了半小时。

给我的感觉就是,面试官并不会否定你的方案,而是围绕你给的方法一步步给予引导和改进,然后形成一套可实施的方案,在这过程中可能面试官看重的是你思考的过程以及一步步改进的意识。

5、介绍一下NLP的项目,图谱如何构建的,NER的效果如何。

 

交叉面的面试官真的是一个好的mentor,一个推荐方案从粗糙到细化,一步步给予引导,基本上自己没接触过,这30分钟至少搞清楚了图文、图集推荐的套路是怎样的,真的是受益匪浅。

 

四. HR:

26号收到面试通过的通知,要求27现场面签,因为学校三方的原因以及头条那边还没沟通薪资的原因,没有立即签约百度,HR也特别好,给了一定时间的宽限。

说实话,feed流算是百度核心部门,所以现在陷入纠结中......

 

五. 总结

百度的面试体验超好,没有刁难,没有超纲的问题,面试官只在乎你懂得东西懂得有多深,而不会触碰你简历上没有的东西,尤其是三面的mentor,真的超赞。

 

 

 

10-05 15:56