2024暑期实习面经

03.26腾讯数据工程一面

20分钟凉凉

  1. 自我介绍
  2. Hadoop集群构建中遇到的问题
  3. 实习的内容
  4. 使用Hadoop处理项目问题的思路
  5. 三个SQL题
  6. 对数据工程,数据仓库的理解
  7. 讲一下对Spark了解多少
  8. 讲一下对Hadoop的理解(MapReduce过程)
  9. 给一个场景:用户id,观看内容id,找到每天top10的热门内容,会遇见什么问题,怎么解决
  10. 只用过逻辑编程解决问题吗,了解其他方式吗
  11. 反问

粉丝每天给明星投票

字段 类型 说明
day_time datetime 投票日期
user_id string 粉丝id
idle_id string 明星id
vote_num bitint 投票数量
1
2
3
4
5
6
1. 找到2024.3.1-2024.3.31投票数量最多的明星

2. 找到2024.3.1-2024.3.31票数的分布(类似直方图的表达形式)

3. 找到每个用户连续最长投票的天数

总结

  1. 面试官问的问题都不难,自己掌握的不深
  2. sql题没做出来有点慌,导致后面脑子转的慢
  3. 自己说的讲的太少了, 表达不好
  4. 技术栈太少, 理解不透彻, 面对场景没有好的思路

3.28帆软算法实习生一面

  1. 自我介绍
  2. python了解多少,闭包,装饰器
  3. python的异步编程用过吗
  4. 了解过SFT吗,做过什么FT的东西
  5. 将一下Attention is all you need
  6. 讲一下encoder的结构
  7. transformer和Bert输入端的区别
  8. Bert最大输入长度,Embedding的长度,每个attention的输出长度
  9. 做题:字符串最短编辑距离,手写讲思路

3.29美团后端实习生一面

  1. 自我介绍
  2. 做题:重组链表(思路没有,提醒之后才想起来,链表的操作不熟练,没做出来)
  3. 最有印象的项目,讲一下,难点,怎么解决的
  4. MySQL的日志,redo log,binlog,区别
  5. MySQL的隔离级别,默认隔离级别,产生的问题
  6. 数据库的索引了解吗?区别?B树,B+树区别,为什么用B+树,B树有什么用
  7. HTTP三次握手,四次挥手,为什么要三次握手,四次挥手
  8. …其他八股,忘了
  9. 反问

4.3中科院苏州空天信息研究院数据库平台开发一面

  1. 校园宣讲
  2. 自我介绍
  3. 项目介绍
  4. 没怎么问技术问题,问了一下对数据的了解程度
  5. 时空数据, 会的技术栈, …, 很浅的问题
  6. 反问:业务内容,

4.7思必驰数据分析实习生一面

  1. 自我介绍
  2. 问项目,狠问,
  3. 讲一下怎么微调的,怎么处理数据的
  4. 讲比赛里面的特征工程,怎么处理的
  5. 主要是问项目,问了很多,大部分是介绍自己使用的东西和内容,技术问题很少
  6. 介绍业务内容
  7. 反问:

4.11美团 机器学习/数据挖掘实习生一面

  1. 自我介绍
  2. 做题:字符串中找到最长的回文串(暴力,面试官说肯定不行,面试做题你用这个方法?中心扩展)
  3. 讲项目,介绍项目,哪个项目最有印象,问项目
  4. XGBoost的损失函数,为什么用XGBoost不用传统树模型
  5. 看你还会Hadoop,讲一下MapReduce过程,数据倾斜怎么处理
  6. 怎么还投了个后端开发,看你找实习找的挺杂啊,我:…
  7. 反问:什么时候出结果?表达有问题吗?业务内容?

4.15美团 机器学习/数据挖掘实习生二面

  1. 自我介绍
  2. 做题:找出数组中唯一的重复的数(数组长度为n+1,元素为1-n)(1.map,2.排序,3.交换位置,4.二分答案(没做出来))
  3. 做题中问道了字典为什么是O(1)O(1)的时间复杂度,处理hash冲突的几种方法
  4. 怎么还投了个后端开发,看你找实习找的挺杂啊,我:…
  5. 介绍项目,问vit和卷积的区别,transformer怎么缓解梯度消失的问题,微调怎么调的,问项目
  6. XGBoost中为了防止过拟合的方法,XGBoost中可调节的参数,SVM求解优化了解吗,
  7. 项目中的评价指标,为什么不用auc,考虑过同时给图像和数字的情况吗
  8. 反问:什么时候出结果?表达有问题吗? 做题的最后一个解法是什么?

4.20神州信息大数据开发一面

  1. 忘记时间了
  2. 自我介绍(校招,实习生在6月份开始)
  3. 介绍实习的内容,难点,怎么解决
  4. 大数据的特点(四个V忘了, 太基础了没想到会问)
  5. 问大数据平时用的什么技术栈,了解多少
  6. Hadoop的组件
  7. Seeyou,不到十分钟结束