03.26腾讯数据工程一面
20分钟凉凉
- 自我介绍
- Hadoop集群构建中遇到的问题
- 实习的内容
- 使用Hadoop处理项目问题的思路
- 三个SQL题
- 对数据工程,数据仓库的理解
- 讲一下对Spark了解多少
- 讲一下对Hadoop的理解(MapReduce过程)
- 给一个场景:用户id,观看内容id,找到每天top10的热门内容,会遇见什么问题,怎么解决
- 只用过逻辑编程解决问题吗,了解其他方式吗
- 反问
粉丝每天给明星投票
字段 | 类型 | 说明 |
---|---|---|
day_time | datetime | 投票日期 |
user_id | string | 粉丝id |
idle_id | string | 明星id |
vote_num | bitint | 投票数量 |
1 | 1. 找到2024.3.1-2024.3.31投票数量最多的明星 |
总结
- 面试官问的问题都不难,自己掌握的不深
- sql题没做出来有点慌,导致后面脑子转的慢
- 自己说的讲的太少了, 表达不好
- 技术栈太少, 理解不透彻, 面对场景没有好的思路
3.28帆软算法实习生一面
- 自我介绍
- python了解多少,闭包,装饰器
- python的异步编程用过吗
- 了解过SFT吗,做过什么FT的东西
- 将一下Attention is all you need
- 讲一下encoder的结构
- transformer和Bert输入端的区别
- Bert最大输入长度,Embedding的长度,每个attention的输出长度
- 做题:
字符串最短编辑距离
,手写讲思路
3.29美团后端实习生一面
- 自我介绍
- 做题:重组链表(思路没有,提醒之后才想起来,链表的操作不熟练,没做出来)
- 最有印象的项目,讲一下,难点,怎么解决的
- MySQL的日志,redo log,binlog,区别
- MySQL的隔离级别,默认隔离级别,产生的问题
- 数据库的索引了解吗?区别?B树,B+树区别,为什么用B+树,B树有什么用
- HTTP三次握手,四次挥手,为什么要三次握手,四次挥手
- …其他八股,忘了
- 反问
4.3中科院苏州空天信息研究院数据库平台开发一面
- 校园宣讲
- 自我介绍
- 项目介绍
- 没怎么问技术问题,问了一下对数据的了解程度
- 时空数据, 会的技术栈, …, 很浅的问题
- 反问:业务内容,
4.7思必驰数据分析实习生一面
- 自我介绍
- 问项目,狠问,
- 讲一下怎么微调的,怎么处理数据的
- 讲比赛里面的特征工程,怎么处理的
- 主要是问项目,问了很多,大部分是介绍自己使用的东西和内容,技术问题很少
- 介绍业务内容
- 反问:
4.11美团 机器学习/数据挖掘实习生一面
- 自我介绍
- 做题:字符串中找到最长的回文串(暴力,面试官说肯定不行,面试做题你用这个方法?中心扩展)
- 讲项目,介绍项目,哪个项目最有印象,问项目
- XGBoost的损失函数,为什么用XGBoost不用传统树模型
- 看你还会Hadoop,讲一下MapReduce过程,数据倾斜怎么处理
- 怎么还投了个后端开发,看你找实习找的挺杂啊,我:…
- 反问:什么时候出结果?表达有问题吗?业务内容?
4.15美团 机器学习/数据挖掘实习生二面
- 自我介绍
- 做题:找出数组中唯一的重复的数(数组长度为n+1,元素为1-n)(1.map,2.排序,3.交换位置,4.二分答案(没做出来))
- 做题中问道了字典为什么是的时间复杂度,处理hash冲突的几种方法
- 怎么还投了个后端开发,看你找实习找的挺杂啊,我:…
- 介绍项目,问vit和卷积的区别,transformer怎么缓解梯度消失的问题,微调怎么调的,问项目
- XGBoost中为了防止过拟合的方法,XGBoost中可调节的参数,SVM求解优化了解吗,
- 项目中的评价指标,为什么不用auc,考虑过同时给图像和数字的情况吗
- 反问:什么时候出结果?表达有问题吗? 做题的最后一个解法是什么?
4.20神州信息大数据开发一面
- 忘记时间了
- 自我介绍(校招,实习生在6月份开始)
- 介绍实习的内容,难点,怎么解决
- 大数据的特点(四个V忘了, 太基础了没想到会问)
- 问大数据平时用的什么技术栈,了解多少
- Hadoop的组件
- Seeyou,不到十分钟结束