面试题记录 [toc]
- python
-基础
-面向对象
-多线程 - java
-基础
-容器
-并发 - 计算机网络
-TCP/UDP
-3次握手,4次挥手 - 数据库
- 大数据
- 数据结构与算法
-排序算法
-二叉树
-剑指offer
-leetcode - 机器学习
-PCA - NLP
- 数据分析
- linux
- 非技术问题
装饰器(什么是AOP/面向切面编程), python代码执行原理,
pthon的int怎么实现的 ,is
和==
的区别,深拷贝-浅拷贝,read,readline和readlines,python2.7 与python3.x的区别,python自省, python 中的下划线, python字符串格式化
all 作用,装饰器作用,面向对象的3大特性
pandas怎么进行加速
网络的几种分层体系结构, HTTP从发起到接受的过程, 计算机网络分为哪几层?
TCP和UDP的区别, TCP协议如何保证可靠传输,
为什么要3次握手,2次不行吗。 为什么要传回SYN, 4次挥手是什么,那么为什么是4次挥手呢?tcp握手的时候为何ACK(确认)和SYN(建立连接)是一起发送。挥手的时候为什么是分开的时候发送呢? 为什么客户端最后还要等待2MSL?
OSI7层模型(TCP4层) 每层的协议 url到页面的过程 HTTP http/https 1.0、1.1、2.0 get/post 以及幂等性 http 协议头相关 网络攻击(CSRF、XSS) TCP/IP 三次握手、四次挥手 拥塞控制(过程、阈值) 流量控制与滑动窗口 TCP与UDP比较 子网划分(一般只有笔试有) DDos攻击 (B)IO/NIO/AIO 三者原理,各个语言是怎么实现的 Netty
数据库(最多的还是mysql,Nosql有redis) 索引(包括分类及优化方式,失效条件,底层结构) sql语法(join,union,子查询,having,group by) 引擎对比(InnoDB,MyISAM) 数据库的锁(行锁,表锁,页级锁,意向锁,读锁,写锁,悲观锁,乐观锁,以及加锁的select sql方式) 隔离级别,依次解决的问题(脏读、不可重复读、幻读) 事务的ACID B树、B+树 优化(explain,慢查询,show profile) 数据库的范式。 分库分表,主从复制,读写分离。 Nosql相关(redis和memcached区别之类的,如果你熟悉redis,redis还有一堆要问的)
关系型数据库和菲关系型数据库的区别
排序算法的稳定性
算法和数据结构 数组、链表、二叉树、队列、栈的各种操作(性能,场景) 二分查找和各种变种的二分查找 各类排序算法以及复杂度分析(快排、归并、堆) 各类算法题(手写) 理解并可以分析时间和空间复杂度。 动态规划(笔试回回有。。)、贪心。 红黑树、AVL树、Hash树、Tire树、B树、B+树。 图算法(比较少,也就两个最短路径算法理解吧)
AB test的流程,双总体异方差t检验?为什么是异方差? 多元统计, P值, log2for the change ,
- 贝叶斯公式
- 先验概率,后验概率,联合概率,高斯分布,伯努利分布,最大似然法
- 生成模型,判别模型是什么
- 判别式模型和生成式模型分别有哪几种 ,优缺点
信息熵,交叉熵
softmax,样本不均衡是多不均衡?怎么处理? 缺失值填充有什么方法,异常值的检测有什么方法
决策树原理,
PCA与LDA的区别
f1 score ,关于AUC,准确率,f1的理解
logistic regression的原理, 逻辑回归的常见面试点总结
gbdt的原理
- 异常值检测
- sd a
操作系统: 进程通信IPC(几种方式),与线程区别 OS的几种策略(页面置换,进程调度等,每个里面有几种算法) 互斥与死锁相关的 linux常用命令(问的时候都会给具体某一个场景) Linux内核相关(select、poll、epoll)