RNN系列, CNN系列,attention系列, CRF等序列标注, Tensor Network与ABCNN一系列match模型;
高斯, LDA, Random walk, Word2vec, Glove, Fasttext, Deepwalk, LINE, Node2vec等一类概率模型以及采样方法(Gibbs sampling,负采样)等;
树形结构(C4.5, ID3), SVM; EM; RF, Adaboost, GBDT, Xgboost, LightGBM等集成模型;bagging,stacking, boosting 等模型集成**;
链表操作,排序,查找,树,图,动态规划,贪心算法,网络流;
线搜索准则,SGD, 牛顿法,拟牛顿法(BGFS,DFP),共轭梯度,KKT条件,凸函数性质等;
特征分解,奇异分解,矩阵正定性,矩阵求导等;
常用损失函数(绝对值,平方,对数,指数,最大间隔Hinge等),常用评价指标(Percision, Recall, Acc, F1, RMSE, NMI, AUC, MAP, MRR, nDCG等),常用解决过拟合方法(正则化,数据增强,dropout等),VC维理论,信息熵理论;
频繁模型发现FPTree,子图匹配VF2等,社区挖掘,图数据库Neo4j ;
协同过滤等矩阵分解模型,基于HNE的匹配打分模型,神经协同过滤;
NLP近年来papers中主要任务(机器翻译,对话系统,知识图谱,阅读理解,关系抽取)重点模型;刷过的论文梳理核心知识点梳理;
强化学习RL, 生成对抗网络GAN;
Python 基本编程知识,Linux常用操作,Tensorflow 常用编程知识;
关系型数据库,图数据库,Nosql, Hadoop Family(Hbase,Hive, Map-reduce), Spark, Kafka;
进程,线程,并行,并发,文件系统常用算法,Redis等分布式缓存机制;
5层结构,TCP握手原理,网络路由常用算法;