懒惰学习代表。KD树、球树加速近邻搜索。距离度量:欧氏、曼哈顿、余弦、马氏。加权KNN、近似近邻ANN,以及在推荐、检索中的应用。
传统 ML
传统 ML
文章列表
- 71
- 72贝叶斯定理的应用。高斯NB、多项式NB、伯努利NB。特征独立性假设、拉普拉斯平滑。文本分类、垃圾邮件过滤实践,以及在速度要求高场景中的应用。
- 73有监督降维技术。Fisher线性判别、LDA vs PCA对比。多类别LDA、正则化LDA。人脸识别(Eigenfaces、Fisherfaces)应用,以及在特征提取中的实践。
- 74GBDT原理:加法模型、梯度提升。XGBoost、LightGBM、CatBoost三大框架对比。特征重要性、Partial Dependence Plot、SHAP值解释,以及在表格数据竞赛中的实践。
- 75概率聚类模型。单高斯vs混合高斯、EM算法推导。模型选择(BIC、AIC)。分量数量选择、协方差类型,以及在异常检测、密度估计中的应用。
- 76异常检测方法总览。孤立森林iForest原理、路径长度、异常评分。One-Class SVM、LOF、HBOS。工业异常检测、欺诈检测实践,以及在时间序列异常中的应用。
- 77时间序列特性:趋势、季节性、周期性。AR、MA、ARIMA、SARIMA模型。指数平滑、状态空间模型、Kalman滤波。在经济预测、销量预测中的应用。
- 78时间到事件数据建模。Kaplan-Meier生存曲线、Cox比例风险模型。生存树、生存森林。医疗数据分析、设备寿命预测、客户流失预测应用。
- 79相关性≠因果性。潜在结果框架、 Rubin因果模型。倾向得分匹配PSM、工具变量IV、双重差分DID。 uplift建模,以及在营销归因、策略评估中的应用。
- 80表格数据、图像、文本、时序数据的不同选择。数据规模、特征工程、可解释性考量。集成学习优势、深度学习优势。工业实践中的模型选型决策框架。