0x10-机器学习算法集成
机器学习算法集成 本篇是《大数据算法与UDF系列》的第10篇(最终篇),讲解Spark MLlib中的常用机器学习算法,包括K-Means聚类和线性回归,以及如何在实际业务中应用。 1. MLlib简介 1.1 什么是Spark MLlib...
机器学习算法集成 本篇是《大数据算法与UDF系列》的第10篇(最终篇),讲解Spark MLlib中的常用机器学习算法,包括K-Means聚类和线性回归,以及如何在实际业务中应用。 1. MLlib简介 1.1 什么是Spark MLlib...
窗口函数与累计计算 本篇是《大数据算法与UDF系列》的第1篇,将带领大家从零认识窗口函数,掌握累计计算、排名分析等高级技能。 1. 什么是窗口函数? 1.1 通俗解释 想象一下,你站在一扇窗户前,窗户大小可以调整: ┌───────────...