本人的Spark练习代码。
主要是分布式优化及分布式机器学习。
-
Admm、Fista、ProximalAlgorithm为分布式优化求解齐次线性方程组算法。 -
Gradient: 基于RDD,优化logistics regression模型,使用的库为spark.mllib -
Classify与Boosting: 基于DataFrame,使用的为spark.ml
| Name | Name | Last commit date | ||
|---|---|---|---|---|
本人的Spark练习代码。
主要是分布式优化及分布式机器学习。
Admm、Fista、ProximalAlgorithm 为分布式优化求解齐次线性方程组算法。
Gradient: 基于RDD,优化logistics regression模型,使用的库为spark.mllib
Classify与Boosting: 基于DataFrame,使用的为spark.ml