自然语言处理

ScalaNLP—机器学习和数值计算库的套装





Breeze —Scala用的数值处理库





Chalk—自然语言处理库。

FACTORIE—可部署的概率建模工具包。用Scala实现的软件库。

为用户提供简洁的语言来创建关系因素图。评估參数并进行判断。

数据分析/数据可视化

MLlib in Apache Spark—Spark下的分布式机器学习库





Scalding —CAscading的Scala接口





Summing Bird—用Scalding 和 Storm进行Streaming MapReduce





Algebird —Scala的抽象代数工具





xerial —Scala的数据管理工具





simmer —化简你的数据,进行代数聚合的unix过滤器





PredictionIO —供软件开发人员和数据project师用的机器学习server。





BIDMat—支持大规模探索性数据分析的CPU和GPU加速矩阵库。

通用机器学习

Conjecture—Scalding下可扩展的机器学习框架





brushfire—scalding下的决策树工具。





ganitha —基于scalding的机器学习程序库





adam—使用Apache Avro, Apache Spark 和 Parquet的基因组处理引擎,有专用的文件格式,Apache 2软件许可。





bioscala —Scala语言可用的生物信息学程序库





BIDMach—机器学习CPU和GPU加速库。

Figaro - 一个构造概率性模型的Scala库

英文原文链接:Scala机器学习

05-15 21:29