MLlib(ApacheSpark)

2年前发布 286 0 0

MLlib是 Apache Spark的可扩展机器学习库

收录时间:
2024-10-26
MLlib(ApacheSpark)MLlib(ApacheSpark)
MLlib(ApacheSpark)

使用方便
可用于Java、Scala、Python和R。
MLlib适合Sparke的API,并与Python (从 Spark 0.9开始)和R库(从Spark 1.5开始)中的NumPye互操作。您可以使用任何Hadoop数据源(例如 HDFS、HBase或本地文件),从而轻松插入Hadoop工作流。
表现
高质量算法,比 MapReduce 快100倍。
Spark擅长迭代计算,使MLlib能够快速运行。同时,我们关心算法性能:MLlib包含利用迭代的高质量算法,并且可以产生比有时在 MapReduce 上使用的单遍近似更好的结果。
│无处不在
Spark在Hadoop、Apache Mesos、Kubernetes上独立运行,或在云中针对不同的数据源运行。
您可以使用其独立集群模式在EC2e、Hadoop YARN@ 、Mesose或Kubernetes上运行Spark。访问HDFS?、Apache Cassandraz、 Apache HBasec、Apache Hive和数百个其他数据源中的数据。

MLlib是 Apache Spark的可扩展机器学习库

数据统计

相关导航

官网 晴数智慧Magic Data(原北京爱数智慧科技有限公司)

官网 晴数智慧Magic Data(原北京爱数智慧科技有限公司)

北京晴数智慧科技有限公司(Magic Data,原爱数智慧)是一家全球领先高质量数据集解决方案公司,为人工智能领域研发企业和科研机构提供高质量数据集和解决方案,打造MLOps闭环,涵盖数据采集、生成、标注,模型测试、调优,数据治理等环节。产品涵盖智慧出行、智慧金融、智能社交、智能家居、智能终端等五大行业。超15万小时(1亿轮次)多轮对话数据集覆盖覆盖全球近60种语言,超100个国家和地区。