MLlib是 Apache Spark 的可扩展机器学习库
MLlib适合Spark的API,并与Python(从Spark0.9开始)和R库(从Spark1.5开始)中的NumPy互操作。您可以使用任何Hadoop数据源(例如HDFS、HBase或本地文件),从而轻松插入Hadoop工作流。
Spark擅长迭代计算,使MLlib能够快速运行。同时,我们关心算法性能:MLlib包含利用迭代的高质量算法,并且可以产生比有时在MapReduce上使用的单遍近似更好的结果。
您可以使用其独立集群模式在EC2、HadoopYARN、Mesos或Kubernetes上运行Spark。访问HDFS、 ApacheCassandra、 ApacheHBase、 ApacheHive和数百个其他数据源 中的数据。
西北工业大学计算机学院是一个集教学、科研于一体的研究型学院。计算机专业创建于1958年,是较早在全国高校中开设的专业之一。
像我五岁一样解释 (ELI5) ...
Pliny提供了一个轻量级的接口...
用人工智能轻松地理解心理模...
用人工智能驱动的搜索和发现...
为学生撰写论文、讨论问题、...