Apache Mahout
スクリーンショット | |
開発元 | Apache Software Foundation |
---|---|
最新版 | 0.13.0 / 2017年4月17日 (2017-04-17) |
リポジトリ | git.apache.org/mahout.git |
プログラミング言語 | Java |
対応OS | Cross-platform |
サポート状況 | Active |
種別 | machine learning |
ライセンス | Apache 2.0 Licence |
公式サイト | mahout.apache.org |
Apache Mahoutは、Apache Software Foundationが管理する機械学習アルゴリズムのオープンソース・ソフトウェアである。Apache Mahoutは、協調フィルタリングやクラスタリング、クラス分類に特化されたスケーラブルなアルゴリズムを実装している。これらの実装の多くは、Apache Hadoopのプラットフォームが使用されている。[1][2]Mahoutでは、一般的な線形代数や統計などの数学操作のためのJavaライブラリやプリミティブ型を提供している。Mahoutは現在開発中であり、実装されたアルゴリズムの数は急速に増えている。しかし、アルゴリズムの種類は未だ満たされたものとは言えない。[3]
Mahoutのコアとなるクラスタリング、クラス分類のアルゴリズムは、Apache HadoopのMapReduceのパラダイム上に実装されているが、これによってHadoopを利用しないと実装が制限されるわけではない。したがって、単一ノード、もしくはHadoopクラスタ以外での実行も推奨されている。
例えば、Mahoutを使う上でメインディッシュとなる、協調フィルタリングによるレコメンダシステムコンポーネントは、Hadoopを使わない環境でも実行することができる。
Pregel(Google社で開発)ライクなGiraphなどの開発途上のプロジェクトとの統合も積極的に議論されている。
参考文献
^ “Introducing Apache Mahout”. ibm.com (2011年). 2011年9月13日閲覧。
^ “InfoQ: Apache Mahout: Highly Scalable Machine Learning Algorithms”. infoq.com (2011年). 2011年9月13日閲覧。
^ “Algorithms - Apache Mahout - Apache Software Foundation”. cwiki.apache.org (2011年). 2011年9月13日閲覧。
外部リンク
- 公式ウェブサイト
- EC2 AMI with Hadoop and Mahout
Giraph - a Graph processing infrastructure that runs on Hadoop (see Pregel).
Pregel - Google's internal graph processing platform, released details in ACM paper.
Mahout Mailing List Archives - Mahout Mailing List Archives
|