Java Data Mining API

Java Community Process で Java Data Mining API が公開されています。現在は、バージョン2.0のドラフトが出ている段階で、Oracleがspec策定の先導をしているようです。Javaxパッケージになっていて、クラスタリングや決定木、時系列解析はもちろんのこと、Support Vector Machineなどの最新のアルゴリズムやテキストマイニングのAPIも整備されています(実用的な機能が実装されているかは不明)。

SPSSやSASのような高価なソフトウェアを買わなくても、データマイニングツールを自作して利用できるようになってきています! 大量データから有効な法則を見つけ出すというのは、ビジネスに限らずとても役立つ技術です。WekaやR言語といったフリーのツールもあるので、ちょっと頑張ればデータ解析ができる時代になっているのですね。

僕もこのAPIを使ってデータマイニングに役立つツールを作ってみたいと思います。