你如何使用hadoop .. Python用户

问题描述:

我是一个*的python用户,我的主要兴趣恰好是机器学习。 大多数情况下,我在Python中使用python中的MySQL包(mysqldb)来完成这些工作。 而事情看起来不错..但现在我正在步入被称为“大数据”的领域。 你有什么建议可以让我开始使用Hadoop或Mahout Hadoop。 大多数情况下,我有我的机器学习库,我已经建立了一段时间.. 所有在python中。 我可以在Hadoop上运行它吗?我希望这个问题是有效的..或者如果不是。 那么什么是Hadoop?你如何使用hadoop .. Python用户

我可以使用自己的笔记本电脑进行开发吗? 如何一个建立在Hadoop或数据什么都EC2实例等等等等 感谢

编辑:

我的主要问题是关于数据库。 在正常情况下,你有一个在你的本地mysql或服务器配置中设置的数据库...这就是你的数据所在......你使用mysql查询来获取数据,然后用数据..你做了很多东西..cool..right .. :)

但是,如果我必须使用hadoop ..(或mahout hadoop),我可以在哪里保存数据..我一直在关注云计算..我是否需要买空间某处的东西来开始.. ?? 如何从数据库中获取数据?

+1

FRAZ avaliable,您可能希望以足够一般的方式改写您的问题,使其适用于其他方面ERS。规范链接:[问]。 :) – mac 2011-12-27 19:23:29

RTFM。

检查来自cloudera的suome酷视频。

http://www.cloudera.com/resources/?type=Training

他们也有虚拟机启动丝毫

https://ccp.cloudera.com/display/SUPPORT/Downloads

很酷的东西地块也在hadpop页

http://wiki.apache.org/hadoop/