用Python获取文件名和扩展名为hdfs的文件

用Python获取文件名和扩展名为hdfs的文件

问题描述:

在Python中是否有等效的os模块读取文件系统(hadoop 2.6)?用Python获取文件名和扩展名为hdfs的文件

特别是我对获取文件和基本名称的扩展名(不包括完整路径)感兴趣。

+0

为什么你需要一个与'os'模块等价的东西?它应该在hadoop挂载的文件系统没有问题的情况下工作。你有没有尝试过没有用的东西? – iamauser

无需“等效”,os.path.basenamehdfs完全相同。

即:

import os.path as path 
print path.basename("/path/to/file.txt") 
# file.txt 

os.path — Common pathname manipulations

该命令将只给出文件名。你可以在Python中使用shell脚本或子进程

hadoop fs -stat "%n" my/path/*