各位用户为了找寻关于使用python实现正则匹配检索远端FTP目录下的文件的资料费劲了很多周折。这里教程网为您整理了关于使用python实现正则匹配检索远端FTP目录下的文件的相关资料,仅供查阅,以下为您介绍关于使用python实现正则匹配检索远端FTP目录下的文件的详细内容
遇到一个问题,需要正则匹配远端FTP目录下的文件,如果使用ftp客户端可以通过命令行很容易的做到这一点,但是暂时没有一个工具支持这样的需求,于是通过python对FTP的支持和对正则表达式的支持,写了这么一个简单的工具,用于使用正则表达式来匹配远端目录的文件。
代码如下
? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63# coding=utf-
8
#########################################################################
# File Name: reg_url.py
# Author: WangWeilong
# Company: Baidu
#########################################################################
import
re
import
sys
import
os
from ftplib
import
FTP
dhccmd =
"http://xxx/api/submit"
class
DHC_FTP():
def __init__(self, hostname, username=
""
, passwd=
""
):
self.hostname = hostname
try
:
self.ftp = FTP(self.hostname)
except:
print
"hostname error!"
exit(-
1
)
self.username = username
self.passwd = passwd
self.filelist = []
self.reg_pattern =
""
def getftpfilelist(self, path):
self.ftp.login(self.username, self.passwd)
self.ftp.cwd(path)
self.filelist = self.ftp.nlst()
def matchnames(self, regpattern):
pattern = re.compile(regpattern)
matchedfiles = []
for
file in self.filelist:
match = pattern.search(file)
if
match:
matchedfiles.append(match.string)
return
matchedfiles
if
__name__ ==
"__main__"
:
if
len(sys.argv) !=
4
:
print
'usage:python reg_url.py $ftpurldir $regular'
else
:
#解析ftpurl字符串
head = sys.argv[
1
].split(
"@"
)[
1
].split(
"/"
)[
0
]
username = sys.argv[
1
].split(
"//"
)[
1
].split(
":"
)[
0
]
passwd = sys.argv[
1
].split(
"//"
)[
1
].split(
":"
)[
1
].split(
"@"
)[
0
]
pathdir = sys.argv[
1
].split(head)[
1
]
dhc_ftp = DHC_FTP(head, username, passwd)
dhc_ftp.getftpfilelist(
"./"
+ pathdir)
#获取正则表达式
regpattern = r
'%s'
% sys.argv[
2
]
matchedfiles = dhc_ftp.matchnames(regpattern)
for
files in matchedfiles:
ftpname = sys.argv[
1
] +
"/"
+ files
print ftpname
通过输入想要的检索的远端目录地址和想要用来匹配的正则表达式,就能获取到远端的文件了,至于用这些文件来干嘛,那就是需求问题了。
以上所述就是本文的全部内容了,希望大家能够喜欢。
请您花一点时间将文章分享给您的朋友或者留下评论。我们将会由衷感谢您的支持!