初始化方法;自对象的LEN()

初始化方法;自对象的LEN()

问题描述:

def __init__(self,emps=str(""),l=[">"]): 
    self.str=emps 
    self.bl=l 


def fromFile(self,seqfile): 
    opf=open(seqfile,'r')          
    s=opf.read()            
    opf.close()              
    lisst=s.split(">")            
    if s[0]==">": 
     lisst.pop(0)              
    nlist=[] 
    for x in lisst: 
     splitenter=x.split('\n')           
     splitenter.pop(0)            
     splitenter.pop()             
     splitstring="".join(splitenter)         
     nlist.append(splitstring)          
    nstr=">".join(nlist)             
    nstr=nstr.split() 
    nstr="".join(nstr) 
    for i in nstr: 
     self.bl.append(i) 
    self.str=nstr 
    return nstr 

def getSequence(self): 
    print self.str 
    print self.bl 
    return self.str 

def GpCratio(self): 
    pgenes=[] 
    nGC=[] 
    for x in range(len(self.lb)):         
     if x==">": 
      pgenes.append(x)           
    for i in range(len(pgenes)):           
     if i!=len(pgenes)-1:            
      c=krebscyclus[pgenes[i]:pgenes[i+1]].count('c')+0.000  
      g=krebscyclus[pgenes[i]:pgenes[i+1]].count('g')+0.000           
      ratio=(c+g)/(len(range(pgenes[i]+1,pgenes[i+1]))) 
      nGC.append(ratio)           
    return nGC 

s = Sequence() 
s.fromFile('D:\Documents\Bioinformatics\sequenceB.txt') 
print 'Sequence:\n', s.getSequence(), '\n' 
print "G+C ratio:\n", s.GpCratio(), '\n' 

我不明白为什么它给人的错误:初始化方法;自对象的LEN()

in GpCratio  for x in range(len(self.lb)): AttributeError: Sequence instance has no attribute 'lb'. 

当我打印的清单中DEF某个getSequence它打印测序正确的DNA列表,但我无法使用列表来搜索核苷酸。我的大学只允许我输入1文件,而不是利用在定义其他参数,但“自我” 顺便说一句,这是一类,但它拒绝了我将它张贴的话..类调用序列


+0

问题/ 1132941/python-the-mutable-default-argument中的至少惊讶) –

看起来像一个错字。您在__init__()例程中定义self.bl,然后尝试访问self.lb

(另外,emps=str("")是多余的 - emps=""效果一样好。)

但是,即使你改正错字,循环将无法工作:

for x in range(len(self.bl)): # This iterates over a list like [0, 1, 2, 3, ...] 
    if x==">":     # This condition will never be True 
     pgenes.append(x) 

你可能需要做一些事情像

pgenes=[] 
for x in self.bl: 
    if x==">":     # Shouldn't this be != ? 
     pgenes.append(x) 

这也可以写成一个列表理解:

pgenes = [x for x in self.bl if x==">"] 

在Python中,您几乎不需要len(x)for n in range(...);你宁愿直接迭代序列/迭代。

由于您的程序不完整,缺少样本数据,因此无法在此处运行以查找所有其他缺陷。也许下面的内容可以让你指出正确的方向。假设包含字符的字符串ATCG>

>>> gene = ">ATGAATCCGGTAATTGGCATACTGTAG>ATGATAGGAGGCTAG" 
>>> pgene = ''.join(x for x in gene if x!=">") 
>>> pgene 
'ATGAATCCGGTAATTGGCATACTGTAGATGATAGGAGGCTAG' 
>>> ratio = float(pgene.count("G") + pgene.count("C"))/(pgene.count("A") + pgene.count("T")) 
>>> ratio 
0.75 

但是,如果你不想看整个字符串,但在不同的基因(其中>是分隔符),使用这样的:

>>> gene = ">ATGAATCCGGTAATTGGCATACTGTAG>ATGATAGGAGGCTAG" 
>>> genes = [g for g in gene.split(">") if g !=""] 
>>> genes 
['ATGAATCCGGTAATTGGCATACTGTAG', 'ATGATAGGAGGCTAG'] 
>>> nGC = [float(g.count("G")+g.count("C"))/(g.count("A")+g.count("T")) for g in genes] 
>>> nGC 
[0.6875, 0.875] 

但是,如果你要计算GC含量,那么你当然不希望(G + C)/(A + T),但(G + C)/(A + T + G + C) - >nGC = [float(g.count("G")+g.count("C"))/len(g)]。关于你的`__init __(self,emps = str(“”),``l = [“>”]``)`:[请注意python中的可变默认参数](http://*.com/)的

+0

哎呀哈哈谢谢; D,但现在它返回一个空列表D: –

+0

我也改变了:对于范围内的x(len(self。 bl)): if self.bl [x] ==“>”: pgenes.append(x)但它仍然返回一个空的列表 –

+0

我改变了(虽然我还不熟悉这种风格)pgenes = [x for self.bl if x ==“>”],但它返回一个空的列表 –