初始化方法;自对象的LEN()
def __init__(self,emps=str(""),l=[">"]):
self.str=emps
self.bl=l
def fromFile(self,seqfile):
opf=open(seqfile,'r')
s=opf.read()
opf.close()
lisst=s.split(">")
if s[0]==">":
lisst.pop(0)
nlist=[]
for x in lisst:
splitenter=x.split('\n')
splitenter.pop(0)
splitenter.pop()
splitstring="".join(splitenter)
nlist.append(splitstring)
nstr=">".join(nlist)
nstr=nstr.split()
nstr="".join(nstr)
for i in nstr:
self.bl.append(i)
self.str=nstr
return nstr
def getSequence(self):
print self.str
print self.bl
return self.str
def GpCratio(self):
pgenes=[]
nGC=[]
for x in range(len(self.lb)):
if x==">":
pgenes.append(x)
for i in range(len(pgenes)):
if i!=len(pgenes)-1:
c=krebscyclus[pgenes[i]:pgenes[i+1]].count('c')+0.000
g=krebscyclus[pgenes[i]:pgenes[i+1]].count('g')+0.000
ratio=(c+g)/(len(range(pgenes[i]+1,pgenes[i+1])))
nGC.append(ratio)
return nGC
s = Sequence()
s.fromFile('D:\Documents\Bioinformatics\sequenceB.txt')
print 'Sequence:\n', s.getSequence(), '\n'
print "G+C ratio:\n", s.GpCratio(), '\n'
我不明白为什么它给人的错误:初始化方法;自对象的LEN()
in GpCratio for x in range(len(self.lb)): AttributeError: Sequence instance has no attribute 'lb'.
当我打印的清单中DEF某个getSequence它打印测序正确的DNA列表,但我无法使用列表来搜索核苷酸。我的大学只允许我输入1文件,而不是利用在定义其他参数,但“自我” 顺便说一句,这是一类,但它拒绝了我将它张贴的话..类调用序列
看起来像一个错字。您在__init__()
例程中定义self.bl
,然后尝试访问self.lb
。
(另外,emps=str("")
是多余的 - emps=""
效果一样好。)
但是,即使你改正错字,循环将无法工作:
for x in range(len(self.bl)): # This iterates over a list like [0, 1, 2, 3, ...]
if x==">": # This condition will never be True
pgenes.append(x)
你可能需要做一些事情像
pgenes=[]
for x in self.bl:
if x==">": # Shouldn't this be != ?
pgenes.append(x)
这也可以写成一个列表理解:
pgenes = [x for x in self.bl if x==">"]
在Python中,您几乎不需要len(x)
或for n in range(...)
;你宁愿直接迭代序列/迭代。
由于您的程序不完整,缺少样本数据,因此无法在此处运行以查找所有其他缺陷。也许下面的内容可以让你指出正确的方向。假设包含字符的字符串ATCG
和>
:
>>> gene = ">ATGAATCCGGTAATTGGCATACTGTAG>ATGATAGGAGGCTAG"
>>> pgene = ''.join(x for x in gene if x!=">")
>>> pgene
'ATGAATCCGGTAATTGGCATACTGTAGATGATAGGAGGCTAG'
>>> ratio = float(pgene.count("G") + pgene.count("C"))/(pgene.count("A") + pgene.count("T"))
>>> ratio
0.75
但是,如果你不想看整个字符串,但在不同的基因(其中>
是分隔符),使用这样的:
>>> gene = ">ATGAATCCGGTAATTGGCATACTGTAG>ATGATAGGAGGCTAG"
>>> genes = [g for g in gene.split(">") if g !=""]
>>> genes
['ATGAATCCGGTAATTGGCATACTGTAG', 'ATGATAGGAGGCTAG']
>>> nGC = [float(g.count("G")+g.count("C"))/(g.count("A")+g.count("T")) for g in genes]
>>> nGC
[0.6875, 0.875]
但是,如果你要计算GC含量,那么你当然不希望(G + C)/(A + T),但(G + C)/(A + T + G + C) - >nGC = [float(g.count("G")+g.count("C"))/len(g)]
。关于你的`__init __(self,emps = str(“”),``l = [“>”]``)`:[请注意python中的可变默认参数](http://*.com/)的
哎呀哈哈谢谢; D,但现在它返回一个空列表D: –
我也改变了:对于范围内的x(len(self。 bl)): if self.bl [x] ==“>”: pgenes.append(x)但它仍然返回一个空的列表 –
我改变了(虽然我还不熟悉这种风格)pgenes = [x for self.bl if x ==“>”],但它返回一个空的列表 –
问题/ 1132941/python-the-mutable-default-argument中的至少惊讶) –