我可以用php解析hg19.2bit吗?

我可以用php解析hg19.2bit吗?

问题描述:

我知道这可能是一个晦涩的使用PHP,但我正在研究一个想法,以相当有趣的方式浏览人类基因组。我可以用php解析hg19.2bit吗?

问题是我需要知道我是否可以编写一个php脚本来解析可用的数据,如果是的话我将如何开始?有没有任何PHP脚本来做到这一点?

+0

“能”?当然。几乎任何图灵完全语言都可以在其中写入解析器。 –

我建议创建一个数据库设计(MySQL),它包含您想要在PHP应用程序中探索的数据的子集。

然后找到一种方法将数据上传到该数据模式。对于上传部分,您可以使用比您选择的PHP更强大的语言,它可以是C#,F#,Haskell或其他。

这种分离将有助于简化事情,而不仅仅是在PHP中完成。

+0

这不是一个PHP应用程序,当然想法是将数据存储在像mySQL这样的数据库中。问题是我如何去解析使用PHP的HG19.2bit文件。 – T9b

你必须写一个分析器,但应该是相当简单: http://jc.unternet.net/genome/2bitformat.html

而且在Perl的例子:http://www.perlmonks.org/?node_id=672251

+0

我到了那里,但不完全。我可以在php中使用'unpack()',但文件大小接近800MB。 – T9b

+0

你可能想看看来自php-reader项目的Zend IO Reader。我自己也没有玩过,但它听起来像它会做的伎俩:http://code.google.com/p/php-reader/source/browse/trunk/src/Zend/Io/Reader.php和http://code.google.com/p/php-reader/ –