Twitter的流API与多语言关键字和速率限制

问题描述:

对于科学研究,我不想进行Twitter的研究,因此,需要大量的推文。
我有5种不同语言的10个句子,我不想实时匹配。我这样做是为了过滤掉其他语言的推文。我不想为所有5种语言推出相同数量的推文。这可能会很棘手,因为某些语言过多(例如英语)。此外,我不想收集24小时内散播的数据。我正在考虑每隔15分钟收集100条推文,以便与那些特定语言的关键字匹配。Twitter的流API与多语言关键字和速率限制

我知道我必须使用流媒体API实时收集推文,但我怎样才能以5种不同的语言收集推文(每15分钟限制100条推文),并在15分钟内扩散。期限基于一个http请求认证?

你应该看看Twitter Streaming API和node.js的实现。 https://github.com/technoweenie/twitter-node

+0

看了一下它,似乎仍然很难实施它,每15分钟有100条推文的速率限制。每种语言都有特定的关键字。因此,总共5种语言* 100(每15分钟的推文)* 4(每小时的季度)=来自5个不同国家(语言)的2000个推文每小时一次。 PHP中没有这个我可以修改的东西吗?还是有另一种解决方案,如使5个不同的连接,每个有1个关键字语言,然后速度限制这些语言单独? – TRD07

+0

实际上twitter-node正在使用Twitter的流媒体API。 这意味着你可以实时接收到所有推文(根据你的过滤器当然) 服务器推送新的推文给你,所以你不需要做大量的请求。 我认为这是你想要做的最好的方式。 你可以在这里找到更多关于这个流API的信息: https://dev.twitter.com/docs/streaming-api – Antoine