Google语音识别通过cu​​rl流式传输API

问题描述:

我想通过流式传输方法使用Google语音识别API,因此我可以流式传输我的文件并实时获取文本。这是必要的,所以我知道什么时候在音频文件中说过什么。问题是,我没有使用任何谷歌提供SDK的语言,他们的文档也没有说明如何在没有SDK的情况下提出这样的请求。Google语音识别通过cu​​rl流式传输API

有人知道该怎么做吗?

对Google云语音识别API的流式支持可用only through gRPC,原因是仅使用普通的旧REST API实现流式传输是困难的或几乎不可能的。

流语音识别您可以传输音频到云 语音API和音频处理接收实时 时间流语音识别结果。另请参阅 流式语音识别请求的音频限制。流式语音识别是 只能通过gRPC获得。

话虽如此,Cloud Speech API Client library is available in the following languages并涵盖了体面的通用开发语言。

  • C#
  • 转到
  • 的Java
  • Node.js的
  • PHP
  • 的Python
  • 红宝石

由于您没有提及您正在使用的语言,并且如果您使用的语言不是上述列表中的语言,您可以很好地查看客户端库源代码(用于其他语言)以及它如何使用gRPC进行流式传输并使用您正在使用的语言来实现它。

再一次,现在唯一的限制是language which gRPC has support for。与上面的列表相比,gRPC支持C++和Objective C.所以如果你使用其中的一个,尽管有很多挖掘客户端库代码库的方法,但这可能是一个可行的选择。

我的确同意,在谷歌客户端库中支持C++和/或ObjectiveC对于开发者来说真的很有用。

UPDATE: 上快速搜索,我发现this github repo这对如何调用谷歌语音云API使用C++几个样品(仍然不知道这是你使用,虽然语言)。

+0

嘿,谢谢你的回复。我使用的Elixir没有提供gRPC实现。好像我必须用支持的语言之一构建一个小脚本。 – Phillipp

+0

@Phillipp - 是的,你将不得不调用一个调用运行在任何这些支持语言的程序。我对elixir不太熟悉,但我认为使用一个支持elixir的RPC库以及对上述任何语言的支持也可以解决您的问题。'药剂程序的Python 谷歌语音API Service'(以Python作为一个例子,假设RPC库具有Python和酏剂支持)。 – Tuxdude