SoundHound 不只是音樂辨識,還要做 Siri 沒做到的事

作者 | 發布日期 2015 年 06 月 03 日 | 分類 APP , 數位音樂 , 網路
tout-4-hound-expanding

音樂雷達類產品,都「意不在音樂」。Shazam 從音樂辨識,擴充到影像辨識、瞄準多螢互動和 O2O,切入到整個企業行銷市場。



而另一個產品 SoundHound,看起來沒有 Shazam 這麼多動靜,直到今天:今天(3 日)他們上線了新產品 Hound 的 Android 內測版

說出來嚇死你,Hound 已經秘密研發了 9 年。創辦人和 CEO Keyvan Mohajer 形容他們過去低調的經歷為「矽谷隱藏得最深的秘密」。音樂辨識從來只是他們的第一步,他們一直以來都在埋頭研究技術:語音辨識和自然語言處理。現在時候到了,他們推出了 Hound,要讓它來解決人類對語音助理更大的需求。

換句話說,Hound 就是在做一個 Siri 這樣的語音助理。市面上有這麼多款語音助理了,Hound 的區別在哪裡?其實沒有什麼差異,Hound 要做到的區別只有一個字:更好。

官方稱目前 Hound 比較強的地方包括導航,在地搜尋,天氣、股票、時區、地理等資訊,飯店資訊、航班資訊、新聞、圖片和影片搜尋、貨幣換算等。

tout-2-hound-say-it

(Source: Hound

 

在 Mohajer 向外媒展示 Hound 的時候,我們能看到 Hound 在一些方面表現很強大:

能理解複雜的長句。Mohajer 向 TC 展示的時候說了一個很複雜的長句:When is the sun going to rise two days before Christmas of 2021 in Tokyo, Japan?

可以理解對不同主體的連續疑問,比如問「日本有多少人口啊」,然後再問一句「中國呢?」。也能對一個主體的不同事情聯繫發問,比如問完「中國有多少人口啊」之後,直接再問「所以按每平方公里來算是多少」。

另一個特點是延遲低。在發文之後,Hound 不會隔太久就能給出回答。Mohajer 解釋道,這是因為 SoundHound 把語音辨識和自然語言處理,結合在一個引擎裡,而不是把它們當成兩個分別的任務區處理。

 

此外,Hound 在一些服務上接入了第三方應用的服務。比方在處理飯店預訂時,Hound 和 Expedia 合作,使用者實際上是在後者的函式庫裡搜尋資訊以及預訂服務。但是與第三方合作的時候,似乎延遲會嚴重一些,大概 3 – 4 秒左右。

除了直接面向使用者的 Hound App,這款產品還上線了一個開放平台。開發者可以輕鬆地為自己的 App 裡增加一個語音互動。Mohajer 提到,Hound 的最終目標,不只是和 Siri 這樣的語音助理或者 Google 這樣的搜尋引擎去競爭,而是希望將整個行動網際網路的互動趨勢從「觸控和點選」轉移到「語音」。

但是一個創業公司來做這件事情的確困難。技術只是一方面,長久以來使用者已經形成的使用習慣是另一個門檻。如何說服使用者下載 Hound 並探索 Hound 的種種功能,這並不容易。

這也是他們要做開放平台的原因,讓各種各樣不同的 App 去幫 Hound 推起語音互動這個潮流,比他們自己推面向使用者的 App 容易一些。

 

(本文由《36氪》授權轉載;首圖來源:Hound) 

如果你喜歡我們的分享和文章,請幫我們按個讚

36Kr

36氪(36Kr.com)是中國領先的科技新媒體,報導最新的網路科技新聞以及最有潛力的網路創業企業。36氪的目標是,通過對網路行業及最新創業企業的關注,為中文網際網路讀者提供一個最佳的瞭解網路產業當下與未來的科技媒體。

發表迴響