音樂雷達類產品,都「意不在音樂」。Shazam 從音樂辨識,擴充到影像辨識、瞄準多螢互動和 O2O,切入到整個企業行銷市場。
而另一個產品 SoundHound,看起來沒有 Shazam 這麼多動靜,直到今天:今天(3 日)他們上線了新產品 Hound 的 Android 內測版。
說出來嚇死你,Hound 已經秘密研發了 9 年。創辦人和 CEO Keyvan Mohajer 形容他們過去低調的經歷為「矽谷隱藏得最深的秘密」。音樂辨識從來只是他們的第一步,他們一直以來都在埋頭研究技術:語音辨識和自然語言處理。現在時候到了,他們推出了 Hound,要讓它來解決人類對語音助理更大的需求。
換句話說,Hound 就是在做一個 Siri 這樣的語音助理。市面上有這麼多款語音助理了,Hound 的區別在哪裡?其實沒有什麼差異,Hound 要做到的區別只有一個字:更好。
官方稱目前 Hound 比較強的地方包括導航,在地搜尋,天氣、股票、時區、地理等資訊,飯店資訊、航班資訊、新聞、圖片和影片搜尋、貨幣換算等。
(Source: Hound)
在 Mohajer 向外媒展示 Hound 的時候,我們能看到 Hound 在一些方面表現很強大:
能理解複雜的長句。Mohajer 向 TC 展示的時候說了一個很複雜的長句:When is the sun going to rise two days before Christmas of 2021 in Tokyo, Japan?
可以理解對不同主體的連續疑問,比如問「日本有多少人口啊」,然後再問一句「中國呢?」。也能對一個主體的不同事情聯繫發問,比如問完「中國有多少人口啊」之後,直接再問「所以按每平方公里來算是多少」。
另一個特點是延遲低。在發文之後,Hound 不會隔太久就能給出回答。Mohajer 解釋道,這是因為 SoundHound 把語音辨識和自然語言處理,結合在一個引擎裡,而不是把它們當成兩個分別的任務區處理。
此外,Hound 在一些服務上接入了第三方應用的服務。比方在處理飯店預訂時,Hound 和 Expedia 合作,使用者實際上是在後者的函式庫裡搜尋資訊以及預訂服務。但是與第三方合作的時候,似乎延遲會嚴重一些,大概 3 – 4 秒左右。
除了直接面向使用者的 Hound App,這款產品還上線了一個開放平台。開發者可以輕鬆地為自己的 App 裡增加一個語音互動。Mohajer 提到,Hound 的最終目標,不只是和 Siri 這樣的語音助理或者 Google 這樣的搜尋引擎去競爭,而是希望將整個行動網際網路的互動趨勢從「觸控和點選」轉移到「語音」。
但是一個創業公司來做這件事情的確困難。技術只是一方面,長久以來使用者已經形成的使用習慣是另一個門檻。如何說服使用者下載 Hound 並探索 Hound 的種種功能,這並不容易。
這也是他們要做開放平台的原因,讓各種各樣不同的 App 去幫 Hound 推起語音互動這個潮流,比他們自己推面向使用者的 App 容易一些。
- SoundHound Challenges Siri With New Hound Voice Search App And Developer Platform | TechCrunch
- After Nine Years of Secret Development, Hound Voice Search App Has a Dazzling Demo | Re/code
36Kr
更多關於 36Kr 的文章 (所有文章)
- 不看臉只憑聲音?《Rolltape》App 主打社群語音通訊 - 2016-04-26
- 穿戴式硬體商 Zepp 發表足球感測器,搭配《北看台》錄製業餘比賽 - 2016-04-21
- YouTube 推全景直播服務,Coachella 音樂節上首次亮相 - 2016-04-21