近日,618年中大促正如火如荼進行,各大電商平臺已早早開始了這場消費狂歡的競速。數據顯示,在競爭激烈的智能網絡產品中,科大訊飛脫穎而出,成功奪得翻譯機、錄音筆、智能機器人等多個產品品類的銷售冠軍。
在普通大眾的印象中,這家以語音技術見長的人工智能企業似乎是近些年來國內的一股新鮮力量,畢竟人工智能熱潮前后才不過五六年的時間。但事實上,這家公司已在智能語音與人工智能領域深耕多年。6月9日,科大訊飛迎來了它的20周歲生日。
一個決定,一個誕生
在科大訊飛20周年內部講話中,劉慶峰說:“未來十年,我們有三個關鍵戰略路徑。第一,要堅定不移地實施頂天立地的技術戰略,我們的價值核心基礎是技術的持續領先和引領、立足于未來的產業需求、發展高科技并實現產業化;第二,要堅定不移地推行我們平臺+賽道的產品戰略,產品要成功、生態也要成功;第三,要堅定不移地推動to B和to C的雙輪驅動。用A.I.賦能個人成為產業的拓荒者和領導者,我相信科大訊飛在未來十年產業版圖的前途會非常巨大?!?
這些年劉慶峰做了無數次演講,而上述一幕只是這些年間的無數分之一。演講之后,面對滿堂的鼓掌與喝彩,也許劉慶峰眼前會掠過自己26歲時的影子。
1999年,26歲的劉慶峰必須做出一個至關重要的選擇。
一是出國讀博,已經有學校愿意提供幾萬美元的獎學金。而這條路的盡頭,或許是窮經皓首的劉博士,亦或許是一顆耀眼的學界明星;
二是接受剛剛組建微軟亞洲研究院的李開復提供的微軟獎學金,到微軟實習一個月。更大的公司,更大的平臺,更平穩的過渡;
三是帶領實驗室的師兄弟們,一起做一番事業,前路一片混沌。
三個選擇,三種人生。劉慶峰選擇了最難的第三條路,而這看似沖動的決定背后,卻是十分具體而審慎的選擇。
在當時,劉慶峰正擔任福建中銀集團與中科大建立的聯合實驗室、中文語音合成第一個產業化的實體中銀天鷹智能多媒體實驗室的總工程師,和師兄弟一起開始為中銀集團提供技術支持。
在上個世紀末,所有人都并不清楚語音要具體做什么。今天想搞個語音PDA,明天又想做個語音聽寫軟件,后天又搞工商查詢系統,團隊疲憊不堪。兄弟們受不了,便找到劉慶峰說,要么你出來當CEO,要么我們就解散。
與此同時,劉慶峰的博士生導師王仁華也對他說,這個事情可以成,這么多優秀的年輕人能團結在一起,在科大的歷史上還從來沒有過,要是解散就太可惜了。
而且,當時語音技術大都掌握在國外的高校和企業手中,而國內關于這片土地還仍是一片待開墾狀態。因此有一句話一直在劉慶峰腦袋里揮之不去,那個聲音在說:“中文語音技術應當由中國人做到全球最好,中文語音產業應當掌握在中國人自己手中?!?
青年的熱血澆筑理想,風華正茂,揮斥方遒。
夢開始的地方,在合肥市西園新村的出租小屋。由于計算機散發的熱量,本來狹窄局促的房間顯得更加悶熱,夏季來臨,計算機圍成一圈,房頂吊一個電扇,每個人都汗流浹背,一邊擦汗一邊擦鍵盤。
回想起創業之初的情形,劉慶峰說,我們在工作室旁邊的農村里找了一戶人家給我們做飯,中午吃飯也沒椅子,大家就都蹲在那個地上。因為做語音需要,我們請了一個播音員女孩子,她來的時候還很興奮,結果來了三天,她很委屈,一邊吃飯一邊說,這哪是搞研究的,就是一幫難兄難弟。
而平行宇宙中的劉慶峰,或許正身穿白襯衫,出入于微軟研究院,做著一份更加“體面”的工作。
等風來
創業生涯,九死一生,這不是開玩笑。
早在1998年,劉慶峰帶隊參加了在北京的863語音合成評測,這一次中科大在評測中獲得了3分(5分是播音員水準,4分是普通人發音表現,而3分則是勉強可以接受的),這是當時語音合成獲得最高的分數,“唯一達到了可實用階段”。
隨后,在1998年8月的“國家火炬計劃十周年成就暨高新技術產品博覽會”中,中科大的語音合成系統被選為唯一的軟件標志性產品而列在特展位上。同年12月,在新加坡舉行的國際漢語口語處理研討會(ISCSL)上,中科大的KD語音合成系統被與會各國專家高度評價,劉慶峰介紹KD系統的論文也獲得了大會的最佳學生論文獎。
這是一個技術上極其強勁的團隊,但在商海中一樣必須面對暗礁涌動。
2000年,個人電腦開始進入中國家庭,很多用戶根本不會操作,科大訊飛看準了這個“痛點”,推出了第一款產品“暢言2000”。借助語音方便電腦操作,在當時打出了“會說話就會用電腦”的廣告。
劉慶峰將銷售渠道鋪到了全國10多個省,他們甚至預想了產品熱銷的豐滿夢想,但由于語音輸入和控制并非硬需求,大多數人還是更習慣于使用鍵盤和鼠標,加之價格太高,暢言2000幾乎無人問津,科大訊飛也由此虧掉兩千多萬。
秋末,科大訊飛經歷了市場的沉痛打擊后,于巢湖半湯溫泉,迎來自己命運的第二次抉擇。
半湯會議持續了兩天,雖然劉慶峰希望借助溫泉這樣一個放松的環境來想清楚公司的前路。但秋末的寒冷依然使會議的氣氛變得肅殺。
有人說直接解散吧。
有人說可以做別的賺錢更快的行業。
十幾個人各抒己見,會場一片狼藉。最后,劉慶峰做出了最終的決定:繼續做語音,誰不樂意,直接走人。
“燃燒最亮的火把,要么率先燎原,要么最先熄滅”,這是劉慶峰在當年的年度大會上說的一句話,這句話至今仍被掛在訊飛大廈的墻上,激勵著每個訊飛人在智能語音與人工智能道路上不忘初心,堅守前行。
回顧科大訊飛二十年來的發展歷程,這是兩個關乎命運的決定。而隨后將科大訊飛帶到“全球50大最聰明公司第六名”、“中國第一個語音上市公司”、“中國第一個在校大學生創業上市的公司”這樣位置的,則是一個堅持。
智能語音和人工智能,這一在創業初期就決定好的方向,在二十年里科大訊飛一直沒有動搖過,并且從來都是全力以赴,而非當作一個簡單的業務線來做。
而這樣的堅持,在最近幾年終于等到了屬于自己的風。
2010年10月,科大訊飛發布國內首個以智能語音和人機交互為核心的人工智能開放平臺——訊飛開放平臺,隨后基于該平臺相繼推出訊飛輸入法、訊飛聽見等示范性應用,推動與廣大合作伙伴攜手構建以訊飛為中心的人工智能產業生態。截至2019年5月31日,訊飛開放平臺開發者總量超過103萬,總應用數超過64萬,累計終端用戶數超過23.9億,AI大學學員總量超過30萬。
而在之后的短短幾年間,各式各樣的智能語音公司如雨后春筍般長了出來,行業終于開始蓬勃向上,而在此之前,科大訊飛已經深耕并等待了十幾年。
前路繁花
5月21日,上海世博中心,科大訊飛召開了2019新品發布會。
新品發布會上,劉慶峰透露,2018年11月,科大訊飛機器翻譯系統參加CATTI全國翻譯專業資格(水平)科研測試,達到英語二級《口譯實務(交替傳譯類)》和三級《口譯實務》合格標準,意味達到了專業譯員水平。
這是歷史上首次參加并通過國家級權威口譯水平科研評測的人工智能系統,這也標志著機器自動翻譯在輔助人類跨語言信息溝通交流方面上了一個新臺階。
此外,2019年3月,機器閱讀理解國際權威評測SQuAD 2.0任務中科大訊飛再次登頂冠軍,并同時在EM和F1兩個指標上全球首次均超越人類平均水平,一舉創下比賽的全新紀錄。
“這個里程碑是由中國人寫下的,這是英文的自然語言理解,機器已經超過真人水平”,劉慶峰說。26歲劉慶峰腦子里的那個聲音:“中文語音技術應當由中國人做到全球最好,中文語音產業應當掌握在中國人自己手中?!币呀洺蔀楝F實。
上述在語音智能領域所取得的歷史性突破,離不開背后堅定的戰略決心。早在2015年訊飛的年度董事會上,相關高層就已經作出了一個非常重要的決定:不再只追求當前的稅后利潤增長,要把資金投到決定未來的戰略方向上。
結合財報來看,科大訊飛連續多年的研發投入占銷售收入的比例達到20%、甚至25%,這就是在為未來做大量儲備,把利潤填充到了未來發展的戰略準備之中。
而這些投入也獲得了相應的回報?,F如今,科大訊飛在語音合成、語音識別、機器翻譯、醫學影像、人臉識別、自然語言理解等方面的國際比賽中,多次刷新全球紀錄,僅2018年,科大訊飛拿12個國際權威賽事的“世界第一”。此外,目前,科大訊飛主持和參與制定的國家標準有2項、國際標準有1項,累計獲得國內外的有效專利有 260 件。
而在具體成果方面,科大訊飛更是提出了嚴謹的AI價值兌現標準。劉慶峰認為,跨越鴻溝后的人工智能技術價值兌現有三大標準,分別是:“必須要有看得見摸得著的真實應用案例”,“要有能夠規?;涂赏茝V的對應產品”,“要可以通過統計數據去說明應用成效”。
同時根據該標準,推出了一系列切實可用的新產品。
雙輪驅動,初露鋒芒
在中國,想只靠提供技術就成為一家大企業,在客觀上存在有諸多困境,而清楚意識到這一點的科大訊飛,從來都沒有放棄過C端的布局。
2016年年底,科大訊飛做出新的組織結構調整,拆分出消費者事業部。經過兩年的勵精圖治,在2018年這一調整也已經初見成效。
科大訊飛2018年財報顯示,ToC業務實現營業收入25.17億,同比增長96.54%;實現毛利12.96億,同比增長70.77%;ToC業務在整體營收中占比達31.80%,毛利占比達32.72%。,To B - To C雙輪驅動的良好格局正在形成,在各種經濟周期下實現相互補充、相互促進。
而這一系列營收上的突破,很大程度上得益于產品突破。
科大訊飛2019新品發布會中,發布了五大單品和一個操作系統,具體是訊飛翻譯機3.0、訊飛智能錄音筆、訊飛智能辦公本、訊飛學習機X1 Pro、訊飛轉寫機和iFLYOS 2.0。
其中,在去年成為“新國禮”的訊飛翻譯機,全年提供翻譯服務5億+次,伴隨用戶走遍全球197個國家和地區,電商用戶好評率達99%。全新升級的訊飛翻譯機3.0實現了醫療、外貿、體育、金融、能源、計算機、法律等七大熱門行業翻譯,支持粵語、四川話、東北話、河南話四大方言與英語的互譯,整體支持的語言已經覆蓋到近200個國家和地區。
就在最近,訊飛翻譯機3.0、訊飛智能錄音筆SR501、訊飛智能錄音筆SR701等三款新產品還斬獲了2019亞洲消費電子展(CES Asia 2019)的創新大獎,代表了當屆該領域內的創新趨勢和產業方向。
錄音筆作為一款早已被市場驗證過的傳統工具,在科大訊飛AI技術的加持下,煥發出了全新生機。無論是硬件方面麥克風的豪華配置,還是訊飛自研的算法降噪,都使得智能錄音筆在拾音方面上了一個全新的臺階。
而科大訊飛超強的語音識別技術,也使得錄音筆兼具了語音轉文字功能,識別準確率高達98%,真正實現了錄音1小時,出稿 5分鐘。
這些都體現了深入還原需求場景,解決用戶痛點的產品思維。而這一系列產品所取得的成績,也為科大訊飛的商業前景和進一步生態布局,奠定了重要基礎。
結 語
回望來路,科大訊飛從語音合成技術提供商,到語音識別技術應用于彩鈴業務,從第一個基于深度學習的語音識別系統,到語音交互乃至人工智能領域的探索。
腳步不停,景色變幻。但唯一不變的是以智能語音與人工智能領域為核心的深耕。
或許有一天,隨著科技的飛速發展和外部環境的急速變化,科大訊飛會延展出更多的業務線條,但有一些內核是永遠不會變的,那就是底層的價值觀。
2019新品發布會中,劉慶峰登臺展示了一段實時變聲黑科技,他在臺上說什么,臺下立馬會以另外一種聲音傳達出來??拼笥嶏w的這項技術,可通過提取原聲語音中的內容信息,包括原聲的節奏和情感,再結合特定人的音色進行轉換結合,惟妙惟肖的復刻模仿特定人的聲音,這種基于音色與內容分離的聲音轉換技術,實現了聲音的cosplay。該項技術在Voice Conversion Challenge 2018國際音色轉換大賽中獲得全部指標第一名,也是音色和相似度上唯一一家超過4.0MOS分的系統。
不過,劉慶峰現場明確表示不會輕易將該技術在各種APP中對外開放,因為技術是一把雙刃劍,存在安全風險,“一定是要有一種健康、安全又有趣的方式來跟這個世界對接”。
“人工智能要持續發展,最核心的是它的價值觀如何陽光健康,與人為善?!?
自2008年上市以來,科大訊飛始終秉持著這樣的價值觀。無論是“方言保護計劃”,還是“AI教育公益”,抑或是“AI醫療公益”,“AI無障礙公益計劃”等一系列行為舉措,都體現出了科大訊飛的價值導向,以及積極承擔起的社會責任。
科大訊飛2019新品發布會的slogan是“你的世界,因AI而能”,旨在宣揚人工智能(AI)對世界的巨大影響。
但事實上,科技本無善惡,其背后的研發運營人員才是決定科技應用的關鍵因素。
仔細想想,這何嘗不也是我們的世界,“因AI(科技)而能,因愛而能”。