互聯網大廠集體搶灘發布AI大模型后 進展如何?-世界頭條
來源:21世紀經濟報道     時間:2023-06-02 17:48:35

在發布“通義千問”不到兩個月后,阿里云基于大模型在AI音視頻賽道打出了一槍。

6月1日,阿里云宣布通義大模型進展,聚焦音視頻內容的AI新品“通義聽悟”正式上線,成為國內首個開放公測的大模型應用產品。

今年以來,國產AI大模型賽道熱鬧非凡,各家廠商、機構的大模型接踵而至,應接不暇。最新數據顯示,截至目前,我國10億級參數規模以上大模型已發布79個。


【資料圖】

相比于集體宣布搶發AI大模型,未來,如何基于大模型研發針對行業細分領域的垂直的模型更加重要。各路人馬已有動向。“百模大戰”的下一個新擂臺,已然搭起。

國內首個開放公測大模型應用產品

開會AI幫忙記錄,還能幫忙總結、提取重點和整理待辦事項?

6月1日,阿里云宣布通義大模型進展,聚焦音視頻內容的AI新品“通義聽悟”正式上線,成為國內首個開放公測的大模型應用產品。

從現場演示可以看到,通義聽悟接入了通義千問大模型的理解與摘要能力,能夠完成對音視頻內容的轉寫、檢索、摘要和整理,比如用大模型自動做筆記、整理訪談、提取PPT等。聽悟還與阿里云盤打通,同時支持云盤導入和本地上傳。

阿里云CTO周靖人介紹,聽悟集成了阿里最先進的語音和語言技術。其內置阿里新一代工業級語音識別模型,識別準確率極高;融合自研語音語義多模態說話人算法,能對10人以上說話場景進行角色區分;接入通義千問大模型后,能夠對上萬字的音視頻內容進行摘要總結,支持跨多音視頻內容的精準問答理解。

聽悟技術負責人鄢志杰向21世紀經濟報道記者表示,通義聽悟的前身是阿里云內部一個名為“聽悟”的產品,主要為投資部、HR等部門做項目會議的音頻轉寫功能,在2022年,這款產品的潛力逐步被挖掘,內部開始思考其工具屬性是不是要發生變化。

“工具是什么呢?人還是支配他的,基本上它不會比你更聰明,也不會比你懂得更多。但是,大模型能力跟工具應用相結合變成助手以后,它甚至能給到建議啟發你,知曉你不知道的知識,留意到你之前沒有留意的細節。”鄢志杰說。

繼此前阿里云降價之后,此次聽悟同樣推出免費使用體驗,聽悟用戶可通過每日登陸等多種任務領取免費轉寫時長。公測期間,阿里云官方微博、微信及各大平臺社區還會發放大量20小時轉寫口令碼,用戶獲得的福利權益可累加,一年內有效,免費時長可高達100小時以上。

周靖人表示,聽悟發布公測版后,希望更多人能夠體驗到該產品,真正把大模型的能力變成工作學習的AI助手。在接下來的階段,聽悟也將陸續推出增強版,到時候會有一些商業化的安排。

“百模”推出之后

ChatGPT帶火了國內AI大模型市場,5月28日發布的《中國人工智能大模型地圖研究報告》顯示,截至目前,我國10億級參數規模以上大模型已發布79個。距離實現真正的“百模”,已然不遠。

此前,中國工程院院士、清華大學計算機科學與技術系教授鄭緯民接受21世紀經濟報道記者采訪時,ChatGPT的爆紅源于其能流暢地與人對話、寫詩,甚至作畫,但未來AI大模型所帶來的貢獻應不止于此,如何基于大模型研發針對行業細分領域的垂直的模型更加重要。

各家企業、機構也在緊鑼密鼓地發展大模型、打磨基于大模型的應用。

阿里云推出通義聽悟時,距離“通義千問”的發布還不到兩個月的時間。周靖人對21世紀經濟報道記者表示,目前外界對大模型要求很高,從通義千問發布以來,阿里云也陸陸續續做了大量工作,并在全國開始部署AI的模型。同時,在云的底層通過一系列模型優化不斷降低模型使用的成本,降低模型所使用的資源,只有這樣能夠讓模型真正意義大規模去服務社會。

對比阿里云發布國內首個開放公測的大模型應用產品,百度則帶著國內首個大模型基金而來。

5月31日,百度正式宣布設立規模為10億元的“百度文心投資基金”,重點投資孵化大模型領域的優質創業企業,為其提供包括資金、技術、人才在內的一站式資源。另外,創始人李彥宏正式宣布啟動百度“文心杯”創業大賽,致力于尋找大模型時代的“game-changing founder”,參賽創業者將有機會獲得來自百度集團的1000萬元投資。

在最近的財報電話會議上,騰訊方面也表示AI基礎模型“混元”取得良好進展,模型構建進展順利。其業務部門稱,目前正積極對訓練部門及生產線擴容,相信未來人工智能將在不同領域有所應用。

據悉,騰訊已成立類ChatGPT對話式產品項目組“混元助手”。該項目組將聯合騰訊內部多方團隊構建大參數語言模型,目標是通過性能穩定的強化學習算法訓練,完善騰訊智能助手工具,打造騰訊智能大助手,并能成為國內的業界標桿。

(文章來源:21世紀經濟報道)

關鍵詞: