產品功能
辦公數位化
AI&溝通
貝行銷
選英
AI助理
AI蒐索
即時溝通
企業郵箱
日程&會議
釘閃會
日曆
釘釘會議
釘釘直播
釘釘會議室
組織數位化
智慧考勤
智慧人事
智慧招聘
OA審批
釘釘薪酬
組織大腦
上下級
企業門戶
業務數位化
釘釘宜搭
多元錶
釘釘項目
釘釘PaaS
開放平臺
智慧財務
智慧差旅
智慧契约
智慧行銷服
釘釘快辦
釘釘視頻號
數智化底座
365會員
創業版
專業版
專屬版
混合版
釘釘教育
家校通訊錄
管理員AI助理
家長工作臺
家校本
班級打卡
AI班級群
班級通知
課程表
班級文化
成績單
AI小黑板
老師AI助理
家庭群
成長記錄
解決方案
行業解決方案
產業鏈
政府
政企服務
消費
製造業
互聯網
金融
醫療
交通
高校
汽車
物流
餐飲
機器人
中資出海
釘釘十年時間參與各行業標杆客戶共創,沉澱的優秀行業解決方案與同行分享; 幫助您的企業快速學習優秀管理模式和管理思想。
精選AI助理
行政助理
工單助理
Excel資料分析
審批助理
法務助理
口碑助理
模版中心
行業通用
高效實用表格大全
行政服務工單
任務管理提效秘笈
互聯網
產品專案驗收錶
需求收集與管理系統
產品研發全過程管理
製造業
車間巡檢自動化
採購入庫管理
設備巡檢管理
物業後勤
辦公物品申領管理
公司用車申請
餐廳訂餐管理
門店/批發/零售
線索表單留資管理
門店庫存管理系統
每日門店巡檢
電商
電商選品立項管理
新媒體內容創作管理
電商多管道退款管理
服務業
群聊輿情智慧監控
一表人才招聘管理
培訓
參會報名與簽到
排課與課件管理
高校
個人簡歷範本
個人主頁
超級服務
市場活動
走進釘釘
超級城市活動
創造者聯盟
釘釘生態CEO說
釘釘實戰營
低程式碼研修社
魔法數位營
釘釘動態
幫助支持
幫助中心
新管理員指南
走進專屬超能力
快速上手多元錶
走進宜搭低程式碼
安全合規
釘釘招聘
社會招聘
校園招聘
新聞資訊
新聞資訊
新聞中心
說明中心
聯絡我們

粵語語音識別為何咁難搞

講到粵語語音識別,真係要同AI「傾偈」都唔容易!普通話有四聲,英文仲乾脆連聲調都冇,但粵語偏偏有「九聲六調」,同一個音可以因語調不同變出「詩、史、試、時、市、事」咁多意思。咪搞啊,連人類都要問:「你話邊個『si』呀?」AI點分得清?

仲有更難搞嘅——粵語口語成日「吞音」,好似「我哋走啦」講快咗變「我地走~」,尾音拖長兼消失,語氣助詞「啦」「囉」「啫」又隨處拋,聽落似加密電碼。語言學研究顯示,標準粵語同街坊日常用語差異可以大到好似「兩種語言」。

而家大部分語音模型,根本係用普通話或英語訓練出身,粵語語料庫少得可憐,等於叫外國人靠一本《廣州話入門》去睇懂茶記阿姐飛砂走奶咁快嘅對白,點頂得住?



釘釘的粵語識別引擎到底點運作

講到釘釘會議的粵語識別引擎,唔係靠「估佢死」或者「耳仔尖」,而係真係有一套黑科技坐鎮!背後用緊深度神經網絡(DNN)同端到端(End-to-End)模型,直接將聲波「睇」成文字,跳過傳統語音識別中一堆中間步驟。重點係,呢套系統唔單止學咗標準粵語,仲特別針對九聲六調做咗聲調建模——即係話,AI 會分析音高曲線,分到「分」同「粉」之間微妙到瞓覺都分唔清嘅差異。

更犀利嘅係,釘釘團隊為咗克服粵語語料不足嘅硬傷,用咗「跨語言遷移學習」:先用海量普通話數據訓好基礎模型,再用精選粵語語音微調(fine-tune),等 AI 快速掌握廣東話精髓。連「啦」「囉」呢類語氣助詞都唔放過,全部內建到語言模型度,識別時唔會當你「呃交」。仲有實時上下文預測,聽到「開咗個會先至返屋企」,自動推斷「開咗個會」係會議行為,唔會譯成「劈咗個會」!



提升識別準確率的五大秘技

想令釘釘會議聽你講粵語準過唐伯虎點秋香?識得使招先至贏!網絡唔穩,聲帶變哭帶——Wi-Fi甩鏈、4G跳秒,咪話AI唔識聽,就連你阿媽都問你「邊度斷咗氣?」麥克風爛過茶記隔夜叉燒,收音夾雜風聲、吞字、回音,等同叫機器解密碼。背景嘈到似深水埗街市?仲要多人齊聲開口?AI唔係諸葛亮,真係分唔清邊個講「加薪」定「減薪」!

發音懶過週星馳扮三六九?「我哋」變「我地」、「唔該」唸成「唔該~~~」拖音三秒,AI聽到瞓著。試下用標準粵語出擊,少啲俚語「hea」、「窒一窒」,系統先有機會學識你條路。仲要記得入設定檢查語言選項,咪成日當「普通話」用,結果「老細」變「老鼠」,災難級烏龍即刻發生。

高階玩家必殺:用「自定義詞彙表」塞入公司名、專有名詞,等「釘釘」唔再將「CRM系統」聽成「西呀米訊」。語速唔好快到似報賽馬號碼,適時停一停,等AI喘口氣消化。記住,而家AI仲係「學語期BB」,唔係語言大師,合理期待先至長遠!



真實場景測試:由茶餐廳到董事會

講起釘釘會議嘅粵語語音識別,唔使再當係「聽聲認字」遊戲!我哋由茶餐廳「凍檸茶走甜」開始測試,到董事會「Q3業績同比升15%」,發現AI有時聰明到貼地,有時又傻更更將「合同」變「合共」、「伺服器」解作「服侍器」——真係想叫佢返去讀返三年廣東話文法。

日常對話入面成把「啦、啫、咪」語氣詞,釘釘偶爾會當係雜音過濾掉,導致語意斷晒鏈;業務匯報中數字同英文夾雜,例如「API延遲低於200ms」,識別結果可以變成「阿婆遺留…二百蚊」,令人哭笑不得。多方會議最考功夫,三人同時搶咪,系統分唔清邊個講「我哋要擴展雲端部署」,最後轉成「我哋要擴張春咁佈局」。

背景有電視聲播《金枝慾孽》都仲好,最怕鍵盤嗒嗒聲夾埋入嚟,AI即刻「耳鳴」。錯誤主因唔係聲學模型未夠強,就係詞庫冇收足地道用語。現實場景複雜如煲仔飯,技術仲未完全「炆」得透。



未來展望:AI幾時先真係聽得明廣東話

講到未來,AI聽廣東話真係幾時先至「開竅」?現時釘釘會議雖已做到九聲六調基本分得清,但遇到「點解」定「典解」、「其實」變「其食」呢類同音字災難,仲要靠人手救亡。不過大模型時代來臨,好似通義千問語音版呢類AI,憑住超強上下文理解力,或可從整句意思「估」中正確用字,唔使再靠運氣。想像下AI聽到「我哋要簽合共」,自動覺醒:咦,前文後理講緊合約,應該係「合同」啦!

但光靠算法唔夠,語料先至係王道。若大眾可以貢獻日常對話錄音,建立開放粵語語音數據集,等AI學識市井懶音、潮語甚至笑話語氣,識別率先會飛昇。多模態技術都值得期待——結合唇讀、手勢甚至表情,等AI「睇口型」都識講嘢。最後,點解法文、西班牙文都有頂級語音系統,廣東話卻常被當「小語種」邊緣化?語言科技公平性不容忽視。開發者啊,請記住:我哋嘅聲,唔想喺數碼世界失蹤。



多姆科技(DomTech)是釘釘在香港的官方指定服務商,專門為廣大客戶提供釘釘服務。如果您還想瞭解更多釘釘平臺應用的內容,可以直接諮詢我們的在線客服,或者通过电话+852 64392620或邮箱cs@dingtalk.com.hk联系我们。我們有優秀的開發和運維團隊,豐富的市場服務經驗,可以為您提供專業的釘釘解決方案和服務!